数値列密度 - ページ 24

 
さて、繰り返しになりますが、なぜ私が示した方法はv2 suitableと呼ばれないのでしょうか?どのデルタに最も多くのクラスターがあるかは、そのデルタに立ち寄ることです。
 
Vyacheslav Kornev:
50個のセルと11個のサイコロがあり、数字が書かれている。
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1.最も密度の高いクラスターは10,11 и 15,16.

V2.密度が低いのは、1、3、6、8、10、11、15、16です。

V3.さらに密度が低いのは、1,3,6,8,10,11と15,6です

V4.次に1,3,6,8,10,11,15,16です。

要は、こういうことです。デルタをピックアップしてみました。つまり、このバリアントでは、最も多くのクラスタが存在するので、v2を計算します。

アグリゲーション1,3は50セルのうち3セル、つまり1キューブあたり1.5セルを取り出します。

クラスター6,8,10,11は6セルを占有する。そして、ここでは1キューブあたり1.5セル。これ以上は言いません。

10と11を別のクラスタにしたくなかったんですね。










デルタ2が一番多いかどうか見てください。そして、このデルタの中の重心は?

 
明確な密度計算式と、このクラスタへの2つのパーティションの比較計算式を定義するまでは、何枚でも割ることができます。つまり、2つのアルゴリズムの性能を比較するための数値的な基準が必要なのです。
 
Vyacheslav Kornev:
デルタが大きければ大きいほど、クラスタが広くなることはご理解いただけたと思いますので。なぜ、左利きだと言うのですか?大きなクラスターの中には、小さなクラスターがたくさんある

おっしゃるとおり、小さいものがたくさんあります。おそらく、私のアルゴリズムに論理的な誤りがあるのでしょう。

Vyacheslav Kornev:
ああ、どのようなデルタをカウントするかまでですね。
まあ、へえ、よりによってデルタの。
最も一般的なものです。

あまりに多いので、他のデータで別の推定をする場合もありますが。

Vyacheslav Kornev:
そして、一般的には質量中心を求める方法で。つまり、デルタの中のデルタを数えるのである)。

ええと、どのように想定しているのでしょうか。アルゴリズムを述べてください。

 
Vyacheslav Kornev:
デルタ2が一番多いかどうか見てください。そして、このデルタの中の重心は?

理論的な研究は、十分な数のテストとその結果の評価がないため、さらに複雑になっています。

コードがなければ、今すぐExcelで作業して時間をつぶしたくないんだ。

肝心のアルゴリズムは、その有効性を検証するために、データ上でテストする必要があります。

 
Avals:
明確な密度計算式と、このクラスタへの2つのパーティションの比較計算式を定義するまでは、何枚でも割ることができます。つまり、2つのアルゴリズムの性能を比較するための数値的な基準が必要なのです。

数値推定の選択肢を提案する - 先ほど2つの選択肢を挙げました。

 

スクリプトコードを変更し、チャート上で直接結果を見ることができるようになりました - 最大密度は別の色でハイライトされ、バー期間は日付またはゼロからのバーで選択できます - デフォルトで。

ファイル:
 

フィルターロジックを変更しました - ノイズが少なくなったようです - Variantパラメータで変更 - 0が古い、1が新しい(デフォルト)です。

ファイル:
 

グループ内のアイテム数によるフィルタを追加 - 5 - 変更可能です。数値行の桁数が多いほど、フィルタの値を高くする必要があります。最大のグループの最大桁数のパーセンテージを作る価値があるかもしれません。

数値行に対する以前のデフォルトのプレフィルタリングアルゴリズム - 0 を返した。

ファイル:
 

計算用データをずらして修正した。

ファイル: