数値列密度 - ページ 9

 
OK、10番のデルタはどこですか?
 
Vyacheslav Kornev:
OK、10番のデルタはどこですか?

3列目

 
で、13と15の間のデルタが0とかなんなの?
 
Vyacheslav Kornev:
とすると、13と15の間のデルタは0になるのでしょうか?

ここで、より分かりやすくするために......というと、より分かりやすくなるでしょうか。列と行の交点で、デルタを求めることができます。ところで、あなたの言うとおりです。どうやら計算式に間違いがあるようです。後で解決しましょう。


 

 

そうすると、ボトムラインも変わってくる

デルタの総和アルゴリズム1アルゴリズム2
1670 56 10
1670 65 13
1680 51 15
1682 71 21
1700 46 40
1710 78 42
1724 42 46
1728 81 51
1740 40 56
1830 31 78
1950 21 81
2034 15
2066 13
2120 10
2600 190
2930 223
3038 232
3290 250
3450 260
8580 545
 

私のはアルゴリズム1なので。 さて、密度点、つまり平均的に他の数字に最も近い数字があるのですが

いわば密度の高いセンターが昇順に並ぶ

 

さて、クラスターを探すなら、おっしゃる通り、すなわち

これらは、近い数字のグループであると理解してよろしいですか?

初期クラスタの場合、2や3に近い数字はいくつになるのでしょうか?また、最大距離は?

 
Vyacheslav Kornev:

私のはアルゴリズム1なので。 さて、密度点、つまり平均的に他の数字に最も近い数字があるのですが

いわば密度の高いセンターが昇順に並ぶ

どうやらそうらしい。

Vyacheslav Kornev:

さて、クラスターを探すなら、おっしゃるとおりです。

は、近い数字の集まりですよね?

2や3に近い数字はいくつになるのでしょうか?また、最大距離は?

私たちはそれを知らない--基準がないのです。逆に、グループ化された数字の密度を(おそらくすべてのバリエーションで)決定し、最大密度を持つ数字を選択する必要があります。

しかし、あなたの考えを見るのは構わない。例えば、グループの最小値を4数字にする、距離は不明、密度は最大値...とする。密度としては、グループの最初と最後の数字の間のデルタを、このグループの桁数で割ったものを取る(独自の方法を提案することができる)(係数は小さければ小さいほどよい)。


 
遠出するので、後日書き込みます。