数値列密度 - ページ 23

 
Maxim Kuznetsov:


"点の密度 "とは?

そんな大げさなこと言わないでくださいよ :)

明確な解があるのはわかるのですが、この方法は特定のグループを強調したもので、求めているナンバークラスタ領域のパラメータを満たしていない可能性があります......。

密度についてですが、私は2つの可能性を考えています。

1.(行の開始番号-行の終了番号)/番号の個数。

2.SumTruth/NumberTruth(サムトゥルース/ナンバートゥルース

最初の選択肢は一様な 分布を強調し、2番目の選択肢は相対的な分布を強調する(ということにしておこう)。

 
Maxim Kuznetsov:
課題は、点の密なクラスターを見つけることでした。そのために、密度をとって実際に導出する、つまり微分をとったのです。微分をもとに、「ここが最大」「ここが最小」「ここで密度が上がり、ここでゆっくり減っていく」と言えるのです。

しかし、絶対値を 比較することはできない。そのためには、元の関数を計算する必要がある(この場合、極値近辺の点の数を単純に数えればよい)。

そうですね、アプローチは面白いですね~、ありがとうございます。

おそらく、このオプションが優れていることも証明されるでしょう。しかし、それをすべてプログラムするのは私の仕事です。大きな数値系列でテストしない限り、このオプションが私に合っているかどうかの最終結論を出すのは時期尚早でしょう。

 
何か別の議論をしているようですね。

クラスターを見つけるには、2つの解決策しかありません。

1- 非集中型クラスター:特定の中心点が存在しないクラスター。すでに発見しています。

2 - 集中型クラスタ。たった一点から、デルタが溢れ出すところ。

本当になんてシンプルなんだろう。

大きなクラスターもあれば、小さなクラスターもあります。

小さなクラスタが大きなクラスタの一部になることもあります。

サードがないんです。
 
Vyacheslav Kornev:
何か別のことを議論しているようですね。
クラスターを見つけるための解法は2種類しかない。
1- 非集中型クラスター:特定の中心点が存在しないクラスター。すでに発見しています。
2 - 集中型クラスタ。たった一点から、デルタが溢れ出すところ。
本当になんてシンプルなんだろう。
大きなクラスターもあれば、小さなクラスターもあります。
小さなクラスタが大きなクラスタの一部になることもあります。
3つ目はないんです。

1について - 図形の数とほぼ同じ数の異なるデルタが存在しうることを理解している - この場合、どのような基準(いくつのデルタを取るか)で数値をグループ化するか事前に知ることができないため、解決策は生産的ではありません。そんなこともわからないの?

2について - はい - 問題に対する意見として、そのような解答のバリエーションは理解できます。

 
これらのクラスターは整数系列とは関係ないことになる。


あなたが知っている全体の行に最も重要なを見つける方法。

 
-Aleks-:

1について - 数値の数だけ異なる差分が存在する可能性があることに気づきます。この場合、どのような基準(いくつの差分を取るか)で数値をグループ化するかが事前に分からないため、解決策は生産的ではありません。それが理解できないのでしょうか?

2について - はい - 問題に対する意見として、そのような解答のバリエーションは理解できます。

地獄に落ちろ少なくともデルタ1,2,3,4,5,6,7はあるかもしれません。そのため、密度の高い順にクラスタが表示されます。
 
Vyacheslav Kornev:
なんだよ、これ。少なくともデルタ1,2,3,4,5,6,7はあるかもしれません。そのため、密度の高い順にクラスタが表示されます。

昔、私が提案したのは、密度の高い順にクラスターを探し、それぞれの密度を個別に求めて比較することです。

しかし、密度が高くなると、左側の数字が落ちてきて、雲にノイズが入ることがわかったので、このアイデアはやめました。

しかし、私は多数の実験を行うためのツールを持っていません。あなたの方法は、比較できるようにプログラムする必要があります。今はまだその準備ができていません。多次元配列を 扱った経験がありません。

 
この数字、左利きじゃないんですよ。大きなクラスターの中の小さなクラスターです。

すでに計算されているのですね。1つの数字のデルタをすべて数える必要はないのです。では、昇順に並べてみてください。そして、数値間のデルタだけを計算し、それ以上は必要ありません。
 
デルタが大きければ大きいほど、クラスタの幅が広がることに気づいたからです。なぜ、左利きだと言うのですか?大きなクラスターの中には、小さなクラスターがたくさんあります。
 
あ、どのデルタまで数えますか。
まあ、へえ、よりによってデルタの。
最も一般的なものです。

そして、一般的には質量中心を求める方法で。つまり、デルタの中のデルタを数えるのである)。