数値列密度 - ページ 16

 
Vyacheslav Kornev:
よし、わかった。どうすればいいか教えてあげよう。誤解を招くだけだ。密度を求めているわけではないんですね。クラスターをお探しですか?整数を扱うとき
Row : 1,2,3,4,5,6 は密度基準です。100%
1,2,_,4,5,6行目-は密度が低いです。
1,2,3,4,5,6よりも密な列。6で限定、存在しない。

私は、数列の数字のクラスターの密度を探して いるのです。論理的に正しく、誤解を招くようなことはしていません。

将来的には非数値が使われるようになる - だから、ベンチマークとして数値系列に限定することはまともではない。


 
すでに説明したとおりです。ポイントによって密度が違う......何を目指しているのでしょうか?もう、すべてお見せしました。3ページ前、列の帯域を説明したときにも。すべての行からクラスターの密度を計算することは、物理的に不可能です。なぜなら、他の人の間に数字が並んで現れても、今度は密度が違ってくるからです。

日中、数字を使うのは、マックスウィークでは物足りないですか?

列は2辺に制限されること。数字が無秩序に表示される場合。

もう一つの問題は、数値が常に昇順/降順である場合のみです。そうすると、左側の数字については帯域が変わりません。
 
質量中心を探すときに、すべての密度を昇順に見つけました


 
Vyacheslav Kornev:
すでに説明したとおりです。ポイントによって密度が違いますが、何を目指しているのでしょうか?もう、すべてお見せしました。3ページ前のローストライピングの説明の時点でもそうでした。UNLIMITEDシリーズからクラスターの密度を計算することは、物理的に不可能です。なぜなら、他の人の間のシリーズに数字が登場することがあり、今度は密度が違ってくるからです。
日中、数字を使うのは、マックスウィークでは物足りないですか?
列は2辺に制限されること。数字が無秩序に表示される場合。
もう一つの問題は、数値が常に昇順/降順である場合のみです。そうすると、左側の数字については帯域が変わりません。

学問的な知識を持っていることはわかりますが、知識を持っていることとそれを応用することは別です。

私は、自分の検索が異なる用語のラベルを持っていることを認めますが、たとえそれが科学的予約用語と衝突したとしても、私は論理的に正当化されるラベルを使用します。

せっかく実用的な問題があるのだから、もっと本質的な議論をしよう。数字の単一のセットを使用しての不足についての質問に答える - 市場が定期的に変更されます - 1を決定するためのウィンドウが選択しますが、私は15分を好む - それはすべての15分私は蓄積を検索し、最も可能性の高い市場に影響を与えることを選択する必要があることを意味します(この規則性は、それがもちろん存在すれば、決定されなければならない)。

これらのクラスターを数値系列で見ると、どのような特徴があるのでしょうか。

1.要素数

2.数値系列の位置 - 限界をパーセントで制限すると便利です

3.整数系列に対する相対的な大きさ

4.密度 - クラスター内の数値が互いにどの程度密集しているか(計算方法が異なる)

分析される数値系列は常に変化しており、差分は定常ではないので、提案された方法は不完全に見えます。


 
50個のセルと11個のキューブに数字が入っています
1, 3, 6, 8, 10, 11, 15, 16, 30, 40,50
V1.最も密度の高いクラスターは10,11 и 15,16.

V2.密度が低いのは、1、3、6、8、10、11、15、16です。

V3.さらに密度が低いのは、1,3,6,8,10,11と15,6です

V4.次に1,3,6,8,10,11,15,16です。

要は、こういうことです。デルタをピックアップしてみました。つまり、このバリアントでは、最も多くのクラスタが存在するので、v2を計算します。

アグリゲーション1,3は50セルのうち3セル、つまり1キューブあたり1.5セルを取り出します。

クラスター6,8,10,11は6セルを占有する。そして、ここでは1キューブあたり1.5セル。これ以上は言いません。

10と11を別のクラスタにしたくなかったんですね。




実は、数列の重心はすでに計算済みであることを知っておいてください。それが最高密度です。

そして、その周りの数字は、すべての数字の中央値デルタの中にあり、クラスターを形成しています。
 
要するに、平均的なデルタを計算するのである。そして、どの数字の周りに最も多くのクラスターがあるかを見て、それでおしまいです。玉突き事故の中心は、その番号になります
 
-Aleks-:

学問的な知識を持っていることはわかりますが、知識を持っていることとそれを応用することは別です。

私は、自分の検索が異なる用語のラベルを持つことを受け入れますが、たとえそれが科学的予約用語と衝突したとしても、論理的に正当なラベルを使用します。

せっかく実用的な問題があるのだから、もっと本質的な議論をしよう。数字の単一のセットを使用しての不足についての質問に答える - 市場が定期的に変更されます - 1を決定するためのウィンドウが選択しますが、私は15分を好む - それはすべての15分私は蓄積を検索し、最も可能性の高い市場に影響を与えることを選択する必要があることを意味します(それはもちろん存在していればこの規則性は、決定されなければなりません)。

これらのクラスターを数値系列で見ると、どのような特徴があるのでしょうか。

1.要素数

2.数値系列の位置 - 限界をパーセントで制限すると便利です

3.整数系列に対する相対的な大きさ

4.密度 - クラスター内の数値が互いにどの程度密集しているか(計算方法が異なる)

解析された数値系列は常に変化しています。デルタは定常ではないので、不完全な方法を提案されましたが、いくつかのデルタを自動的にフィルタリングできる基準が必要です。


では、お願いします。どうせデルタの数には限りがあるのだから。各バーに再計算期間を設定するだけでよいのです。
 
Vyacheslav Kornev:
そこで、平均的なデルタを計算する。そして、どの数字が一番周りに溜まっているかを見て、それでおしまいです。クラスターの中心はこの数字です。

先ほどの例では、平均デルタは122.98でした。そんなこともあるのかと思いましたが、この数字は明らかに選択されたデルタバリアントと大きく異なっています。

 
Vyacheslav Kornev:
歓迎しますよ。やはり範囲は狭くなります。各バーに再計算期間を設定するだけです。

もちろん、範囲は限定されます。その都度、制限は異なります。

ただし、デルタレンジをどのように選択するかが問題である。

 

スクリプトに変更を加えました。数値のクラスタ領域での密度をより論理的に計算するようにしたのです。

ファイル: