数値列密度 - ページ 2

 
Dmitry Fedoseev:
最も長く伸びるのは、元の系列が平均を下回るときです。

そうですね、どちらかの数値が著しく大きい場合、それを除外することだけが解答の結果となる--これは確かに良くないですね。

この効果を買い取る方法があれば教えてください。

 
-Aleks-:

そうですね、どちらかの数値が著しく大きい場合、それを除外することだけが解答の結果となる--これは確かに良くないですね。

この効果を買い取る方法があれば教えてください。

実は、あなたのアルゴリズムを、冗長性を排除して短く並べただけなんです。

平均値以上の短い出力は無視してもいいのでは?例えば、データが1~3本平均より上に留まる場合、平均より下と考える。

 
-Aleks-:

ご清聴ありがとうございました。理論的なエクスカーションは、知識が実際にどのように働くのかがわかれば便利です。私は最初のデータを与え、結果を示しましたが、エクセルで計算式と解説を付けて計算し、結果を示して いただけるとありがたいのです。靴下を探すタスクは、似たような機能の検索があり、この機能が知られていないことを事前に知っているため、ここでは適用されません。ここでモジュールを適用する方法私は理解していない、しかし、再び、私は正しく理解している場合 - あなたは、自分自身のグループに入るの範囲を指定する必要があり、それは解決策を排除します。

別の質問があります:それは歴史の中で数回発生した場合、同じレベルを何回数えるために "に答える、私が正しく理解すれば、問題は、数値の行で数字が繰り返されている場合である方法です - 一見、それらの間のデルタはゼロになり、これは高密度の兆候であり、上記のアルゴリズムを破壊してはいけません。

太字は私のものです。

すみません、さっきの "批判的なコメントやアイデアを待っている "という言葉を真に受けてしまいました。要は、やはり課題が定まっていないのです。計算の仕方がわからない。

要は「結果はどうあるべきか」ということであり、その答えは、同じ入力データから、異なる不慣れな人が、この答えだけを用いて、同じ結果を得るように定式化されていなければならない。これはExcelでも何でも、作業の自動化の基本です。

数列の中の部分集合における「密度」「近さ」とは何か--著者の代わりに誰がそれを言うのだろうか。

 
Dmitry Fedoseev:

実は、あなたのアルゴリズムを、余分なものをあまり入れずに短く並べただけなんです。

平均値以上の短い出力は無視してもいい。例えば、データが1~3本平均より上に留まる場合、平均より下と考える。

あなたを理解したい、ここに数字があります。

NO.P./P.番号デルタ数値の平均値平均デルタ値
1 1 150,9 111
2 4 3
3 5 1
4 20 15
5 21 1
6 28 7
7 30 2
8 100 70
9 300 200
10 1000 700


明らかに8~10の順番の数字は互いに離れており、7からも離れていますが、これらの数字をどのようにフィルターにかけることができるでしょうか?
 
Vladimir:

太字は私のものです。

すみません、さっきの "批判的なコメントやアイデアを待っている "という言葉を真に受けてしまいました。要は、やはり課題が定まっていないのです。計算の仕方がわからない。

このタスクが設定されていないとは......。では、どのように話し合いを進めたのですか?

もう一度言いますが、数列のどのグループが、数列全体に対して最も近いかを判断するアルゴリズムが必要なのです。

 
-Aleks-:

この課題が設定されていないとは......。では、どのように話し合いを進めたのですか?

もう一度言いますが、ある数列の中で、数列全体から見て最も 互いに近い数のグループを決定するアルゴリズムが必要なのです。

どこに行って、何を持ってくるかわからない」ことまで議論するのは難しいことではなく、このテーマはおとぎ話の中で非常によく展開されています。

これが何なのか(太字になっているもの)、読み解いてください。より大きなグループでの親密さに対して、グループ内での親密さ。私が推測しているように、近接は数字であり、別の数字と比較することができます(「最も」という言葉があるからです)。おそらく、ノンネガティブでも?どのように算出するのですか?

 
Vladimir:
それが何であるか(太字のもの)を読み解いてください。大きなグループでの近接度に対する、グループ内での近接度。推測するに、それは数字であり、別の数字と比較することができる(「最も」という言葉があるため)。おそらく、ノンネガティブでも?どのように算出するのですか?

入力データは数値系列であり、数値群はこの数値系列において「近接している」という基準を満たし、数値系列の限界に制限された並びである。しかし、近接を判断する数値はなく、見つけなければならないのです。数字は、今のところ、ポジティブなものしか考慮していません。

もし私があなたの質問に答えていなければ、それを指定してください - 正直に私が間違って説明したことを理解しようとしています。

 
クラスタリングの一つの方法が思い浮かびます。集合において、あるクラスタの要素間の最大距離が、そのクラスタの要素からそのクラスタに含まれない要素までの最小距離よりも小さくなるように、要素のグループ(クラスタ)が割り当てられている、というようなことです。距離は、通常の距離、実数の差のモジュラスでもよい。もちろん、そのようなクラスタは1つだけとは限りません。もしかしたら、正確に1つのクラスタでなくても、他の方法でも比較した方がいいかもしれませんね。例えば、グループ内のあるレベルの平均発生時間など。
 
-Aleks-:

入力データは数値系列であり、数値群はこの数値系列において「近接している」という基準を満たし、数値系列の限界に制限された並びである。しかし、近接を判断する数値はなく、見つけなければならないのです。数字は、今のところ、ポジティブなものしか考慮していません。

もし私があなたの質問に答えていないなら、それを明らかにしてください。私は正直に言って、私が間違って説明したことを理解しようとしているのです。

実軸上の2点間の距離を、その差のモジュラスとして測定するのは誰にでもできることだ。数学では、一般にこれをメートル法と呼んでいる。実数である点の組の平面上の距離は、どのように測ればよいのだろうか。ここでもおなじみのユークリッド距離、つまり下位の差の二乗の和の平方根という解決法が用意されているのだ。また、数学者は平面上の他の指標、例えば、2つの差の最大弾性率、差の弾性率の和(http://ad.cctpu.edu.ru/Math_method/math/45.htm)を持っています。そして、これは数字のペアの場合のみである。たった2つの数字、そしていつも2つ。そして、もっと複雑な状況で近接測定を導入する必要があります。 1つのグループには2つの数字があるわけではなく、異なるグループには異なる数字があるのです。

数学には、2つの関数の距離を測る指標がある。しかしまた、常に2つの間にある。またもや自分に合わない、グループを持っている。

だからこそ、自分でしっかり理解することが大切なんです。これを、集合における近さの数値特性を得るためのアルゴリズムに定式化することができるかもしれない、と書いてください。

しかし、それを作ることもあきらめて考えてください。上記のリンク先には、メトリックが満たすべき要件が書かれています。突然そこに現れたわけではなく、どれかが欠けても不思議な効果が生まれます。上の投稿で、そのような包括的な試みを放棄する例を挙げました。グループ内の点は、点の外の要素よりも実軸上で互いに近いペアになるようにします。とても非自明なことを発明する必要はないでしょう。

 
-Aleks-:

あなたを理解したい、これが数字です。

NO.P./P.番号デルタ数値の平均値平均デルタ値
1 1 150,9 111
2 4 3
3 5 1
4 20 15
5 21 1
6 28 7
7 30 2
8 100 70
9 300 200
10 1000 700


明らかに8~10の順番の数字は互いに離れており、7からも離れていますが、これらの数字はどのようにフィルタリングされているのでしょうか?
書いてませんよ~、まずは違いを数えてみてください。それから、他のすべて。