引用における依存性統計(情報理論、相関などの特徴選択法) - ページ 2

 
alexeymosc:

まず、サイクリカリティは日足チャートではなく、時間足チャートで見ていますちなみに私はそこに書きました。

また、日足チャートの場合、結果は周期的ではありません、おっしゃる通りです。

失礼、1時間足チャートで繰り返します。

120時間分のオリジナルチャート。

グラフに周期性は見られない、トレンドはある。正常性を確認しよう。

ローストビールでは、まったく普通ではありません。ACFを確認する。

トレンドがあり、循環性がない-異なる結果です。

トレンドがあれば、統計解析は必要ない。同じホドリックでデトレンドしてみましょう。

残差はホワイトノイズです。その中のサイクルを見てください。


もちろん波はあるのですが、あなた方と比べるとソリッドではないし、全然美しくないんです。全体の差はデトレンディングだと思います。デトレンド成分を除去しなければ、統計をとることはできない。

 
自分なりの工夫をしているのですね。私の仕事とは全く関係ありません )))まず、私が一連のインクリメントで仕事をしていることから始めましょう。そして、この系列の値をモジュロ(つまりプラスとマイナス)して自己相関図を作ると、きっと周期24のきれいな周期が得られるはずです。この方が論理的に私のケースに近いと思います。
 
昨日、フーブラの記事に情報理論に関する抜粋を追加しました。重要な変数を見つける過程を理解するのに役立つかもしれません。
 
alexeymosc:
自分なりの工夫をしているんですね。私がやっていることとは全く関係ないのですが )))まずは、私が数字にこだわって仕事をしていることから始めましょう。そして、この系列の値をモジュロ(つまりプラスとマイナス)して自己相関図を作ると、周期24のきれいなサイクリックが得られると思いますね。この方が論理的に私のビジネスに近いのです。

あなたが何を言おうとも増分は、連続するそれぞれの1つ前の1つとの差として計算します。グラフが出るんです。

これらの増分でACFを計算します。

最後の列は、棒グラフの間に相関がない確率であることに注意してください。

増分の2乗をとっています。これがそのグラフです。

これらはボラティリティのピークであり、増分の周期性はどう関係するのでしょうか?ボラティリティの周期性かな?それも面白いですね。降着の周期性を確認しよう。

また、最後の欄には、相関がない可能性が極めて高いことを指摘している。

その他、2つの数字が興味深い。増分の正規性を確認しよう。

Jarque-Beraによれば、正規性の確率は0に等しいことに注意!

どのような配信なのでしょうか?普通であればいいんですけどね。私は以前から、後続と前の差分として導き出されるインクリメントで作業するという考え方に疑問を持っていました。

最後になぜか結果が出ません。

 

faa1947 さん、あなたの計算は、トピックの立ち上げ人が言っていた平均的な情報の流れ とは関係ありませんよ。あなたは過去5日間のデータを処理していますが、アレクセイの グラフは十数年分の時計のデータを処理した結果です。アレクセイの 場合は統計ですが、あなたの場合は、議論の文脈上、何も証明しない孤立した一例です。

トピックスターが示す周期性は、ボラティリティやリターンに直接関係するものではありません。価格の周期性ではなく、 インフォマティクスな のです。横軸はラグ、縦軸は平均相互情報量(ビット)である。そして、Alexeyは 皆を混乱させるために、autocorrelogramに言及しました :)リターンの自己相関ではない!このような情報依存性は明らかに大部分が非線形であり、ACFリターンでは全く検出できないので、全く話にならない。

フーブラの記事はよく読まれましたか?それは、あなたの愛する定常性とも、リターンストリームの正規性とも、ボラティリティの条件付き周期性とも、何の関係もない。もちろん、ここでも定常性を確認できればいいのですが、情報的には(あるとすれば)かなり違う種類のものになるでしょう。

2 アヴァルス: 残念ながら、あなたのボラティリティ仮説を直接検証するための深いティック履歴 を見つけることができません。そう、そしてここでの計算は完全に非常識なボリュームになる(すでにかなりのボリュームになっている)。直接予測の試みによって何が見つかるかを判断する(もちろんうまくいけばの話だが、落とし穴もたくさんある)。

 
Mathemat:

アレクセイの 場合は統計ですが、あなたの場合は単一の孤立したケースであり、議論の文脈では何の証明にもなりません。

ただ、観測数が30を超えると、t統計はz統計に収束することに注意したい。10000回の観測が必ずしも1000回より良いというのは、私にとって大きなニュースです。時間単位のデータで週単位の周期性を明らかにするには - 時間単位で数週間が必要です。でも、それはそれでいいんです。


トピックスターターが示す周期性は、ボラティリティやリターンとは関係がない。全然価格の周期性がなくて、 インフォームド・マンションな んです。

それ以上に重要なのは、このアプローチの方法論的な 価値である。どんな数学的計算も、定性的な経済的解釈が必要であることは、私にとって自明の理である。情報の周期性とは、データの周期性を明らかにする何らかの公式であり、本来は漸進的な関係である。元の時系列に戻り、これらの場所を見つけ、経済的な説明を見つけることができなければなりません。つまり、価格に戻ることは必須であり、そうでなければ単なる数学的な巧みさに過ぎません。だから、このトピックを定期的なサイクルにリンクさせたのです。
 
Mathemat: これはリターンの自己相関ではない!?これらの情報依存性は明らかに大部分が非線形であり、ACFリターンでは全く検出できないため、全く話にならない。

実は、論文の最後に、通常の数理統計の手法が適用されているのです。

私は誤解を解き、近隣の価格との比率をとることにしている。

価格比のグラフ。

正規性のチェック

意外なことに、正規性は厳しく否定される。

ACFをプロットする - それは、ラグ間の依存関係+ACFの依存関係からクリーニングされた部分ACFです

最後の列は、依存関係がない確率が非常に高いことに注意してください。

私は、これらの写真について、引用図によって十分に裏付けられた明確な経済的説明を持っています。最初の見積もりでどのように確認されるのか、経済的な正当性はどうなのか。これらの疑問への回答がなければ、「情報依存」の意味が理解できない。

 
一番簡単な答えは、「あなたにとって」です。自己相関を 利用している、つまり線形依存関係だけを探しているのです。相互情報は任意の 依存関係の存在を示すものであり、そこからすべての違いが生まれる。また、数千、数万単位の統計的に冗長なサンプルで実験したところ、1週間かかりましたね。その週は何があってもおかしくない、特別な週なんです。結果には何の意味もありません。
 
faa1947: 情報の周期性とは、本来、漸進的な関係であるデータの周期性を明らかにする何らかの公式のことである。

根本的に間違っている。データには、漸進的な関係のような周期性を問うことはできない。

増分の比率の周期性を全く導く必要のない情報依存性が明らかになった。それがデータマイニングの特徴で、表層にない構造を見出すことが可能になります。

元の時系列に戻り、その場所を見つけ、経済的な説明を見つけることができなければなりません。つまり、価格に戻ることは必須であり、そうでなければ単なる数学的な巧妙さのひとつに過ぎません。だから、このトピックを定期的なサイクルにリンクさせたのです。

経済的な説明が必要なわけではありません。価格に戻るくらいです。しかし、この現象を正常なサイクルと結びつけるのは間違っています。私は、チャート上に顕著な周期性がないことに気づかないほど盲目ではありません。

線形依存と非線形依存の違いについては、すでにアレクセイから聞いて いる。

 
alexeymosc:
あなたにとって一番簡単な答え。自己相関を利用している、つまり線形依存関係だけを探しているのです。相互情報は、任意の種類の 依存関係の存在を示すものであり、それゆえ、すべての違いがある。また、数千、数万単位の統計的に冗長なサンプルで実験したのですが、あなたは1週間かかりましたね。その週は何があってもおかしくない、特別な週なんです。結果には何の意味もありません。

また、私は数千、数万単位の統計的に冗長なサンプルで実験していたのですが、あなたは1週間かかりましたね。その週は何があってもおかしくない、特別な週なんです。結果には何の意味もありません。

サンプルサイズを大きくすることは、確率が正規の法則に収束するという極限定理の範囲内でしか 関心を持たれないようです。そのような目的を設定しなければ、単にサンプル数を増やしても何の意味もないというのが、私の残念なところです。以下、10回分の増量例を挙げる。

前の価格に対する次の価格の比率で増分を表すグラフ。

このグラフの2乗。

グラフはあなたと多少似ていますね。このグラフの経済的な解釈について質問があったのですが、回答がありませんでした。


次のページ


10倍小さいサンプルで比較すると、何も変わっていないのです



ここで新たに、関係がない確率がゼロであることを示す。


相互情報は、任意の種類の 依存関係の存在を示すものであり、それゆえ、すべての違いがある。

また、「直線性」と「非直線性」についても注意が必要です。この問題は、時系列を 近似するモデルの枠組みの中で考えることができますし、そうしなければならないからです。このモデルの係数を分析すると、これらの係数は、定数(またはほぼ定数)、決定論的関数、確率論的関数のいずれかであると結論づけることができます。これは、依存関係のタイプを分析する、完全に具体的かつ建設的なプロセスである そして、この情報依存を発見することの何が建設的なのでしょうか。そしてまた、元の時系列で見るとどうでしょうか。