引用における依存性統計(情報理論、相関などの特徴選択法) - ページ 30

 
faa1947:

自己相関と確率密度関数のタイプの残差分析。 また、当然ながらR^2も。これらは、原理的には一般的な時系列予測手法である。

これはあくまでスタート地点であり、一般的に受け入れられているという意味では、完全なものではありません。ここでは、あくまで使用例ではありますが、コンプリートをご紹介します。係数、残差、安定性の3つの解析グループ。矛盾を調整できれば、推定値が得られるかもしれない。目標は予測値で、それ以外は中間結果なので、常に予測誤差がある。

そうですね、FULLの学術的な研究はしたことがないと思います。通常、この仕事には時間と労力が不足しているので、私は近道として、複数(2つ以上)の予測モデルを構築して残差分析を行い、残差系列の精度と品質をバランスよく評価した上で、1つのモデルを選択します。時間があれば、予測器の信頼性推定を深く掘り下げることができるのは、私も同感です。

ちなみに、予測器の精度や安定性を調べるのに、比較的低コストで良いのがクロスバリデーションで、訓練期間と検証期間を何度も選んで、最終的に元の系列全体を小さなセグメントに分割し、それぞれのセグメントを検証サンプルに含めます。

 
alexeymosc:

ええ、FULL学術的な研究はしたことがないと思います。通常、私の仕事では時間と労力が足りないので、近道として、複数(2つ以上)の予測モデルを構築して残差分析を行い、残差系列の精度と質をバランスよく見積もって、1つのモデルを選択するようにしています。時間があれば、予測器の信頼性推定を深く掘り下げることができるのは、私も同感です。

ところで、予測器の精度や安定性を調べるのに、比較的低コストで良いテストがクロスバリデーションです。訓練期間と検証期間を何度も選び、最終的には元の系列全体を小さなセグメントに分割して、それぞれのセグメントを検証サンプルに含めます。

私は長い間、自らの経験から得たアドバイスとして、次のようなことを述べてきました。30年ほど前から、特に最近は、ある分野をマスターするために、その分野に特化した既成のパッケージを受講することが最も生産的な方法になっています。EViewsを紹介しましたが、これだけがパッケージではありません。ただ、このパッケージは、私たちの大学での授業で使われています。パッケージを利用することで、得られるものがあります。

数百万人のユーザーによって検証された膨大な数の機能的な専門プログラム

分析スキーム

分析の完全性

使用したアルゴリズムの引用元となったリファレンス。

経験と展望を得た上で、いくつかの強化に移ることができます。しかし、これらの改良は、対象分野に関する体系的な知識に基づくものであり、上記の一部のようにピータースやプトレマイオスのような人物を持ち込むことは思いもよらないことでしょう。

 
faa1947:

私は長い間、自らの経験から次のようなアドバイスをしてきました。30年ほど前から、特に最近は、ある分野を学ぶのに最も生産的な方法は、その分野に焦点を当てた既成のパッケージを受講することです。EViewsを紹介しましたが、これだけがパッケージではありません。ただ、このパッケージは、私たちの大学での授業で使われています。手に入れたパッケージを使うこと。

数百万人のユーザーを対象とした、機能的でテスト済みの多数の専用プログラム

分析フレームワーク

分析の完成度

使用したアルゴリズムが引用された文献のリスト。

経験と展望を得た上で、あらゆる改善策に着手してください。しかし、これらの改良は、対象分野に関する体系的な知識に基づくものであり、上記の一部の人々のように、ピータースやプトレマイオスのような人物を持ち込むことは思いもよらないことでしょう。


申し訳ありませんが、メインは正しい問題文と結論です。例えば、「指標の診断」に関連する条文に書かれていることや、残差に基づいて指標が有用であるか否かの結論を出すことなどです。- は正しくない(imha)。その指標は、シリーズ全体で予測しなければならない、あるいは全く役に立たないと言うことがないのと同じです。利益を得るために常に価格を予測する必要はなく、比較的まれな瞬間にのみ価格を予測することができます。一回の価格変動ではなく、システムの堅牢性と過去の統計の繰り返しであるため、ある意味での予言。また、予測をするのは指標ではなく、あくまでもシステム全体です。

P.S. 記事はやはり役に立ちました、ありがとうございます :)

 
Avals:


例えば、「指標診断」に関連して記事にしたこと、残差からその指標が有用か否かを結論づけること等です。- は正しくない(imha)。また、インジケータは全範囲で予測したり、全く役に立たなければならないというわけではありません。

確かに、この記事は、アプローチ全般、いわば方法論の全体像を示すことが目的であったため、多少のためらいを感じながら書きました。

常に価格予測をする必要はなく、比較的稀な瞬間にのみ利益を出すことができる

全く同意できない。どんなTSでも、それを認めるかどうかは別として、常に予測はしています。ポジションを取るか、撤退するか、市場から撤退するか、市場にとどまるか、といった将来の ための意思決定を行うために、周期性をもって分析が行われるのである。これらの意思決定は、将来の市場動向の予測に基づいて行われます。

予測されるのは単一の価格変動ではなく、システムの頑健性です。

ロバスト性は予測するものではなく、構築するものであり、構築の結果は予測誤差で評価される。誤差の分散が一定に近ければ、システムは安定となる。

そして、予測するのは指標ではなく、あくまでもシステム全体です。

当然です。この記事では、システムが単一のインジケータで構成されていることを想定しています。このように単純化しても、記事は複雑になりすぎています。

もし、記事の詳細について議論したいのであれば、適切なトピックに移動することをお勧めします、多分他の人も参加するでしょう。このスレッドは、結局のところ話題が違う。

 
faa1947:

利益を上げるために常に価格を予測する必要はなく、比較的稀なケースのみ

まったくもって同意できない。どんなTSでも、それを認めるかどうかは別として、常に予測はしている。TSの周期性を利用して、将来の ための意思決定を行うために分析が行われます ポジションを取る、終了する、市場から撤退する、または市場に滞在する。これらの決定は、将来の市場動向の予測に基づいて行われます。


予測する必要はないが、継続的に 予測する必要はない :)離散的な瞬間だけで,系列全体に対する指標の残差をチェックすることで,実際に系列を連続的に予測する能力が試される
faa1947

予測されるのは単一の価格変動ではなく、システムのロバスト性

ロバスト性は予測するのではなく、構築するものであり、構築の結果は予測誤差で評価される。誤差の分散が一定に近ければ、システムは安定となる。

個々のトレードの結果は重要ではなく、多くのトレードの統計が重要なのです。バックテストの良好な統計値と少なくとも部分的に対応している必要があります。ですから、システム運用にお金を出すということは、まさにこのこと、つまり、私たちの有利な統計が(システム的に)残ることに賭けているのです。そして、それがロバスト性
 
alexeymosc:

という可能性もあります。しかし、X[t]-X[t-1]という形の帰線列を作ると、ほとんど表示されない。私はリターン、インクリメント、リターンという言葉を使っていますが、それらはすべて差別化された価格系列です。

これは簡単に検証できることであり、言語学的な議論は必要ない :) 。ちなみに、この掲示板で調べてみるのもいいと思います。

符号の変化方向への確率の偏りはごくわずかであり、重要ではない。しかし、2つ以上のラグで従属変数とリターンの間の条件付きエントロピーを計算すると、結果の図にすべてのムラが説明されるので、エントロピーが減少する。

もう一度言いますが、効果の強さはTFに依存しますが、ランダムなティックで生成されたH1は、リアルリターンのティックで生成されたH1に似ているでしょうか?

NSを1時間ごとのデータで学習させようと、最も情報量の多いラグだけを取りました(42変数、ラグ1, 2, 23, 25,... 479, 480, 481にあります)。残念ながら、結果はあまりうまくいきませんでした。分位数の予測精度 - 30-40%の領域で。しかし、ニューラルネットワークは不規則性を出力に変換することはできたが、その依存関係は予測には十分ではない。全体の問題は、独立変数がラグ1、2、24...で相互に情報を持っていることです。と、ゼロバーに関する情報の総量は本当に少ない。日足以上の時間枠を取ることも選択肢の一つとして考えるべきでしょう。


私は最初から、この技術は予測に役立つものも役に立たないものも含めて、すべての依存関係を感知していると考えていました。ボラティリティについては、そのような仮定を裏付ける明確な根拠がここにあります。つまり、あなたのその「情報的」なラグは、単にこのような予測に役に立たない情報で詰まっている可能性があるのです。

このスレッドでの私の出番は終わったか、まだ来ていないかのどちらかだと思います :).噴水はそろそろお休みでしょうか :) 。

 
Candid:


私は最初から、予測に適した依存関係も無用な依存関係も、この方法論が感知してくれるものと思っていました。ボラティリティに関しては、その前提を裏付ける根拠がここにある。つまり、あなたのその「情報的」なラグは、単にこのような予測に役に立たない情報で詰まっている可能性があるのです。

私もかなり実感しています。問題は、価格変動の兆候を 示す情報的なサインを見つけるレベルまで複雑になっている。そして、もし日中の時間枠で、必要な情報量のラグが周期的であることが判明したら(私はそうだと思う)、ゼロバーでの値動きの方向に関する情報の総量は非常に小さくなる......。

これは私が確認します。次にあるのは:日足バーを調査しようとすると、おそらく週はまだ統計的に信頼できるかもしれません。しかし、そこでも情報量の多いラグが周期的に発生するのであれば、残念ながらラグだけを使うという発想は成り立たないと思います。それから、インジケーターを試してみるのもいいでしょう。

ちなみに、最初からそのように計画していたんです。でも、テストするまでは、噴水が消えないんです。

"つまり、あなたのこの「有益な」ラグは、このような予測に役に立たない情報で詰まっているだけかもしれないのです。"

また、「役に立たない情報」というのはどういう意味ですか?なるほど、ボラティリティは私たちの味方ではありませんね。また、ノイズ成分もあります。早い段階で方式を破棄することを決めたのでしょう。どんな道具も使い方を知らなければなりません。私はまだ勉強中で、だからここではカロリーよりも水の方が多いのです。

すでに提案したことですが、任意の指標とそれが示すターゲットを掲載してください。一つの条件として、Echelの数式によるものであること、そのパラメータを弄れる可能性があることです。例えば、最大6本のバーで価格が下がる、あるいは現在の 価格を10ポイント上回るなど、目標も具体的であるべきです。データを実行して、情報エントロピーの観点から最適なインジケータ・パラメータ群をお示しします。

 
Avals:
現実には、少なくともバックテストの統計と部分的には一致するはずです。
好意的」であることを希望する、あるいはこの「好意的」を表す数値表現を持っている。上記で私は、予測誤差の分散変動が5%を超えてはいけないという推定値の1つを挙げました。しかし、堅牢なシステムの要件はこれだけではありません。そして、バックテストは、それが変わらないことを期待させるだけです。
 
faa1947:
好意的に」望むこと、またはこの「好意的」を表す数値表現があること。上記では、計算値の1つとして、予測誤差の分散変動が5%を超えないようにすることを挙げました。しかし、堅牢なシステムの要件はこれだけではありません。そして、バックテストは、それが変わらないことを期待させるだけです。


はい、ロバスト性を評価する方法はあります。

トピックとあなたの記事に適用:正のMOを持つ定常形に価格シリーズ全体をもたらす方法は、常に市場にある収益性の高い堅牢なリバーサルシステムを作成することです。これは、実系列とランダムなさまを見分ける方法にも当てはまります。それは、実は、あなたのテストに合格する指標であり、本物のシリーズとSBを見分ける基準は、このシステムのアルゴリズムなのです。したがって、ランダムに取った指標や相互情報交換法が、そのような相場のアルゴリズムであると考えるのは、甘い。それは、純粋に偶然にしか起こり得ないことなのです。

 
faa1947:

効率的市場理論は、計量経済学では考慮 されない。その前提はすべて、市場が効率的でないという事実に基づいている。計量経済学には、マーコウィッツとその弁明者たち、そして彼らの効率的なポートフォリオが含まれていない。計量経済学は100年以上の歴史があるが、もともと市場が非定常 であることを前提にしているので、ピータースやマンデルブロなどによって反証されたことはない。

一歩先の予測を正当化し、数歩先の予測を致命的に悪化させる理由を示すのが計量経済学である。


問題は、マクロ指標は定期的に重み付けなどを変更する可能性があること、また、完全な分析に利用できる期間が短いことです。

もちろん、私もそう思います。分析には位相が必要ですが......。