トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2739

 
mytarmailS #:
アレクセイ、それは普通の検索タスクだよ。

スクリプトがやっているのかやっていないのか?

私はただ、ここでどれだけの人が簡単に会話の糸を見失うのだろうと思っています。

 

私は多くの予測因子を含むサンプルを投稿することができます、誰が最も良いものを選択することができます - よくできました - コンテストを作りましょう。

選んだ予測変数でモデルをトレーニングした後、独立したサンプルでベストを決定する。

誰か参加したい人はいますか?それとも、みんな口コミで実力を知っているのでしょうか?

 

あまりにも一般的な話題。しばしば構成要素に分解される。複数のスレッドに分割される時期がとっくに過ぎている。例えば1.MO:データ前処理。2.MOモデルの選択。3.MO.モデルのトレーニングと最適化4.MO.モデルの実装5.MO.IOオートメーション。

この区分は非常に大きく、おおよそのものだが、枝葉の内容は明らかだろう。そうして、すべてについて、そして何もかもについて。

そして もちろん再現可能なコード例を示す必要がある。

幸運を祈る。

 
Aleksey Vyazmikin #:

では、脚本はそれをやるのかやらないのか?

ここにいる多くの人たちが、会話の糸口を簡単に見失ってしまうことに驚いているんだ。

アレクセイ、あなたはスライディングウィンドウでサインの重要性を見る方法の例を尋ねた。

私はあなたのためにスクリプトを書いた。

それなのに、なぜ過去のスクリプトが未来のあなたの望みを叶えてくれるんだ?

だから、ここで簡単に話の糸口を見失う人が多いことに驚いているんだ。 それは君だよ。

 
Vladimir Perervenko #:

あまりにも一般的な話題。しばしば構成要素に分解される。複数のスレッドに分割される時期がとっくに過ぎている。例えば1.MO:データ前処理。2.MOモデルの選択。3.MO.モデルのトレーニングと最適化4.MO.モデルの実装5.MO.MOEの自動化

この区分は非常に大きく、おおよそのものであるが、枝葉の内容は明らかであろう。そうして、あらゆることについて、そして何もないことについて。

そして もちろん再現可能なコード例を示す必要がある。

幸運を祈る

むしろ、解決する課題によって分けるべきですが、それは個人差がありすぎる......。

例えば、前処理のスレッドで、一方が全サンプルのZZを予測し、もう一方がMOを使って全データから10-20のクラスターを選択するような場合、2人の人間が共通の土台を見つけることはできないでしょう。などなど...。

同じようなことが起こるだろうが、それはトピック上でより汚くなるだろう。
 
Valeriy Yastremskiy #:

もちろん、予測因子と結果の相関を見つけるという目標は明らかだ。唯一新しいと感じたのは、彼はトレーニング全体では約200の有意な特徴を発見しているが、特定のデータではそのうちの5%しか使っていないということだ。

これは、最新のデータに対してのみ、より有意な予測因子を選択するために、系列の状態/特性を素早く決定する方法がいくつかあるということだと理解しました。もちろん、適切な選択のためには量や長さの問題が生じる。しかしどうやら、大規模なトレーニング全体で200の予測変数しか発見・選択されなくてもうまくいくようです。

私はこのように考えて いる。ある系列は、いくつかの指標において安定した特性を持っているが、これらの指標やその数は異なるセクションで異なっている。MOは、系列の安定性が十分持続するいくつかの異なる状態を見つけ、それらは異なるモデルによって記述され、それに応じてモデル設定 - 予測子 - によって記述されます。予測変数の総数は、異なるモデルの設定の総数であり、それゆえ、モデルを定義することによって、そのモデルのために以前に発見された設定を素早く見つけることができる。


一度このスレッドに表を投稿したのですが、今は手元にないので、私の考えを言葉で明確にします。

私が頼りにしているのは、予測者と教師の相関関係という概念です。「連関」とは,MOE のほとんどすべてのモデルに当てはまる予測変数の相関や「重要度」ではない.後者は、予測変数がアルゴリズムで使用される頻度を反映するので、土星の輪やコーヒーのかすに大きな "重要度 "の値が与えられるかもしれない。例えば、情報理論に基づいて予測因子と教師との間の「リンク」を計算できるパッケージがある。

そこで、ここに掲載した表について一言。

その表には、各予測因子と教師との間の「つながり」を数値で推定したものが含まれていた。ウィンドウが移動するにつれて、「連結性」の数百の値が得られた。特定の予測変数のこれらの値は変化した。私は各 "接続 "の平均とsdを計算し,それは以下を可能にした.

- 小さすぎる "結合 "値を持つ予測子を分離 - ノイズ.

- 変動しすぎる "連結 "値を持つ予測変数を分離する.十分に大きな "結合 "値と10%未満のsdを持つ予測変数を見つけることが可能であった.


もう一度言うが,MOに基づくTCを構築することの問題は,"結合 "の値が大きく,窓が動いたときのsdの値が小さい予測変数を見つけることである.私の考えでは、そのような予測変数が、将来にわたって予測誤差の安定性を保証する。


私が上記のことを言ったのはこれが初めてではありません。残念ながら、議論は常にノイズとナルシシズムの中に入っていく。

 
mytarmailS #:

アレクセイ、あなたはスライディングウィンドウを使った特徴の重要性の見方の例を尋ねていますね。

あなたのためにスクリプトを書きました。

それなら、異なるスケールで検索したいとか、何でもいいじゃないか。なぜ、過去のスクリプトが将来あなたの望みを叶えてくれるんだ?

だから、ここで簡単に話の糸口を見失う人が多いことに驚いているんだ。 それは君だよ。

私はスクリプトの作成を依頼した--そう、引用した--「Rで私のサンプルの計算スクリプトを作って くれませんか。実験によって最適なサンプルサイズが明らかになるはずです。"と書いたが、これはすでに行われたことに対する返答である。

先に私は「...」と書いた。そして、あなたはどのようにダイナミクスを見ることを提案し、どのように実現するのですか?「ここで私が質問したのは,ダイナミクスにおける予測変数の推定の実装,つまり,あるウィンドウによる規則的な推定についてです.もしこれがあなたが行ったことだとしたら,私には理解できません.

あなたが投稿したコードは素晴らしいのですが、私にはそれが具体的に何をしているのか、本質的に何を証明しているのか理解するのが難しいので、追加の質問を始めました。グラフのある2つの写真は何を意味しているのですか?

 
СанСаныч Фоменко #:

以前、このスレッドに表を掲載したことがあるが、今手元にないので、私の考えを言葉で明確にしよう。

私が頼りにしているのは、予測因子と教師の相関という概念です。「連関」は、ほとんどすべてのMOEモデルに当てはめた予測変数の相関や「重要度」ではありません。後者は、予測変数がアルゴリズムで使用される頻度を反映するので、土星の輪やコーヒーのかすに大きな "重要度 "の値が与えられるかもしれない。予測変数と教師との間の "リンク "を計算できるパッケージがあり,たとえば情報理論に基づく.

というわけで、ここに掲載した表について一言。

その表には、各予測変数と教師との間の「つながり」の数値的推定値が含まれていた。ウィンドウが移動するにつれて、「連結性」の数百の値が得られた。特定の予測変数のこれらの値は変化した。私はそれぞれの "つながり "の平均とsdを計算した:

- 小さすぎる "結合 "を持つ予測子を分離 - ノイズ.

- 変動しすぎる "連結 "値を持つ予測変数を分離する.リンク "の値が十分に大きく,sdが10%未満の予測変数を見つけることが可能であった.


もう一度言うが,MOに基づくTCの構築の問題は,"link "の値が大きく,ウィンドウが移動してもsdの値が小さい予測変数を見つけることである.このような予測変数が、将来にわたって予測誤差の安定性を保証すると私は考えている。


私が上記のことを言ったのはこれが初めてではない。残念ながら、議論は常にノイズとナルシシズムの中に入っていく。

好奇心旺盛なあなたは、要するに私と同じアプローチをしているわけだ!ただ、"つながり "の探し方は違うかもしれない。窓のように、私は10個のサンプルプロットを取って、その上で "つながり "を探す。

つながりを見つけるアルゴリズムは何ですか?

 
СанСаныч Фоменко #:


私が上記のことを言うのはこれが初めてではない。残念ながら、この議論は常にノイズとナルシシズムに流れている。

そう、本当のディスカスは、バックグラウンドで最もダルタニャンのダルタニャンのプレゼンテーションに行く(モデレートされた言葉) :-)

すべての結果の欠如から。あなたは方法を改善し、変更することができますが、結果は五分五分の岩のようなものです。

 
Aleksey Vyazmikin #:

好奇心旺盛なあなたは、要するに私と同じアプローチをしているわけだ!ただ、"つながり "を探す方法は違うかもしれない。窓のように、私は10個のサンプルプロットを取って、その上で "つながり "を探す。

つながりを見つけるアルゴリズムは何ですか?

私独自のアルゴリズムを使っています。例えば

library("entropy")

グラフを使えばいいのです:



全てはこのスレッドに投稿されている。ウラジミール・ペレヴェンコの 記事には、すべてが体系的に記述され、コードレベルで噛み砕かれている。

理由: