トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2023.10.26 18:00 #33231

Andrey Dik #:

そう、問題は常に新しいデータに対するモデルのロバスト性を保証することだ。ですから、そのような基準を見つけることが最も重要で難しいことの一つだと申し上げたのです。

つまり、私たちがトレーディングや機械学習で使い慣れた結果評価基準は、結果として得られたモデル／チューニング／近似の品質を評価するための一部に過ぎないということです。

重要なのは、どのような条件でこれを達成したかである。そのためにどれだけの情報が必要だったのか。時間経過に伴うオブザベーションの安定性を評価する必要がある。各予測変数の寄与。

多数の予測変数と決定ルール（それが木であれニューロンであれ）を持つ複雑なモデルの問題は、それらが全体として繰り返される可能性が低い複雑なパターンを作成することであり、それゆえクラスの1つに割り当てられる確率に偏りが生じることである。以前、私は「樹木が騒いでいること」の写真を投稿したが、それによると、ほとんどの葉は単に新しいデータでは活性化しないだけである。

これはすべて、近似するために完全に探索することができない「関数」（実際にはそれらの合計）を扱っているという事実からきている。つまり、より理解されている／知られているものだけに特別な注意を払う必要があるということだ。モデルは、過去の単一ケースを操作するよりも、状況に精通していないため、新しいデータに対して「沈黙を守る」方が良いのである。

つまり、確信が持てない場合にはモデルを沈黙させ、有利な事象が起こる確率が高い場合には確信を持たせるにはどうすればよいかという問題が生じる。

既成のモデルを修正する方法が必要なのだ。訓練後にモデルに影響を与えたり、2つのクラスのモデル-1つはブスティングタイプ、もう1つは最近傍タイプ-を適用することで実施できる。

Andrey Dik 2023.10.26 18:11 #33232

Aleksey Vyazmikin #:

私が言いたいのは、トレーディングや機械学習で使い慣れた結果評価指標は、結果として得られるモデル／チューニング／近似の質を評価するための一部に過ぎないということだ。

重要なのは、どのような条件下でこれを達成したかである。そのためにどれだけの情報が必要だったのか。時間経過に伴うオブザベーションの安定性を評価する必要がある。各予測変数の寄与。

多数の予測変数と決定ルール（それが木であれニューロンであれ）を持つ複雑なモデルの問題は、それらが全体として繰り返される可能性が低い複雑なパターンを作成することであり、それゆえクラスの1つに割り当てられる確率に偏りが生じることである。以前、私は「樹木が騒いでいること」の写真を投稿したが、これはほとんどの葉が単に新しいデータでは活性化しないことを示している。

これはすべて、近似するために完全に探索することができない「関数」（実際にはそれらの合計）を扱っているという事実からきている。つまり、より理解されている／知られているものだけに特別な注意を払う必要があるということだ。新しいデータに対しては、その状況に精通していないモデルを "沈黙 "させておく方が、過去の単一ケースを操作するよりも良いのである。

つまり、確信が持てない場合にはモデルを沈黙させ、有利な事象が起こる確率が高い場合には確信を与えるにはどうすればよいかという問題が生じる。

既成のモデルを修正する方法が必要なのだ。これは、トレーニング後のモデルへの影響によって実装することもできるし、2つのクラスのモデル-1つはブスティングタイプ、もう1つはK最近傍タイプ-を適用することもできる。

私は以前、時間の経過とともに売買シグナルを出さなくなるモデルを作ったことがある。そして、これは新しいデータで正解の確率を50/50にシフトするよりも良い。ポイント - グリッドの答えを狭い範囲の数値で得るように訓練すると、時間が経つにつれて答えが範囲外になり始め、シグナルが消えてしまう。これは非常に手間のかかるプロセスで、私はトレーニングとさらなる取引を自動化することはできていない。

これはアプローチの一つであり、おそらく他にもあるので、このトピックを研究する必要がある。

Ivan Butko 2023.10.26 18:31 #33233

Andrey Dik #:

本質 - 狭い範囲の数字でグリッドの答えを打つことを達成するために訓練中に、時間の経過とともに答えが範囲外に行くようになり、信号が消えます。これは非常に手間のかかるプロセスで、私はトレーニングとさらなる取引を完全に自動化することはできていない。

私はこのアイデアをMT5オプティマイザーの助けを借りて実装した。

私は擬似ニューロンに条件を設定した：「
入力 -Close[2];

オプティマイザーは収益性の高い取引を懸命に探し始めますが、その代わりに取引回数でセットを並べ替えます。

オプティマイザーが終了すると、取引回数が最大で最も消耗の激しいセットを選択します。これは当然、Expert Advisorが未来の価格を最大数推測したことを意味します。

次に、テストモードに切り替える。このモードでは、すでに条件が変更されている。「セットの結果がClose[1]よりNポイント大きい場合、買いを建てる」

ほら、1年後にフォワードが利益を上げている。

一つ問題がある。それは、午前2時の1時間足のローソク足でしか機能しなかったことだ。

どうにかそのようなパターンを見つけた。それは別の朝の時間にEURUSD、USDCHFとEURGBPで動作しました。

Aleksey Vyazmikin 2023.10.26 18:35 #33234

Andrey Dik #:
狭い数値範囲でのグリッド回答

NSのことですか、それとも別のグリッドのことですか？

Andrey Dik#:
時間が経つにつれて、回答が範囲外に移動し始め、シグナルが消えます。

予測変数の合計が変化したためでしょうか、それとも1つだけが「望ましい」結果を示さなくなったのでしょうか？

一般的に、何かが壊れた理由の質問は、さらなるアイデアを得るために非常に重要です。

Andrey Dik 2023.10.26 18:45 #33235

Aleksey Vyazmikin #:

1.NSのことですか、それとも別のグリッドのことですか？

2.予測変数の合計スコアが変化したためでしょうか、それとも1つだけが「望ましい」結果を示さなくなったのでしょうか？

一般的に、なぜ何かが壊れたのかという疑問は、さらなるアイデアのために非常に重要である。

1.はい、もちろんです。

2.言い方が悪かったかもしれない。いや、それは単なるプラス効果で、新しいデータではトレードが徐々に無になる。トレードの回数が単位時間あたり一定レベル以下に減ったら、すぐにまたトレーニングする必要がある。つまり、再トレーニングのシグナルとしてのOOSでの取引効率の低下ではなく、取引回数の減少である。

つまり、OOSでの取引の損失をもたらす無意味な話をする代わりに、NSはよくわからないデータに対して沈黙を与える。

Aleksey Vyazmikin 2023.10.26 18:48 #33236

Aleksey Nikolayev #:
あなたのリンク先では、"プロファイル "とクロスバリデーションとの関連についても言及されているが、これについてはパケットを見つける方が簡単かもしれない。

私はここでのつながりがわかりません。どのような言葉から来ているのでしょうか？

Aleksey Vyazmikin 2023.10.26 18:50 #33237

Forester #:

作品は実験的だ。以下はhttp://www.ccas.ru/frc/papers/students/VoronKoloskov05mmro.pdf からの引用である。

すべての実験がパッケージとして作成されたとは考えにくい。

それと、この実験は人為的なものだ。クラスごとに明確に分けられたデータセットにノイズが加えられた。しかも、明確に分離されているのは1つの特徴（Y軸）のみである。ノイズ（0.2から0.8までのすべてのデータ）を取り除くと、他のクラスとの距離が0.6以下でない例だけが残ることがわかった。つまり、写真の中で最も複雑な3番目の変形です：

実世界に行き、この1つの作業フィッシュにノイズとなる5000の予測変数を追加します。クラスタリングでは、この5001次元空間におけるポイント間の距離の合計を計算します。このカオスでは、0.6の作業は決して見つかりません。

、どんな分類器でももっとうまくいくと思います。同じツリーがこの単一の特徴を見つけて、まず0.5で分割し、次に0.2と0.8の分割に達し、純度100％の葉が続きます。

このアルゴリズムでkagleで1位を取ることができたと言われていますが、単純な作業ではないと思うのですが......。

試してみましょうか？数式は理解できない。

Aleksey Vyazmikin 2023.10.26 18:52 #33238

mytarmailS #:
ウラジミール・ペレヴェンコの記事のひとつに、この方法が紹介されていて、もちろんコード付きの例もあった。

私はビデオでこのアルゴリズムについて学びましたが、スレードにはいくつかの数式があり、コードと呼ぶのは難しいです。

どこでコード例を見たのですか？

Aleksey Vyazmikin 2023.10.26 18:53 #33239

Andrey Dik #:

1.はい、もちろんです。

2.そういう言い方はしなかったかもしれない。いや、それは単なるプラス効果で、新しいデータではトレードは徐々に無になる。単位時間あたりのトレード回数が一定レベル以下に減ると、すぐにまたトレーニングする必要がある。つまり、再トレーニングのシグナルとしてのOOSでの取引効率の低下ではなく、取引回数の減少である。

つまり、OOSでの取引による損失をもたらす無意味な話をする代わりに、NSはそれに対してよくわからないデータに対して沈黙を与えるのである。

それが私の実感です。ただ、その原因は特定されているのかどうか。何が壊れているのかではなく、なぜシグナルが消えているのか。

mytarmailS 2023.10.26 18:54 #33240

Aleksey Vyazmikin #:

このアルゴリズムについてはビデオで学んだ。

どこでコードの例を見たのですか？

これは荒らしですか？

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3324