トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2019.02.21 05:11 #13531

Yuriy Asaulenko：

アーカイブを残す。添付ファイルをご覧ください。

Learn.csv - 入力。各行の一番最初の桁は歴史的な縛りなので、削除してください。

Cell.scv - ターゲット

このデータでトレーニングすると、このようなチャートになるはずです。

フィルターはEMA(16)にほぼ等しく、予測は-5分です。

後日、必要な時にテストを実施します。

このグラフがトレーニングチャートなのか、テストチャートなのか、よくわからないのですが。

こちらはテスト中のCatBoost- 直近100件の値です。

偏差値のヒストグラム。

トレーニング用に4000行、検証用に2000行、テスト用に100行を取りました。深さ6の木を1000本、RMSE式（ポアソンに置き換えた）で学習させた。

添付のサンプルと設定、再生にはCBをダウンロードし、Setupディレクトリに置く必要があります。

トレーニングサンプルでは、同じ分布があなたのように見えません。

追記：モデルの適用に誤りがあり、確率プロットが判明しました。

ファイル:

Setup.zip 587 kb

Yuriy Asaulenko 2019.02.21 05:48 #13532

アレクセイ・ヴャジミキン

どのサンプルでこのグラフを取得したのか、トレーニングなのかテストなのか、よくわからないのですが。

こちらはテスト中のCatBoost - 直近100件の値です。

偏差値のヒストグラム。

トレーニング用に4000行、検証用に2000行、テスト用に100行を取りました。深さ6、RMSE式で1000本の木を学習させました。

添付のサンプルと設定、再生にはCBをダウンロードし、Setupディレクトリに置く必要があります。

トレーニング用サンプルでも、あなたのような分布は見られません。

私のグラフは、全サンプルに対してのみトレーニングを行っています。これについては、テストはしていない。トレーニングの内容とほぼ同じになる予定です。

X軸プロットの負の値はどこに行ったのでしょうか？また、xの値の範囲は yと同じではない？どうしてですか？

予測値と実測値（目標値）を比較したグラフがあるのですが。配信はしていません。

Aleksey Vyazmikin 2019.02.21 05:58 #13533

ユーリイ・アサウレンコ
私のグラフは、全サンプルに対してのみトレーニングを行っています。これについては、テストはしていません。トレーニングの内容とほぼ同じになる予定です。

グラフのX軸のどこにマイナスの値があるか？また、xの値の範囲は yと同じではない？どうしてですか？

予測値と実測値を比較したグラフがあるのですが、これはどうでしょうか？

そうですね、回帰はやったことがないので、分類とは違って、わかりにくいフィットネス関数がたくさんあって、違う結果を出してしまい、間違った値を取ってしまったんです。

こちらがテストサンプルです。

そして、こちらがトレーニングサンプルで、4000行です。

テストサンプルの偏差値のヒストグラム

3つのサンプルの全体グラフはこちら。

テストサンプルのトレーニングに使用されたメトリック

250回の反復で学習を止めればよかったのに、モデルは再学習されるそうです。

Yuriy Asaulenko 2019.02.21 06:08 #13534

アレクセイ・ヴャジミキン

そうなんです、回帰はやったことがないんです、分類と違って不明瞭なフィットネス関数がたくさんあって、結果が違うんです、間違った値を取ってしまったんです。

こちらがテストサンプルです。

そして、こちらがトレーニングサンプルで、4000行です。

テストサンプルの偏差値のヒストグラム

以下は、3サンプルの一般的なグラフです。

問題なさそうです。テストでも、再教育されたが）。

Aleksey Vyazmikin 2019.02.21 06:10 #13535

Yuriy Asaulenko:
問題なさそうですね。

まあ、そうですね、改善しようと思えばできますね。ただ、私は回帰モデルの経験がないんです。

つまり、主な予測因子は作業用具ということですね :)

設定済みの最終版を添付します。異なるSeedを持つ10個のモデルをトレーニングします。

ファイル:

Setup.zip 588 kb

Yuriy Asaulenko 2019.02.21 06:20 #13536

アレクセイ・ヴャジミキン

まあ、そうですね、改良しようと思えばできますね。ただ、私は回帰モデルの経験がないんです。

つまり、主な予測因子は作業用具ということですね :)

入力として、スケーリングされた価格系列がある。- 20の近い値で、それだけです。予測器の問題ではなく、問題の定式化-それは解決可能なのです。そして、あなたの森は予測因子そのものを思いつくでしょう）。

Aleksey Vyazmikin 2019.02.21 07:37 #13537

ユーリイ・アサウレンコ
入力にスケーリングされた価格系列がある。- 近い値が20個あって、それでおしまい。予測器ではなく、問題を定式化することで、解決することができるのです。そして、あなたの森が勝手にプレディクターを考えてくれる）。

そうですね、問題文のことですね、納得です。ただ、私は価格をパイを成形するための生地とは考えておらず、そのパイを成形するために予測因子が必要だと考えています。

Aleksey Vyazmikin 2019.02.21 07:38 #13538

マキシム・ドミトリエフスキー

モデルを改善する古典的なテクニックの一つです。というか、最適なものを見つけてください。モンテカルロの応用の原点。

https://en.wikipedia.org/wiki/Importance_sampling

この方法を記事で応用したのでは？

Aleksey Vyazmikin 2019.02.21 07:39 #13539

マキシム・ドミトリエフスキー

オフポリシー（政策勾配）RLについて

https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6

ロシア語で、どういう考えなのか、自分の言葉で説明してください。いわば英語で)

Forester 2019.02.21 19:11 #13540

ユーリイ・アサウレンコ

私たちが予測したLPFフィルターは、かなりうまくいっています。今でも2人で、NSどころか、森まで。では、価格を予想してみましょう。これは全く無意味な運動です）。むしろ、（期待値が）現在不明である価格期待値の変化のうち、RF成分を予測したいのです。そしてここでは、あらゆる種類の動きやHFの振動など、あらゆることを想定しています。

つまり、1mTFで予測時間は5mという結果が得られました。

いつものように、xが予測値、yが実測値です。45度に傾斜させると長方形に見えますね、円にならなくてよかったです。xのゼロから少し右左に移動すると、50％強の確率で遊ぶこともできる（領域参照）。

もちろん、いろんな回帰線や分布が作れればいいのですが、スライスくらいは必要ですからね〜、それは後回しにして。

PS さて、そして少し修正したアルゴリズムを使った予想です。タイムフレーム1mで同5分。

もうだいぶ良くなっています)2以上、-2未満の予想からхでスタートし、単純に5分で決済すれば損失のあるトレードはほとんど期待できない。

2枚目の写真は本当に良いですねアルゴリズムのどのような変更がそれを可能にしたのでしょうか？

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 1354