トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Maxim Dmitrievsky 2021.04.02 11:55 #23811

Evgeni Gavrilovi：

ランダムに? ここに示すように?

はい、sklearnのドキュメントで読むことができます。

季節限定バージョンで同じ（ビデオの）テストをしました...あまり何も改善されないようです

Aleksey Vyazmikin 2021.04.02 12:51 #23812

elibrarius:

何か標準的な・古くからあるクロスバリデーションの話ですね。
まず、0-90トレーニング 90-100テスト、次に10-100トレーニング 0-10テスト、次に20-100-10トレーニング 10-20テストなどがあるので、ラインを混ぜずにブロック分けして受講してください。
次に、Pradoのアドバイスに従って、trainとtestの間にスペースを空けておく必要があります（プルーニング）。テストの10〜100の例題に隣接する電車の例題が、そのヒント/シーカーとなる。詳しくはこちら https://dou.ua/lenta/articles/ml-vs-financial-math/
もしくはこちらが画像です。

20％でも、好きなだけでも構いません。

そして最後にクロスバリデーションの代わりにローリングフォワードを適用することができます。これは、テストプロットを円周上に持っていかず、前方だけに持っていくものです。

ここに書かれていることは、すべて私の実験にすでに使われていることです。

これらの仕掛けの目的は何かというと、サンプルをチャンクに分割することで、サンプル全体に内在するパターンがよりノイズの少ないチャンクを見つけることである。分類に寄与するルールのノイズが少ない／顕著であるほど、より優れたモデルになる。そう、この方法には生きる権利があるのですが、ターゲットに関連する予測変数がランダムなものほど多く、予測変数の組み合わせをできるだけ多く収容できるようにサンプルサイズが十分大きいときに使うとよく、予測変数が多いほどサンプルは大きくする必要があります。私のサンプルサイズは20k行（100%）を超えることはほとんどなく、予測変数は2k以上あり、明らかにすべての組み合わせはサンプル自体にフィットせず、モデルによって考慮されないので、常に+-50%以下のRecallとなります。

つまり、各予測格子量子は時間的安定性とターゲットへの素因を評価され、選択された予測量子は1つの2値予測子に結合されます。したがって、ノイズの多い予測量子/分割からクリアされ、ほとんどの予測量子は単に選択をパスしないだけなのです。このような二値化サンプリングの選択結果に基づき、すべての学習サイトにおいて予測因子の挙動が類似しているため、履歴にあった類似の事象が発生した場合にもモデルの安定性に寄与することが期待されます。

Forester 2021.04.02 13:22 #23813

Aleksey Vyazmikin：

ここに書かれていることはすべて、すでに私の実験で使っていることです。

これらの仕掛けの目的は何かというと、サンプルをチャンクに分割することで、サンプル全体に内在するパターンがよりノイズの少ないチャンクを見つけることである。

いいえ - すべてのテストチャンクに渡るモデルの平均値（誤差など）を求めます。または残高の合計。

クロスバリデーションは、初期の行をテストとして使用しても構わないのであれば、問題ないでしょう。
前を向いて歩くというのは、もう無理でしょう。20000行は、先のテストのために多くのチャンクに分割するのは難しいです。

あなたのスキームは非典型的なので、あまりアドバイスになりませんが)

Aleksey Vyazmikin 2021.04.02 13:35 #23814

elibrarius:

いいえ - すべてのテストピースにわたるモデルの平均値（誤差など）を求めます。または残高の合計。

そこで、何がそうさせるのか、そして、後で堅牢になる関係が優勢なプロット、有意な予測因子とターゲットを特定する必要があります。

elibrarius:

クロスバリデーションは、初期のラインをテストとして使うことが許容されるなら、それに越したことはないでしょう。

前を向いて歩くこと、たぶんもう無理です。20000行は、多くのチャンクに分割して先にテストするのは難しいです。

非定型なスキームなので、あまりアドバイスにならない)

初期ストリングスの使用は、量子-サンプルの60％での評価に使用されたという理由で受け入れがたいものです。ここでは、個々のチャンクによって行う全体の評価手順 - しかし、そのポイントは何ですか - グローバルには何もありません。

メソッドLassoは、より良い結果を示した、CatBoost- 私は確かに後で他のサンプルで比較しますが、どうやらそれは非常に単位10〜20％、バイナリ予測器を排出し、一般化することができます。しかし、それをどのように収益抽出に生かすかが問題です。

Maxim Dmitrievsky 2021.04.03 03:48 #23815

Aleksey Vyazmikin：

L2正則化を減らしても改善されなかった。だから、Lassoの方が良い結果になるんです。

良くなった...どちらも悪い、数パーセントの差はある。

Aleksey Vyazmikin 2021.04.03 10:36 #23816

マキシム・ドミトリエフスキー：

どう良くなったのか...あるものは悪く、あるものは数％の違い

4％の精度は金額的にも大きい。利益率も期待値も上がるぞ。

mytarmailS 2021.04.04 08:30 #23817

誰が10年間のユーロ5分を持っている私達にtxtまたはcsvを送信してください。

Evgeny Dyuka 2021.04.05 07:36 #23818

ブラウザでニューラルネットワークの予測を描きました。インジケータを入手し、エントリーポイントを示そうとした。
リンクは私のプロフィールにあります。

Maxim Dmitrievsky 2021.04.05 14:20 #23819

mytarmailS:
10年後のeur 5minをお持ちの方はtxtかcsvをお送りください。

端末のダウンロードはできないのですか？

ファイル:

EURUSD_M5_201001040000_202104051715.zip 9489 kb

Vitaly Muzichenko 2021.04.05 16:25 #23820

マキシム・ドミトリエフスキー：

端末のダウンロードはできないのですか？

10年間、M5の見積もりでテスト ...家計に迷惑をかける前に、端末を隠しておく必要がある。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2382