トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2382 1...237523762377237823792380238123822383238423852386238723882389...3399 新しいコメント Maxim Dmitrievsky 2021.04.02 11:55 #23811 Evgeni Gavrilovi: ランダムに? ここに示すように? はい、sklearnのドキュメントで読むことができます。 季節限定バージョンで同じ(ビデオの)テストをしました...あまり何も改善されないようです Aleksey Vyazmikin 2021.04.02 12:51 #23812 elibrarius: 何か標準的な・古くからあるクロスバリデーションの話ですね。 まず、0-90トレーニング 90-100テスト、次に10-100トレーニング 0-10テスト、次に20-100-10トレーニング 10-20テストなどがあるので、ラインを混ぜずにブロック分けして受講してください。 次に、Pradoのアドバイスに従って、trainとtestの間にスペースを空けておく必要があります(プルーニング)。テストの10〜100の例題に隣接する電車の例題が、そのヒント/シーカーとなる。詳しくはこちら https://dou.ua/lenta/articles/ml-vs-financial-math/ もしくはこちらが画像です。 20%でも、好きなだけでも構いません。 そして最後にクロスバリデーションの代わりにローリングフォワードを適用することができます。これは、テストプロットを円周上に持っていかず、前方だけに持っていくものです。 ここに書かれていることは、すべて私の実験にすでに使われていることです。 これらの仕掛けの目的は何かというと、サンプルをチャンクに分割することで、サンプル全体に内在するパターンがよりノイズの少ないチャンクを見つけることである。分類に寄与するルールのノイズが少ない/顕著であるほど、より優れたモデルになる。そう、この方法には生きる権利があるのですが、ターゲットに関連する予測変数がランダムなものほど多く、予測変数の組み合わせをできるだけ多く収容できるようにサンプルサイズが十分大きいときに使うとよく、予測変数が多いほどサンプルは大きくする必要があります。私のサンプルサイズは20k行(100%)を超えることはほとんどなく、予測変数は2k以上あり、明らかにすべての組み合わせはサンプル自体にフィットせず、モデルによって考慮されないので、常に+-50%以下のRecallとなります。 つまり、各予測格子量子は時間的安定性とターゲットへの素因を評価され、選択された予測量子は1つの2値予測子に結合されます。したがって、ノイズの多い予測量子/分割からクリアされ、ほとんどの予測量子は単に選択をパスしないだけなのです。このような二値化サンプリングの選択結果に基づき、すべての学習サイトにおいて予測因子の挙動が類似しているため、履歴にあった類似の事象が発生した場合にもモデルの安定性に寄与することが期待されます。 Forester 2021.04.02 13:22 #23813 Aleksey Vyazmikin: ここに書かれていることはすべて、すでに私の実験で使っていることです。これらの仕掛けの目的は何かというと、サンプルをチャンクに分割することで、サンプル全体に内在するパターンがよりノイズの少ない チャンクを 見つけることである。いいえ - すべてのテストチャンクに渡るモデルの平均値(誤差など)を求めます。または残高の合計。クロスバリデーションは、初期の行をテストとして使用しても構わないのであれば、問題ないでしょう。 前を向いて歩くというのは、もう無理でしょう。20000行は、先のテストのために多くのチャンクに分割するのは難しいです。 あなたのスキームは非典型的なので、あまりアドバイスになりませんが) Aleksey Vyazmikin 2021.04.02 13:35 #23814 elibrarius: いいえ - すべてのテストピースにわたるモデルの平均値(誤差など)を求めます。または残高の合計。 そこで、何がそうさせるのか、そして、後で堅牢になる関係が優勢なプロット、有意な予測因子とターゲットを特定する必要があります。 elibrarius: クロスバリデーションは、初期のラインをテストとして使うことが許容されるなら、それに越したことはないでしょう。前を向いて歩くこと、たぶんもう無理です。20000行は、多くのチャンクに分割して先にテストするのは難しいです。 非定型なスキームなので、あまりアドバイスにならない) 初期ストリングスの使用は、量子-サンプルの60%での評価に使用されたという理由で受け入れがたいものです。ここでは、個々のチャンクによって行う全体の評価手順 - しかし、そのポイントは何ですか - グローバルには何もありません。 メソッドLassoは、より良い結果を示した、CatBoost- 私は確かに後で他のサンプルで比較しますが、どうやらそれは非常に単位10〜20%、バイナリ予測器を排出し、一般化することができます。しかし、それをどのように収益抽出に生かすかが問題です。 Maxim Dmitrievsky 2021.04.03 03:48 #23815 Aleksey Vyazmikin: L2正則化を減らしても 改善されなかった。だから、Lassoの方が良い結果になるんです。 良くなった...どちらも悪い、数パーセントの差はある。 Aleksey Vyazmikin 2021.04.03 10:36 #23816 マキシム・ドミトリエフスキー: どう良くなったのか...あるものは悪く、あるものは数%の違い 4%の精度は金額的にも大きい。利益率も期待値も上がるぞ。 mytarmailS 2021.04.04 08:30 #23817 誰が10年間のユーロ5分を持っている私達にtxtまたはcsvを送信してください。 Evgeny Dyuka 2021.04.05 07:36 #23818 ブラウザでニューラルネットワークの予測を描きました。インジケータを入手し、エントリーポイントを示そうとした。 リンクは私のプロフィールにあります。 Maxim Dmitrievsky 2021.04.05 14:20 #23819 mytarmailS: 10年後のeur 5minをお持ちの方はtxtかcsvをお送りください。 端末のダウンロードはできないのですか? ファイル: EURUSD_M5_201001040000_202104051715.zip 9489 kb Vitaly Muzichenko 2021.04.05 16:25 #23820 マキシム・ドミトリエフスキー: 端末のダウンロードはできないのですか? 10年間、M5の見積もりでテスト ...家計に迷惑をかける前に、端末を隠しておく必要がある。 1...237523762377237823792380238123822383238423852386238723882389...3399 新しいコメント 取引の機会を逃しています。 無料取引アプリ 8千を超えるシグナルをコピー 金融ニュースで金融マーケットを探索 新規登録 ログイン スペースを含まないラテン文字 このメールにパスワードが送信されます エラーが発生しました Googleでログイン WebサイトポリシーおよびMQL5.COM利用規約に同意します。 新規登録 MQL5.com WebサイトへのログインにCookieの使用を許可します。 ログインするには、ブラウザで必要な設定を有効にしてください。 ログイン/パスワードをお忘れですか? Googleでログイン
ランダムに? ここに示すように?
はい、sklearnのドキュメントで読むことができます。
季節限定バージョンで同じ(ビデオの)テストをしました...あまり何も改善されないようです
何か標準的な・古くからあるクロスバリデーションの話ですね。
20%でも、好きなだけでも構いません。まず、0-90トレーニング 90-100テスト、次に10-100トレーニング 0-10テスト、次に20-100-10トレーニング 10-20テストなどがあるので、ラインを混ぜずにブロック分けして受講してください。
次に、Pradoのアドバイスに従って、trainとtestの間にスペースを空けておく必要があります(プルーニング)。テストの10〜100の例題に隣接する電車の例題が、そのヒント/シーカーとなる。詳しくはこちら https://dou.ua/lenta/articles/ml-vs-financial-math/
もしくはこちらが画像です。
そして最後にクロスバリデーションの代わりにローリングフォワードを適用することができます。これは、テストプロットを円周上に持っていかず、前方だけに持っていくものです。
ここに書かれていることは、すべて私の実験にすでに使われていることです。
これらの仕掛けの目的は何かというと、サンプルをチャンクに分割することで、サンプル全体に内在するパターンがよりノイズの少ないチャンクを見つけることである。分類に寄与するルールのノイズが少ない/顕著であるほど、より優れたモデルになる。そう、この方法には生きる権利があるのですが、ターゲットに関連する予測変数がランダムなものほど多く、予測変数の組み合わせをできるだけ多く収容できるようにサンプルサイズが十分大きいときに使うとよく、予測変数が多いほどサンプルは大きくする必要があります。私のサンプルサイズは20k行(100%)を超えることはほとんどなく、予測変数は2k以上あり、明らかにすべての組み合わせはサンプル自体にフィットせず、モデルによって考慮されないので、常に+-50%以下のRecallとなります。
つまり、各予測格子量子は時間的安定性とターゲットへの素因を評価され、選択された予測量子は1つの2値予測子に結合されます。したがって、ノイズの多い予測量子/分割からクリアされ、ほとんどの予測量子は単に選択をパスしないだけなのです。このような二値化サンプリングの選択結果に基づき、すべての学習サイトにおいて予測因子の挙動が類似しているため、履歴にあった類似の事象が発生した場合にもモデルの安定性に寄与することが期待されます。
ここに書かれていることはすべて、すでに私の実験で使っていることです。
これらの仕掛けの目的は何かというと、サンプルをチャンクに分割することで、サンプル全体に内在するパターンがよりノイズの少ない チャンクを 見つけることである。
いいえ - すべてのテストチャンクに渡るモデルの平均値(誤差など)を求めます。または残高の合計。
クロスバリデーションは、初期の行をテストとして使用しても構わないのであれば、問題ないでしょう。
あなたのスキームは非典型的なので、あまりアドバイスになりませんが)前を向いて歩くというのは、もう無理でしょう。20000行は、先のテストのために多くのチャンクに分割するのは難しいです。
いいえ - すべてのテストピースにわたるモデルの平均値(誤差など)を求めます。または残高の合計。
そこで、何がそうさせるのか、そして、後で堅牢になる関係が優勢なプロット、有意な予測因子とターゲットを特定する必要があります。
クロスバリデーションは、初期のラインをテストとして使うことが許容されるなら、それに越したことはないでしょう。
前を向いて歩くこと、たぶんもう無理です。20000行は、多くのチャンクに分割して先にテストするのは難しいです。
非定型なスキームなので、あまりアドバイスにならない)初期ストリングスの使用は、量子-サンプルの60%での評価に使用されたという理由で受け入れがたいものです。ここでは、個々のチャンクによって行う全体の評価手順 - しかし、そのポイントは何ですか - グローバルには何もありません。
メソッドLassoは、より良い結果を示した、CatBoost- 私は確かに後で他のサンプルで比較しますが、どうやらそれは非常に単位10〜20%、バイナリ予測器を排出し、一般化することができます。しかし、それをどのように収益抽出に生かすかが問題です。
L2正則化を減らしても 改善されなかった。だから、Lassoの方が良い結果になるんです。
良くなった...どちらも悪い、数パーセントの差はある。
どう良くなったのか...あるものは悪く、あるものは数%の違い
4%の精度は金額的にも大きい。利益率も期待値も上がるぞ。
リンクは私のプロフィールにあります。
10年後のeur 5minをお持ちの方はtxtかcsvをお送りください。
端末のダウンロードはできないのですか?
端末のダウンロードはできないのですか?
10年間、M5の見積もりでテスト ...家計に迷惑をかける前に、端末を隠しておく必要がある。