トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1532

 
アレクセイ・ニコラエフ

あるいは、システムシートのポートフォリオにローリング再計算を加えたようなもの。

具体的に何を再計算すればいいのでしょうか?

 
アレクセイ・ニコラエフ

もしくは、スライド式再計算によるシステムリストポートフォリオのようなもの。

では、マルチクラスですね。どのシートを取引するのが現時点ではベストなのかを選択する2ndモデルを作ってください。利点は明白でなく、作りにくい。

 
マキシム・ドミトリエフスキー

まあ、理論から入るしかないんですけどね。例えば、販売用と購入用を分けてモデルを選定する意味はあるのでしょうか?

買っていないものはすべて売っている、その逆も然り。

私の思想は、基本的な取引戦略の改善であり、戦略はトレンドフォローです。したがって、それは空の場所でフリップを提供していない - フラットから市場エントリ、および "入力しないでください "は本質的に偽フロップの内訳を排除することです。

さらに、ZZのロングピーク付近で利益が出ているポジションを閉じるためのモデルを実験してみましたが、結果は満足できるものではありませんでした。つまり、そこでは予測能力が低いか、私の予測ツールがうまく機能しないか、あるいはその両方かもしれません。したがって、私はリバーサル戦略を使用しません。逆に、ここで2種類のモデルを訓練した方がいいと思います。

マキシム・ドミトリエフスキー

より高いしきい値でエントリーをフィルタリングすればよい場合。取引しない」クラスは、モデルによって過度の重みが与えられ、モデルの誤差が減少し、予測(汎化)能力が一般に低下する可能性があります。

ほぼこのアプローチで、モデルの閾値で指定された取引する/しないのバイナリ分類を、私はCatBoostの実験で使用しています。しかし、問題は、モデルが良いものも悪いものもすべて吸い込むフーバーのように構築され、出力は高速モデルですが入力数が少ないことです。

マキシム・ドミトリエフスキー

2番目のモデルのポイントは、1番目のモデルには1番目と2番目の種類のエラー、つまり偽陽性と偽陰性が発生することです。除去することに関心があります。 これを行うには、2番目のモデルの入力と1番目のモデルの取引の出力に同じ特徴を与え、0 - 取引が利益を生んだ、1 - 取引が負けたとします。2番目の分類器を学習させ、0を示したときのみ取引を行う、つまり1番目のモデルのシグナルをフィルタリングする。 ロスカットはトレイでほとんど消えてしまうので、テストでテストする必要があります - それは1つです。

2つ目のモデルはトレイだけでなく、OOSを捉えて学習させれば、新しいデータでトレードを修正してくれる、それが2つです。そして、テスト。

ただ、リンクされていない予測変数ではなく、すでにシートを予測変数として使い、1が予測変数のシートからの信号、ターゲットに正しい分類の答えとなるようにしたのです。もちろん、私の方法では新しい予測変数の関係を見つけることはできませんが、既存の関係間の関係を探すことはできます。

私もあなたの方法を試してみます、ありがとうございました。ただ、今回のコンセプトでは、時間短縮のためにCatBoostモデルのみで実現することも可能ですが、その場合、またすべてを削りすぎてしまいそうで怖いですね。

 
マキシム・ドミトリエフスキー

であれば、それはマルチクラスです。どのシートを取引するのが現時点ではベストなのかを選択する2ndモデルを作ってください。メリットは明白でなく、作りにくい。

いや、枚数が多すぎて、そんな分類は通用しないか...。

 
アレクセイ・ヴャジミキン

私の思想は、基本的な取引戦略の改善であり、戦略はトレンドフォローである ため、空の場所で反転を提供しない- フラットから市場参入、および "入力しないでください "は、本質的に偽のフラットブレークダウンを排除することができます。

さらに、ZZのロングピーク付近で利益が出ているポジションを閉じるためのモデルを実験してみましたが、結果は満足のいくものではありませんでした。つまり、そこでは予測能力が低いか、私の予測ツールがうまく機能しないか、あるいはその両方かもしれません。したがって、私は反転戦略を使用しません。逆に、ここで2種類のモデルを訓練した方がいいと思います。

ほぼこのアプローチで、モデルの閾値で指定される取引する/しないのバイナリ分類を、私はCatBoostの実験で使っていますが、問題は、モデルが良いものも悪いものもすべて吸い込むフーバーのように構築され、出力がエントリ数の少ない賢いモデルであることです。

その通りなのですが、ただ、アンバンドルの予測子ではなく、シートを予測子として 使い、1が予測子のシートからの信号で、正しい分類の答えがターゲットにあるのです。もちろん、私の方法では新しい予測変数の関係を見つけることはできませんが、既存の関係間の関係を探すことはできます。

私もあなたの方法を試してみます、ありがとうございました。しかし、与えられたコンセプトの中で、時間短縮のためか、CatBoostモデルとしてのみ実現することは可能ですが、またすべてを強く削ることになるのではないかと思います。

反転はそのようなものであってはならず、第2モデルの偽シグナルによってフィルタリングされるだけである。まあ、実装や求めるものによりますが。

では、なぜ負けトレードが多いのか不思議ですが、OOSの画像でしょうか?2番目のモデルを使用するには、フィルタリングするために多くの取引が必要であり、そのために人為的に取引を追加することもできます(オーバーサンプリング)。

 
マキシム・ドミトリエフスキー

そのような反転はないはずで、2番目のモデルで偽のシグナルをフィルタリングしているだけでしょう。まあ、実装や求めるものによりますが。

では、なぜ負けトレードが多いのか不思議ですが、OOSの画像でしょうか?はい、2番目のモデルをフィルタリングするために十分な取引があるはずで、そのために人為的に取引を追加することもできます(オーバーサンプリング)。

上記のスクリーンショットは、モデルトレーニングに一切関与していないデータでのテストです。

トレーニングの結果、スクリーンショットです。1枚目はトレーニングに使用したデータについて私がまとめたシートです(1/5セクションしか撮影していません)。

52,86%の利益を上げているロングトレードがあることに注目してください。

他のシートの回答を元にツリーを追加しています。

そして結果は改善され、利益率の高いロングトレードは79.56%になりました。

結論から言うと、この方法は全体としてはうまくいくのですが、実生活に適用した場合のアウトプットはあまりよくありません。なぜかというと、おそらく学習に使用するシートの中には安定した接続を担っていないものや、その接続が少ないものがあるのでしょう。各シートの回答率は、1サンプルあたり1%~3%の範囲です。

 
また、分類ではなく回帰を行い、高収量の葉の組み合わせを正確に分離することで、もしかしたら金額的にも良い効果が得られるかもしれないと考えています。
 
アレクセイ・ヴャジミキン

上のスクリーンショットは、モデルのトレーニングに一切関与していないデータでのテストです。

スクリーンショットは、トレーニングに使用したデータ(1/5セクションのみ撮影)に私が初めてシートをレイアウトしたものです。

52,86%の利益を上げているロングトレードがあることに注目してください。

他のシートの回答を元にツリーを追加しています。

そして結果は改善され、利益率の高いロングトレードは79.56%になりました。

要約すると、このアプローチは一般的には有効だが、実生活に適用した場合の出力はそれほど大きくない。なぜかというと、おそらく学習に使用するシートの中には安定した接続を持たないものや、これらの接続が少ないものがあるのだろう。各シートの回答率は、1サンプルあたり1%~3%程度です。

まあ、今あるものを改善しようとするだけなら、それはフォールズという選択肢もあるのですが。いくつかのチャンクに分割して、1人目はいくつかのチャンクで、2人目は残りのチャンクでトレーニングします。500ファールまでやったことがあります。もちろん、もっと少なくても大丈夫です。ある種の改善

 
マキシム・ドミトリエフスキー

まあ、自分の持っているものを伸ばそうとするだけなら、ファウルという選択肢もあるんですけどね。いくつかのチャンクに分割して、1stはいくつかのチャンクで、2ndは他のチャンクでトレーニングしてください。500ファールまでやったことがあります。もちろん、もっと少なくても大丈夫です。ある程度の改善はされます。

サンプルを塊に分割して、複数のモデルを学習させる、とか?

私のサンプルは14000行ほどしかありませんが...。

 
アレクセイ・ヴャジミキン

サンプルを分割して、複数のモデルを学習させる、とか?

とはいえ、14,000行ほどのサンプルしかないのですが...。

上に書きました。チャンクの半分に基本モデル、もう半分に第二補正モデル

5-10ファウルで十分、いやもっとかもしれない。
理由: