トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2563

 
Maxim Dmitrievsky#:

であれば、もっと具体的に説明する必要があります。

もっと詳しく説明する記事を書こうと思っています。

同じようなアプローチをここで議論したかったのですが、関心がないことがわかりました。

簡単に言うと、こんな感じで段階を踏んでやっています。

1.CatBoostを使って、「クアンタ」の数が異なる様々なタイプの量子テーブルを保存しています(強制プリ・スプリット)。

2.スクリプトで各量子を分析し、指標の安定性と予測能力を確認しています。

2.1 サンプル全体から完全性と正確性の閾値をパスすること。

2.2 サンプル領域における予測対象指標と対象指標の乖離の安定性の評価 - 7点を取り、RMSでふるい分ける。

3.各予測器に対して、量子化が行われた範囲内で重複しないように考慮しながら、すべてのテーブルから最適な量子を選択します。

4.私は新しいサンプル(すべての量子に渡って結合された2つのタイプと、何もないタイプ)を作成し、量子からの予測変数は0または1のシグナルを持つ。

5.サンプルで似たようなシグナルを持つ予測因子を除外しています。

6.モデルを教えること。

ポイント5の後に、テストと試験のサンプルでもロバストネスチェックを行い、満足のいく結果を示した予測変数のみを選択すると、学習結果が大幅に改善されます。これは一種のチートですが、使う価値があるかどうかは、実験してみないとわかりません。私の想定では、指標が安定している期間が長ければ長いほど、安定した状態が続く可能性が高いと考えています。

もし、特定のステージについて質問があれば、尋ねてください。

P.S. サンプルされた数量表を保存し、非効率な予測因子を除外し、通常のサンプルで学習することもできます - これも学習効果を高めます。
 
Aleksey Vyazmikin#:

もっと詳しく説明する記事を書こうと思っています。

同じようなアプローチをここで議論したかったのですが、関心がないことがわかりました。

簡単に言うと、こんな感じで段階を踏んでやっています。

1.CatBoostを使って、「クアンタ」の数が異なる様々なタイプの量子テーブルを保存しています(強制プリ・スプリット)。

2.スクリプトで各量子を分析し、指標の安定性と予測能力を確認しています。

2.1 サンプル全体から完全性と正確性の閾値をパスすること。

2.2 サンプル領域における予測対象指標と対象指標の乖離の安定性の評価 - 7点を取り、RMSでふるい分ける。

3.各予測器に対して、量子化が行われた範囲内で重複しないように考慮しながら、すべてのテーブルから最適な量子を選択します。

4.私は新しいサンプル(すべての量子に渡って結合された2つのタイプと、何もないタイプ)を作成し、量子からの予測変数は0または1のシグナルを持つ。

5.サンプルで似たようなシグナルを持つ予測因子を除外しています。

6.モデルを教えること。

ポイント5の後に、テストや試験のサンプルでもロバストネスチェックを行い、満足のいく結果を示した予測変数のみを選択すると、学習結果が大幅に改善されます。これは一種のチートですが、使う価値があるかどうかは、実験してみないとわかりません。私の想定では、指標が安定している期間が長ければ長いほど、安定した状態が続く可能性が高いと考えています。

もし、特定のステップについて質問がある場合は、尋ねてください。

P.S. サンプルされた数量表を保存し、非効率な予測因子を除外し、通常のサンプルで学習することもできます - これも学習効果を高めます。

量子テーブルって何? ツリーパーティショニングテーブル? そんなものやったことない。

一芸に秀でる
 
Maxim Dmitrievsky#:

量子テーブルとは何ですか? ツリーパーティショニングテーブルですか?

りょうひん

量子表は、予測器を境界/範囲に分割し、学習に関与させるものである。はい、以前から何度も書いています。

 
Aleksey Vyazmikin#:

量子表とは、予測器を境界/範囲に分割し、学習に関与させるものである。はい、以前から何度も書いています。

ああ、なるほど。チップの量子化は、学習の高速化にのみ使われているようです。それともハードなもの?私は古典的なアプローチに自分の曲解を加えただけのサポーターです。
 
Vladimir Baskakov#:
君たちはまだ何も役に立つことを見せていない、ただしゃべっているだけだ。オタク

見続けてください。

 
Aleksey Vyazmikin#:

量子表とは、予測器を境界/範囲に分割し、学習に関与させるものである。そう、これまで何度も書いてきたことだ。

要は、何を、どのように、どんな目的で量子化するのか、ということです。

 
Aleksey Nikolayev#:

何をどう数値化するか、何のために数値化するかが重要なのです。

時間の代わりに予測変数が使われる場合、Equity Monotonicityプロットによる量子化を試したことがあります。特に良いものは見当たりませんでした。

 
モンティコール・パラドックスを トレーディングや意思決定に適用しようとした人はいるのだろうか?
 
Maxim Dmitrievsky#:
あ、わかった。量子化機能は、あくまで学習のスピードアップのために使われているようです。それともハードなもの?私は古典的な手法の支持者であり、それに自分の変態性を少し加えただけです。

学習加速はメリットの一つですが、似たような予測状態の集約の効果もありますね。大雑把に言うと、パーティショニングセクションを独立したバイナリ予測器として扱い、基本予測器からノイズを除去するのです。

学習効果が上がるだけでなく、同じような結果を出すモデルの木の本数が減り、モデルのノイズが減りますね。

リジッドフレームテーブルとは、データではなく、フィボナッチレベルなど、与えられた基準に基づいてパーティショニングを行うもので、現在実験中です。

 
Aleksey Nikolayev#:

量子を、どのように、何のために使うかが重要なのです。

特定の分野で統計的に優位に立つ一貫したパターンを特定することが目的だ、と書いたのはそのためです。そして、あらゆる予測因子を量子化するのです。

そして、それを「どのように」行うかは未解決の問題である。今のところ、経験則に基づいて作られた既製のテーブルを検索するか、統計的分割アルゴリズムCatBoostを使用するのみである。

図3の "quanta "は、おそらく中間のレンジが選ばれており、何らかのステータス上の優位性がある。

理由: