トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 803

 

クラスのバランスをとるには、誰がどのメソッドを使うのがベストか?

また、面白いと思う予測因子もお聞きしたいのですが、個人的なメモと捉えてよろしいでしょうか(笑)。

 
forexman77:
クラスのバランスをとるには、誰がどのメソッドを使うのがベストなのでしょうか?

機能があります

 caret:: downSample() - обрезает большой класс до меньшего

downSample は、すべてのクラスが同じ頻度となるように、データセットをランダムにサンプリングします。

マイノリティクラスupクラス分布が等しくなるように,置換付きでサンプルを採取 する.

 caret:: upSample() - добавляет меньший класс до большего


一般的に、私はcaretを見ることをお勧めします:それは「what-if」チュートリアルとして使用することができます - それは完全なサイクルのためのツールを含んでいます。

  • 生データの作成。
  • 予測器の選択(とてもクールなツールです)。
  • 200以上のモデル(回帰モデル、分類モデル)と
  • モデル評価(テスターとは関係ない)。

かなりインダストリアルなデザインも手に入ります。



PS.

誰もプレディクターを明らかにしないと思います。それが一番大事なことで、モデルはテクニックとアジリティの問題なのです。

 
サンサニッチ・フォメンコ


誰も予測因子を明らかにしないと思います。それが一番大事なことで、モデルはテクニックと勤勉さの問題なのです。

まあ、くだらない質問をしただけなんですけどね。何しろ、「預金を3倍にする方法」「稼げるExpert Advisorを教えてくれ」など、くだらない枝葉末節を作るのですから。

しかし、インジケータでアドバイスが欲しい、それは明確です、最初に思いつくのはそれです。しかし、ここでは、ほとんどの人が掘ったことのない、珍しいものがあります。

 
FXMAN77 です。

まあ、あくまで「愚行」なんですけどね。何しろ、「預金を3倍にする方法」「稼げるExpert Advisorを教えてくれ」など、くだらない枝葉末節を作るのですから。

しかし、インジケータでアドバイスが欲しい、それは明確です、最初に思いつくのはそれです。しかし、ここに、ほとんど人が掘ったことのない、珍しいものがある。

最後の方に出てきたデジタルフィルターを取り上げてみましょう。過去の分も全部読むと便利だと思います。

グッドラック

 
サンサニッチ・フォメンコ

機能があります

downSample は、すべてのクラスが同じ頻度となるように、データセットをランダムにサンプリングします。

マイノリティクラスupクラス分布が等しくなるように,置換付きでサンプルを採取 する.


一般的に、私はcaretを見ることをお勧めします:それは「what-if」チュートリアルとして使用することができます - それは完全なサイクルのためのツールを含んでいます。

  • 生データの作成。
  • 予測器の選択(とてもクールなツールです)。
  • 200以上のモデル(回帰モデル、分類モデル)と
  • モデル評価(テスターとは関係ない)。

かなりインダストリアルなデザインも手に入ります。



PS.

予測因子を公開する人はいないと思います。それが一番重要で、モデルはテクニックとアジリティの問題です。

モデルは既製品から作るものですが、ここでは一から作ることができます。

 
FXMAN77 です。

まあ、あくまで「愚行」なんですけどね。何しろ、「預金を3倍にする方法」「稼げるExpert Advisorを教えてくれ」など、くだらない枝葉末節を作るのですから。

しかし、インジケータでアドバイスが欲しい、それは明確です、最初に思いつくのはそれです。しかし、ここには、ほとんど人が掘ったことのない、珍しいものがあります。

最も単純なケースとして、私は予測因子として棒グラフのセットを使用します。


バランシングは、トレーニングマーカーの末尾から履歴の奥深くまで、ループでサンプリングし、サンプル数が設定数に達するまで、比較することで行われる。

 
Ivan Negreshniy:
最も単純なケースでは、私は予測因子として棒グラフのセットを使います。つまり、与えられた公式によって計算された積分値で、これを学習の入力データとして使用します。

実は、最も優れた予測因子は価格シリーズそのものなのです。どんな処理も情報の損失と遅延になる。そして、どんな情報が必要なのかがよくわからないということを考えると......。

私は1Mで仕事をしていますが、30秒でも遅れるとシステムにとっては死活問題です。また、非常にシンプルなインジケーターでも1〜3mの遅延が発生します。

1時間足で作業しても、指標の遅れは1~3時間程度になります)。どう転んでも1~3号蝋燭。

ZSY2時系列の もう一つの利点は、予測因子をピックアップする必要がないことです。ただ、BPそのものをそういうものとして使いこなす。

 
ユーリイ・アサウレンコ

実は、一番の予測材料は価格帯そのものなのです。どんな処理も情報の損失であり、遅れである。そして、どんな情報が必要なのかがよくわからないということを考えると......。

私は1Mで仕事をしていますが、30秒でも遅れるとシステムにとって致命的です。また、非常にシンプルなインジケーターでも1〜3mの遅延が発生します。

1時間足で作業しても、指標の遅れは1~3時間程度になります)。どう転んでも1~3号蝋燭。

ZSY2 時系列のもう一つの利点は、予測因子をピックアップする必要がないことです。ただ、BPそのものをそういうものとして使いこなす。

こんなフレーズで反応しないわけがない。1時間ごとのチャートは、拡大鏡で15m、5m、1mで見ることができます。皆さん、悲しいことです。

 
ウラジミール・イゼルスキー

こんなフレーズで反応しないわけがない。1時間ごとのチャートは、拡大鏡で15m、5m、1mで見ることができます。悲しいよ、みんな。

悲しむな、わかってるんだ)しかし、快適であれば、続けても構いません。

 
データ選択の初期段階で対象データとの相関を調べればよいのでしょうか、その場合、どのような相関の閾値を用いればよいのか教えてください。
理由: