トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2107

 
elibrarius:
こうでなくっちゃね。NSクラスによるバランス取りが必要。木はそのままでもなんとかなる。

まあ、いつもそうとは限りませんが......前にも書きましたね。

 

私の記事で儲かるExpert Advisor(トレーニング手法)を燃やしてしまったようです。

このグラフは、最初のモデルを12ヶ月で訓練し、それに新しい各月の履歴を追加した場合、各月末のモデルの財務結果を示しています - USDRUB_TOMの先物Si 契約を接着します。

 
Aleksey Vyazmikin:

まあ、いつも対応しているわけではないのですが......前にも書きましたね。

木の深さを増すことも、バランスをとることと同じように効果があると思います。
 
Aleksey Vyazmikin:

そう、本質的に予測指数にノイズを加えるのです。この場合、量子化の境界で、1の領域が選択される可能性が高くなりますが、考え方によっては、重複を追加しても同じ効果があるはずで、ただ、学習開始前にCatBoostアルゴリズムで重複がカットされると仮定すると(検証が必要)、選択肢としてはありです。

量子化することで、そのノイズを打ち消すことができる可能性が高くなります。ある列が10000種類の値を持つ場合、255量子に量子化すると、1量子に40種類の値の平均が入ることになります。例えば、元々1000の例があったとして、10000の例を得るためにノイズを加え、それを255の量子に量子化する、このノイズを加える作業は不要だと私は考えています。


最近、コードを見たのですが、重複して削除されていませんでした。むしろその逆で、40種類のサンプルから重複を排除して1つの量子に統合しています。

 
elibrarius:
木の深さを増すことは、バランスをとることと同じくらい効果的だと思います。

深さも増やしてみてください。また、並行して学習率を下げるとよいでしょう。バランスの悪いサンプルに対する結果も改善されます。

elibrarius:

むしろ量子化することで、このノイズを打ち消すことができる。ある列が10000種類の値を持つ場合、255量子化すると、1回の量子化で平均40種類の値が得られる。例えば、元々1000の例があったとして、10000の例を得るためにノイズを加え、それを255の量子に量子化する、このノイズを加える作業は不要だと私は考えています。

そこでは、範囲内のオブジェクトの混在を考慮するなど、さまざまな量子化方法が用いられています。

エリブラリウス

最近、コードを見ていたのですが、重複削除は見当たりませんでした。むしろその逆で、40種類の例から1つの量子にまとめて複製しているのです。

量子化(境界設定)の処理をコードで発見された方は、このコードを掲載していただけませんか?そこに機能があるのでは?

 

奥行き向上と何の関係があるのか

一方のクラスの大きな点群と、もう一方のクラスのいくつかのサンプルを横に並べて(あるいは中に並べて)、決して実行されないようにします。

2つ目のクラスは適正なサイズに肥大化させるか、1つのクラスの分類アルゴリズムを使用する必要がある

 
マキシム・ドミトリエフスキー

奥行きの強化は何か関係があるのでしょうか?

あるクラスの大きな点群と、別のクラスのいくつかのサンプルで、横から横へ(あるいは内側へ)決して実行されないものがあります。

セカンドクラスは、まともなサイズに膨らませる必要がある

深さを増すと、葉の中のサンプル数が少ない部分が強調されます。もうひとつは、ゼロの葉の割合が変わらないことがあり、その場合、その後のツリーで再びそれらのユニットが見えなくなることです。このようなサンプルを学習させると、学習の途中でRecallが0になり、また小さなパーセンテージに戻る様子がよくわかります。

サンプルを渡せば膨らませることができるのでしょうか?もし、この方法がうまくいったら、MT5にどう実装するか考えます。

 
Aleksey Vyazmikin:

深さを増すと、葉の中のサンプル数が少ない部分が強調されます。もうひとつは、ゼロの葉の割合が変わらないことがあり、その場合、その後のツリーで再びそれらのユニットが見えなくなることです。このようなサンプルを学習させると、学習の途中でRecallが0になり、また小さなパーセンテージに戻る様子がよくわかります。

サンプルを渡せば膨らませることができるのでしょうか?もし、この方法がうまくいったら、MT5にどう実装するか考えます。

はい、できますよ。 葉っぱの話とか、くだらないんですけどね。クラスのバランスが取れていること
 
マキシム・ドミトリエフスキー
できるよ。葉っぱがどうとか、そんなのデタラメだ。クラスのバランスが取れていること。

サンプルです。3つのパートに分かれていますが、train.csvだけを修正する必要があるということですね?

ターゲット列「Target_100」-最後の4列はトレーニングには関係ありません(そこでは日付列に注目するとよいでしょう)-バランスを構築するために必要なものです。

Файл из Облака Mail.ru
Файл из Облака Mail.ru
  • cloud.mail.ru
Облако Mail.ru - это ваше персональное надежное хранилище в интернете.
 
Aleksey Vyazmikin:

私の記事で儲かるExpert Advisor(トレーニング手法)を燃やしてしまったようです。

このグラフは、最初のモデルを12ヶ月で訓練し、それに新しい各月の履歴を追加した場合、各月末のモデルの財務結果を示しています - USDRUB_TOMの先物Si 契約を糊付けしてください。

同じ角度で収支が上がる

または再投資された場合は幾何学的に

理由: