トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2255

 
elibrarius:
エグザムで稀に起動するのは、むしろ市場が変化して、トレーヌでよく起きていたことが起きなくなったことを意味します。そして、そこでもシートの活性化があまりなかったとは限りません。

そうですね、市場変化効果もあるというのは、私も同感です。

トレインを見よう。

状況は少し良くなったが、まれに起動回数が多い葉もある。

学習がどのように行われるかに注目してください。大きな重みを持つ木が作られ、条件付きで成功し、次に小さな重みを持つ集合、そしてまた大きな重みを持つ集合、そんなパイを作り、小さな重みを持つ静脈を削除すれば、確率のシフトが得られます。

 
Aleksey Vyazmikin:

そうですね、市場を変えるような効果もあるというのは、私も同感です。

トレインを見よう。

状況は少し良くなったが、アクティブ数がまばらな葉も同様である。

学習がどのように行われるかに注目してください。大きな重みを持つ木が作られ、条件付きで成功し、次に小さな重みを持つ集合、そしてまた大きな重みを持つ集合、そんなパイを作り、小さな重みを持つ静脈を削除すれば、確率のシフトが得られます。

この図で新しいモデルをトレーニングしたら、どうなるんだろう?

一般的には、1つ目のモデルの「内側」で2つ目のモデルを学習させるという考え方があります。

 
マキシム・ドミトリエフスキー

なぜ、キャブレターをいじるのですか?それで何かが改善されるわけでもないでしょう。

何が問題なのかがわかれば、解決策を探すことができます。もちろん、これらの木には欠点があります。

でも、CatBoostのコードが分からなくて編集ができないのは同意です、残念。

しかし、モデルに影響を与える機会があります。葉の中のまれな例をゼロにすることでプラスの効果が得られるかもしれませんが、その場合は葉の係数を再計算することが望まれます。

マキシム・ドミトリエフスキー

葉っぱのない単純なニューラルネットワークを考えてみましょう。ブーストと同様に新しいデータにも対応します。これは何を意味するのでしょうか?

問題は、どちらの影響がより正確に検出・評価され、どちらに対処しやすいかということです。

マキシム・ドミトリエフスキー

特徴選択と解釈のための優れたSHAP ツールがありますが、これはpythonでできています。すべて長い間、あなたのために行われてきたことです)。

実際、これらの手法の大半は、モデルにおける予測変数の使用について述べているだけで、その評価については何もしていません。モデルから独立した予測変数の推定が必要です。私はこれに取り組んでいて、ささやかながら良い結果が得られています。

もちろん、pythonやRの既成のソリューションで遊びたいのですが、新しい構文を扱えるのか疑問です。

 
mytarmailS:

この図で新しいモデルをトレーニングしたらどうなるんだろう?

実は、1つ目のモデルの "内臓 "に2つ目のモデルを学習させるという発想があるんです。

この例のモデルは古代の堆積物からのもので、今、私はモデルの中に60k枚の葉を持っていますが、これはもちろんサンプルを形成するための多くのものです。おそらく、木の本数を大幅に減らしてみてください。ただし、CatBoostからの 葉を評価したところ、遺伝子の木からの葉と比べると、個々の特性は非常に弱いことに注意してください。

学習させた遺伝木の葉(数千枚)に対して、メトリックの性能を向上させることができる。

 
Aleksey Vyazmikin:

何が問題なのかがわかれば、解決策を探すことができます。もちろん、このような木にはデメリットがあります。

でも、CatBoostのコードが分からなくて編集ができないのは同意です、残念。

しかし、モデルに影響を与える機会があります。おそらく、葉の中のまれな例をゼロにすると、プラスの効果がありますが、その後、葉の係数を再重み付けすることが望ましいです - これはより困難ですが、グローバルに解くことができます。

問題は、どちらの影響がより正確に特定・評価され、どちらに対処しやすいかです。

実際、これらの手法の大半は、モデルにおける予測変数の使用について述べているだけで、予測変数自体の評価は行っていない。モデルから独立した予測変数の推定が必要です。私はこれに取り組んでおり、ささやかながら良い結果が得られています。

もちろん、pythonやRで既成のソリューションを回したいのですが、新しい構文に対応できるのか疑問があります。

そこで評価されるのは、特定のモデルの動作に対する機能の効果です

 
Aleksey Vyazmikin:

何が問題なのかがわかれば、解決策を探すことができます。もちろん、このような木にはデメリットがあります。

でも、CatBoostのコードが分からなくて編集ができないのは同意です、残念。

しかし、モデルに影響を与える機会があります。おそらく、葉の中のまれな例をゼロにすると、プラスの効果がありますが、その後、葉の係数を再重み付けすることが望ましいです - これはより困難ですが、グローバルに解くことができます。

問題は、どちらの影響がより正確に特定・評価され、どちらに対処しやすいかです。

実際、これらの手法の大半は、モデルにおける予測変数の使用について述べているだけで、予測変数自体の評価は行っていない。モデルから独立した予測変数の推定 値が必要です - これに取り組んでいます。

もちろん、pythonやRで既成のソリューションを回したいのですが、新しい構文に対応できるのか疑問があります。

1つずつ追加していく(あるいは1つずつ削除していく)のがベストだという結論に達しました。これが 私の研究です。もうご覧になった方もいらっしゃると思います。

Сравнение разных методов оценки важности предикторов.
Сравнение разных методов оценки важности предикторов.
  • www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За
 
マキシム・ドミトリエフスキー

評価されるのは、その機能が特定のモデルの動作に与える影響です。

それこそ、出来上がったモデルを介しての評価になってしまうんです。

 
elibrarius:

1つずつ追加する(または1つずつ削除する)のがベストであると結論づけられた。これが 私の研究です。もうご覧になった方もいらっしゃるでしょう。

見たことがない - 調べました - 一般的に、除去することで本当の効果が得られるということに同意します。CatBoostには、予測器を削除して、予測器なしでモデルを再重量化する方法がありますが、私は扱ったことがありません。これまでは予測因子の追加と削除に限定していましたが、1つだけでなく、グループ単位で追加しています。

 
Aleksey Vyazmikin:

それこそ、出来上がったモデルを介しての評価になってしまうんです。

善かれと思え

新しいデータでどの機能に欠陥があるかがわかる

 

どうなんでしょう...私の経験なのか、お酒のせいなのか...)

...でも、あなたが悩んでいるのは...)

理由: