トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3179

 
Maxim Dmitrievsky #:
見よ、もしあなたがオリジナル・シリーズのパターンを与えられていないなら、ヒルベルトの道はあなたの大切なゴールに導くことはない。あなたがたの努力は悪魔的なものに変わり、あなたがたは楽園の代わりに不名誉な虐殺を見出すだろう。

😁😁

 

boostの開発者に、多重共線性と特徴選択(前処理)をどうするのか聞いてみた。

という明確な答えが返ってきた。)

 
Maxim Dmitrievsky #:

また、フロットからintsへの変換が必要なのは、主に非常に大きなデータの高速化のためだとしたら、なぜ私がそんなことを尋ねなければならないのか。

ボーナスは、運が良ければ、良くも悪くもモデルの小さなキャリブレーションになる。

彼らは同じような答えを返すだけだろうから、長年の苦労が水の泡になるのが怖くて聞けないのだろう :)

結果で判断するのなら、質問に答えることで私の労力が減点されるわけがないでしょう?

そうですね、結果はメトリクスの成長という点ではスーパーではありませんが、他の顕在化も含めてそこにあります。

例えば、私の方法で前処理をしなければ、新しいデータで有益なモデルを全く得られなかったサンプルがある。

 
Maxim Dmitrievsky #:

boostの開発者に、多重共線性や特徴選択(前処理)をどうするか聞いてみた。

それに対して、「そんなの忘れちゃえばいいじゃん」という明確な答えが返ってきた。)

10億の形質があるとして、それを忘れてしまうのか?それとも、やはり相関のないものを選択すべきなのでしょうか?
 
mytarmailS #:
もし10億もの形質があるとしたら、我々はそれを忘れてしまうのだろうか?それとも、相関のないものを選択しなければならないのでしょうか?
気の向くままに。
 
Maxim Dmitrievsky #:
意のままに
むしろ必然的に、フィルターにかけなければならない。
 
Maxim Dmitrievsky #:

boostの開発者に、多重共線性や特徴選択(前処理)についてどうすればいいか聞いてみた。

という明確な答えが返ってきた。)

実際の適用例の情報から判断すると、ほとんど議論されていない機能がそこにある。

例えば、予測因子をグループ化し、それらに重みを与える機能です。私もモデルを改良する可能性を感じていますが、ここで実験することはできません。

また、元々プロジェクト全体を頭に入れていた人がまだそれに取り組んでいるという事実ではなく、実行速度の面でアルゴリズム自体を改善したり、バグを修正したりする同僚などがいる可能性は十分にある。まあ、小さな欠けは時々現れるものだ。

 
mytarmailS #:
むしろ必然的にフィルタリングが必要になる。
そもそも10億もの機能を作らない方が簡単だろう
 
Aleksey Vyazmikin #:

実際の適用例に関する情報から判断すると、ほとんど議論されていない機能性がそこにはある。

例えば、予測因子をグループ化し、それらに重みを与える機能です。私はモデルを改良する可能性も感じているが、ここで実験することはできない。

また、元々プロジェクト全体を頭に入れていた人がまだそれに取り組んでいるわけではなく、実行速度の面でアルゴリズム自体を改善したり、バグを修正したりする同僚などがいる可能性は十分にある。まあ、小さな欠けも時々現れる。

これはすべてオプションです
 
Maxim Dmitrievsky #:
そもそも10億の看板を作らない方が簡単だろう。
ある機能が悪いと気づくにはそれをチェックしなければならないし、それを見るには機能がなければならないし、機能を持つにはそれがなければならない......。
理由: