トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2023.10.26 18:59 #33241

mytarmailS #:

これは荒らしですか？

何が荒らしなのか？

これがそのビデオだ。

mytarmailS 2023.10.26 19:04 #33242

Aleksey Vyazmikin #:

何を荒らしているんだ？

ビデオはこちら

こんな感じ。

Aleksey Vyazmikin 2023.10.26 19:07 #33243

mytarmailS #:

このように

私の方では、インターネット上のある場所、つまりリンクについてだった。

mytarmailS 2023.10.26 19:10 #33244

Aleksey Vyazmikin #:

私の方では、インターネット上の場所、つまりリンクについてだった。

正確な記事は覚えていない、

正確な記事は覚えていないけど、いくらでもあるわけじゃないから調べてみて。

Aleksey Vyazmikin 2023.10.26 19:11 #33245

mytarmailS #:

どの記事かは覚えていない、

どの記事かは忘れたが、百万とあるわけではないから調べてみてくれ。

それで検索してみたんだけど、まだ何も見つかってないんだ。

Andrey Dik 2023.10.26 19:14 #33246

Aleksey Vyazmikin #:

そう気づいたんだ。ただ、その原因が特定できたかどうかを尋ねているんだ。何が壊れたかではなく、なぜ信号が消えたのか。

理由は単純で、意図した通り、新しいデータではシグナルが狭い許容範囲から外れているため、シグナルが欠落しているのだ。

まあ、分類に例えるなら、明確な既知のパターンがあれば、曖昧な未知のパターンもある。時間が経つにつれ、未知のものが増えていき、"既知 "のクラスには何も残らなくなる。

Forester 2023.10.26 19:16 #33247

Aleksey Vyazmikin #:

このアルゴリズムで、カグルで1位を取ることができたと主張されているが、単純なタスクがあったとは思えない...。

試してみましょうか？私は数式を理解できない。

そして、そのアイデアを分解してみると、マーケットデータにはとても悪い。

それは、互いに非常に近い異なるクラスの例のペアを削除することを提案している。3番目の例を見ると、理想的には0.2から0.8までのすべての例が削除され、クラスの絶対的な純度を持つ0.2以下と0.8以上の領域だけが残る。どんなモデルでも、それらをさらに簡単に分類するだろう。

しかし、これは人工的な例です。

市場データでは、このような純粋なブロックは存在せず、1つのクラスが優勢です。つまり、ほとんどすべてをクリーニングしなければならない。例えば、1000のポイントがあり、900がクリーンされ、残りは何とか葉のクリーン度、例えば70%に達したとします。しかし、あなたが本当に取引を開始したときに、我々は掃除の際に取り除いた例（9ゴミ1残りの1つ）と70％からの指標は、例えば53％に低下し、あなたはスプレッド、スリッページなどで失うことになります、あるでしょう。

私はクラスのいずれかの純度の正直53％の木と葉を好む。そしてそれは使わない。

mytarmailS 2023.10.26 19:30 #33248

Aleksey Vyazmikin #:

ーそれでー。

そうなる

Aleksey Nikolayev 2023.10.26 20:31 #33249

Aleksey Vyazmikin #:

このつながりが分からない。それは何から来ているのですか？

リンク先の文章を読む限り、その関連性についての定理さえあった。少なくともリンク先を読むことを怠ってはいけない。

Aleksey Vyazmikin 2023.10.26 20:32 #33250

Forester #:

そして、そのアイデアを分解してみると、市場データにはあまり適していない。それは、互いに非常に近い異なるクラスの例のペアを削除することを提案している。3番目の例を見ると、理想的には0.2から0.8までのすべての例が削除され、クラスの絶対的な純度を持つ0.2以下と0.8以上の領域だけが残る。どんなモデルでも、それらをさらに簡単に分類するだろう。しかし、これは人工的な例です。市場データでは、このような純粋なブロックは存在せず、1つのクラスが優勢です。つまり、ほとんどすべてをクリーニングしなければならない。例えば、1000のポイントがあり、900がクリーンされ、残りは何とか葉のクリーン度、例えば70%に達したとします。しかし、実際に取引を始めると、掃除の際に取り除いた例（残り1つに対して9つのゴミ）が出てきて、70％だった指標は例えば53％に下がり、スプレッドやスリッページなどで負けることになります。私は、クラスの1つの純度が53％という正直な木と葉を好みます。そしてそれは使わない。

この時点で、私たちの考えは、結果に関して一致している。そうですね、私は高度に間引かれたサンプルを期待しています。しかし、私が理解しているように、このプロセスは反復的なものです。つまり、測定値を知り、より早く停止し、同じデータを使用して同じ木材モデルを構築することができます。

初期中心はランダムに配置されるという理解で合っていますか？

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3325