トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

СанСаныч Фоменко 2023.12.24 19:25 #33541

Maxim Dmitrievsky #:
せめてググってくれる人がいればと思ったんだけど。

たとえトレーニングで確率曲線を持っていたとしても、どんな新しいデータについて話すことができるだろう。そして、バスティングとフォレストはこれで大きな罪を犯している。バスティングは自信過剰、フォレストは自信不足。もちろん、閾値を使う予定があればの話だが。

私自身は、しきい値を大きくしても、トレードの質は向上しない ことを観察してきた。では、確率はどうなるのでしょうか？何もない。）

どういうわけか、あなたは確率に焦点を当てた私の投稿に注意を払っていない。確率が何であるかは重要ではなく、重要なのは、確率が向上しない場合、モデルはビンに入ってオーバートレーニングされるということです。OOV、OOS、VNUの予測誤差はほぼ同じになるはずです。

別のヒストグラムを示します。

ラベルと予測変数は同じですが、異なるアルゴリズム-異なるヒストグラムです。もしあなたが、異なる分類アルゴリズムが同じヒストグラムを生成することを暗示する、ある種の理論的確率を探しているのであれば・・・。理論的な理想ではなく、特定のアルゴリズムで作業し、予測し、評価しなければならないからです。ここでの主な評価は、モデルのオーバーフィッティングであり、確率が理論的理想に近いかどうかではない。

Maxim Dmitrievsky 2023.12.24 19:26 #33542

СанСаныч Фоменко #:

どういうわけか、あなたは確率に焦点を当てた私の投稿に注意を払っていない。確率が何であるかは問題ではなく、重要なのは、確率が改善されない場合、モデルはオーバートレーニングされ、ビンに入るということだ。OOV、OOS、VNEの予測誤差はほぼ同じはずです。

箱から出したモデルは、どんなモデルでも正しい確率を出さない。そういうことです。予測されたラベルが完全に一致しても、確率が実際の確率を反映していないのです。

わかりますか？

СанСаныч Фоменко 2023.12.24 19:32 #33543

Maxim Dmitrievsky #:
箱から出したモデルでは、正しい確率は出ない。そういうことだ。完全に一致するラベルを予測しても、確率は一致しない。

わかりますか？

追記しました。分類誤差が変動しないという意味では、どんなモデルも正しい確率を与える。

Maxim Dmitrievsky 2023.12.24 19:34 #33544

СанСаныч Фоменко #:

どういうわけか、あなたは確率に焦点を当てた私の投稿に注意を払っていない。確率が何であるかは問題ではなく、重要なのは、確率が改善されない場合、モデルはオーバートレーニングされ、ビンに入るということだ。OOV、OOS、VNUの予測誤差はほぼ同じはずだ。

別のヒストグラムはこちら

ラベルと予測変数は同じですが、異なるアルゴリズム - 異なるヒストグラムです。もしあなたが、異なる分類アルゴリズムが同じヒストグラムを生成することを暗示する、ある種の理論的な確率を探しているのであれば・・・。理論的な理想ではなく、特定のアルゴリズムで作業し、予測し、評価しなければならないからです。ここでの主な評価はモデルのオーバーフィッティングであり、確率が理論的理想に近いかどうかではない。

あきらめる？分類確率のキャリブレーションでググってみてください。

そして、ベンチマークに対してあなたのモデルの確率曲線をプロットしてください。

СанСаныч Фоменко 2023.12.24 19:45 #33545

Maxim Dmitrievsky #:
あきらめる？分類確率較正でググればRにあるはずだ。。

そして、ベンチマークに対してあなたのモデルの確率曲線をプロットしてください。

私たちは違うことを話している。

私は結果について書いており、あなたは中間データの理想について書いている。

私にとって、RFとadaが与える特定のラベルの確率値が異なることは明らかですが、特定のラベルの予測値はほとんど同じです。私は確率値に興味があるのではなく、予測誤差に興味があるのです

理論化するのであれば、その確率が極限定理を満たすことを証明しなければならないので、あなたの意味でのクラス確率を求めることは不可能である可能性が高い。

Maxim Dmitrievsky 2023.12.24 19:46 #33546

СанСаныч Фоменко #:

僕らは違うことを話しているんだ。

私は結果について書いているし、あなたは中間データの理想について書いている。

RFとadaで与えられるクラス確率の値は異なるでしょうが、特定のラベルの予測値はほとんど同じです。私は確率値に興味があるのではなく、予測誤差に興味があるのです。

理論化するのであれば、その確率が極限定理を満たすことを証明しなければならないので、あなたの意味でのクラス確率を求めることは不可能である可能性が高い。

とはいえ、もともとの質問はそこにあり、誰もそれに答えていない。私は、まさに私が質問したことについて話しているのだ。

だから、努力すべきことがある。

СанСаныч Фоменко 2023.12.24 19:48 #33547

Maxim Dmitrievsky #:
それでも、最初の質問はそこにあり、誰も答えなかった。

だから、楽しみはある。

なぜですか？論文という意味でなら......。

Maxim Dmitrievsky 2023.12.24 19:49 #33548

СанСаныч Фоменко #:

なぜですか？論文のような意味であれば...。

確率曲線を使った取引は、利益を得る代わりに損失を被ることを意味するからです。リスクに敏感なアプリケーションであれば、どんな分類器でもキャリブレーションが必要です。

mytarmailS 2023.12.24 19:51 #33549

キャリブレーションとは

https://stats.stackexchange.com/questions/552146/probability-calibration-of-statistical-models

校正方法

https://www.tidymodels.org/learn/models/calibration/

https://mlr.mlr-org.com/articles/tutorial/classifier_calibration.html

Maxim Dmitrievsky 2023.12.24 19:52 #33550

最後に

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3355