トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2023.04.09 18:46 #30111

Maxim Dmitrievsky #:

あなたが言っていることは、まだ誰にも理解されていないと私は思います )

彼はオッカムの剃刀の原理で、言葉なしでシンプルにすべてを明らかにしている。

いや、私がこのスレッドに来て、木からルールを淘汰し、それを評価することについて話し始めたとき、あなたはその考えを笑った。

私は今、次のステップ、つまり、予測因子の量子セグメントの評価を通じて、潜在的に質の高いルールを生み出すための条件を作り出したのだが、またしても私は完全な誤解に直面している。

Aleksey Vyazmikin 2023.04.09 18:48 #30112

СанСаныч Фоменко #:

ったな。

ここでは同じことを100回言わないと聞いてもらえない。

Maxim Dmitrievsky 2023.04.09 18:52 #30113

Aleksey Vyazmikin #:

いや、私がこのスレッドに来て、木からルールを抽出して評価するという話を始めたとき、あなたはそのアイデアを笑った。

私は今、次のステップ、つまり予測子の量子セクションの推定を通じて、潜在的に質の高いルールを生み出すための条件を作り出したのだが、またしても私は完全な誤解に直面している。

では、ただルールを引き出すだけでは満足できないのですか？理論的には、そこでも運の問題だが、その（ルールの）数を犠牲にすれば、何かを見つけることができるかもしれない。

オプティマイザーで戦略パラメーターを検索するのとほぼ同じだが、よりエレガントな方法だ。

Aleksey Vyazmikin 2023.04.09 19:11 #30114

Maxim Dmitrievsky #:

では、ただルールを抜いただけでは満足できなかったのか？

この方法は、その後の生まれ変わりを伴うルールのさらなる寿命について確実性がないという事実を除けば、かなり優れていることが判明した。長い間隔で、選択されたルールの50％以上がポジティブな成績を示した。

私は遺伝木を使ったが、サンプルに多くの予測変数が含まれる場合、これは非常に時間がかかる。

そこで、トレーニングのためにツリーに与える情報量を減らす方法を探すことにした。潜在的に有用なデータをハイライトする方法を探し始めました。

もう1つの問題は、リーフ/ルールは活性化ポイントが非常に似ているということです。そして葉のベースが大きくなるにつれて、独自性を見つけるのが難しくなった。

その結果、デザインは面白く、改善すべき点もあるが、私の場合は非常に時間がかかった。一般的に、実験には不向きだが、TC建設装置のコンセプト全体が出来上がれば、実装には面白い。

もちろん、私はRを知らないし、地元の達人にも尋ねたが、誰も私の課題を解決する手助けをしてくれなかった。

今、私はサンプリングとルート予測変数の強制選択（リストによる）とすでに使用されている予測変数のブロックを追加します。

Maxim Dmitrievsky 2023.04.09 19:19 #30115

Aleksey Vyazmikin #:

この方法は、その後に生まれ変わるルールのさらなる寿命について確実性がないという事実を除けば、非常に優れていることが判明した。長い間隔では、選択されたルールの50％以上が好成績を示した。

私は遺伝木を使用した - サンプルに予測変数が多く含まれる場合、これは非常に時間がかかる。

そこで、学習のためにツリーに与える情報量を減らす方法を探すことにした。私は有用なデータを選択する方法を探し始めた。

もう1つの問題は、リーフ/ルールは活性化ポイントが非常に似ているということです。そして葉のベースが大きくなるにつれて、独自性を見つけるのが難しくなった。

その結果、デザインは面白く、改善すべき点もあるが、私の場合は非常に時間がかかった。総じて、実験には不向きだが、TC建設装置の全体構想が出来上がれば、実装には面白い。

もちろん、私はRを知らないし、地元の達人にも尋ねたが、誰も私の問題を解決する手助けをしてくれなかった。

今、私はサンプリングとルート予測変数の強制選択（リストによる）とすでに使用されている予測変数のブロックを追加します。

なぜcatbustが必要なのですか？

単純なツリーから、複雑なルールの重みを減らして（ルールの複雑さに対するペナルティ）、ルールによってルートからトップまで行くのはどうだろう？

テスターで各ルールを新しいデータで実行し、エラーが大きいものはあらかじめ捨てておく。

ZY、私はまだこのアプローチが直感的に好きではない。

mytarmailS 2023.04.09 19:32 #30116

Aleksey Vyazmikin #:

そしてもちろん、私はRを知らない、

年以上前からそう聞いている。

Rなんて 1週間で覚えられるよ。

Aleksey Vyazmikin 2023.04.09 19:34 #30117

Maxim Dmitrievsky #:

むかえてむむか、むかむか。

、、、のののののの、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、おっしゃる通りおっしゃる凡百の凡百。

、、フレンドリーなフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリー。ークレーム・ツリーというークレーム・ツリーのークレーム・ツリーのークレーム・ツリーのークレーム・ツリー、のののの駒澤選手と木村拓哉さん

ーそしてフレンドリーなー。いつかコードで実装してみたい。

Aleksey Vyazmikin 2023.04.09 19:37 #30118

Maxim Dmitrievsky #:

単純なツリーで、複雑なルールの重みを減らして（ルールの複雑さによるペナルティ）、ルールごとにルートからトップまで行くのはどうだろう。

テスターで各ルールを新しいデータで実行し、エラーが大きいものはあらかじめ捨てておく。

ZY、私はまだこのアプローチが直感的に好きではない。

基本的には、データ量とモデルを適用する際のCPU負荷の違いだけだ。

それに、葉はグループ化して重みを配分することでアンサンブルしやすくなる（私はこれをハーバリウムと呼んでいる）。

多くのツリーを使ってルールを作るので、シグナルが重なる。

Aleksey Vyazmikin 2023.04.09 19:40 #30119

mytarmailS #:

もう1年以上前から聞いている。

Rは 1週間で習得できる

どうやら誰もがそんなに才能があるわけではないようだ。

そして、コードは単純ではない。私はやり直そうとしたが、インターネット上には問題を解決するのに十分な情報がなかった。

Rのもう一つの欠点は、コンピュータ間で計算を並列化するための簡単なソリューションがないことだ。

Maxim Dmitrievsky 2023.04.09 19:41 #30120

Aleksey Vyazmikin #:

この違いは、本質的にはデータ量とモデルを適用する際のCPU負荷の違いだけである。

まあ、それに加えて、葉はアンサンブルしやすく、グループに集めて重みを配分しやすい（私はこれをハーバリウムと呼んでいる：）。

多くの木を使ってルールを作るので、シグナルが重なり合う。

私がこの考えを嫌う理由は、関連性（ルールなど）＝因果関係だからだ。）

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 3012