トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3012

 
Maxim Dmitrievsky #:

あなたが言っていることは、まだ誰にも理解されていないと私は思います )

彼はオッカムの剃刀の原理で、言葉なしでシンプルにすべてを明らかにしている。

いや、私がこのスレッドに来て、木からルールを淘汰し、それを評価することについて話し始めたとき、あなたはその考えを笑った。

私は今、次のステップ、つまり、予測因子の量子セグメントの評価を通じて、潜在的に質の高いルールを生み出すための条件を作り出したのだが、またしても私は完全な誤解に直面している。

 
СанСаныч Фоменко #:

ったな。

ここでは同じことを100回言わないと聞いてもらえない。

 
Aleksey Vyazmikin #:

いや、私がこのスレッドに来て、木からルールを抽出して評価するという話を始めたとき、あなたはそのアイデアを笑った。

私は今、次のステップ、つまり予測子の量子セクションの推定を通じて、潜在的に質の高いルールを生み出すための条件を作り出したのだが、またしても私は完全な誤解に直面している。

では、ただルールを引き出すだけでは満足できないのですか?理論的には、そこでも運の問題だが、その(ルールの)数を犠牲にすれば、何かを見つけることができるかもしれない。

オプティマイザーで戦略パラメーターを検索するのとほぼ同じだが、よりエレガントな方法だ。
 
Maxim Dmitrievsky #:

では、ただルールを抜いただけでは満足できなかったのか?

この方法は、その後の生まれ変わりを伴うルールのさらなる寿命について確実性がないという事実を除けば、かなり優れていることが判明した。長い間隔で、選択されたルールの50%以上がポジティブな成績を示した。

私は遺伝木を使ったが、サンプルに多くの予測変数が含まれる場合、これは非常に時間がかかる。

そこで、トレーニングのためにツリーに与える情報量を減らす方法を探すことにした。潜在的に有用なデータをハイライトする方法を探し始めました。

もう1つの問題は、リーフ/ルールは活性化ポイントが非常に似ているということです。そして葉のベースが大きくなるにつれて、独自性を見つけるのが難しくなった。

その結果、デザインは面白く、改善すべき点もあるが、私の場合は非常に時間がかかった。一般的に、実験には不向きだが、TC建設装置のコンセプト全体が出来上がれば、実装には面白い。

もちろん、私はRを知らないし、地元の達人にも尋ねたが、誰も私の課題を解決する手助けをしてくれなかった。

今、私はサンプリングとルート予測変数の強制選択(リストによる)とすでに使用されている予測変数のブロックを追加します。

 
Aleksey Vyazmikin #:

この方法は、その後に生まれ変わるルールのさらなる寿命について確実性がないという事実を除けば、非常に優れていることが判明した。長い間隔では、選択されたルールの50%以上が好成績を示した。

私は遺伝木を使用した - サンプルに予測変数が多く含まれる場合、これは非常に時間がかかる。

そこで、学習のためにツリーに与える情報量を減らす方法を探すことにした。私は有用なデータを選択する方法を探し始めた。

もう1つの問題は、リーフ/ルールは活性化ポイントが非常に似ているということです。そして葉のベースが大きくなるにつれて、独自性を見つけるのが難しくなった。

その結果、デザインは面白く、改善すべき点もあるが、私の場合は非常に時間がかかった。総じて、実験には不向きだが、TC建設装置の全体構想が出来上がれば、実装には面白い。

もちろん、私はRを知らないし、地元の達人にも尋ねたが、誰も私の問題を解決する手助けをしてくれなかった。

今、私はサンプリングとルート予測変数の強制選択(リストによる)とすでに使用されている予測変数のブロックを追加します。

なぜcatbustが必要なのですか?

単純なツリーから、複雑なルールの重みを減らして(ルールの複雑さに対するペナルティ)、ルールによってルートからトップまで行くのはどうだろう?

テスターで各ルールを新しいデータで実行し、エラーが大きいものはあらかじめ捨てておく。

ZY、私はまだこのアプローチが直感的に好きではない。
 
Aleksey Vyazmikin #:

そしてもちろん、私はRを知らない、

年以上前からそう聞いている。

Rなんて 1週間で覚えられるよ。

 
Maxim Dmitrievsky #:

むかえてむむか、むかむか。

、、、のののののの、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、おっしゃる通りおっしゃる凡百の凡百。

、、フレンドリーなフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリーフレンドリー。ークレーム・ツリーというークレーム・ツリーのークレーム・ツリーのークレーム・ツリーのークレーム・ツリー、のののの 駒澤選手と木村拓哉さん

ーそしてフレンドリーなー。いつかコードで実装してみたい。

 
Maxim Dmitrievsky #:

単純なツリーで、複雑なルールの重みを減らして(ルールの複雑さによるペナルティ)、ルールごとにルートからトップまで行くのはどうだろう。

テスターで各ルールを新しいデータで実行し、エラーが大きいものはあらかじめ捨てておく。

ZY、私はまだこのアプローチが直感的に好きではない。

基本的には、データ量とモデルを適用する際のCPU負荷の違いだけだ。

それに、葉はグループ化して重みを配分することでアンサンブルしやすくなる(私はこれをハーバリウムと呼んでいる)。

多くのツリーを使ってルールを作るので、シグナルが重なる。

 
mytarmailS #:

もう1年以上前から聞いている。

Rは 1週間で習得できる

どうやら誰もがそんなに才能があるわけではないようだ。

そして、コードは単純ではない。私はやり直そうとしたが、インターネット上には問題を解決するのに十分な情報がなかった。

Rのもう一つの欠点は、コンピュータ間で計算を並列化するための簡単なソリューションがないことだ。

 
Aleksey Vyazmikin #:

この違いは、本質的にはデータ量とモデルを適用する際のCPU負荷の違いだけである。

まあ、それに加えて、葉はアンサンブルしやすく、グループに集めて重みを配分しやすい(私はこれをハーバリウムと呼んでいる:)。

多くの木を使ってルールを作るので、シグナルが重なり合う。

私がこの考えを嫌う理由は、関連性(ルールなど)=因果関係だからだ。)

理由: