トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3168

 
Vladimir Perervenko #:

ウラジミール、新しいデータで得られた「正直な」アクラシの最大値は?

また、どのようなMOアルゴリズムで?

 
Aleksey Nikolayev #:

このアイデアは、例を互いに異なるグループに分け、その中で同質性を持たせることである。特定の特徴がこれを可能にするかどうかはまったく定かではない。実際、例えば非定常性のために、どの特徴もそうであるかどうかは定かではない。

CHAIDは少し近いが、まったく同じではない。

それはそれとして、私は配列順序の変化のダイナミックスに何らかの規則性を見出したい、少なくともブレークポイントの同定を伴う変位の推定をしたい。そして、私は些細なバイナリ予測子について話している。例えば、過去5年間に遭遇した5つのシーケンスを識別し、それらのターゲット値に対する素因の安定性を見て、さらに、シーケンスと素因の両方に有意な変化があれば、予測因子をトレーニングから除外するか、モデルから除外します。この半年間、たくさんの方法を読んだり見たりしてきましたが、テストのためにすべてをコード化するのは現実的ではありません。一番悲しいのは、何かに取り組んでいて、その結果が予想外だったことに気づくときです。

CHAIDの 利点は何だと思いますか?

 

このようなトレーニング方法は、量子セグメントによってサンプルからの除外(ゼロ化)に有利なラインを検出することである。

各ステップはルールの追加である。ルールは以下のようになる if(arr_Q[n0][i]==1|| arr_Q[n1][i]==1||arr_Q[nn][i]==1 ) Propusk=true;

これはGIFです - クリックしないと動きません。

残高-利益(pips)-5桁。

そう、これはトレーニングのためのサンプルの一部に過ぎない。

追加:そして、シグナルが除外される量子セグメントの選択を評価するためのもう一つの基準がここにあります。


 
Aleksey Vyazmikin #:

それはそれとして、私は配列順序の変化のダイナミックスに何らかの規則性を見出したい、少なくともブレークポイントの同定を伴うシフトの推定をしたい。そして、私は些細なバイナリ予測子について話している。例えば、過去5年間に遭遇した5つのシーケンスを識別 し、それらのターゲット値に対する素因の安定性を見て、さらに、シーケンスと素因の両方に有意な変化があれば、予測因子をトレーニングから除外するか、モデルから除外します。この半年間、たくさんの方法を読んだり見たりしてきましたが、テストのためにすべてをコード化するのは現実的ではありません。一番悲しいのは、何かに取り組んでいて、その結果が予想外だったことに気づくときだ。

IMHOは、組み合わせ論的には悪いアプローチだと思う。あまりに豊富な配列のセットは、オーバートレーニングにつながるかもしれない-ランダムな「良い」配列は常に存在するのだから。

アレクセイ・ヴャズミキン#:

CHAIDの利点は何だと思いますか?

まず第一に、matstatの観点からの思慮深さです。これは、左手のルールの代わりに、与えられた有意水準に達したときにツリー構築を停止することです。そしてボンフェローニ補正の使用など。もちろん、名義素性だけを使うのは私には全く合わないので、別のものを探している(構築しようとしている)のですが。

 
Aleksey Vyazmikin #:

それはそれとして、私は配列順序の変化のダイナミックスに何らかの規則性を見出したい、少なくともブレークポイントの同定を伴うシフトの推定をしたい。そして、私は些細なバイナリ予測子について話している。例えば、過去5年間に遭遇した5つのシーケンスを識別し、それらのターゲット値に対する素因の安定性を見て、さらに、シーケンスと素因の両方に有意な変化があれば、予測因子をトレーニングから除外するか、モデルから除外します。この半年間、たくさんの方法を読んだり見たりしてきましたが、テストのためにすべてをコード化するのは現実的ではありません。、ーやることがーやることがーやることがーやることがーやることがーやることがーやることーやることーやることーやることーやることーやることーがー

CHAIDの 利点は何だと思いますか?

1)以下の方法で進めると、(意味において)あなたと同じ結果が得られますか?
あるシート(5分割後)を取り、その中のすべての例を時間順に並べ替え、最初に成長があり、次にある値より落ちたら、そのシートを使用から外す。

ー 2) チャート上にーにー

3) ルール/ー/シートはー トレーニンまたはーまたはーまたはーまたはー検証/ー/テスト ーからーデータに基づいてーに基づいてーにーに基づいてーをー

 
Aleksey Nikolayev #:

IMHOは、それは組み合わせ論的な意味で悪いアプローチだと考えている。あまりに豊富なシーケンスのセットは、オーバートレーニングにつながる可能性がある。

ここでの問題は安定性を検出することであり、もし安定性が履歴上に存在するのであれば、モデルにおける特徴の実際の使用において、少なくともそれを期待する何らかの理由があることになる。そして、それを検出する方法は異なるかもしれない。しかし、分布推定だけでは安定性を推定することはできません。あるいは、クリーニングが必要です。また、例えば1ヶ月という間隔をとった場合、統計的な結論を出すには十分なシグナルがないという事実にも遭遇しました。今のところ、句読点をつけていますが......。いずれにせよ、事象の時間的分布を評価することは重要である。

Aleksey Nikolayev#

matstatの観点からの思慮深さ、まず第一に。これは、何らかの左手のルールの代わりに、与えられた有意水準に達した時点でツリー構築を停止している。そしてボンフェローニ補正の使用など。このような考え抜かれたモデルを見るのは、ただただ美的で楽しいです)もちろん、名義特徴だけを使うのは私には全く合わないので、別のものを探しています(構築しようとしています)。

試してみないとね。他のツリー構築オプションとの比較はしましたか?

 
Forester #:

1) 以下の方法で進めると、(意味において)あなたと同じ結果が得られますか?
あるシート(5分割後)を取り、その中のすべての例を時間順に並べ替え、最初に成長があり、その後ある値より下がった場合、そのシートを使用から削除します。

2) チャートにOOSはありますか?

3) ルール/シートは、トレーニンまたは検証/テストからのデータに基づいてふるいにかけられています。

1) 不合格は普通です。ここで問題なのは、もしそれがシートについて話しているのであれば、周期性です(私は量子セグメントを持っています - 文字通り、F>=X1 &&F<X2 の2つの分割のシート)。つまり、ゼロに近い振動であっても悪くはないのですが、一方向の振動が非常に大きくなってはいけません(推定には10サンプル間隔をとります)。あるいは、文字通り、あなたが書いているように、初めは成長があり、その後はほとんど衰退している。しかし、これは葉についてのすべてであり、量子セクションの場合は、最初の選択基準の一つとして、クラスの平均値の5%から確率バイアスによって選択されます。

2.いいえ、もちろんそうではありません、私はこれがトレーニングサンプルであると書きました。モデル自体のトレーニングは行われていない。

3.例のトレインについて。しかし、スクリーニングではなく、フィルターとして、つまりモデルの応答をゼロにするために、それらを選択するだけです。どうやら、文字列やサンプルをトレーニングから除外するようだ。

そして一般的に、安定した量子セグメントを特定することに焦点を当てれば(バイナリ予測子を考慮すれば)、そのような「モデル」は分類器による訓練なしで機能する。それができない限り、分類器を使う意味はあまりない。もちろん、誰もランダム性をキャンセルしないし、成功するモデルを見つけることもできるが、そのような方法を合理的に検討することは難しいだろう。

この方法の欠点はRecallの低下であるが、CatBoostモデルのRecallより強いわけではない。

 
Aleksey Vyazmikin #:

また、他のツリー建設オプションとの比較はしましたか?

既製品で見つけたものは市場にあまり適していないし、自作のものはまだ準備ができていない。でも、あまり期待はしていないので、急いではいない。

 

こういうこともある。左はOOSパス、右はダメ。そして右サイドは文字通りすぐに飛び込む。


よくあることだ。

つまり、文字通りすぐに大きくダイブする。ダイブの性質は不明だ。SBに近いものがあってもよさそうなものだが、そのような画像を頻繁に見かける。


最適化後に逆転TSをすれば、負けることもないような気がする。

 
fxsaber #:

こういうこともある。左のOOSはパスし、右はパスしない。そして右側では、文字通りすぐに "ダイブ "する。


よくあることだ。

つまり、文字通りすぐに大きくダイブする。急降下の性質は不明である。SBに近いものであるべきだと思うのだが、そのような写真を頻繁に見かける。


最適化後に逆TSを実行すると、負けることさえないようだ。

年ほど前、私はこの効果をここに投稿した
理由: