トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1778

 
ドミトリー

そして、予測する能力は、どのようにして決まるのでしょうか?

まあ、相関関係ではないですが...。

多分、ラグ推定による相互相関で...。

ディミトリ

世界中のあらゆるものを、間抜けにもモデルの中に押し込んでしまうことで、ですか?

なぜダメなのか?トレーニングでは、クロスバリデーションで不要なものを排除したり、一部の統計...

"何がどうなっているのか "を知るには何がどうなっているのか」は、確認してみないとわからない?

 
アレクセイ・ヴャジミキン

まだ、どうやって取引するのか言ってませんね~、だから、どんなTSを作ればいいのかわかりません。

どうして、当たり前でしょう))ZZは上がれば買い、下がれば売りです。

ZZの方向性を予測するでしょ?

 
mytarmailS:

相関関係ではなく、...

多分、ラグ推定による相互相関で...。

なぜダメなのか?クロスバリデーションでトレーニングに不要なものを排除したり、統計学的に必要なものがあったり...。

"何がどうなっているのか "を知るにはテストするまでは?

まあ、特にNSに関連する冗長性の問題については、長々と語りたいところですが、私は怠け者ですからね。

ちなみに、モデルの予測能力が低い原因となっているのは、この問題であることが多いようです

 
mytarmailS:

どうして、当たり前でしょう))ZZ 上がれば買い、下がれば売り。

ZZの方向性を予測しているのですね。

そうすると、ひねくれ者であることがわかるんですよ、たぶん。

分類指標をウィンドウで平均化/平滑化し、外れ値を排除することを試しましたか?

 
アレクセイ・ヴャジミキン

これはひねくれ者であることがわかるだろう、たぶん。

分類指標をウィンドウで平均化/平滑化し、外れ値を排除することを試しましたか?

この場合、平均化はラグに等しい。分類の質を上げる必要があります。スムージングはオプションではありません。

そのままでお試しください

ドミトリー です。

まあ、特にNSに関連する冗長性の問題については、長々と語りたいところですが、私は怠け者ですからね。

ちなみに、この問題こそが、モデルの予測能力を低下させる原因であることが多いのです

ですから、私はこの方向で考えています。サインはすでにAMOやワーキングルールによって訓練することができ、それらのサインは定性的で圧縮された情報であるべきで、前ページの私のミニ実験によってそれが証明されました。

相関関係を予測する方法がまだ理解できていません(

 
mytarmailS:


また、相関関係で予測する方法は、まだ理解していません(

また予想か...。

相関係数は、事前に最も有意な予測変数を識別するのに役立ちます -従属変数と予測変数の間の相関が高いほど、その変数がモデルにとってより有意であることを示しています。

つまり、あなたの例で言えば、2つの方法があるわけです。1つ目は、予測因子を1つずつモデルに代入し、予測精度がどの程度向上するかを確認することです。それは長い時間ですね。

もう一つは、相関係数を使って、モデルをノイズにする重要でない予測因子をあらかじめ選別しておくことです。


単純に冗長性の問題とは、モデルに100+1個の新しい予測子を加えることができますが、100個の予測子は予測品質に0,01%を加えるのに対して、1個は10%を加えるということです。そして、その100個の新しい予測変数でモデルに過大な負荷をかけることは意味がありません。

 
mytarmailS:


ちなみに、多くの予測変数がある場合、ツリーは無意味であり、ランダムフォレストが 有効です。

 
ドミトリー

また予想か...。

相関係数は、事前に最も有意な予測変数を識別するのに役立ちます -従属変数と予測変数の間の相関が高いほど、その変数がモデルにとってより有意であることを示しています。

つまり、あなたの例で言えば、2つの方法があるわけです。1つ目は、予測因子を1つずつモデルに代入し、予測精度がどの程度向上するかを確認することです。それは長い時間ですね。

第二に、相関係数を用いて、モデルにノイズを与える重要でない予測因子をあらかじめ選別しておくことです。

まあ、相関はあくまで篩い分けの一つであって、ベストではないのは確かですが...。相関、相互相関、非線形相関なども使えますが、いずれも単純な分類の誤差より階層的に低いので、 形質の予測誤差 という基準を選びました。

ディミトリ

ちなみに、多くの予測変数がある場合、ツリーは無意味であり、ランダムフォレストが有効です。

部分的には同意しますが、広い意味での森は同じルールで、違いは複雑さだけです。

Rのパッケージには、200本の木の森を、不要なものや余分なものをすべて削除して1つか3つのルールに圧縮できるものがあります。分類の質の損失は0.5-2%で、これは我々が努力すべき情報の圧縮である+解釈可能性

 
mytarmailS:

この場合、平均化は遅れに等しい。分類の質を上げる必要があります。スムージングはオプションではありません。

そのままでお試しください

オプションではありません。フラットでジャミングが多すぎる。

もちろん、起動のしきい値を0.65-買い、0.35-売りにずらすことも可能です。


 
アレクセイ・ヴャジミキン

それは仕方がないことです。フラットの中に溜め込みが多すぎる。

もちろん、起動のしきい値を0.65-買い、0.35-売りに変更することも可能です。

トレードでチャートを表示する

理由: