トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1777

 

統計的に有意な兆候があれば、それを組み合わせれば100%に近い精度が 得られる、というようなことをどこかで聞いたことがあります。

調べてみることに...。

2値のターゲットで合成デートを作り、ターゲットの値ごとに、あるヒット確率のチップをつなげました。

このチップを10個作り、あるターゲットは51:49、別のターゲットは49:51の確率で作られた

フォレストを鍛えました。

新しいデータで得られた

 Accuracy : 0.5145   

10の機能ではなく、100の機能があります

 Accuracy : 0.534 

1000枚看板でゲットしました。

Accuracy : 0.558 

つまり結論は、「 属性の質を高める必要がある、量では遠く及ばない...」ということです。

例えば55:45で 確率を高めてみよう。

10の特性は、与える

Accuracy : 0.6055 

100の特性は与える

Accuracy : 0.7985    

もう一回、60:40の 確率アップを試してみよう

10の特徴

Accuracy : 0.729 

100枚看板

 Accuracy : 0.968 


つまり、各キャンドルでソチに住むには、60%の正解率を出す100のルール/機能/AMOを持たなければ ならないことが判明した...。でありながら、同時に違うものでなければならない...。そんなことができるのだろうか。

 
mytarmailS:

統計的に有意な兆候があれば、それを組み合わせれば100%に近い精度が得られる、というようなことをどこかで聞いたことがあります。

確認することにしました...


日足データでのEURCADとペアの相関関係。

AUDCHF カドカワ CHFJPY ユーロスイスフラン
ユーロコード -0.22 -0.33 -0.39 0.37


最も単純な線形回帰の 決定係数 EURCAD = a*AUDCHF + b*CADCHF + c*CHFJPY + d*EURCHF + k

R^2 = 0.99622555

 
ディミトリ

日足データでのEURCADの相関とペア

相関は予測ではなく、尺度である。それとも、私が的外れなことを言っているのでしょうか?

 
mytarmailS:

相関は予測ではなく、尺度である。それとも、私が的外れなことを言っているのでしょうか?

相関は、各変数の統計的有意性を示すもので、低い。

これらは合わせて、従属変数のダイナミクスを99.6%説明するモデルを形成している

 
ディミトリ

相関は各変数の統計的な有意性を示すもので、低いものである。

これらは合わせて、従属変数のダイナミクスを99.6%説明するモデルを形成している。

そうですね、でも予測ではなく説明です、相関は単に変数間の関係の尺度です、あなたの考えの結論は何ですか? まだ理解できていません(

ペア間の相互相関を調べると
 
mytarmailS:

そうですね、でも予測ではなく説明です、相関は単に変数間の関係の尺度です、あなたの思考の結論は何でしょうか? 私には理解できません(

"どこかで聞いたことのあるような気の利いたアイデアだ。統計的に少しでも有意 な符号があれば、たとえ最低のものでも、それらを結びつけることで100%に近い精度が 得られる"(c)

相関は、線形回帰 モデルにおいて、独立変数が従属変数を予測するための統計的有意性を示す。

 
ディミトリ

" 統計的に有意な 符号が あれば、たとえ最低のものでも、それを組み合わせれば、100%に近い精度が 得られる"(c)というような巧妙なアイデアをどこかで聞いたことがあるのです。

何らかの形で予測できる特性という意味であり、単なる相関関係ではありません

 
mytarmailS:

相関関係だけでなく、何らかの形で予測できる特性を意味する

そして、予測する能力は、どのようにして決まるのでしょうか?

 
mytarmailS:

相関性だけでなく、何らかの予測性のある属性という意味です。

従属変数と、可能性のある独立変数のセットがあります。

予測能力」はどのように定義されるのですか?

世界中のあらゆるものを、間抜けにもモデルに押し込んでしまうことでか?

 
mytarmailS:

まあ...いいね、もっともだ。トレードそのもののバランスと、エントリーのあるチャートが見たい。

どうやって取引すればいいのか、教えてくれなかったから......どんなTSを作ればいいのかわからない。

mytarmailS:

10機種のアンサンブルということですが、それぞれの機種の違いは何ですか?

いいえ、広がりを見るための10個のモデルで、違いはシード、つまり学習を開始するためのランダムな値(スプリットの推定とその選択に使用)だけです。

理由: