トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

СанСаныч Фоменко 2017.08.13 08:30 #4521

話題はコーヒーのカス当てに堕ちたが、少なくとも占星術という科学は持ち込まれた。

なぜわざわざ無意味なことをして、すべてをモデルの入力のせいにするのか？ターゲット変数に影響を与える予測変数のみを取るべきだということは、100ページ近く議論されてきたことです。私はいつもデータマイニングを行っていますが、40％以上の誤差があるモデルはありません。確かに、30％以下の誤差のあるモデルはなかなかありません。でも、50％というような暴挙に出ることはありません。

toxic 2017.08.13 09:31 #4522

サンサニッチ・フォメンコ

話題はコーヒーのカス当てに堕ちたが、少なくとも占星術という科学は持ち込まれた。

なぜわざわざ無意味なことをして、すべてをモデルの入力のせいにするのか？ターゲット変数に影響を与える予測変数のみを取るべきだということは、100ページ近く議論されてきたことです。私はいつもデータマイニングを行っていますが、40％以上の誤差があるモデルはありません。確かに、30％以下の誤差のあるモデルはなかなかありません。でも、50％というような暴挙に出ることはありません。

あなたは "混合馬の人、特徴、ターゲティング、ZZ ... "を持っているので、ローソク足の色やリターンを予測しながら、そのような周波数（> 5min）で、ほぼ同じを持っているでしょう。

toxic 2017.08.13 09:37 #4523

Dr.トレーダー：

実験gbpusd、usdchf、usdrubなど人気のあるシンボルを変えて、eurusdを予測するのはどうでしょう。

ここでは、atacheのtrain.csvとtestの2つのテーブルを紹介します。csvで、ターゲットは次のバーのeurusd m5の成長、予測変数はaudusdOpen[0]-audusdOpen[1]、audusdOpen[2]-audusdOpen[3]、audusdOpen[3]-audusdOpen[4]、eurusdOpen[0]-eurusdOpen[1]、eurusdOpen[1]-eurusdOpen[2]などとなっています。全部で12個のシンボルがあり、それぞれのシンボルから前3バー分の履歴の増分が取られます。一般に、コラムという名称をつければすべてが明らかになる。
トレーニングテーブルの行数は10000行で、これは約7週間分である。

1つのモデルを学習させてみたところ、学習データでr^2 = 0.0006164161となり、ターゲットと結果をクラス-1、1に丸めると、精度は0.5052となりました。これは非常にまずい。ただ、1つの学習例に対して何十本ものバーを取り、文字自体も何十個となると非現実的で、この何百もの列に対する私のモデルの学習には何週間もかかってしまうでしょう。
テストベッドでは、モデルの検証結果は、r^2 = -0.003390913、精度0.4907と低下しています。ランダムがあった、ランダムがある。

でも、どれもつまらなくて、結論が出ないんです。
モデルが各予測変数にどのような重みを与えているかを見ると、興味深いことがわかりました（重みが高いほど、より良い）。

結論：次のM5バーでユーロドルの方向を予測しようとすると、まずaudusd, usdrub, usdsgdを使用するのが良いだろう。

はい、結果は良いものではありませんが、それは公正であり、テスターは、フォワード30％とシャープ比+ - 10になるはず5で同じエラーではなく、関連する株式を持つことになります)))。

あなたのチップは、少なくとも各楽器のためにいくつかの過去のリターンが指数関数的に増加するウィンドウ（1、2、5、10、30、60...）とあなたは分を取る方が良いでしょう、全く良いものではありません。

Mihail Marchukajtes 2017.08.13 10:10 #4524

正直なところ、ユーラ・レシェトフについては、ずいぶん前から同じことを考え始めていました。以前、「私はここを出て行く」と言ったことがあります。最初は秘密組織に入ったのかと思ったほどで、わからないものですね...。と言って、ホームページが動かなくなったりしました。そうだとしたら残念、ご冥福をお祈りします・・・・。

実際、彼の仕事に対する真剣さは、否定できない......。ただ、ほんの少し仕上がっていないような気もしますが......。彼の方法をもっと詳しく分解して、何かをねじ込んでみようかと...。どれどれ

СанСаныч Фоменко 2017.08.13 10:45 #4525

毒性

なぜなら、「混血馬、チップ、ターゲティング、ZZ...」があり、そのような周波数（>5min）で、ローソクの色や戻りを予測していたら、ほぼ同じものが出てくるからです。

ここでは、データマイニングの主な問題、労働の主な量......と、まさに何も混在していないのです。そして、ここにあるのは知的な娯楽です。

toxic 2017.08.13 10:56 #4526

サンサニッチ・フォメンコ

ここでは、データマイニングの主な問題、労働の主な量......と、まさに何も混在していないのです。そして、知的なアミューズメントがあるんですね。

私のHFT述語はすべて良い順序で、私はデータセットを入れて、10分以上は全くそこに何もない、価格自体で、それは他のデータ、マクロ、ニュースなどが必要です価格自体ゼロ、ことわざの効率。

Yuriy Asaulenko 2017.08.13 11:10 #4527

もうひとつは、これです。

私のHFT接頭辞はすべて非常に立派であり、私はデータセットをレイアウトしており、10分以上は、価格自体で、 それは他のデータ、マクロ、ニュースなどを必要とする全く何も ない、ゼロ、悪名高い効率。

むしろ賛成です。しかし、TAのようにサインで開き、定期的に楽しく勝つと断言する人はどうでしょう。

1.希望的観測であり、単なる皮肉である可能性と、2.10分以上でも予測可能な何かがある可能性です。

Алёша 2017.08.13 15:13 #4528

よくわからない のです。

私のHFT述語は、すべての罰金と威厳であり、私はデータセットをレイアウトし、10分以上は、価格自体で、それは他のデータ、マクロ、ニュースなどを必要とし、全く何もありません価格自体ゼロ、悪名高い効率。

HFTで取引しているのですか？もちろん秘密でもなく、「正直に」なら・・・。

Mihail Marchukajtes 2017.08.13 15:15 #4529

ヴィザード_。

ビックリしないでください、私はずっと彼とVovaを笑っていました、ミシカは彼らを凌駕していますが)))。
光を当てず、議論せず、彼ら自身に任せてください)))

それで...より......誰にもしゃべらせない、誰にも良いことを言わせない...。角を曲がったところで笑っているのが見えますが...。あなたは何の役に立ちますか？

おそらく私と同じだと思います。いや...でも、少なくとも私は面白いですよ（笑)。

Mihail Marchukajtes 2017.08.13 16:44 #4530

ヴィザード_。

先生ごめんなさい))))))

よし...怒っているわけではないのですが......。気になるのは、純粋に理論的に......ということですね。ただ、実験のために。私のデータセットをもう一度送りますので、3つの先物、つまり約9ヶ月のデータを含む、モデルを構築し、いくつかの評決を下してください。理想を言えば、あなたのモデルを私のパソコンで動かしたいのですが、あまりこだわらないので......。ただ、気になるのは...。

それで...投稿しましょうか？

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 453