トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

СанСаныч Фоменко 2018.07.08 17:11 #10111

アレクセイ・パンフィロフ

非常に興味深いのですが、予測能力の測定について 詳しく教えてください。

そして何より何を測ればいいのか。

書いたり、グラフを出したり、コードを載せたり......便利屋は、この1000ページにすべてを埋め込んでしまった......。

繰り返すのがだるい。ここで一番使われているのはvtreatで、私は使っていません。要は、このテーマについて考え、それ以外は捨てるということです。

Vladimir Perervenko 2018.07.09 08:34 #10112

アレクセイ・ヴャジミキン

では、ZZの設定をどうするかという問題提起はしなかったのですか？

ZZパラメータは、各商品、各時間枠で異なります。例えば、EURUSD M15の場合、初期値は15pips（4桁）が良いでしょう。また、使用する予測因子にも依存します。予測因子とZZのすべてのパラメータを最適化するのがよいでしょう。したがって，ノンパラメトリック予測変数があることは望ましいことであり，それはあなたの生活をずっと楽にする．そのため、デジタルフィルターが良い結果を示しています。アンサンブルとカスケード結合を使用した場合、平均Accuracy = 0.83となりました。これは非常に良い結果だと思います。明日、その過程を記した検証用の記事を送ります。

グッドラック

СанСаныч Фоменко 2018.07.09 08:59 #10113

ウラジミール・ペレヴェンコ

ZZパラメータは、各商品、各時間枠で異なります。例えば、EURUSD M15の場合、初期値は15pips（4桁）が良いでしょう。また、使用する予測因子にも依存します。予測因子とZZのすべてのパラメータを最適化するのがよいでしょう。したがって，ノンパラメトリック予測変数があることは望ましいことであり，それはあなたの生活をずっと楽にする．そのため、デジタルフィルターが良い結果を示しています。アンサンブルとカスケード結合を使用した場合、平均Accuracy = 0.83となりました。これは非常に良い結果だと思います。明日、その過程を記した検証用の記事を送ります。

グッドラック

極めて興味深い。楽しみにしています。

Женя 2018.07.09 12:25 #10114

グレイル

もし、2004年のビッドとアスクの行を現在の日付で共有することができれば、私は試してみます、私は通常1-3年を学び、20-30％のためにテストします。

データセット、ラーン、テスト、およびducasの生シリーズ

いいカーブですね :)しかし、どのようなソフトウェアで、どのようにこのカーブを計算したのかが不明で、誰も興味をそそられないだろう。あなたのデータセットでは、52％以下の精度しか得られませんでしたが、あなたはチップの前でマーカーを終了させていますが、私はそれをカットしています。そのため、LernとTestを取得し、分類結果をBulltesterで実行するために、さらにカットプライスを追加する必要があります。

PS：実際には、任意のテスターの収量曲線とそれが判明したように分類品質のレポートレグレッションは、公衆に何かを証明することはできません。しばらく前、あるクローズドなアルゴリズム取引グループで、C++ dllで作られた既製のモデル（とにかくすべてのアルゴリズムトレーダーとマシネライナーが使用している）を交換するためのインターフェースに合意するという興味深いアイデアがありました。要するに、ある種の標準化された「ブラックボックス」を交換し、将来、テスターで、データが利用できるようになったときにテストできるようにしようということです。これだけで、モデルが動くかどうかがわかるのですが、まあ、web-apiを使うという手もありますが、特にモデルが多い場合、このためにVPNを維持するのは面倒です。そして、これらの数字の精度やシャープ比などはほとんど意味がなく、意識的に適合しない100500通りの方法があり、意識的に適合しても誰も理解できないので、もっと痕跡的な証拠が必要なのです。

forexman77 2018.07.09 12:25 #10115

マキシム・ドミトリエフスキー

分類なら相対分類誤差やlogloss（クロスエントロピー）、回帰ならrmseで推定できる。また、トレースとテストの誤差差を測定し、最小の差を実現することができます。

ただ、トレーン、バリデーション、テストが予測されるクラスでほぼ同じ分離になるように設定が選ばれています。

ただ、これはどういうことかというと、森は浅い木でもオーバートレーニングになりやすく、確かに純粋な葉っぱまで木を作れば、高い確率でそこにオーバートレーニングが発生します。

では、どうすればこれを回避できるのか。さて、またまた「ゴミはゴミ箱へ」の話です。自然界に「ゴミ」でない予測因子は全くないのでしょうか。

ROC_AUCを取ることで、予測変数に何か良いものがあれば、横軸に沿った値の成長が止まるはずだということです。しかし、すべて目を通したが、見つからなかった。

厳密にはフラットな線が上向きに引かれています。

しかし、どの指標も歴史的に市場を上昇させることはもちろんありません)。

何度も試しましたが、あまり印象に残っていません。

Maxim Dmitrievsky 2018.07.09 12:28 #10116

FXMAN77 です。

ただ、学習者、検証者、テスト者の予測クラスがほぼ同じ割合になるように設定されています。

ただ、これはどういうことかというと、森は浅い木でもオーバートレーニングになりやすく、確かに純粋な葉まで作ると、高い確率でオーバートレーニングになります。

では、どうすればこれを回避できるのか。さて、またまた「ゴミはゴミ箱へ」の話です。自然界に「ゴミ」でない予測因子は全くないのでしょうか。

ROC_AUCを取ることで、予測変数に何か良いものがあれば、横軸に沿った値の成長が止まるはずだということです。しかし、すべて目を通したが、見つからなかった。

上に向かって厳密なフラットラインを描きました。

しかし、どんな指標も歴史的に市場を上昇させることはありません)。

検証済みのプロット上のエラーがトレース上と同じであれば、すべてがうまくいくはずです。明らかに違う

forexman77 2018.07.09 12:40 #10117

マキシム・ドミトリエフスキー

valid.セクションのエラーがtraineeと同じであれば、すべてうまくいくはずです。明らかに違うでしょ。

まあ、まったく同じというわけではありませんが、近いものがありますね。完全に同一であれば、奥行き3の木である、と写真が渡された。

深度15が選ばれており、多少なりともテストが行われたことがわかる。

20分ほどしたら、クラス別の内訳を掲載する予定です。

forexman77 2018.07.09 13:15 #10118

深度3。

[[8010 7122]
 [7312 8410]]
трайн наоборот

[[8026 7105]
 [7209 8512]]
трайн 

[[5538 5034]
 [5117 5395]]
предсказание по обученной модели на трайн, эти данные не участвовали в обучении.
Поясню данные для теста берутся не из не использованных выборок, это данные, которые вообще не доступны для
алгоритма в процессе обучения(находятся вне временного промежутка участка обучения).

奥行き15

[[7667 7464]
 [7227 8494]]
трайн наоборот

[[14430   702]
 [  661 15061]]
трайн 

[[5405 5167]
 [4958 5554]]
тест

同時に、深度15は明らかにオーバートレーニングにつながるものの、フォワードはそのほうがいい。また、私が持っている他のモデルでも。大きくオーバーフィットしていない場合。

フォワード

15

3

探しているクラスのタグを、ネガティブよりも4〜6％多く予測することが判明...。

Ivan Negreshniy 2018.07.09 13:19 #10119

ジャンニ

いいカーブですね :)しかし、どのようなソフトウェアで、どのようにこのカーブを計算したのかが不明で、誰も興味をそそられないだろう。あなたのデータセットでは、52％以下の精度でした。ところで、あなたのマーカーはチップの手前で終わっていますが、私のデータセットではトリミングしています。そのため、LernとTestを取得し、その結果をBulltesterで分類するために、さらにカットプライスを追加する必要があります。

PS：実際には、任意のテスターの収量曲線とそれが判明したように分類品質のレポートレグレッションは、公衆に何かを証明することはできません。しばらく前、あるクローズドなアルゴリズム取引グループで、C++ dllで作られた既製のモデル（とにかくすべてのアルゴリズムトレーダーとマシネライナーが使用している）を交換するためのインターフェースに合意するという興味深いアイデアがありました。要するに、ある種の標準化された「ブラックボックス」を交換し、将来、テスターで、データが利用できるようになったときにテストできるようにしようということです。これだけで、モデルが動くかどうかがわかるのですが、まあ、web-apiを使うという手もありますが、特にモデルが多い場合、このためにVPNを維持するのは面倒です。また、精度やシャープ比などの数値はあまり意味がなく、意識的に調整しない方法は100500通り、意識的に調整しても同じだけあり、誰も理解できない、もっと良い根拠が必要です。

学習データおよびテストデータの先頭にはヌルタプルの特徴がありますが、おそらくそれらを計算するのに十分な履歴がなく、アルゴリズムがそれを制御していなかったため、正しい作業のためにはそれらも削除されるべきです。

このグループは、秘密でなければどこにあるのか、そこを見ることは可能なのか。

Maxim Dmitrievsky 2018.07.09 13:23 #10120

FXMAN77 です。

深度3。

奥行き15

同時に、深度15は明らかにオーバートレーニングにつながるものの、フォワードはそのほうがいい。また、私が持っている他のモデルでも。大きくオーバーフィットしていない場合。

フォワード

15

3

トレードの回数を減らした方がいいと思います、全てのバーでそうです...

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 1012