[[80107122]
[73128410]]
трайн наоборот
[[80267105]
[72098512]]
трайн
[[55385034]
[51175395]]
предсказание по обученной модели на трайн, эти данные не участвовали в обучении.
Поясню данные для теста берутся не из не использованных выборок, это данные, которые вообще не доступны для
алгоритма в процессе обучения(находятся вне временного промежутка участка обучения).
非常に興味深いのですが、予測能力の測定について 詳しく教えてください。
そして何より何を測ればいいのか。
書いたり、グラフを出したり、コードを載せたり......便利屋は、この1000ページにすべてを埋め込んでしまった......。
繰り返すのがだるい。ここで一番使われているのはvtreatで、私は使っていません。要は、このテーマについて考え、それ以外は捨てるということです。
では、ZZの設定をどうするかという問題提起はしなかったのですか?
ZZパラメータは、各商品、各時間枠で異なります。例えば、EURUSD M15の場合、初期値は15pips(4桁)が良いでしょう。また、使用する予測因子にも依存します。予測因子とZZのすべてのパラメータを最適化するのがよいでしょう。したがって,ノンパラメトリック予測変数があることは望ましいことであり,それはあなたの生活をずっと楽にする.そのため、デジタルフィルターが 良い結果を示しています。アンサンブルとカスケード結合を使用した場合、平均Accuracy = 0.83となりました。これは非常に良い結果だと思います。明日、その過程を記した検証用の記事を送ります。
グッドラック
ZZパラメータは、各商品、各時間枠で異なります。例えば、EURUSD M15の場合、初期値は15pips(4桁)が良いでしょう。また、使用する予測因子にも依存します。予測因子とZZのすべてのパラメータを最適化するのがよいでしょう。したがって,ノンパラメトリック予測変数があることは望ましいことであり,それはあなたの生活をずっと楽にする.そのため、デジタルフィルターが 良い結果を示しています。アンサンブルとカスケード結合を使用した場合、平均Accuracy = 0.83となりました。これは非常に良い結果だと思います。明日、その過程を記した検証用の記事を送ります。
グッドラック
極めて興味深い。楽しみにしています。
もし、2004年のビッドとアスクの行を現在の日付で共有することができれば、私は試してみます、私は通常1-3年を学び、20-30%のためにテストします。
データセット、ラーン、テスト、およびducasの生シリーズ
いいカーブですね :)しかし、どのようなソフトウェアで、どのようにこのカーブを計算したのかが不明で、誰も興味をそそられないだろう。あなたのデータセットでは、52%以下の精度しか得られませんでしたが、あなたはチップの前でマーカーを終了させていますが、私はそれをカットしています。そのため、LernとTestを取得し、分類結果をBulltesterで実行するために、さらにカットプライスを追加する必要があります。
PS:実際には、任意のテスターの収量曲線とそれが判明したように分類品質のレポートレグレッションは、公衆に何かを証明することはできません。しばらく前、あるクローズドなアルゴリズム取引グループで、C++ dllで作られた既製のモデル(とにかくすべてのアルゴリズムトレーダーとマシネライナーが使用している)を交換するためのインターフェースに合意するという興味深いアイデアがありました。要するに、ある種の標準化された「ブラックボックス」を交換し、将来、テスターで、データが利用できるようになったときにテストできるようにしようということです。これだけで、モデルが動くかどうかがわかるのですが、まあ、web-apiを使うという手もありますが、特にモデルが多い場合、このためにVPNを維持するのは面倒です。そして、これらの数字の精度やシャープ比などはほとんど意味がなく、意識的に適合しない100500通りの方法があり、意識的に適合しても誰も理解できないので、もっと痕跡的な証拠が必要なのです。
分類なら相対分類誤差やlogloss(クロスエントロピー)、回帰ならrmseで推定できる。また、トレースとテストの誤差差を測定し、最小の差を実現することができます。
ただ、トレーン、バリデーション、テストが予測されるクラスでほぼ同じ分離になるように設定が選ばれています。
ただ、これはどういうことかというと、森は浅い木でもオーバートレーニングになりやすく、確かに純粋な葉っぱまで木を作れば、高い確率でそこにオーバートレーニングが発生します。
では、どうすればこれを回避できるのか。さて、またまた「ゴミはゴミ箱へ」の話です。自然界に「ゴミ」でない予測因子は全くないのでしょうか。
ROC_AUCを取ることで、予測変数に何か良いものがあれば、横軸に沿った値の成長が止まるはずだということです。しかし、すべて目を通したが、見つからなかった。
厳密にはフラットな線が上向きに引かれています。
しかし、どの指標も歴史的に市場を上昇させることはもちろんありません)。
何度も試しましたが、あまり印象に残っていません。
ただ、学習者、検証者、テスト者の予測クラスがほぼ同じ割合になるように設定されています。
ただ、これはどういうことかというと、森は浅い木でもオーバートレーニングになりやすく、確かに純粋な葉まで作ると、高い確率でオーバートレーニングになります。
では、どうすればこれを回避できるのか。さて、またまた「ゴミはゴミ箱へ」の話です。自然界に「ゴミ」でない予測因子は全くないのでしょうか。
ROC_AUCを取ることで、予測変数に何か良いものがあれば、横軸に沿った値の成長が止まるはずだということです。しかし、すべて目を通したが、見つからなかった。
上に向かって厳密なフラットラインを描きました。
しかし、どんな指標も歴史的に市場を上昇させることはありません)。
検証済みのプロット上のエラーがトレース上と同じであれば、すべてがうまくいくはずです。明らかに違う
valid.セクションのエラーがtraineeと同じであれば、すべてうまくいくはずです。明らかに違うでしょ。
まあ、まったく同じというわけではありませんが、近いものがありますね。完全に同一であれば、奥行き3の木である、と写真が渡された。
深度15が選ばれており、多少なりともテストが行われたことがわかる。
20分ほどしたら、クラス別の内訳を掲載する予定です。
深度3。
奥行き15
同時に、深度15は明らかにオーバートレーニングにつながるものの、フォワードはそのほうがいい。また、私が持っている他のモデルでも。大きくオーバーフィットしていない場合。
フォワード
15
3
探しているクラスのタグを、ネガティブよりも4〜6%多く予測することが判明...。
いいカーブですね :)しかし、どのようなソフトウェアで、どのようにこのカーブを計算したのかが不明で、誰も興味をそそられないだろう。あなたのデータセットでは、52%以下の精度でした。ところで、あなたのマーカーはチップの手前で終わっていますが、私のデータセットではトリミングしています。そのため、LernとTestを取得し、その結果をBulltesterで分類するために、さらにカットプライスを追加する必要があります。
PS:実際には、任意のテスターの収量曲線とそれが判明したように分類品質のレポートレグレッションは、公衆に何かを証明することはできません。しばらく前、あるクローズドなアルゴリズム取引グループで、C++ dllで作られた既製のモデル(とにかくすべてのアルゴリズムトレーダーとマシネライナーが使用している)を交換するためのインターフェースに合意するという興味深いアイデアがありました。要するに、ある種の標準化された「ブラックボックス」を交換し、将来、テスターで、データが利用できるようになったときにテストできるようにしようということです。これだけで、モデルが動くかどうかがわかるのですが、まあ、web-apiを使うという手もありますが、特にモデルが多い場合、このためにVPNを維持するのは面倒です。また、精度やシャープ比などの数値はあまり意味がなく、意識的に調整しない方法は100500通り、意識的に調整しても同じだけあり、誰も理解できない、もっと良い根拠が必要です。
学習データおよびテストデータの先頭にはヌルタプルの特徴がありますが、おそらくそれらを計算するのに十分な履歴がなく、アルゴリズムがそれを制御していなかったため、正しい作業のためにはそれらも削除されるべきです。
このグループは、秘密でなければどこにあるのか、そこを見ることは可能なのか。
深度3。
奥行き15
同時に、深度15は明らかにオーバートレーニングにつながるものの、フォワードはそのほうがいい。また、私が持っている他のモデルでも。大きくオーバーフィットしていない場合。
フォワード
15
3
トレードの回数を減らした方がいいと思います、全てのバーでそうです...