トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2805

 
https://habr.com/ru/post/695276/ 人によっては役に立つ/興味深いかもしれない。
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

残高チャート(青)を価格チャート(オレンジ)に重ね合わせると便利なことがある。

この場合、例えば、このモデルは10年間下落相場でしか収益をあげていないことがよくわかる。

より洗練されたモデルも同様に、主に下落相場で利益を得るように学習し、上昇相場や値固め相場では利益を減らしている。市場は10年間ずっと下落しているので、学習サンプルは偏っている。


 
elibrarius #:

本当にランダムにプリオールを選択しているのですか?私はcatbustingではなく、基本的なboustingの例のコードを見ていました。そこではすべての予測値が使われている。つまり、最良のものが選ばれる。相関のあるものはその次になりますが、少し悪くなります。しかし、他の分割レベルや補正ツリーでは、相関のある予測変数の別のものがよりよいかもしれない。

推定のために予測変数の一部だけを取ることを可能にする別のパラメータがあります - それはランダムに取られます - それはモデル木の数を増やしますが、理論的にはトレーニングをスピードアップします。

もし私が彼らのコードを解析していたら確信が持てただろう。だから、私は彼らが宣言したことについてだけ話している。

つまり、彼らが言っているのは、スプリット評価にランダム化を加えることで、これによって学習を改善したということだ。

相関のある予測因子を除去するための前処理があるということですが、私はそれについては聞いていません。

別の予測変数がより良い、あるいはより有用である可能性があることには同意するが、私の目標はできるだけ多くの異なるモデルを訓練することだ。私は彼らに何かを学んでほしいのです。

 
Maxim Dmitrievsky #:
だから、私が試せるように、参考になる数式をいくつか教えてくれ。

よくわからないのですが、あなたに投げればいいのでしょうか、それともデータセットに投げればいいのでしょうか?データセットに投げるのであれば、類似したグループ分けや相関関係との関連はどうなるのだろうか?

 
Aleksey Vyazmikin #:

よくわからないのですが、あなたに投げるべきなのでしょうか、それともデータセットに投げるべきなのでしょうか?もしデータセットに投げるのであれば、類似性のグルーピングや相関関係とどのような関係があるのでしょうか?

pythonとmqlで再現するための良いフィッシュの計算式。タグは自分で拾います。

僕はインクリメントしか使わないから。

トレーニング後にボットをアップロードすることもできる。
 
Maxim Dmitrievsky #:

価格チャート(オレンジ)にバランスチャート(青)を重ねると便利なことがある。

この場合、例えば、このモデルが10年間下落相場でのみ利益を上げていることがはっきりとわかる。

より洗練されたモデルも同様に、主に下落相場で利益を得るように学習し、上昇相場や値固め相場では利益を減らしている。市場は10年間ずっと下落しているので、学習サンプルは偏っている。


価格は、終値と始値の差の原理に基づいているのでしょうか、それとも何らかの時間配分が行われているのでしょうか?

 
Aleksey Vyazmikin #:

価格は、取引終了と取引開始の間のデルタの原則に基づいて構築されているのか、それとも何らかの時間配分のようなものなのか?

はい、取引の瞬間に固定されます。

 
Maxim Dmitrievsky #:

pythonとmqlで再現する良いチップの計算式。ラベルは自分で拾います。

インクリメントしか使わないから。

トレーニング後にボットをアップロードすることもできる。

特徴の "良さ "は、そのターゲットによって決まることはご存じでしょう。

先ほど作成の原理を説明しました。MQL5のコードはすべてMQL5で、関数による変換は一切問わない--数式を与えることはできない。

例えば、現在のセグメントの開始時間ZZ(48)が選択されることが多い。

 
Aleksey Vyazmikin #:

特徴の "良さ "はターゲットによって決まることはご存じだろう。

その原理は先に説明した通りだ。MQL5のコードはすべてMQL5であり、関数による変換は一切問わない--数式を与えることは不可能だ。

例えば、現在のセグメントの開始時間ZZ(48)が選択されることが多い。

標準的なインジケータとそのデリバティブがほとんどですか?

 
Maxim Dmitrievsky #:

はい。

売買のマークアップを行い、インプットの数によってよりバランスのとれたモデルを選択し、サンプルを2つに分割して2つの別々のモデルを作ってみる。

理由: