トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3282

 
Aleksey Vyazmikin #:

2010年から2023年までのサンプル(4万7000行)を取り、時系列で3つのパートに分け、これらのパートを入れ替えたらどうなるか見てみることにした。

サブサンプルのサイズは、トレーニング60%、テスト20%、試験20%である。

私はこれらの組み合わせを作った(-1) - これは標準的な順序である - 時系列順。各サブサンプルにはそれぞれの色があります。


各サンプルのセットに対して異なるSeedで101個のモデルを訓練し、以下の結果を得た。


すべての指標は標準的であり、モデルの平均利益(AVR Profit)、およびトレーニングに参加しなかった最後のサンプルで利益が3000ポイントを超えたモデルの割合を決定することは困難であることがわかります。

たぶん、トレーニング・サンプル・サイズにおける-1と0のバリアントの相対的な成功率を減らすべきでしょうか?一般的に、Recallはこれに反応するようです。

あなたの意見では、私たちの場合、このような組み合わせの結果は互いに比較可能であるべきでしょうか?それともデータは取り返しがつかないほど古いのでしょうか?

もう1つのDIY...

クロスバリデーションがあり、すべてが咀嚼され、咀嚼され...、広く使われている...。

 
СанСаныч Фоменко #:

また自作自演か...。

クロスバリデーションがあり、すべてが咀嚼され、咀嚼され...、広く使われている...。

そこが問題で、クロスバリデーションはここでは効果的に機能しないかもしれない。

そして、このセルフデザインに何の意味があるのか?マキシムは年代別にサンプルを反転させる-結果は同一になると仮定して-私の実験は誤りを示している。あるいは、すべてが個別であり、検証によってサンプル全体のランダムなパターンや発生が明らかになるかもしれない。

 
Aleksey Vyazmikin #:

そこがポイントで、クロスバリデーションはここでは効果的に機能しないかもしれない。

そして、この自己売買はどこにあるのか?マキシムはサンプルを時系列的に反転させ、結果が同じになると仮定している。あるいは、すべてが個別であり、検証によってサンプル全体のランダムなパターンや発生が明らかになるかもしれない。

マキシムへの矢印を動かしてはいけない。特に彼は示唆されたことを何もしていないし、考えてもいないのだから。

 
Maxim Dmitrievsky #:

マキシムに逆らうべきじゃない、特に彼があなたの提案したことを何一つしていないのに。

彼が何もしていないとはどういう意味ですか?あなたはすでに最新の履歴でモデルをトレーニングしているのでは?

 
fxsaber #:

どのマトリックスも対応できないとき

10Mの文字列から長さ30Kの類似文字列を見つけるのに3秒かかる。

これは可能性のある相関パターンをすべてカウントしているのではなく、ソースと他のデータを比較しているのだ。行列は必要なく、ベクトルだけでいい。

 
Aleksey Vyazmikin #:

していないとはどういう意味ですか?すでに最新の履歴でモデルをトレーニングしているのでは?

誰が最初にそれを取り上げたか覚えていない。どこかのオタクだ。私の場合は関係ない。

 
Maxim Dmitrievsky #:

誰が最初にそれを取り上げたのか覚えていない。私の場合は関係ない。

あなたのケースと私のケースはどう違うのですか?

 
Aleksey Vyazmikin #:

あなたのケースと私のケースはどう違うのですか?

なぜなら、私は文盲の詭弁家や心理学者とコミュニケーションを取りたくないからだ。)

そのような人は有益なコンテンツを生み出さない

 
Maxim Dmitrievsky #:

文盲の詭弁家や心理学者と話すのは好きではないからだ。)

そのような人々は有益なコンテンツを生み出さない

あなたの "愛 "はデータに何か不思議な影響を与えるのですか?

 
Maxim Dmitrievsky #:

This is not counting all possible correlated patterns, but comparing the source with other data.You don't need a matrix here, a vector is enough.

度行列の度行計算の

理由: