トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2022.09.05 20:32 #27291

Aleksey Nikolayev #:

ここであなたは多変量サンプル（各要素は表の行、ベクトル）について話しているようですが、あなたの3つのリンクの均質性基準は数値サンプルについて話しています。matstatの多変量均質性基準は別の曲で、私にはよくわかりません。

各予測変数は別々に数値標本であり、なぜ別々に評価し、結果を平均しないのでしょうか？ほとんどの予測変数に悪化のダイナミクスがある場合、サンプルは冗長になります。

アレクシー・ニコラエフ

多くの変化点の検出を検索するタスクのように見えます。繰り返しになりますが、多変量（ベクトル）のケースを扱う必要があることがわかり、物事が非常に複雑になります。

まあ、一般的に、どの属性が研究に選ばれるかに依存するのは好きではない。異なる属性を選択すれば、結果は異なるかもしれない。

おそらく、特定のグループに属するセグメントの識別や、グループ化された母集団に対するトレーニングの効率という点で、最良の結果が得られるような変種を見つけるべきなのだろう。

Maxim Dmitrievsky 2022.09.05 22:32 #27292

Aleksey Vyazmikin #:

サンプルの中でしかミックスできない。2つのサンプルをミックスすれば、市場が変化していることを否定することになる。

もう一度理屈を考えてみてください。

トレーニングサンプルの最適な長さを決めるためにシリーズを比較するのは無意味です。

どの時点で混合しても、何も変わりません。

Aleksey Vyazmikin 2022.09.05 22:45 #27293

Maxim Dmitrievsky #:
もう一度理屈を考えてみてください。

トレーニングサンプルの最適な長さを決めるためにシリーズを比較するのは無意味だ。

どの時点でミックスしても、何も変わらない。

市場が変化していることをどうやって証明するのですか？そのプロセスにはどれくらいの時間がかかるのか？それとも常に変化しているのか？

Maxim Dmitrievsky 2022.09.05 22:49 #27294

Aleksey Vyazmikin #:

市場の変化可能性をどのように証明するのか？このプロセスにはどれくらいの時間がかかるのか？それとも常に変化しているのか？

以上、愉快な論客の登場だ。

少なくとも非定常性。絶え間なく変化し、時には一服する。

Aleksey Vyazmikin 2022.09.05 23:21 #27295

Maxim Dmitrievsky #:
以上、愉快な論客が登場。

少なくとも不安定だ。絶えず変化し、時には一服するために止まる。

そして、定常性／非定常性を決定するために、どの程度のサンプルサイズを取るべきか？

あなたによれば、パターンの寿命はサンプルの変化の寿命よりも長くないというが、私のサンプルに8年間繰り返すパターンがあるとしたらどうだろう？それは異常なのか、パターンがすべて変化しているわけではないのか、あるいは狭い範囲で確認されたパターンが誤りであり、他の要因によるものなのか？

Aleksey Nikolayev 2022.09.06 04:28 #27296

Aleksey Vyazmikin #:

各予測因子はそれぞれ数値標本であり、なぜ個別に推定して結果を平均化しないのか？

これは独立した特徴の場合にのみ機能し，それらは同じ価格でカウントされるので，それは不可能である．一変量分布は常に同じ一様ですが、二変量分布は大きく異なることがあります。

Aleksey Vyazmikin#:

おそらく、特定のグループに属するセグメントの識別や、グループ化された母集団に対するトレーニングの効率化という点で、最良の結果が得られるような変種を見つけるべきでしょう。

列挙の計算が大変ですね）（すでにかなりの量の列挙に）特徴タイプによる列挙と、おそらく特徴パラメータによる列挙を追加しなければならないでしょう。

とはいえ、あなたのアプローチには合理的な粒子があるように思えます。

mytarmailS 2022.09.06 06:07 #27297

Aleksey Vyazmikin #:

あなたの理論が正しければ、サンプルは増加するにつれて類似しなくなり、これを理解するためには、類似性を評価する方法から派生した、その変化を評価するための基準が必要である、と私は書きませんでしたか？

おそらく、サンプルの均質性に関する統計的基準の代わりに、ダイナミクスにおけるモデルの特徴の重要性の変化を（スライディングウィンドウで）観察すべきなのでしょう。

もし現在の状態と以前の状態の間に強い不一致があれば、それはすでに異なるサンプルにいることを意味します。

長所

1.スタットをプログラムする必要がない。テストは箱から出してすぐにできる。

2.サンプルの時間的変化だけでなく、ターゲットサンプルの変化も考慮される。

Maxim Dmitrievsky 2022.09.06 06:19 #27298

Aleksey Vyazmikin #:

また、定常性／非定常性を判断するには、どの程度のサンプルサイズを取るべきでしょうか？

あなたによると、パターンはサンプルの変化の寿命より長くは生きないということですが、もし私のサンプルに8年間繰り返されるパターンがあるとしたらどうでしょうか？それは異常なのか、パターンがすべて変化しているわけではないのか、あるいは狭い範囲で確認されたパターンが間違っていて他の要因によるものなのか？

私は、任意の時間スケールにおける特定のトレンドの寿命以上のものはないと言いたい。

しかし、それは緩やかな表現だ。

点から分岐点まで。

Valeriy Yastremskiy 2022.09.06 08:48 #27299

モデルは違うが似ている、似ているが違う、似ていないがどう違うのか？分岐点は必ずしもモデルの変更につながるとは限らない。同じ部分を手動で視覚的にマークすることは可能だが、最後に予測的な部分はない。

モデルの複雑さ、ここにももちろん矛盾がある。単純なモデルは、十分に必要な長さの区間を記述することはできないが、繰り返される。いつものように、その中間が必要なのだ))))))

Maxim Dmitrievsky 2022.09.06 09:19 #27300

Valeriy Yastremskiy 最小のサンプル長を見つけることである。
モデルの複雑さ、ここにももちろん矛盾がある。単純なモデルは、十分に必要な長さの区間を記述することはできないが、繰り返される。いつものように、その中間が必要なのである))))))

一般に、異なるモデルはランダム性の実装において異なるが、同じ理由で類似している。

特に数十から数百の特徴が使われる場合。そのうちのいくつかはフォワードで機能し、いくつかは機能しない。しかし、それらを選択する方法はない。

上で提案したように、優れた密造工場の助けを借りるしかない。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2730