トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2730

 
Aleksey Nikolayev #:

ここであなたは多変量サンプル(各要素は表の行、ベクトル)について話しているようですが、あなたの3つのリンクの均質性基準は数値サンプルについて話しています。matstatの多変量均質性基準は別の曲で、私にはよくわかりません。

各予測変数は別々に数値標本であり、なぜ別々に評価し、結果を平均しないのでしょうか?ほとんどの予測変数に悪化のダイナミクスがある場合、サンプルは冗長になります。

アレクシー・ニコラエフ

多くの変化点の検出を検索するタスクのように見えます。繰り返しになりますが、多変量(ベクトル)のケースを扱う必要があることがわかり、物事が非常に複雑になります。

まあ、一般的に、どの属性が研究に選ばれるかに依存するのは好きではない。異なる属性を選択すれば、結果は異なるかもしれない。

おそらく、特定のグループに属するセグメントの識別や、グループ化された母集団に対するトレーニングの効率という点で、最良の結果が得られるような変種を見つけるべきなのだろう。

 
Aleksey Vyazmikin #:

サンプルの中でしかミックスできない。2つのサンプルをミックスすれば、市場が変化していることを否定することになる。

もう一度理屈を考えてみてください。
トレーニングサンプルの最適な長さを決めるためにシリーズを比較するのは無意味です。

どの時点で混合しても、何も変わりません。
 
Maxim Dmitrievsky #:
もう一度理屈を考えてみてください。
トレーニングサンプルの最適な長さを決めるためにシリーズを比較するのは無意味だ。

どの時点でミックスしても、何も変わらない。

市場が変化していることをどうやって証明するのですか?そのプロセスにはどれくらいの時間がかかるのか?それとも常に変化しているのか?

 
Aleksey Vyazmikin #:

市場の変化可能性をどのように証明するのか?このプロセスにはどれくらいの時間がかかるのか?それとも常に変化しているのか?

以上、愉快な論客の登場だ。
少なくとも非定常性。絶え間なく変化し、時には一服する。
 
Maxim Dmitrievsky #:
以上、愉快な論客が登場。
少なくとも不安定だ。絶えず変化し、時には一服するために止まる。

そして、定常性/非定常性を決定するために、どの程度のサンプルサイズを取るべきか?

あなたによれば、パターンの寿命はサンプルの変化の寿命よりも長くないというが、私のサンプルに8年間繰り返すパターンがあるとしたらどうだろう?それは異常なのか、パターンがすべて変化しているわけではないのか、あるいは狭い範囲で確認されたパターンが誤りであり、他の要因によるものなのか?

 
Aleksey Vyazmikin #:

各予測因子はそれぞれ数値標本であり、なぜ個別に推定して結果を平均化しないのか?

これは独立した特徴の場合にのみ機能し,それらは同じ価格でカウントされるので,それは不可能である.一変量分布は常に同じ一様ですが、二変量分布は大きく異なることがあります。

Aleksey Vyazmikin#:

おそらく、特定のグループに属するセグメントの識別や、グループ化された母集団に対するトレーニングの効率化という点で、最良の結果が得られるような変種を見つけるべきでしょう。

列挙の計算が大変ですね)(すでにかなりの量の列挙に)特徴タイプによる列挙と、おそらく特徴パラメータによる列挙を追加しなければならないでしょう。

とはいえ、あなたのアプローチには合理的な粒子があるように思えます。

 
Aleksey Vyazmikin #:

あなたの理論が正しければ、サンプルは増加するにつれて類似しなくなり、これを理解するためには、類似性を評価する方法から派生した、その変化を評価するための基準が必要である、と私は書きませんでしたか?

おそらく、サンプルの均質性に関する統計的基準の代わりに、ダイナミクスにおけるモデルの特徴の重要性の変化を(スライディングウィンドウで)観察すべきなのでしょう。

もし現在の状態と以前の状態の間に強い不一致があれば、それはすでに異なるサンプルにいることを意味します。

長所
1.スタットをプログラムする必要がない。テストは箱から出してすぐにできる。
2.サンプルの時間的変化だけでなく、ターゲットサンプルの変化も考慮される。

 
Aleksey Vyazmikin #:

また、定常性/非定常性を判断するには、どの程度のサンプルサイズを取るべきでしょうか?

あなたによると、パターンはサンプルの変化の寿命より長くは生きないということですが、もし私のサンプルに8年間繰り返されるパターンがあるとしたらどうでしょうか?それは異常なのか、パターンがすべて変化しているわけではないのか、あるいは狭い範囲で確認されたパターンが間違っていて他の要因によるものなのか?

私は、任意の時間スケールにおける特定のトレンドの寿命以上のものはないと言いたい。
しかし、それは緩やかな表現だ。

点から分岐点まで。
 

モデルは違うが似ている、似ているが違う、似ていないがどう違うのか?分岐点は必ずしもモデルの変更につながるとは限らない。同じ部分を手動で視覚的にマークすることは可能だが、最後に予測的な部分はない。

モデルの複雑さ、ここにももちろん矛盾がある。単純なモデルは、十分に必要な長さの区間を記述することはできないが、繰り返される。いつものように、その中間が必要なのだ))))))

 
Valeriy Yastremskiy 最小の サンプル長を見つける ことである。

モデルの複雑さ、ここにももちろん矛盾がある。単純なモデルは、十分に必要な長さの区間を記述することはできないが、繰り返される。いつものように、その中間が必要なのである))))))

一般に、異なるモデルはランダム性の実装において異なるが、同じ理由で類似している。

特に数十から数百の特徴が使われる場合。そのうちのいくつかはフォワードで機能し、いくつかは機能しない。しかし、それらを選択する方法はない。

上で提案したように、優れた密造工場の助けを借りるしかない。
理由: