トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2022.09.04 18:54 #27261

Aleksey Nikolayev #:

あなたの仮定は強すぎるようだ。もしそれを実現することが可能であれば、それは事実上聖杯のようなものでしょう。私が解決したいのは、もっと控えめで具体的な問題、つまり、トレイネの十分な長さと、その中に時代遅れの例がないことの妥協点を見つける一般的な方法を見つけることです。

私の意見では、この問題はMOとmatstatを我々の分野に応用するための基本的な問題である。

実験的に試したことはないのですか？結局のところ、この問題に対するあなたの理論的アプローチによれば、サンプルサイズが臨界的に増加した後、サンプル中のパターンは古くなり、もはや機能しなくなります。つまり、サンプルが増加すると、学習が質的な意味で悪化し、新しいデータに対する結果が悪くなるはずです。

Maxim Dmitrievsky 2022.09.04 20:23 #27262

Aleksey Nikolayev #:

すでに訓練されたモデルの事後分析が得られます。トレーニングサンプルを選択する段階でのアプリオリな分析を補足したい。

私もそう思います。シンプルにするためにジグザグの最後にできた頂点を使うことにしたが、もっと凝ったものが欲しい。

私は、新しいデータから作業ピースだけを取り出して、古いデータと新しいデータの両方で機能するように、2番目のモデルの形でフィルターを適用し始め、その後、記事のように他の新しいデータでそれをチェックします。

これも一種のフィッティングですが、モデルの誤差に基づいています。少なくとも、うまく分類できた変種を選択するように、ランダム性（少なくとも訓練と検証、その他の検証）以外に何かがあるのです。

もし先験的に何かを敷設するのであれば、おそらくどんな長期的なモニタリングも意味があり、それは少なくともいくつかの適切なマークアップを与えるだろう。兆候を拾う

私は、機能とターゲットの新しいスパマーを思い付いた（それは有益であるように思われ、それは、通常のランダムサンプリングに比べて）。しかし、いくつかの亜種があり、まだテストしていない。

Aleksey Nikolayev 2022.09.05 04:27 #27263

Aleksey Vyazmikin #:

実験的に試したことはないのですか？結局のところ、この質問におけるあなたの理論的アプローチによれば、サンプルサイズが決定的に増加した後、サンプル中のパターンは古くなり、もはや機能しなくなり、したがって学習は質的な意味で悪化するはずであり、新しいデータではサンプルが増加すると結果が悪くなる。

あなたはおそらく、履歴の長さに対して多数の変種を多数の時点について学習することは、完全に膨大な計算タスクであることに気づいているだろう。たとえ奇跡的にこれらの統計をすべて集めることができたとしても、この情報の山を有意義に体系化することには疑問が残るだろう。きっと、それぞれの時点に最適な歴史の長さは異なるだろう。そして、これをどのように解釈し、最も重要なことは、どのように未来に外挿するかである。

私は逆に、トレーニング履歴の長さに対してバリアントの数を劇的に減らす（文字通り数バリアントまで減らす）ためのヒューリスティックを考え出したいと思っている。

Aleksey Nikolayev 2022.09.05 04:31 #27264

Maxim Dmitrievsky #:

私は、新しいデータから作業チャンクだけを取り出し始め、古いデータと新しいデータの両方で機能するようにフィルターを第2のモデルとして適用し、記事のように他の新しいデータでチェックする。

これも一種のフィッティングですが、モデルの誤差に基づいています。少なくとも、うまく分類できたバリアントを選択するように、ランダム性以外に何かがあるのです（少なくとも訓練と検証、その他の検証において）。

アプリオリに何かを敷設する場合、それはおそらく、任意の長期的な監視を取ることに意味があります、それは、少なくともいくつかの適切なマークアップを与えるだろう。兆候を拾う。

私は、機能とターゲットの新しいスパマーを思い付いた（それは有益であると思われるので、通常のランダムサンプリングと比較されます）。しかし、いくつかの亜種があり、まだテストしていない。

私はそれについて熟考する必要があります。私自身のアイデアやコンセプトにどのように反映させればいいのかよくわからない。

Maxim Dmitrievsky 2022.09.05 06:39 #27265

Aleksey Nikolayev #:

私はそれについて考えなければならない。自分の認識や概念の言語にどう翻訳すればいいのか、よくわからないんだ。

また、ティックからバーに切り替えると、予測力が大幅に低下します。

しかし、dtsとの潜在的なコンフリクトは取り除かれる)

Aleksey Nikolayev 2022.09.05 07:35 #27266

Maxim Dmitrievsky #:

また、ティックからバーに切り替えると、予測能力が大幅に低下する。

しかし、dtsとの潜在的なコンフリクトは解消される :)

ところで、これは重要な実用的かつ興味深い理論的問題でもあります。実際のビッド-アスク・スプレッドの出来高（流動性、ボラティリティ）依存性として定式化し、対応する回帰を計算し、FXと証券取引所の商品を比較することなどができます。もうひとつは、TSが大量の取引を行っている場合にのみ興味深いということである。）

Aleksey Vyazmikin 2022.09.05 08:40 #27267

Aleksey Nikolayev #:

おそらく、歴史の長さのために、多数の変種を多数の瞬間について訓練することは、絶対的に膨大な計算作業であることに気づいているだろう。たとえ奇跡的にこれらの統計をすべて集めることができたとしても、この情報の山を意味のある体系化することには疑問が残るだろう。きっと、それぞれの瞬間に最適な歴史の長さは異なるだろう。そして、それをどのように解釈し、最も重要なことは、それをどのように未来に外挿するかである。

私は逆に、トレーニング履歴の長さに対してバリアントの数を大幅に減らす（文字通り数バリアントまで）ためのヒューリスティックを考え出したいと思っている。

実験の問題は解決可能で、私も似たようなことをやったことがある。

その時、サンプルの比較可能性を推定する方法を掘り下げるべきだという考えに至りました。しかし、私はそれを実行することができなかった - 私は式を理解していなかった。

Aleksey Nikolayev 2022.09.05 10:33 #27268

Aleksey Vyazmikin #:

実験の問題は解決できる。

技術的にはかなり解決可能だ。問題は、そのような実験の結果をどう解釈するかだ。

Aleksey Vyazmikin#:

私はその時、サンプルの比較可能性を評価する方法について掘り下げるべきだという考えに至りました。しかし、私はそれを実現することができなかった - 私は式を理解していなかった。

Matstatには、たとえば標本の均質性をチェックするためのたくさんの検定があります。もちろん、私があなたの用語を正しく理解していればの話ですが。

Maxim Dmitrievsky 2022.09.05 10:34 #27269

Aleksey Nikolayev #:

ところで、これは重要な実践的かつ興味深い理論的問題でもある。実質ビッド・アスク・スプレッドの出来高（流動性、ボラティリティ）依存性として定式化し、対応する回帰を計算し、FXと証券取引所の商品を比較する、などといったことができる。もうひとつは、TSの取引量が多い場合にのみ興味深いということである。）

ああ、混乱していて何もわからない。この出来高付きの相場はどこから入手するのか、どんなサプライヤーがいるのか、存在するのか、そんなことまで。結局のところ、たとえ成功したとしても、似たような原理で他のすべてのように、このような有害なツは禁止されるだろう。あるいは、帽子を持ってさまざまな場所を走り回り、魔法のペンデルの前にその中に落ちるものを集める。

時間トランザクションの長さからTSを歓迎し、それはいくつかの楽器で可能である、彼らは毒性の面で特に緊張を誰もしないように見えるが、それは彼らが緊張しないので、おそらく、そのような難しい作ることは困難である。

Aleksey Nikolayev 2022.09.05 10:38 #27270

Maxim Dmitrievsky #:
ああ、理解できないほど混乱している。どこからこんなボリュームの見積もりを取ってくるのか、どんな業者を使っているのか、存在するのかどうか、そんなことまで。結局、うまくいったとしても、似たような原理で、このような有害なTSは他のTSと同様に禁止されるだろう。

fxsaberは、問題はいくつかの大きなターンオーバーから始まると書いたと思います。おそらく、あなたのTSは、コピーの間であまりにも高い人気の犠牲になっている)

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2727