トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Nikolayev 2022.12.30 20:08 #28771

Maxim Dmitrievsky #:

ハッシュ関数を使えばいいのは明らかだ。しかし、どのような原理で任意の長さのベクトル（というか、そのための長さ）を選ぶのか、またどのようなデータから選ぶのか、恥ずかしながらお聞きしたい。

多くのバリエーションがある

最初の選択肢はより快適ですが、ロジックに何かを入れる必要があります。

これは非常に重要な質問で、私はいつもそれについて考えています）使用する履歴の長さについてだけ話しましょう。計算には関連性と長さの適度な妥協が必要です。短ければ短いほど関連性は高くなるが、長ければ長いほど計算は正確になる。良い妥協点は原理的に達成できないこともある。

Aleksey Nikolayev 2022.12.30 20:10 #28772

Maxim Dmitrievsky #:

よくやった。窓の長さを変えるという文脈で、自分自身にとって興味深いものを見つけることができた。

また何か質問があれば、スケッチしてください。

それでは、良いお年をお迎えください（笑)。

Maxim Dmitrievsky 2022.12.30 20:10 #28773

Aleksey Nikolayev #:

今年もよろしくお願いします。）

同じく :)

Forester 2022.12.30 20:29 #28774

GPTの会話から何を得たのかよく分からない。

彼は時々間違ったことを答えてしまう。以下はその例だ。

В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать.

*はい、理想的には、アルゴリズムは任意の数の特徴を扱うことができるべきです。

あなたは行の長さを変えることについて質問し、彼は列の長さを変えることについて答えた。

現実的には、履歴の長さはモデルを再トレーニングすることで変えることができる。例えば、1日、3日、7日、1ヶ月、2日、...でトレーニングする。1年、2年、3年・・・。どの長さの履歴でもうまく予測できる場合は、それを使用する。

sibirqk 2022.12.31 05:04 #28775

Aleksey Nikolayev #:

とても重要な質問なので、いつも考えています）使用する履歴の長さについてだけ話しましょう。関連性と計算のための長さの間には妥当な妥協点があるはずだ。短ければ短いほど関連性は高くなるが、長ければ長いほど計算は正確になる。良い妥協点は原理的に達成できないこともある。

私もずいぶん前にこの問題について考えたことがある。私自身は、このアプローチを使っています - 既知の大規模な履歴で金融資産のいくつかの特性を大まかに分析し、トレンド、ボラティリティなど、変化する傾向の座標を見つけ、このグローバルな特性がしばらくの間残ると仮定して、変化の最後のポイントから作業します。

Aleksey Nikolayev 2022.12.31 07:28 #28776

elibrarius 行の長さを変えることについて質問し、彼は列の長さを変えることについて答えた。
実際、履歴の長さはモデルを再トレーニングすることで変えることができます。例えば、1日、3日、7日、1ヶ月、2日、...でトレーニングする。1年、2年、3年・・・。どの履歴の長さでもうまく予測できる場合は、その長さを使用する。

コラムについてはまだまったく議論されていない。混乱は、サインが価格（バー、レンコなど）であることを言わないことに起因する。つまり、同質の属性のベクトルの任意の長さについて話しているのだ。属性のベクトルの任意の長さに加えて、属性の任意のタイプを持ちたいのであれば、それはすでに明らかなやりすぎである。

mytarmailS 2022.12.31 08:05 #28777

Aleksey Nikolayev #:

問題は、SBはルールがあるように見せるのが非常にうまいということだ。

ということは、任意の数の特徴の問題ではなく、そもそも特徴の不変性の問題なのだ。

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf

СанСаныч Фоменко 2022.12.31 09:29 #28778

Aleksey Nikolayev #:

とても重要な質問なので、いつも考えています）使用する履歴の長さについてだけ話しましょう。関連性と計算のための長さの間には妥当な妥協点があるはずだ。短ければ短いほど関連性は高くなるが、長ければ長いほど計算は正確になる。良い妥協点は原理的に達成できないこともある。

基準が必要であり、唯一の基準はモデルフィッティングの誤差である。

ここに写真がある。

これは2000本の棒グラフ、43変数のサンプルです。木の数を100以上に増やしても無意味であることがわかります。サンプル・サイズを変えました。その結果、1500本以上では絵が変わりません。これは、私の先生に対する予測変数のパターンの数が約100個であり、それらはすべて1500本の小節の履歴で見つけられることを意味します。さらにこれらのパターンは繰り返される。

Aleksey Nikolayev 2022.12.31 10:15 #28779

mytarmailS #:

そう考えると、任意の特徴数の問題ではなく、そもそもの特徴不変性の問題なのだ

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf

画像認識に例えるなら、大雑把に言えば、各点について、その点が位置する物体（ブロブ）の境界を見つける問題である。

問題は、写真の画質が極めて悪く、実際に何が描かれているのかよくわからないことだ。

このような状況で小さな物体を選択するのは非現実的であり、大きな物体は曖昧なまま選択される。

Aleksey Nikolayev 2022.12.31 10:22 #28780

СанСаныч Фоменко #:

基準が必要であり、唯一の基準はモデルフィッティングの誤差である。

ここに写真がある。

これは2000本の棒グラフ、43変数のサンプルです。木の数を100以上に増やしても無意味であることがわかります。サンプル・サイズを変えてみました。その結果、1500本以上の棒グラフは変わりません。これは、私の先生に対する予測変数のパターンの数が約100個であり、それらはすべて1500本の小節の履歴で見つけられることを意味します。さらにこれらのパターンは繰り返される。

1500小節は病院の平均温度である。履歴の半分が大きく異なるブレイク・ポイントが存在し、何も数えずに取引しない方が良い場合がある。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2878