トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Nikolayev 2022.02.05 07:44 #25681

mytarmailS#:
トレンド決定論のテストがあるかどうかは、誰にもわからない...。

これが本当にトレンドなのか、それともランダムな変動なのかを知る必要がある...。

もしかしたら、同じハースト？

異なるタイプのトレンドをすぐにテストできる

R最高!!!!

Rには良いトレンドパッケージがあり、線形トレンドの場合、そこからsens.slope()が良い。

vladavd 2022.02.05 07:53 #25682

mytarmailS#:

金融数学とIRの何がわかるか、市場の仕組みとプレーヤーを知る必要がある

群衆は、そのカウンターエージェントが「大手」であるため、ほとんどの場合、負けるに決まっている。

1）彼らは、小売の買い手と売り手の不均衡を見る必要があります：多くの売り手がある場合、「大きなプレーヤー」（買い手）は、取引の反対側にあります。

例えばJewで今みたいに、多くの売り手が

2）群衆に対抗する瞬間の取引もある、これはマーケットメーカーである

常に群衆と逆の動きをすることが見受けられる（逆相関）。

群衆が成長を信じて買っている間は、価格は下がり、その逆もある...。

それが市場全体の...

p.s. そして、ビデオも必ず見ます。

それにも少なからず問題があるのです。私たちが入手できるのは市場のほんの一部で、どのように代表的で信頼性の高いものであるかは不明です。2枚目の写真（一般的な感情）は、まったく役に立ちません。第一に、反転は、「群衆に逆らう」トレンドが続くと思われる極限で起こるのが常である。第二に、制裁は単に価格（逆さで、トレンドが少ない）を繰り返すだけである。まあ、インジケータが価格を繰り返すということは、その予測は価格チャートそのものより簡単ではないということですよね？最初の絵（ガラスとオープンポジション）と利益率の値の方が価値があるのですが、それもそう...。は非常に疑問です。

Aleksey Vyazmikin 2022.02.05 08:05 #25683

Aleksey Nikolayev#:

具体的にどのようにコード化するかは、（組み合わせの観点から）大きな違いはないのです。ポイントは同じで、各ラインにはどのルールが適用され、どのルールが適用されないかが特徴としてあります。常に2^Nの変種であり、Nはルールの数である。その後、これらのルールは、最終的に2^(2^N)個のバリエーションに含まれることになります。これだけのバリエーションを形式的に試すだけでは無理があるのは明らかです。だからこそ、合理的にアレンジすることに意味があるのです。例えば、まず1つのルールで記述されたすべてのvariantを取り、次に2つのルールで記述されたすべてのvariantを取り、といった具合である。とか、そんな感じです。

説明不足かもしれませんが、もう一度強調しておきたいのは、初期サンプルを使っていることです。CatBoost学習アルゴリズムでは、初期サンプルは一度量子化されます。例えば、1000個の予測変数があり、それぞれを10個のセグメントに量子化した結果、10000個のセグメントができました。さらに、CatBoostアルゴリズムは予測変数をランダムに取り出し、エッジ/量子化を実行し、中間である量子を選択するために、3つの不等式を構築するか、8つの葉を作成する必要があります。アルゴリズムがそのような木を作るかどうかも、ランダム性の愛があり、隣の量子が葉に入り込むこともあるので、確実ではありません。そして、それは一本の木だけであるように。私の方法では、不等号は1つで十分です-2枚の葉。仮にすべての予測変数が使われ、それぞれに有用な1葉があったとしても、モデル作成時の組み合わせの数はかなり少なくなります。しかし、重要なことは、新しいツリーを構築する必要がある安定化するための誤ったサンプル分割があまりないため、ノイズも少なくなることです（ブースティングの原理）。

アレクセイニコラエフ# :

遅かれ早かれ、他の多くのプレーヤーがそれを見つけることになるでしょう。

それなら、どうにかしてこの説を検証すべきなのでは？この法則によれば、優位性の再発の最小頻度があり、それを超えると、優位性が存在し続けるよりも消滅する可能性が高くなるのですか？

例えば、我々はそれぞれの半年を測定し、1,5年の利点がある - 我々は半年が動作することを考慮し、それがすでに2,5年であれば意味がないとそれを取る - それは動作を停止することをより確率が高いです。

科学的な数式は苦手なのですが、この計算方法と仮説の確認方法を教えてください。

mytarmailS 2022.02.05 08:29 #25684

Aleksey Nikolayev#:

Rにいいトレンドパッケージがあるので、そこから線形トレンドならsens.slope()でいいんじゃない？

しゃい

vladavd#:

それにも問題があり、かなりの数にのぼります。私たちが入手できるのは市場のほんの一部であり、それがどの程度指標となり、信頼できるものなのかはわかりません。2枚目の画像（全体的なセンチメント）は、全く役に立ちません。第一に、反転は、「群衆に逆らう」トレンドが続くと思われる極限で起こるのが常である。第二に、制裁は単に価格（逆さでトレンドの少ない）を繰り返すだけであり、どんなオシレーターでも反転させれば、非常に似たような絵が得られる。まあ、インジケータが価格を繰り返すということは、その予測は価格チャートそのものより簡単ではないということですよね？最初の絵（ガラスとオープンポジション）と利益率の値の方が価値があるのですが、それもそう...。は非常に疑問です。

いろいろなことに迷い、表面的になりすぎて、考えなしに情報を捉えてしまっているのですね。

Aleksey Nikolayev 2022.02.05 08:33 #25685

Aleksey Vyazmikin#:

説明不足かもしれませんが、CatBoostの学習アルゴリズムでは、元のサンプルを一度量子化する、つまり例えば、1000個の予測変数があり、それぞれを10個のセグメントに量子化した結果、10000個のセグメントができました。さらに、CatBoostアルゴリズムは予測変数をランダムに取り出し、エッジ/量子化を実行し、中間である量子を選択するために、3つの不等式を構築するか8つの葉を作成する必要があります。アルゴリズムがそのような木を作るかどうかも、ランダム性の愛があり、隣の量子が葉に入り込むこともあるので、確実ではありません。そして、それは一本の木だけであるように。私のやり方では、不等号は1つで十分です-2枚の葉。仮にすべての予測変数が使われ、それぞれに有用な1葉があったとしても、モデル作成時の組み合わせの数はかなり少なくなります。しかし、重要なことは、新しいツリーを構築するために必要な安定化のための誤ったサンプル分割があまりないため、ノイズが少なくなることです（ブースティングの原理）。

おそらく、1つの決定木の例であなたのアプローチを説明する必要があります。しかし、それだけですでにブースティングはかなり複雑な構造、つまりリファイニングツリーのシーケンスを構築しているのです。そして、あなたはまだそれを使って別のことをやっています）。

Aleksey Vyazmikin#:

それなら、この説をどうにかして確認する必要があるのでは？それによると、利点の再発の最小頻度があり、それが増加した後は、その存在の継続よりも消滅の確率が高くなるのですか？

例えば、半年ごとに測定すると、1,5年のメリットがある - 半年はまだ動作することを考慮し、それがすでに2,5年であれば、意味がないとそれを取る - それは動作を停止する確率が高くなります。

科学的な数式に強くないのですが、このような計算をして仮説を確認する方法を教えてください。

半減期のある放射能の公式のようなもの）人間の活動はそんな単純な公式では説明できないと思います。

Aleksey Vyazmikin 2022.02.05 08:50 #25686

Aleksey Nikolayev#:

おそらく、1本の決定木を例にして、そのアプローチを説明すべきなのでしょう。しかし、ブースト自体はすでにかなり複雑な構造、つまり木の精錬列を構築しているのです。そして、あなたはまだそれを使って別のことをやっています）。

たしかに、すぐに方法を理解するのは難しいというのはわかります。もっと詳しく説明する予定です。また、データはCatBoostに渡す前に処理されますが、分割するときに、あなたの言う「減衰」の変化するダイナミクスを考慮した、独自のアルゴリズムを作りたいと思っています。

Aleksey Nikolayev#:

半減期のある放射能の公式のようなものです）人間の活動はそんな単純な公式では説明できないと思います）あなたの「優位性の頻度」は、何か非常に予測不可能な形で変化する可能性があります。

何もないのかもしれないが、どうやって確認するのか？

vladavd 2022.02.05 08:53 #25687

mytarmailS#:

しゃい

この情報については、あまりにも表面的で考えも及ばず、いろいろと迷走していますね。

ああ、このツールでずっとやってきただけで、全然考えていなかったんだ。

具体的にどのような点に異論があるのでしょうか？

Forester 2022.02.05 08:54 #25688

Aleksey Vyazmikin#:

そうですね、そう言っておきましょう。

いや、今は不等号ルールの実行を1として、サンプルによってルールが発動されたときの対象（2値分類とします）の平均値を見て、最初の平均値が例えばサンプルの0.45で、応答による評価のみ後の値が0.51なら、予測器（そのプロット／量子）の予測力は0.06、すなわち6％と見なすのです。

このような、すでに独立したバイナリ予測因子であるセクションを持つ予測因子をたくさん集め、それを使ってモデルを構築します。

そのような量子をすべて（予測力のあるなしにかかわらず）組み合わせることは、さすがにすぐにできることではありませんが、予測力のある量子が特定されたベース予測器を用いて行うのであれば、無理なことではないのかもしれません。

しかし、理論上でも、可能な組み合わせが全サンプルより少ないので、この再教育は少なくなるはずです。

なぜ、このような量子パターンが7年間も機能し、突然停止するのか、その理由はまだ解明されていない...。

あなたのやっていることは正しく理解されていますか？:

1）1本の木を手に入れる。
2) 各ノードは最大10個の分岐を与えることができ、各分岐は1個の量子によって生成される（量子とは10%の予測子の一部：パーセンタイルまたは10%の振幅で、どの量子化方式が使われたかによって異なる）。
3) 最初の分割の後、3つの量子を見つけ、それが成功した葉につながる
4) その後の分割で、成功した葉につながるいくつかの良い分割/量子を見つける
5) 成功した葉の前に成功した量子を記憶する
6) 我々が選んだ量子だけを予測子として使う新しい木を構築する。

最初の木を量子化したのと同じ方法で、スクリプトで予測子を量子化すると、100のうち1000の予測子が得られ、それらはすでに0か1のバイナリになっています。予測値の値がこの範囲にあれば＝1、なければ＝0。
成功したパス/クアンタのみを選択するので、選択したクアンタの値はすべて＝1。もし、すべての予測変数が1であれば、新しい木は学習できない。答えはもう出ている。

それとも、もう新しいツリーを作る必要はないのでしょうか？予測値の値が選択された量子の中に入ったら、すぐにそれを実行するのでしょうか？

mytarmailS 2022.02.05 09:08 #25689

vladavd#:

ああ、このツールでずっとやってきたから、全然考えていなかったんだ。

何に反対なんだ？

具体的にはどのようなツールで？

vladavd 2022.02.05 09:10 #25690

mytarmailS#:

どのようなツールで？

さて、この写真には何が写っているのでしょうか？グラスと制裁

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2569