トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2649

 
Aleksey Vyazmikin #:

すぐに気がつかなかったので、説明してくれてありがとう。

しかし、その後、最初の段階のアルゴリズムは、よりよくボックスに分離する予測変数のペアを見つけ、それらに「ピーリング」を適用する必要があることがわかりました。

いいえ、それは予測変数の数に関係なく機能します。各ステップで、どの予測変数とどのスライス(左または右)を切り取るのが最適かが選択されます。従来の決定木も同じことをする--各ステップで、予測変数とそのカットポイントの両方が、2つの新しいボックスを生成するために最適になるように選択される。PRIMとの唯一の違いは、各ステップで限りなく小さなスライスがカットされることであり、その結果、緩やかなプロセスに なる。

個人的には、標準的なアプローチにもう1つの改良を加えるのも面白いと思う。これについては、いつか考えてみたい。

 
Aleksey Nikolayev #:

これについては、いつか考えを述べるつもりだ。

もしかしたら、気づいてテストしたほうがいいかもしれない
 
Aleksey Nikolayev #:

いいえ,それは予測変数の数に関係なく機能します.各ステップで,どの予測変数とどのスライス(左または右)をカットするのが最適かを選択する.従来の決定木も同じことをする--各ステップで、予測変数とそのカット・ポイントの両方が最適になるように選択され、2つの新しい箱が生成される。PRIMの唯一の違いは、各ステップで、限りなく小さなスライスがカットされることであり、その結果、漸進的なプロセスに なる。

個人的には、標準的なアプローチにもう一つの改良を加えて、それぞれの箱を2つではなく3つの新しい箱に切り分けるという方法も面白いと思う。これについては、いつか考えを述べるつもりだ。

https://xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html
 
Aleksey Nikolayev #:

いいえ,それは予測変数の数に関係なく機能します.各ステップで、どの予測変数とどのスライス(左または右)をカットするのが最適かを選択する。従来の決定木も同じことをする--各ステップで、予測変数とそのカット・ポイントの両方が、2つの新しいボックスを生成するために最適になるように選択される。

ですから、私はそうではないと主張したのではありません - それは機能します - ただ実装の問題です - 良い境界を持つ2つの予測子を任意に取ると、箱は出てきません - そこがポイントです!だからペアワイズ探索は一度に行われると仮定したんだ。

Aleksey Nikolayev#:

PRIMの 違いは、各ステップで限られた小さな断片が切り取られるという点だけです

カットオフとは、木の根に近いところで条件付きで分割された後の小さな残留物という意味ですか?

Aleksey Nikolayev#:

個人的には、各ボックスを2つではなく、新たに3つに切り分けるという、標準的な手法の別の修正も面白いと思います。これについてはいつか考えてみたいと思います。

なぜ5つではないのですか?:)実験には大賛成だ!

 
mytarmailS #:
多分、実現とテストの方がいいだろう

そうはならないと思う。今のところ漫然とした仮定しかない。

重要な規則がA<x1<Bであることはどこからか確実に分かっているが、今のところa<x1<bという規則があり、a<AかつB<bであるとする。良いルールは、例えば1)a<x1<B、2)A<x1<Bという ように、少なくとも2段階で得られる。 実際には、これは別の予測変数のパーティショニング・ステップが誤ってこれらの2つのステップの間に入り込み、この重要なルールが最終的に表示されないことを意味するかもしれない。したがって、各ステップでの分割チャンクの数は固定ではなく、最適性の考慮から決定されるかもしれません。特別な場合(戦時中の正弦のように)、その数は5と等しくなる。

 
Aleksey Vyazmikin #:

カットオフとはどういう意味ですか?

いい木を作ろうという考えはまったくないのだろう-彼らはただ「いい塊」を切り落としたいだけなのだ)私は、隙間なく空間全体を舗装しなければならないタイル職人のふりをするよりも、むしろ取引に適した塊を切り出すべきだという考えに近い)これは、「常に相場にいようとするな」という古くからの名言とまったく一致する。予測者が「良い塊」に入らないケースは単に無視されるだけなので、ツリーは結局あまり役に立たない。

確かに、ツリーを放棄すると、可能性のあるボックスの交点をいじくり回すことになるが、うまくいくのであれば、ツリーは哀れではない)

 
Maxim Dmitrievsky #:
https:// xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html

それは、私の小さな実験よりももっと深刻なことのようです)予測変数間の依存構造を考慮に入れることと関係しているようです。

 
Aleksey Nikolayev #:

うまくいくとは思えない。今のところ、漫然とした推測に過ぎない。

重要なルールがA<x1<Bであることはどこからか確実に分かっているが、とりあえずa<x1<bというルールがあり、a<AかつB<bであるとする。良いルールは、例えば1)a<x1<B、2)A<x1<Bという ように、少なくとも2段階で得られる。 実際には、これは別の予測変数のパーティショニング・ステップが誤ってこれらの2つのステップの間に入り込み、この重要なルールが最終的に表示されないことを意味するかもしれない。したがって、各ステップでの分割チャンクの数は固定ではなく、最適性の考慮から決定されるかもしれません。特別な場合(戦時中の正弦のように)、その数は5と等しくなる。

シンボリック回帰を使い、他のアルゴリズムが提供するものではなく、あなたが望むものを正確に設計してください。

あなたはRkuを知っていて、パッケージがあり、例題があり、すべてが以前から行われていて、私たちのために行われている。

 
Aleksey Nikolayev #:

私の小さな実験よりももっと深刻なことのようだ)予測変数間の依存構造を考慮に入れることと関係しているようだ。

もし1と2だけが相互作用できるとしたら。あるいは3,4,5。そうすると、最初の分割、たとえば3での分割の後、すべての下流の分割は、集合3,4,5からのみとなります。
単純に1,2と3,4,5のセットから2つのツリーを構築すると仮定します。10個のセットがあれば、10本の木がある。等々。
 
でも、これはブースティングだね。それから、1つのセットで最初のツリー。他のセットで2本目の精製ツリー、といった具合だ。
理由: