トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1620

 
アレクセイ・ヴャジミキン

クラスタリングの入力は何ですか? - すべてのサンプル予測変数ですか?

そうですね...でも、実験もできますしね。

 
アレクセイ・ニコラエフ

その考えを、ある程度論理的にまとめていく。同じ資産にあるシステムのセットがあるとします。各システムは、市場に出たとき、一定の数量のポジションを持ちますが、方向が変わることがあります。戦略のリターンとボラティリティは既知である。 ここで、T1 と T2 は市場に存在する時間、t1 と t2 はこれらの戦略が同時に市場に存在し、それぞれ同じ方向と反対方向を向いている時間であり、(t1-t2)/sqrt(T1*T2)式を使って戦略間の相関を定義してみましょう。SBへの価格接近を想定して導き出された簡便な計算式です。これで、マーコウィッツ理論を適用して最適なポートフォリオを見つけるためのデータはすべて揃った。

明らかに、この方法では意味のあるポートフォリオは得られません(少なくとも、1つの資産しか使用されていないため)。少し修正する必要があります。

1) 最適化アルゴリズムの変更(パラメータ制限、ペナルティ)。戦略間の相関の定義を明確にする。

2)戦略作成の時点ですでにポートフォリオを最適化する。つまり、それに対するポートフォリオの最適化条件に基づいて戦略を探します。これをどのように形式化し、実用化するのかがよくわからないが、一般的にはこのアプローチの方が論理的であるように思われる。すでに書かれているように、アルゴリズムを書き換える必要があるなど、いろいろありますが。手間をかける価値があるかどうか

おっしゃるとおりです。なぜなら、市場に参入するだけでは十分ではなく、時間内に撤退しなければならないからです。ここでは、条件付きで2つの類似した戦略、1つは固定テイクで、もう1つはテイクなしですが、高い時間相関を与えますが、異なる財務結果をもたらします。例えば、2つの似たようなストラテジーがあると便利です。1つはフラットな状態で利益を出し、もう1つはトレンドの状態でより多くの利益を出し、共にバランスカーブを滑らかにすることができます。

戦略数が少なければ、その直接探索と共同推定が可能である。

 
mytarmailS:

そうですね...でも、実験もできますしね。

また、ランダム化を行わず、妥当な計算時間で納得のいく結果を得るには、どのようなアルゴリズムを選べばよいのでしょうか?クラスタリングは苦手なんです。

 
Aleksey Vyazmikin:

CatBoostを研究してきましたので、その話をします。

深さは4~6分割が推奨されています。これは、私が一般的に試している深さです。

予測分割は、3種類のアルゴリズムから選択することができます。いわゆるグリッドが出来上がります。

分割の結果は、自分で引き出して見てみると面白いですよ。AlgLibはforestのツリーを構築する際、予測因子をどのように等分しているのでしょうか?

AlgLibは、入力された部分を中央値で分割します(訂正 - 中央値ではなく、中央値です)。例えば、100個の例が来た場合、値をソートし、50個目の例からの値で割るのです。コードには分位数オプションがありますが、使用されていません。

XGBoostについて、ランダム除算の変種があることを思い出しました。キャットバストでも同じようです。

一般に、このような浅い木を推奨するのはおかしい。
以前にも書きましたが、このような浅いツリーでは、価値の2~3割といったセクターが選択されることはまずありません。せいぜい1、2回が中央値で割るか、Boostsでランダムな値で割る程度です。
深さが100だったら、何かの予測で20~30%のセクターになることは十分あり得る。

Boostsでは、メインツリーで使われなかった他の予測子を使うこともあるのですが、それらも1~2倍程度しか離れていないため、多数の絞り込みツリーによって補われているのだと思われます。

 
アレクセイ・ヴャジミキン

また、ランダム性を排除し、適度な計算時間で納得のいく結果を得るには、どのようなアルゴリズムを選べばよいのでしょうか?クラスタリングは苦手なんです。

はい、任意のトレーラー(knn、som、dtwclust...)で、最高のバリアントは確かに実験を表示されます...

誤解しないでいただきたいのは、私が書いたものを使っているわけではなく、あなたの考えを読んで、少し違う側面から実装を見たので、発言したまでです......。結果を保証するものではありません

 
elibrarius:

Algibは入力されたスライスを中央値で分割します。例えば、100個の例が来たら、値をソートして50個目の例からの値で割る。コード内に分位数によるバリアントがありますが、使用されていません。

XGBoostについて、ランダム分割のオプションがあることを思い出しました。キャットバストでも同じようです。

一般に、このような浅い木を推奨するのはおかしい。
以前にも書きましたが、このような浅いツリーでは、価値の20~30%といったセクターが選択されることはまずありません。せいぜい1、2回が中央値で割るか、Boostsでランダムな値で割る程度です。
深さが100だったら、何かの予測で20~30%のセクターになることは十分あり得る。

Boostsでは、メインツリーで使われなかった他の予測子を使うことができる、多数の絞り込みツリーによってこれを補っているのだと思います。

現実は我々の想像とは違うかもしれません。CatBoostの パーティショニングアルゴリズムを再現して、そこで実際に何が起こっているのか、どの程度正しいのかを確認する必要があります。

ランダム性については、予測格子分割の選択にランダム性があり、ベストなものではなく、ランダムなものだと理解しています。そして、スタックをレンジで不均等に分割するアルゴリズムがあります。

 
mytarmailS:

トレーラーでは、どのようなもの(knn、som、dtwclustなど)を使っても構いませんが、最適なオプションはもちろん実験によって示されます。

誤解しないでいただきたいのは、私が書いたものを使っているわけではなく、あなたの考えを読んで、少し違う側面から実装を見たので、発言したまでです......。結果を保証するものではありません。

私は保証について話しているのでしょうか。ただ、あなたの考えを理解することに興味があります。

 


Neuroインジケータはほぼ完成しています ))これはEAで、純粋に私の技量不足を示す指標です。
 
上部のオレンジ色の部分-下降を予測、下部の緑色の部分-上昇を予測、ニューラルネットワークの信頼度の太さです。BTCUSD M1 のみで動作します(今のところ...)。
カッコイイですか?))
 
エフゲニー・デューカ
上のオレンジのゾーンは下降、下の緑のゾーンは上昇を予測します。BTCUSD M1でのみ動作します(現時点では)。
カッコイイですか?))

悪くないといえば悪いのですが、悔しいです。

基本的には通常の買われ過ぎ/売られ過ぎの指標と同じように機能します。

正しいこともあれば、間違っていることもある、あってはならないこと......。

このネットでトレードのテストは全くしていないのですか?私の経験では、儲からないと思うのですが...。

ネットの「信頼性」にフィルターをかければ別ですが。