トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

mytarmailS 2020.03.18 22:06 #16191

アレクセイ・ヴャジミキン

クラスタリングの入力は何ですか？ - すべてのサンプル予測変数ですか？

そうですね...でも、実験もできますしね。

Aleksey Vyazmikin 2020.03.18 22:09 #16192

アレクセイ・ニコラエフ

その考えを、ある程度論理的にまとめていく。同じ資産にあるシステムのセットがあるとします。各システムは、市場に出たとき、一定の数量のポジションを持ちますが、方向が変わることがあります。戦略のリターンとボラティリティは既知である。ここで、T1 と T2 は市場に存在する時間、t1 と t2 はこれらの戦略が同時に市場に存在し、それぞれ同じ方向と反対方向を向いている時間であり、（t1-t2）/sqrt（T1*T2）式を使って戦略間の相関を定義してみましょう。SBへの価格接近を想定して導き出された簡便な計算式です。これで、マーコウィッツ理論を適用して最適なポートフォリオを見つけるためのデータはすべて揃った。

明らかに、この方法では意味のあるポートフォリオは得られません（少なくとも、1つの資産しか使用されていないため）。少し修正する必要があります。

1) 最適化アルゴリズムの変更（パラメータ制限、ペナルティ）。戦略間の相関の定義を明確にする。

2）戦略作成の時点ですでにポートフォリオを最適化する。つまり、それに対するポートフォリオの最適化条件に基づいて戦略を探します。これをどのように形式化し、実用化するのかがよくわからないが、一般的にはこのアプローチの方が論理的であるように思われる。すでに書かれているように、アルゴリズムを書き換える必要があるなど、いろいろありますが。手間をかける価値があるかどうか

おっしゃるとおりです。なぜなら、市場に参入するだけでは十分ではなく、時間内に撤退しなければならないからです。ここでは、条件付きで2つの類似した戦略、1つは固定テイクで、もう1つはテイクなしですが、高い時間相関を与えますが、異なる財務結果をもたらします。例えば、2つの似たようなストラテジーがあると便利です。1つはフラットな状態で利益を出し、もう1つはトレンドの状態でより多くの利益を出し、共にバランスカーブを滑らかにすることができます。

戦略数が少なければ、その直接探索と共同推定が可能である。

Aleksey Vyazmikin 2020.03.18 22:11 #16193

mytarmailS:

そうですね...でも、実験もできますしね。

また、ランダム化を行わず、妥当な計算時間で納得のいく結果を得るには、どのようなアルゴリズムを選べばよいのでしょうか？クラスタリングは苦手なんです。

Aleksei Kuznetsov 2020.03.18 22:36 #16194

Aleksey Vyazmikin：

CatBoostを研究してきましたので、その話をします。

深さは4～6分割が推奨されています。これは、私が一般的に試している深さです。

予測分割は、3種類のアルゴリズムから選択することができます。いわゆるグリッドが出来上がります。

分割の結果は、自分で引き出して見てみると面白いですよ。AlgLibはforestのツリーを構築する際、予測因子をどのように等分しているのでしょうか？

AlgLibは、入力された部分を中央値で分割します（訂正 - 中央値ではなく、中央値です）。例えば、100個の例が来た場合、値をソートし、50個目の例からの値で割るのです。コードには分位数オプションがありますが、使用されていません。

XGBoostについて、ランダム除算の変種があることを思い出しました。キャットバストでも同じようです。

一般に、このような浅い木を推奨するのはおかしい。
以前にも書きましたが、このような浅いツリーでは、価値の2～3割といったセクターが選択されることはまずありません。せいぜい1、2回が中央値で割るか、Boostsでランダムな値で割る程度です。
深さが100だったら、何かの予測で20～30％のセクターになることは十分あり得る。

Boostsでは、メインツリーで使われなかった他の予測子を使うこともあるのですが、それらも1～2倍程度しか離れていないため、多数の絞り込みツリーによって補われているのだと思われます。

mytarmailS 2020.03.18 22:40 #16195

アレクセイ・ヴャジミキン

また、ランダム性を排除し、適度な計算時間で納得のいく結果を得るには、どのようなアルゴリズムを選べばよいのでしょうか？クラスタリングは苦手なんです。

はい、任意のトレーラー（knn、som、dtwclust...）で、最高のバリアントは確かに実験を表示されます...

誤解しないでいただきたいのは、私が書いたものを使っているわけではなく、あなたの考えを読んで、少し違う側面から実装を見たので、発言したまでです......。結果を保証するものではありません

Aleksey Vyazmikin 2020.03.18 22:48 #16196

elibrarius:

Algibは入力されたスライスを中央値で分割します。例えば、100個の例が来たら、値をソートして50個目の例からの値で割る。コード内に分位数によるバリアントがありますが、使用されていません。

XGBoostについて、ランダム分割のオプションがあることを思い出しました。キャットバストでも同じようです。

一般に、このような浅い木を推奨するのはおかしい。
以前にも書きましたが、このような浅いツリーでは、価値の20～30％といったセクターが選択されることはまずありません。せいぜい1、2回が中央値で割るか、Boostsでランダムな値で割る程度です。
深さが100だったら、何かの予測で20～30％のセクターになることは十分あり得る。

Boostsでは、メインツリーで使われなかった他の予測子を使うことができる、多数の絞り込みツリーによってこれを補っているのだと思います。

現実は我々の想像とは違うかもしれません。CatBoostのパーティショニングアルゴリズムを再現して、そこで実際に何が起こっているのか、どの程度正しいのかを確認する必要があります。

ランダム性については、予測格子分割の選択にランダム性があり、ベストなものではなく、ランダムなものだと理解しています。そして、スタックをレンジで不均等に分割するアルゴリズムがあります。

Aleksey Vyazmikin 2020.03.18 22:50 #16197

mytarmailS:

トレーラーでは、どのようなもの（knn、som、dtwclustなど）を使っても構いませんが、最適なオプションはもちろん実験によって示されます。

誤解しないでいただきたいのは、私が書いたものを使っているわけではなく、あなたの考えを読んで、少し違う側面から実装を見たので、発言したまでです......。結果を保証するものではありません。

私は保証について話しているのでしょうか。ただ、あなたの考えを理解することに興味があります。

Evgeny Dyuka 2020.03.18 23:15 #16198

Neuroインジケータはほぼ完成しています ))これはEAで、純粋に私の技量不足を示す指標です。

Evgeny Dyuka 2020.03.18 23:16 #16199

上部のオレンジ色の部分-下降を予測、下部の緑色の部分-上昇を予測、ニューラルネットワークの信頼度の太さです。BTCUSD M1 のみで動作します（今のところ...）。
カッコイイですか？))

mytarmailS 2020.03.18 23:48 #16200

エフゲニー・デューカ
上のオレンジのゾーンは下降、下の緑のゾーンは上昇を予測します。BTCUSD M1でのみ動作します（現時点では）。
カッコイイですか？))

悪くないといえば悪いのですが、悔しいです。

基本的には通常の買われ過ぎ/売られ過ぎの指標と同じように機能します。

正しいこともあれば、間違っていることもある、あってはならないこと......。

このネットでトレードのテストは全くしていないのですか？私の経験では、儲からないと思うのですが...。

ネットの「信頼性」にフィルターをかければ別ですが。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 1620