トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 155

 
J.B:

これは、分類品質ゲインを経験的に推定するもので、この因子がなければ、すべてが単純で、相互情報、非線形多因子系における決定が信頼できない働きとなる。そして、4-5%という数字はドグマではなく、「すべての市場」と「情報の流れ」を使って、ある商品の価格のダイナミクスを無視して、ある地平線のためにその将来を予測できること、<5%悪化すること、それだけなのだ、と理解しなければならない。つまり、将来の資産の前上昇を予測する1分間の確率が例えば70%であれば、予測した系列の価格を分析用データから除外すると70 - (70-50)*0.5 = 69%となり、ほぼ差分のノイズ限界内に収まります。まあ、もちろん、市場だけでなく、世界中の市場のリアルタイムデータがあれば、内部情報もなく、一つの商品の価格だけなら・・・残念ですが、どんなAIを作ったとしても、そんなデータで市場を叩くよりターミネーターを作る方が簡単です。

まあ、いいや。

ゲインの上下を分類するのではなく、回帰モデルを構築するとしよう。だからR^2や他の決定論的な指標(例えばロバスト絶対偏差の指標)でもいいんです。

相互情報量について - 根拠がないのか、それともメトリックが信頼できない働きをするという強い証拠があるのか?私は疑問を持っています。

Update: 相互情報を使った合成データと実データについて、いろいろと調べてみました。依存性が定常的であれば、メトリックはどこでもうまく機能する。依存性がノイズになりかけている場合、メトリックは依存性ゼロを示すことがある。しかし、全体として、多変量非線形システムにおいて、例えばF1よりも性能が悪いという理由は見当たりません。こちらの記事で紹介しています:https://habrahabr.ru/company/aligntechnology/blog/303750/

しかし、増分する値動きを分類すると、およそ次のような図が得られました(5つの通貨ペアをまとめて、つまり1つのモデルですべての通貨を分類した場合)。


これは、50個の保留サンプルに対する少なくとも中央値の精度値で、最大で57%の領域です。個別の通貨ペアでは、中央値で60%以上の精度を達成しています。時系列データのみです。

 
アレクセイ・ブルナコフ

1)これは決してナイーブな見方ではない。それは、検索の方向性です。また、必ずしもニューラルネットワークである必要はありません。つまり、時系列の価格の過去の値から、実際のフォワードテストの時間軸に関係なく、利益を生む(コストを克服する)取引に十分な情報を引き出すことができる、というものです。

このテーマについて、いくつかのチャートも掲載します。現在、記事のための資料を作成しているところです。

2)追記:個人的には、オーバートレーニングにつながるすべての要因を考慮し、最も保守的で信頼性の高いモデルの条件を取ろうとすると、それは年間30〜40%以上(最大ドローダウン25%で)絞り出すことができないことが判明した。しかし、すでにヘッジファンドの利回りの中央値を超えている。その他、時系列のテクニカル分析によって長期的に得られるとされる宇宙的な利益は、すべて嘘である。

1) もちろん、あらゆる場所を探す必要はありますが、私はより多くの情報とそれだけを使うように提案しました。

2)アメリカのヘッジファンドでさえ、リターンの中央値はインデックスより低く、最も厳しいものでも10年間で平均15-20%は出せない。ただし、モデルは2-3以下のシャープ*で取引することは許されず、もちろん容量は10^6-9ドルで計算すると、誰もが少なくとも20-30%あるはずだが・・・。

 
J.B:

1)もちろん、あなたはあらゆるところを見なければなりませんが、私はただ、より多くの情報を利用することだけを提案しました。

2)中央値returneesもアメリカのヘッジファンドは、インデックス以下の悲しいですが、最も急な15-20%は10年の平均を与える、モデルは2-3以下のシャープ*と取引することはできませんが、もちろんそこに容量$ 10^6-9、計算は少なくとも20〜30%でなければなりませんが...。

1) それはそうです

2)そうですね...でも、このシャープ2-3は、どうやって算出しているのでしょうか?ファンドはどのように計算するのか、いや、どのようにこれが実際の取引における本当のシャープ推定値であると判断するのだろうか。

 
アレクセイ・ブルナコフ

追記:個人的には、過学習につながるあらゆる要因と格闘し、最も保守的で信頼できるモデル条件を取ろうとした結果、年率30~40%以上(最大ドローダウン25%)を絞り出すことは不可能であることが判明しました。しかし、すでにヘッジファンドの利回りの中央値を超えている。時系列に基づくテクニカル分析によって長期的に得られるとされるその他の宇宙的な利益は、すべて嘘である。

)))面白い!

この年率30~40%というのは、どれくらいのレバレッジなんでしょうか?

 
ドミトリー

)))面白い!

年間30~40%というのは、どれくらいのレバレッジでやっているんですか?

入金負荷は最大10%(1:10)。

まあ、時々、さらに何年も作っている例も見かけるので、その辺は書いておきます。しかし、それは手探りか、反則寸前のドローダウンの状態であった。

 
アレクセイ・ブルナコフ

入金負荷は最大10%(1:10)。

まあ、それ以上のことを何年もやっている例も時々見かけるので、指摘しておきますが。しかし、それは手探りか、反則寸前のドローダウンの状態であった。

私は預金の負荷のことではなく、レバレッジのことを指しているのですが、この年率30~40%の収益をどのようなレバレッジで得ているのでしょうか?
 
mytarmailS:

みんなアイデアがある、それは確認する価値がある、私はずっと前にそれを持っていた、私はチェックしたかったが、パッケージがわからなかったし、何とか忘れて放棄したが、ここで私はJ.Bの ブランチを読んで思い出した、それは彼がまた、同様のことをしたことが判明した:)。

あるBPが他のBPにどれだけ遅れているか、その間に何らかの関係があるかどうかを計算することができるのです.

私のアイデアの本質は、同時に多数のペアを監視し、各ペアを比較するために相互相関マトリックスのようなものを構築し、お互いにフォローするペアを見つけて、1つはこの遅れを取引することでした、市場は時間よりも不変のものを持っているので、私は計算が新しいバーごとに常に行われるべきであると思います、すぐに新しい関係が表示されたときに通知し、またすぐにこの関係が消えたときに通知するために...

なぜなら、マーケットメーカーの商品の価格は、ほとんど常に他の商品の1つまたは束によって導かれており、古典的な指標は適合しそうにないからです。

動的に変化する予測子を用いてニューロネットを学習させることもできる。要するに、すべては想像力によってのみ制限されるのだ......。

自分でも実装してみたいが、他のプロジェクトで忙しく、内臓をこぼしたくはない。

の相互相関の標準的なccf()関数は、P

は、事前にスペクトルをレベル分割し、クロスオーバーをチェックする "wavemulcor "を備えた高度なパッケージです。と、多くのBPを同時に比較することができます。

残念ながら失敗です。ペアは自分で歩きます。エントロピーはまた別の問題で、そちらの方が面白いです。
 
ディミトリ
預金残高の話ではなく、レバレッジの話なのですが、どのようなレバレッジで年率30~40%を稼いでいるのですか?
おっと、レバレッジの意味が分かっていないようですね。最大でも括弧内に1:10のレバレッジを指定しました(複数のトレードが判明した場合)。
 
ところでそうだ、もう記事を書き始めているんだ、出来上がり次第、このスレッドに投稿させてもらうよ。それが私の論文になります.:-)
 
アレクセイ・ブルナコフ
あ、レバレッジの意味がわかってないんですね。私は、最大でも括弧内に1:10のレバレッジを指定しています(複数の案件が判明した場合)。

10%はデポジットロードです。

1000ドルの預金がある場合、それを10%積み上げる、つまり100ドルの取引を開始します。

注意:ブローカーやコーチが提供するレバレッジによって、10,000ドル(1:100)、5,000ドル(1:50)、20,000ドル(1:200)という異なるロットを購入することができます。

追伸:ファッカーベイビー.........。

理由: