トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3091

 
 
Forester #:

ここまで8ページ。そして、これはまだ入門編である))
クロス・バリデーションによるシャープ(ただし、他の指標を使ってもいいと書いてある)による比較になるようだ。

私の理解では、4つのパラメータを最適化する必要があります。

summary(my_pbo)
Performance function Omega with threshold 1

      p_bo      slope       ar^2     p_loss 
 0.3714286  1.6891000 -0.0140000  0.3430000 
  • p_bo バックテストにおけるオーバートレーニングの確率)は0に近づける。
  • slope ( 線形回帰の勾配係数) は 1 に近いことが望ましく、これはトレーニング・サブセットとテスト・サブセットのパフォーマンス指標値の間に強い線形関係があることを示します。
  • ar^2 ( 修正済み決定係数) は,1に近いことが望ましく,これは線形回帰の精度がよいことを示す.
  • p_loss ( テスト・サブセットのパフォーマンス・メトリック値のうち、あるしきい値以下の値の割合) は、0に近いはずで、テスト・サブセットのパフォーマンス・メトリック値の大部分が、あるしきい値以上であることを示す。

ただし、これらの値は、選択されたパフォーマンス指標と閾値に依存する可能性があることに注意する必要がある。


多基準パレート前後多基準最適化の必要性

 
mytarmailS #:

私の理解では、最適化には4つのパラメータがある。

  • p_bo ( バックテストでのオーバートレーニングの確率)は、オーバートレーニングのリスクが低いことを示す0に近づける。
  • slope ( 線形回帰の勾配係数) は 1 に近いことが望ましく、これはトレーニング・サブセットとテスト・サブセットのパフォーマンス指標値の間に強い線形関係があることを示します。
  • ar^2 ( 修正済み決定係数) が1に近いことは,線形回帰の精度がよいことを示す.
  • p_loss ( テスト・サブセットのパフォーマンス・メトリック値のうち、ある閾値を下回る値の割合) は、0に近いはずで、テスト・サブセットのパフォーマンス・メトリック値の大部分が、ある閾値を上回っていることを示す。

ただし、これらの値は、選択されたパフォーマンス指標と閾値に依存する可能性があることに注意する必要があります。



オーバーフィットの統計
セクション 2 で紹介したフレームワークによりストラテジーのバックテス トの信頼性
bility を4 つの補完的な分析で特徴付けることが できる
1. バックテストのオーバーフィットの確率 (PBO):


2. パフォーマンスの低下:これは、より大きなパー
フォーマンスISがどの程度低いパフォーマンスOOSにつながるかを決定するものでBaileyら[1]で議論されたメモリ効果に関連する
[
3. 損失の確率:最適として選択されたモデル
ISがOOSに損失を もたらす確率
4. 確率的優位性 この分析では戦略ISを選択するために使用される手順
dureが、 N個の の選択肢の中から1つのモデル構成をランダムに選択
するよりも望ましいかどうかを判断する

以下、各項目について詳しく説明する。

 
Forester #:

これらのパラメーターが何なのか理解するには短すぎる。以下は、記事13ページからの詳細である(パッケージが記事のメソッドを完全に再現している場合だが、もしかしたら他の何かが追加/削除されているかもしれない)。

このパッケージはひどすぎる。こんなパータクはここ数年見たことがない。

コードはひどい

ドキュメントはほとんど役に立たない

どうやってCRANに入ったのか理解できない。


いまだに理解できないのだが、調査された取引システムはバッチに分けられているのか、それとも(このライブラリには)複数のTSがあるのか?

 
mytarmailS #:

私はまだ理解できないが、1つの取引システムがバッチに分割されて研究されているのか、それとも(このライブラリでは)複数のTSなのか。

異なるパラメータ/ハイパーパラメータで得られたモデル群の中から最適なモデルを選択する。入力は行列で、各列はモデルの1つの予測である。

違うかもしれない。私もまだ理解していない。
 
Forester #:

異なるパラメータ/ハイパーパラメータで得られたモデル集合の中から最良のモデルを選択する。入力は行列で、各列はモデルの1つの予測値である。

これはもうわかった。

結果の扱い方がわからない

私は1つの列(1つのTS)を与える

結果

summary(my_pbo)
Performance function Omega with threshold 1

  p_bo  slope   ar^2 p_loss 
0.0000 2.2673 0.9700 0.3710 

私は5列(5つのTC)をフィード

私はまた、1行を取得します。

summary(my_pbo)
Performance function Omega with threshold 1

     p_bo     slope      ar^2    p_loss 
0.3428571 1.9081000 0.0440000 0.2860000 

5つの行があるはずだし、もしそれがベストのTSの結果なら、ベストのTSのmndexがあるはずなのだが...。


この作者を殺してやりたい

 
Forester #:

異なるパラメータ/ハイパーパラメータで 得られたモデル集合の中から最良のモデルを選択する。入力は行列で、各列はモデルの1つの予測です。

あるいは違うかもしれない。私もまだ理解していない

これは、異なる市場セクション (パラメータ/ハイパーパラメータ)からTS利益リターンを取ると解釈することができますか?



異なる市場セクション == パラメータ/ハイパーパラメータ

 
mytarmailS #:

それは、市場のさまざまな部分 (パラメータ/ハイパーパラメータ)からTC利益のリターンを取っていると解釈できる。

正確には利益リターン。

mytarmailS#:

市場の 異なる部分== パラメータ/ハイパーパラメータ

私は正確に設定を理解したように:MA、SLなどの異なる期間。

 
mytarmailS #:

ももにもにも

5行か、ベストのTCならベストのmndexがあるはずだが...。

その結果、モデル(そしておそらく予測データとターゲット・データ)の全体的な評価が得られます
悪いモデルは、このような結果を与えます(0以上のOOS結果の17%のみ)。

良いモデル - 0以上のOOS結果の95

 
Forester #:

到着したのは帰国子女だ。

利益と損失があるでしょ?

だから、ポジションが空いたときに各州の帰国者を取るんだ。

フォレスター

私の理解では、MA、SLなどの異なる期間という設定です。

TSの設定が違うのではなく、異なる領域での取引を取るだけです。

理由: