ATC構築におけるフィルターの有効性評価 - ページ 4

 
-Aleks-:

トレード数が減れば、ストラテジー(セット)の推定指標は確実に変化するわけで、それをどの程度変化させられるかが問題なのだ。

例えば、フィルターなしで、基本パラメータの全範囲の最適化では、平均500回の取引で、平均利益10万円、損失(負け預金)35%となります。 フィルターを適用すると、平均250回の取引で平均利益1万円、損失5%となります。利益は10倍、悪い結果の割合はわずか7%、取引数は2倍に減少していますが、これは良いのでしょうか、悪いのでしょうか?どちらの優先順位が高いのでしょうか?

統計学には標本の比較というものがある。

ある実験を行ったとする。何らかの要因の影響を調べることが主題です。この場合、フィルターの効果です。

2つのサンプルを比較します。最初のサンプルは全取引の結果の初期セットで、2番目のサンプルはフィルタリングされた結果です。

帰無仮説 - フィルターは機能しなかった、対立仮説 - フィルターは何かを除去した。

アレックスは、推定の最初のステップである、すべての取引の結果の分布を描き、異常値を探し、それを取り除くということを見逃していると思います。そうでなければ、「平均利益」のような指標は代表的なものではありません。
 

Dennis Kirichenko:

アレックス イミフでは、推定の最初のステップである、全取引の結果の分布を構築し、異常値を探し、それを除去することが欠けています。そうでなければ、「平均利益」のような指標は代表的なものではありません。

これらのバリエーションをどのように探せばいいのでしょうか?まだ完全に理解しているわけではありませんが、データの正規化についてではないでしょうか?単に戦略論の枠組みに当てはまらない非論理的な結果をふるいにかけるということであれば、このステップは既に踏まれていると考えられるが、非常に顕著な結果を除外するということであれば、その除外の正当性が必要であろう。

私は、逆に、魅力のない、しかし、許容バリアントを除外しないようにしようとしながら、アイデアは、市場が(原則として、その動作の多様性は、異なる楽器に見ることができる)揮発性であることである。

 
-Aleks-:

この異常値をどのように探すのでしょうか?内容を完全に理解しているわけではありませんが、データの正規化に関するものでしょうか。単に戦略論の枠組みに当てはまらない非論理的な結果をふるいにかけるということであれば、そのステップはすでに踏まれていることが示唆されますが、非常に顕著な 結果を除外するということであれば、その除外の正当性が必要となるわけで......。

だから、統計的な手順 があるのです。そうそう、値が大きすぎたり小さすぎたりする要素を排除するんです。
...逆に、魅力は低いが許容できる選択肢を排除しないようにしているが、市場は不安定であるということだ(原則として、その行動の多様性は異なる楽器で目にすることができる)。
はい、揮発性です。しかし、それはまた別の問題です。この考え方は単純で、フィルターが戦略のパフォーマンスに影響を与えたかどうかを評価する必要があります。

方法論としては、最適化の 結果を表す指標を探し、それを使って遊ぶのではなく、2つのサンプル - Before と After - を比較する方が正しいと思います :-)

そしてサンプルは、どんな結果基準で構成されても構いません。上に書いたのは、取引の結果についてです。でも、他のものも撮れるし...。それにしても、面白い作業だなあ...。
 
Dennis Kirichenko:
だから、統計的な手順 があるのです。そうそう、値が大きすぎたり小さすぎたりした人口要素を取り除くんです。はい、可変です。しかし、それはまた別の問題です。この考え方は単純で、フィルターが戦略のパフォーマンスに影響を与えたかどうかを評価する必要があります。

そこで、実際にはすべての指標を平均化することで、異常値を平準化するようにしていますね。私は最適化結果の畳み込み(2つの属性に分解して-ただし分かりやすくするためです-片方は削除可能です-つまり、どちらかの選択肢が明らかに悪くなります)を作り、畳み込みを比較(いくつかの指標の最大値と最小値、外れ値の割合としての構造があります-そしてあなたはまだファイルを見ていません)して、排出量の影響を平準化するだけです。また、13の通貨ペアを個別に売買して比較し、13*2*2=52の最適化結果を平均化したものを集計しています。フィルターがグローバルに機能しているならば、すべてのペアで機能するはずで、すなわち正のトレンドがあるはずです。

Dennis Kirichenko:

最適化の結果を 表す指標を探して、それで勝負するのではなく、2つのサンプル(ビフォーとアフター)を比較するのが方法論として正しいと思います :-)

そしてサンプルは、どんな結果の指標で構成してもかまいません。上に書いたのは、取引の結果についてです。でも、他のものも撮れるし...。それにしても、面白い作業だなあ...。

サンプルはすべてではなく、一部である。この部分を選択するために、どのような属性を取るか?

もし、本当に興味深いのであれば、詳細な分析のために、例えば、フィルターなしとフィルターありの1組の比較データを掲載する用意があります。



 
Так я это и делаю фактически путем усреднения всех показателей - таким образом выбросы нивелируются, разве нет? 
いいえ、排出量を考慮しています。そして、それらは平均値に大きな影響を与えることがあります。これは根本的に間違っています。

そして、標本分布の形状を見ることが重要である。ピークが2つあるなど、通常とは大きく異なる場合は困りますが......。ということで、一応...。

サンプルはすべてではなく、その一部です。この部分を区別するために、どのような属性を使用すべきでしょうか?

もし本当にご興味があれば、最適化の結果、例えばフィルターなしとフィルターありの1組の比較データを掲載し、詳細な分析を行う用意があります。

ここでいうサンプリングとは、定義上、一般集団全体が存在しないためです。つまり、ここでは、現象(取引履歴)の一部しか見えていない、ということです。

はい、見ることができます。



1)はフィルタなしのパス、

2)はフィルタありのパスです(ここだけはフィルタパラメータを最適化せず、固定にすべきです)。
 
Dennis Kirichenko:
いいえ、外れ値も考慮します。そして、それらは平均値に大きな影響を与えることがあります。そして、これは根本的に間違っています。

偶発的な排出でない場合はどうするのか?

Dennis Kirichenko:

はい、ご覧の通りです。



1)はフィルタなしのパス、

2)はフィルタありのパスです(ここだけはフィルタパラメータを最適化せず、固定にすべきです)。

このファイルには、フィルタなしとフィルタありの最適化結果が含まれています。7つのフィルタ変数の位置が別々のシートに分かれているので、それらの解析に問題はなく、異なる設定により、どの程度フィルタリングするかという質問への答えが得られます。

最悪の選択肢を選んだ - 2013-2015年のEURUSD M15ペア - 買いのみ。

フィルタリングなし。

フィルターなし

フィルター付き-7ポジションのフィルタースイッチの境界がチャート上で見分けられる。

ファイル:
 

Dennis Kirichenko 、十分なデータがあるのか、それとも興味が薄れてしまったのか?

 
-Aleks-:

Dennis Kirichenko、十分なデータがあるのか、それとも興味が薄れてしまったのか?

いつか見るよ、ごめんね、忙しくて...。
 
Dennis Kirichenko:
この間、見てみますね、すみません、忙しくて・・・。

いいですね!面白くてためになりそうです。

 
1stスタンダートシート(スタンダードの方が正しいかもしれませんが)の「当期利益」 欄を見てみましょう。

まず、記述統計量を計算してみましょう。特に、異常値があるかどうかを知りたいのです。





外れがあるんです。58,351.76を超える損失を出し、最も損失の大きい取引に関するものである。

ヒストグラム



排出物を取り除いて、さらに分析することです。しかし、ここにはかなりの数の外れがある。そして、それらを取り除くことは、むしろ方法論上のトリックです。現在の形によると、外れ値のある分布は正規分布ではないようで、他よりも結果に影響を与える何らかの要因があることを意味しています。