トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Yury Reshetov 2016.08.02 18:59 #851

ミハイル・マルキュカイツ

まあ、仮に混ぜて半分にしたとすると、トレーニングサンプルとテストサンプルで両クラスの数が同じになりますよね？

サンプルで両クラスの例数が同じでなかった場合、テストパートでは同じにならない。代表性の低いクラスの例のみが半減され，その半分がトレーニングパートに，残りの半分がテストパートに置かれる．教壇には、最も代表的なクラスの例と最も代表的でないクラスの例がちょうど同じ数だけある。そして、トレーニングパートに含まれない最も代表的なクラスの残りの例が、テストパートに含まれることになる。

要は、以前のバージョンではバランス調整が全くできていなかったということです。サンプルはMSRPで混合し、半分をトレーニングパートに、残りの半分をテストパートにと些細なことから2つに分けました。そんな中、両クラスの例が非常に偏っているサンプルに出会いました。最も代表的なクラスが汎化性で優れた結果を出し、代表性の低いクラスがプラマイゼロ以下であることは一目瞭然でした。そのような異常値を取り除くために、セパレーターアルゴリズムにバランス調整を加える必要がありました。

Mihail Marchukajtes 2016.08.02 19:04 #852

いや...いいんです誤報:-)

Dr. Trader 2016.08.03 04:39 #853

サンサニッチ・フォメンコ
予測変数のリストがノイズ予測変数からクリーンアップされていないため、モデルが再トレーニングされます。これはトレーニング用の例であり、意図的にそのように作られています。だからこそ、自信をもって言えるのです。

少し考えてみました。
森がデータを記憶する、それは事実です。木が増えれば、記憶する「記憶容量」が増えます。しかし、十分な数の木を使っても100％の精度が出ないとしたら、それは学習データの中に矛盾した例があるということです。学習例には、予測値が全く同じでありながら、クラスが異なるものがあります。このようなデータは、学習データを用いても、100％予測することはできない。つまり、モデルは完全に学習することもできず、ただデータが不足しているため、再学習の機会が少なくなってしまうのです。
学習例の矛盾は、エラーによって引き起こされたものでもなく、100％の精度を可能にする予測器を削除したことによって引き起こされたものです。しかし、それがなければ、新しいデータでの予測はより良いものになるでしょう。
このルールを使って、モデルのトレーニングやクロスバリデーションの前に、予測変数の事前推定を行うための簡単な方法を作成することができます。

mytarmailS 2016.08.03 06:29 #854

こんにちは。

1) 上記のいずれかを試された方はいらっしゃいますか？結果は？

2) Rで直接ストラテジーをテストしようとした人はいますか？ R-kaでかなり原始的に取引をシミュレートする必要がありますが、ストップやその他の小さなことがあります、できるだけ簡単で速くできるようなツールはありませんか？

Mykola Demko 2016.08.03 07:59 #855

ユーリー・レシェトフ

ヒストリカルデータとしての実数量はどこで入手できますか？MetaTraderでは、「ボリューム」と呼ばれるティックメーターのみが提供されています。しかも、これらのカウンターの値は、キッチンによって一桁違うこともある。

...

ダニの量はキッチンによって違うだけでなく、1つのキッチンでも違います。ここが密集していたかと思うと、今度はまばらな流れになるといった具合に、段階を踏んでいくことができます。

これは、ディリング内部のチークフィルターが変化したためです。

興味深い質問です。実数値とティックボリュームには相関があり、ティックボリュームとバーサイズには相関があります。

mytarmailS 2016.08.03 08:06 #856

ニコライ・デムコ

ということは、実数値と棒グラフの大きさには相関があるということでしょうか？

勿論

Mihail Marchukajtes 2016.08.03 08:34 #857

mytarmailS:
勿論

ボリュームとバーのコロケーションとは。出来高は高くてもローソクの胴体が欠けるので、オボロドでも同じです。出来高は少ないし、ローソク足は上がったし...。すべては、その時々の市場の状況次第......。

mytarmailS 2016.08.03 08:40 #858

ミハイル・マルキュカイツ
ボリュームとバーの相関の意味は。出来高が多くてもローソク足本体がない場合もあり、バーも同様です。出来高が少なく、ローソク足が伸びてしまった...。すべては、その時々の市場の状況次第......。

:)

流動性の高い市場というのは、先物や為替市場のことだと思うのですが、ペナルティを取引している人はいないと思うのですが。

http://prntscr.com/c10p51

図では、100スライドウィンドウで、ボラティリティと出来高の相関を示していますが、確か、0.6以上の値が有意な正の相関とみなされるはずです。

Скриншот

prnt.sc

Снято с помощью Lightshot

mytarmailS 2016.08.03 14:02 #859

mytarmailS:

多分、誰かが興味を持つだろう、私はquantstratという 取引のシミュレーションと取引システムを構築できるパッケージを見つけた。

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf

もしかしたら、すれ違ったかもしれないので、再掲します。

そして、もう一つの有用なリンクhttp://www.r-programming.org/papers

このようなパッケージには誰も興味を示さないのでしょうか？もしそうでなければ、なぜでしょうか？

СанСаныч Фоменко 2016.08.03 14:29 #860

mytarmailS:

再掲載します、もしかしたら飛んでしまったかもしれませんが

そして、もう一つの有用なリンクhttp://www.r-programming.org/papers

このようなパッケージには誰も興味を示さないのでしょうか？もしそうでなければ、なぜでしょうか？

すべてのパッケージ（モデル）は、2つのカテゴリーに分けることができます。

こうぎ
柄にもなく

基本的に良い」とされたパッケージの性能はほぼ同じであり、その差は大きくはありません。

問題はモデルではなく、予測変数のセットとその前処理にある。予測変数のセットをいくつか取れば、過学習のモデルを構築する可能性も、誤差の大きさも、モデルの変更にほとんど依存しない。したがって、「原理的に適合する」ものの中から、最もシンプルで高速なモデルを選択する必要があります。

PS.

自分の体験からTSの構築における労働投入量の75％以上が私であり、予測変数の選択であるため、もしすべて、特定のターゲット変数に対してそのようなセットを見つけることができる。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 86