トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Forester 2019.09.20 07:13 #15341

マキシム・ドミトリエフスキー

ぞうけい

今週末にはコネクタを完成させて、テストにかけたいと思います。モデルをクラウドにアップロードして、端末から信号を取得する予定です。私は、このモデルをクラウドに置き、ターミナルから信号を取るつもりです。後で、あなたもテストしてみてください。mt5クライアントを後で送ることができます

最初のうちは、2〜3ヶ月間デモを使うだけでも面白いと思います。
そして、その方法を真似たり、繰り返したりすることに投資します。
Alglib forestとシングルツリーで、エントリー時の価格増分と目標TP/SLを設定した実験では、面白いものは見つかりませんでした。

Maxim Dmitrievsky 2019.09.20 07:21 #15342

エリブラリウス
まずは2〜3ヶ月間、デモを見るだけでも面白いですよ。
そして、その方法を真似たり、繰り返したりすることに投資する。
alglib forestとsingle treeで、価格増分とTP/SLでマークされたターゲットを入力した実験では、面白いことは何も表示されませんでした。

私は1年後に初めてターゲットをきちんと組み立てられるようになったのですが、そのパラメータを変えることで、アキュラシを予測可能な形で変化させることができます。

デモでは、はい、テストは表示されます。

alglib forest には、サンプル数が増えるほどオーバートレーニングになるというよくわからない問題があります。

そのためにバンホット、つまり特徴をカテゴリーに変換することは意味があるのかもしれません。木はそれほど巨大にはならないだろう

Maxim Dmitrievsky 2019.09.20 11:12 #15343

マキシム・ドミトリエフスキー

alglib forest には理解できない問題がある - サンプル数が増えれば増えるほど、オーバートレーニングになる

そのためにバンホットを作る、つまり特徴をカテゴリー化する意味があるのかもしれません。木はそれほど大きくはならない

ぞくにん

バンコックは樹形が非対称になるから足場が悪いと書く人もいれば、オーバーフッティングを防ぐと書く人もいます。2つ目を選択 :)

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6368971/

Splitting on categorical predictors in random forests

www.ncbi.nlm.nih.gov

This is an open access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, reproduction and adaptation in any medium and for any purpose provided that it is properly attributed. For attribution, the original author(s), title, publication source (PeerJ) and either DOI or...

Forester 2019.09.20 11:56 #15344

マキシム・ドミトリエフスキー

じつは

バンコックは木が左右非対称になるから森に悪いと書く人もいれば、オーバーフッティングを防ぐと書く人もいる。2つ目を選択 :)

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6368971/

入力データを単純に離散化し、例えば5桁を4桁に変換することができます。そして、データはすでに10個単位になります。
あるいは、先ほど提案したように、alglibの森で、シート内の目的の深さまたは例の数に達したときに分岐を停止するように構築することも可能です。

Maxim Dmitrievsky 2019.09.20 11:58 #15345

エリブラリウス

5桁の値を4桁に変換するなど、入力データを単純に離散化することができます。そして、データはすでに10個単位になります。
あるいは、前に提案したように、alglibの森で、リスト内の目的の深さまたは例の数に達したときに分岐を停止するように構築することができます。

これは異なるので、値を互いに比較できないようにカテゴリ化する必要があります。

記事の内容は後ほど、忘れないように割り引いて考えています

Aleksey Vyazmikin 2019.09.21 00:15 #15346

マキシム・ドミトリエフスキー

Yandexのような大企業が動いて、いろいろなことをやっている。やれば大丈夫と言われる。こうすればいいんだ、素人仕事はやめよう。そうでなければ、言葉遣いやさまざまなアプローチに溺れてしまうでしょう。

グラデーションに沿って、木々を積み上げながら変化していく様子を表現しています

木を追加すると変化しますよね。サンプルを見ながら、サンプルに新しい行を追加するような感じで、どの辺が学習しにくいか、その学習しにくい部分を克服できる予測因子を考えることができるのでしょう。

Aleksey Vyazmikin 2019.09.21 00:19 #15347

エリブラリウス
悪くない！ボリュームを増やせば、何かはすでに獲得できる)

こうして葉っぱを選んで1つのモデルにまとめ、量を増やすことが、入力数を増やすこと、すなわちRecallにつながるのです。

もしかしたら、この方法はあなたのサンプルでも使えるかもしれませんが、もしそれが加速されたら...。

このような結果は、5〜7分割の深さを持つ木によって得られますが、これはある特定のパターンしか明らかにしません。通常、3〜4枚が-1および1に、残りが0になります。

Aleksey Vyazmikin 2019.09.21 00:20 #15348

マキシム・ドミトリエフスキー

ぞうけい

プレディクターは全部でいくつあるのですか？

Aleksey Vyazmikin 2019.09.21 00:23 #15349

エリブラリウス

入力データを単純に離散化し、例えば5桁を4桁に変換することができます。そして、データはすでに10個単位になります。
あるいは、先に提案したように、alglibの森で、リスト内の目的の深さまたは例の数に達したときに分岐を停止するように構築することもできます。

もちろん、1つのリーフに含まれる例の数（完全性 - Recall）で枝刈りしたり、単純に分岐を禁止したりする必要があります。また、精度と完全性の値が台座以下であれば、ツリーを廃棄することができます。

Aleksey Vyazmikin 2019.09.21 00:29 #15350

マキシム・ドミトリエフスキー

これは異なるので、値を比較できないようにカテゴリ化する必要があります。

忘れないようにダウンロードしておいたので、後で記事を入手する。

ところで、モデル学習のためのパラメータは？

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 1535