トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Renat Akhtyamov 2019.02.03 02:36 #12911

グレイル

一般的に、「トレンド/フラット」状態の予測は、単位時間あたり、次の増分の方向よりもはるかに正確ではありません、どこか約57％の精度で、いくつかの信じられない数字について言われた もの、明らかにエラーの結果。

その数字は何ですか？

Aleksey Vyazmikin 2019.02.03 07:01 #12912

機械学習は、結局のところ、奇妙で予測不可能なビジネスなのです。CatBoostのデバッグ作業を続けていると、以下のようなモデルができました（training+test+exam）。

2014年から2019年の案件は少ない（346件）かもしれませんが、ずっと1299件のドローダウンで、10％以下です。もちろん2014年に強烈な上昇があり、それはもう起こらないかもしれませんが、その後はかなりスムーズです。

以下は、試験サンプルだけのグラフです（本試験よりサンプルが少ないため、条件付き）。

ただ、グラフを見せるだけでなく、ここでは珍しいことではなく、モデルの中身を見て非常に驚いたことを申し上げたいのですが、そこには38個の予測変数のうち、たった4個しか使われていないんですよ。

TimeH- 時刻（単位：分

DonProcVisota_M15 - M15におけるドンチアチャネルの相対的な幅

LastBarPeresekD_Down_M15 - 前回ドンチャンネルを越えてからのバー数

BB_PeresekN_Total_M1 - 直近のXバーで価格がiDeltaレベルを超えた回数。

もちろん、私のサンプルにはたくさんの予測変数があり、それらを分画し、そして、それらを啜るのですが、それはすべて、サンプルを欲で分けることは必ずしも有効ではない、つまり、何も保証しない手法に過ぎないという私の理論に合致するものです。

こういう機種は集めてプールしておきたいですね。

Forester 2019.02.03 09:07 #12913

アレクセイ・ヴャジミキン

機械学習は、結局のところ、奇妙で予測不可能なビジネスなのです。CatBoostのデバッグ作業を続けていると、以下のようなモデルができました（training+test+exam）。

2014年から2019年の案件は少ない（346件）かもしれませんが、ずっと1299件のドローダウンで、10％以下です。もちろん2014年に強烈な上昇があり、それはもう起こらないかもしれませんが、その後はかなりスムーズです。

以下は、試験サンプルだけのグラフです（本試験よりサンプルが少ないため、条件付き）。

ただ、グラフを見せるだけでなく、ここでは珍しいことではなく、モデルの中身を見て非常に驚いたことを申し上げたいのですが、そこには38個の予測変数のうち、たった4個しか使われていないんですよ。

TimeH- 時刻（単位：分

DonProcVisota_M15 - M15におけるドンチアチャネルの相対的な幅

LastBarPeresekD_Down_M15 - 最後にドンチャンネルを越えてからのバー数です。

BB_PeresekN_Total_M1 - 直近のXバーで価格がiDeltaレベルを超えた回数。

もちろん、私のサンプルにはたくさんの予測変数があり、それらを分画し、そして、それらを啜るのですが、それはすべて、サンプルを欲で分けることは必ずしも有効ではない、つまり、何も保証しない手法に過ぎないという私の理論に合致するものです。

そういうモデルを集めて、プールしておきたいですね。

予想通り、ほとんどの予測変数が実際にはノイズであったり、互いに相関があったりすることがわかりました。

サイドウォークって何？Yandexはトレント配信の話しかしていない。

Aleksey Vyazmikin 2019.02.03 09:28 #12914

エリブラリウス
予想通り、ほとんどの予測因子は実際にはノイズであったり、互いに相関があったりする。

横向きって何？Yandexはトレント配信の話しかしていない。

それらはノイズではなく、ある予測因子が他の予測因子と重なり合う、つまり形成される関係が重要であり、それを生み出す必要があるという考え方です。

もちろん、これは私が勝手に作った言葉で、--random-seed フラグを特定の数値で適用しているのです。確かに、この値がどのような範囲にあるのかは分かりませんが、学習に大きな影響を与えることは分かりましたし、この制御されたランダム化は私に合っています。

Mihail Marchukajtes 2019.02.03 10:02 #12915

こんにちは、皆さん。テスターでのストラテジーテストの結果で、ファンドチャートを作るインジケータを知りたいです。見つからない...。覚えていますよ。もし、手元にある人がいたら投げてみてください。ありがとうございます。

Forester 2019.02.03 10:43 #12916

アレクセイ・ヴャジミキン

もちろん、「シッティング」というのは私が勝手に作った言葉で、--random-seed フラグを特定の数値で適用しているのです。この値がどの程度の範囲なのかはわかりませんが、学習に大きな影響を与えることがわかり、この制御されたランダム化は私に合っていると思います。

ランダム性を修正する。通常は再放送時の結果の再現性のために使用されます。
できれば、結果にあまり影響を与えないようにしてください。そうでなければ、特定のランダム性にフィットしたものを得ることができます。つまり、最適化しなければならない別の機能（大きく影響する）が現れるのです。

Грааль 2019.02.03 11:29 #12917

レナト・アフティアモフ

何番煎じ？

トレンド・フロートは9割近く予測されるって上の方で見た気がする、誰かの孫か弟子が言ってた気がする。

Yuriy Asaulenko 2019.02.03 13:54 #12918

グレイル

トレンド・フラットは90％近く予測されるって、上の方で誰かの孫か弟子が言ってたような気がするけど

ええ、100％、フラットな後にトレンドが来るということです。何を予測するのか。

Renat Akhtyamov 2019.02.03 15:01 #12919

グレイル

トレンドやフロートはほぼ90％予測できると言っていた人を上で見た気がする。誰かの孫か弟子が言っていた気がする。

アーン

まあティックがなければ100％横ばい相場なんだろうけど。

で、ダニが多い場合は、フラットな

Aleksey Vyazmikin 2019.02.03 15:15 #12920

エリブラリウス
ランダム性を修正する。これは通常、再起動の際の結果の再現性のために使用されます。
できれば、結果にあまり影響を与えないことが望ましい。そうでなければ、特定のランダム性にフィットしたものを得ることができます。つまり、最適化しなければならない別の機能（大きく影響する）が現れるのです。

はい、後で結果を再現するため、また一般的に結果を生成するために必要です。

ただ、その仕組みが全く不明で、このパラメータが最適な選択肢を選択する際の分割結果のランダム性を担っていることは理解できるのですが、詳細がどこにも書かれていません。

そして、フィッティングについて...。すべてが潜在的な適合であると仮定しなければならず、時間の経過とともに接続の安定性を確認し、その有効性を監視することしかできません。たとえば、そのモデルは4本の木から成り、それぞれが4本の深さもあります。つまり、組み合わせの数が少ないために、ここでの適合は非常に有効であり、したがって、単なるサンプルの記述ではなく、何らかの規則性があるのかもしれないのです。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 1292