トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Maxim Dmitrievsky 2022.02.17 09:20 #25851

mytarmailS#:

))))

出てきた)

ヒントをあげると、一般化という点では、何も変わらない

Aleksey Nikolayev 2022.02.17 09:32 #25852

Maxim Dmitrievsky#:
Loglossは、私の理解する限り、形質と対象との相互情報量を示しています。これは、依存の形を書かず、最も客観的なf-iである。特にブースティングはそのような情報の損失を最小限に抑えるようにモデルを学習させます。カスタム1の上に追加したものは、トレーニングで止まってしまいます。

loglossは二項分布の最尤法に基づいて導出されているようです。matstatでは、最尤法が拡張され、M推定として一般化されており、実験の理論的正当性をある程度保証することができる（もちろん、実験の成功を保証するものではない）。

Maxim Dmitrievsky 2022.02.17 09:41 #25853

Aleksey Nikolayev#:

loglossと同様、二項分布の最尤法から導かれる。matstatでは最尤法が拡張され、M推定として一般化されており、実験の理論的正当性をある程度保証することができる（もちろん、実験の成功を保証するものではない）。

クロスエントロピーと混同されるかもしれないが、多クラスに対してよりよく使われる。いずれにせよ、f関数による追加推定ではなく、純粋にバランスグラフから推定することに問題はないと思います。

Aleksey Nikolayev 2022.02.17 11:03 #25854

Maxim Dmitrievsky#:
crossentropy と混同されるかもしれないが、多クラスに対してより頻繁に使われる。

最小ログロスの理論値がエントロピーと一致するというのは、そこに何かありそうですね。

Maxim Dmitrievsky#:
とにかく、f関数を使った追加推定は問題ないと思いますが、純粋にバランスグラフから見ると

そうですね。記事数が少ないので戸惑うだけ) 怪しげな場所を公開するのが怖いのだろう)

Maxim Dmitrievsky 2022.02.19 05:57 #25855

Aleksey Nikolayev#:

そこには、loglossの最小値の理論値がエントロピーと一致するということがあるようです。

そうですね。ただ、このテーマに関する記事が少ないのが気になる) おそらく、あやしい場所を明らかにするのを恐れているのだろう)

プラドには、興味深い記事がたくさんあります。長い引き出しの中に入れておくが、後で読むことができたら嬉しい。最も良識のある作家の一人 )

Aleksey Nikolayev 2022.02.19 10:12 #25856

Maxim Dmitrievsky#:
Pradoはこのテーマで興味深いものをたくさん持っています。彼の記事はウェブサイトに掲載されています。長い引き出しの中に入れておいて、後で読みたいと思います。最もセンスのある著者の一人）。

そうですね、彼の記事を見てみないといけませんね。彼はかなりの数を持っていますが)

標準的な測定基準とカスタム測定基準を組み合わせるというアイデアについて、私は、クロスエントロピーによってツリーを構築し、エラーの頻度によって刈り込むというアイデアを覚えていました。周波数ではなく、独自の指標を使ってみるのもいいのではないでしょうか。

Replikant_mih 2022.02.20 08:06 #25857

Renat Fatkhullin#:
情報を共有してもらえますか？

1) MT5 python ライブラリを使用していますか？

2) MT5の外部と内部のどちらで使用するのですか？

3）図書館に足りない機能は何ですか？指標へのアクセスは？

MQL5では、高速な行列演算を追加したバージョンアップを準備中です。これにより、膨大な計算を行うことができるようになります。

さらに、分析パッケージとのコネクタを開発し、標準的なWinMLとの統合を実装する予定です。

1.ときどき。

2.内側、外側。

3.

3.1 イベントサブスクリプション特定のハンドラメソッドによって引き起こされる、MQL5と同じイベントです。

バックテスターでテスト可能なPython（アプリケーションの一種）でストラテジーを書くことが可能です。

MQL5とPythonのインタラクションメカニズムをいくつか用意しました。Pythonはmt5と双方向でやりとりできる、MQL5はターミナルと一体で非常に優秀

トレーディング機能などはあるが、業界トップクラスのデータセンスのあるソリューションと快適に連携する方法がわからない。Pythonは、pandas、numpy、TensorFlow、Keras、PyTorchなど、データセンスの業界標準ですが、プラットフォームへの「トレーダー」の統合はあまり進んでいないようです。mt5でPythonスクリプトを実行すると、スクリプトにモデルが待機している、あるいはモデルのプールがある、データの前処理を行う関数がある、などといったような、この2つの力を統合する標準手段があるとクールだと思います。このスクリプトは、MQL5のアプリケーションとストラテジーを持ち、自分の仕事をし、必要な時にこのスクリプトからML機能を呼び出す - 迅速かつ松葉杖を使わずにね。

mytarmailS 2022.02.20 09:52 #25858

Quantstrat戦略のバックテストにPパッケージを使っている人はいますか？

速度の面ではいかがでしょうか？

Forester 2022.02.23 12:03 #25859

Aleksey Nikolayev#:

正直、あまり理解できていません。問題は、その確率が時間の経過とともに変化するかどうかだ。これを調べるには、単純に時間に関するロジスティック回帰を構成すればよい（そして、係数とゼロの差の有意性を確認すればよい）。

もし、時間以外に確率に影響を与える他の要因が研究されているのであれば、それらもロジスティック回帰に追加してみることができる。

elibrarius#:

あるいは、別の予測因子、つまり現在のデータラインからの距離を作る方が簡単かもしれません。フォレスト自身は、8ヶ月以上前のデータは今回の予測に不利だと計算できる。そして、8ヶ月前（葉の状態が良い）と8ヶ月後（葉の状態が悪い）という単純な分け方をすることになります。
もちろん、お盆になると、みんなよく勉強しますよ。テスト/クロスバリデーションでは、私たちはチェックすべきです。でも、どうやって？明確ではありません。予測因子の有意性でもなく、分割の有意性である。

今日はそんな現在のバーからの距離を予測する機能を追加しました。それは数字でもいいし、時間だけでもいい。時間をかけました。

実験的に、学習データセットの履歴の長さを1ヶ月にすることで、最良の結果が得られることが確認された。

最初のデータ行から距離予測器を追加すれば解決するという前提が間違っていたのです。実際には、1ヶ月のデータでフォワードが悪化し、2ヶ月で悪化し、10ヶ月で悪化しているに過ぎません。

2ヶ月のデータがあり、木が1ヶ月の分割を見つけ、その枝の1つが実験的に選ばれた1ヶ月の長さと同じデータで学習したとします。もう1つの月も、自分のデータで学習させた。そして、（冒頭で提案したように）悪くなくよく学習できました。フォワードにも悪いし、お盆に学習するだけでしょう。その結果、モデルは両方の月の結果を平均化し、フォワードは1ヶ月だけ学習させた場合よりも悪くなります。

結論：グローバルタイムやラインナンバーを適用することはできません。周期的な時間のバリエーション：曜日、時間、分は便利だが、チェックが必要だ。
各ターゲット（および/または予測変数のセット）に対して、トレーニングのための履歴の長さを調整/最適化する必要があります。

Forester 2022.02.23 12:39 #25860

チェックしました。"Cyclical time options:Day of week, hour, minute number may be useful - need to check."（周期的時間オプション：曜日、時間、分数は便利かもしれません。

分単位はほとんど影響なし、0.5%以下の変化
時間と曜日は影響あり。3～5％程度の変化。

私は、買い用と売り用の2つのモデルを同時に作っています。
買いモデルは時間がない方が4～5％、売りモデルは時間がある方が同じように4～5％うまくいきます。5%はスケジュールで売り、他の原則で買うというように。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2586