トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1917

 
mytarmailS:

はい、みんなと同じはずです)特徴を修正し、モデルを訓練し、新しいデータで何が起こるかを見るというものです。


普通のモデルでどうやるかというと、x1,x2,x3,...x20を投入して終わりです。


前回のスクリプトでやったことは、-0.82

31の指標をすべて予測因子とした。

その後、彼らの予測を2次予測因子とし、予測因子から予測を行う、ということを誤差が小さくなるまで11回繰り返したところ、0.7ではなく0.82となりました。


どこで間違えたんだろう((

この考え方は非常に正しく、本質的に予測器を生成することができるのですが、2つの微妙な点があります。

1.結果の再現性 - 何らかの追加変換が必要になる - 処理後に何が得られるか - 新しいテーブルか?

2.サンプリング期間中の規則性を確認する必要があります。正しい分類は異なるサイトで行われるはずですが、私が知っているどの学習モデルでも実現されていないのは、非常にまずいことです。

私の予測変数の大部分は本質的に分位数でカテゴリカルなので、統計的に有意な予測変数の範囲を結合することによって予測変数を生成することを試みたいと思います。

エラーについてですが、これまで知られていなかったサンプルに落ちたのか、それともテストサンプルに落ちたのか?もしかしたら、新しいルールを生成する際に、スクリプトがテストサンプルの測定値を考慮したのかもしれません。

久しぶりですね、肝心の方法はうまくいっているのでしょうか、いないのでしょうか?

 
mytarmailS:

は、3DでNSをトレーニングするために、典型的な データがどのようなものかを見ることにした )) 。

データは31指標、ターゲットはジグザグ型

pca、t-sne、umapの3つのアルゴリズムで次元を3次元に減らした(最後の2つは最も先進的と考えられる)。


what is it anyway -https://en.wikipedia.org/wiki/Dimensionality_reduction

how it can help -https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%BA%D0%BB%D1%8F%D1%82%D0%B8%D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8


そこで、データ31の指標となるジグザグを、まずPCAで 求めます。

私のようなバカでもサンプルでこんな素敵な写真が見られるように、スクリプトを掲載していただけませんか?

 
mytarmailS:

ターゲット機能を議論するスレッドを作ろう、議論とまではいかなくても、様々なタイプのターゲット機能とそれに関する統計、何が有効で何が全く有効でないかのデータベースを作ろうというアイディアがあったんです。

誰かに必要とされていると思いますか?

アイデアは良いのですが、アイデアだけでなく、MQLでコードが開けると便利なのですが......結果、ライブラリになってしまいます。

コードとまではいかなくても、せめて再現のための言葉のアルゴリズムくらいは。


1. 日中のデータを使って最大日の価格を予測する(回帰)。

前日の内部データで、あるいは日中に、もし後者なら、一日の終わりには誤差は単純に減少しているはずです。

ある時点で、サンプルが少なくなる場合。


2.どのレベルの内訳でオーバーボラティリティになるか(回帰+分類)

スーパーボラティリティが何なのかもわからないけど、トレンドがあるかないかくらいかな?

レベルが多ければクラスも多くなり、2値分類よりもはるかに誤差が大きくなる。

レベルごとに違うモデルを使うしかないのでは...。


2.日中データを用いた 日足反転時間の予測(分類)。

上限価格の予測と本質的には同じ問題である。


3.1本目のキャンドルが黒かったら、3本目は白になる?(分類)

とても簡単なことなので、やってみてもいいかもしれませんね。


4.サポートと レジスタンスのレベルを マークし、どのレベルから飛び降り/ブレイクダウンが起こるかを予測する(分類)。

第2文と同じ問題です。


5.任意の明確な時点における指標の最適な期間を予測する(回帰)。

これはもちろん、インジケーターを使う目的を裏返せば、面白いことになります。

 
アレクセイ・ヴャジミキン

長い時間が経ちましたが、結果はどうでしょうか。この方法は有効ですか、それとも無効ですか?

そうですね、自分でもよくわからなかったので、同じようなことをやってみようと思います。


符号x1,x2,x3とターゲット "Y "がある。

占う

"Y_x1[i+1]" ~ x1+x2+x3

"U_x2[i+1]" ~ x1+x2+x3

"Y_x3[i+1]" ~ x1+x2+x3

を追加し、モデルに

x1,x2,x3"U_x1" + "U_x2"+"U_x2" とターゲット "U"

現在、6つの看板があります。


Aleksey Vyazmikin:

私のような間抜けがサンプルでこんな素敵な写真を見ることができるように、スクリプトを掲載していただけませんか?

もう消しました、映像化するのは楽しいです、ふけます...でも、全く必要ないかな...。必要なら、また書けばいいんでしょ?


Aleksey Vyazmikin:

アイデアは良いのですが、アイデアだけでなく、MQLでコードが開けると便利なのですが......結果、ライブラリになってしまいます。

コードとまではいかなくても、せめて再現のための言葉のアルゴリズムくらいは。

予測の方法が何百万通りもあることを示したかったら、2進法(アップ/ダウン)か増分で、1つでは飽き足らないんですどっちも効かないけど、みんな嫌になっちゃうんだよねー(笑)

 
mytarmailS:

自分でもよくわからなかったので、そう思います。


符号x1,x2,x3とターゲット "Y "がある。

星座を占う

"Y_x1[i+1]" ~ x1+x2+x3

"U_x2[i+1]" ~ x1+x2+x3

"U_x3[i+1]" ~ x1+x2+x3

を追加し、モデルに

x1,x2,x3"U_x1" + "U_x2"+"U_x2" とターゲット "U"

今、6つのサインがあります。

そうですね、私の方法論を試してみますが、やはり全てに時間がかかりそうですね。組み合わせがたくさんあります。

Rでは、どれくらいのサンプリングで行っているのでしょうか?

mytarmailS:

もう消したよ、視覚化するのは楽しいよ、ただ...全く必要ないかな...。本当に必要なら、また書けばいいんでしょう?

面白いかもしれませんね。ただ、ライブラリの何をどう置くか、もっと書いてください。さらにスクリプトでコメントデリミターのカスタマイズ、対象カラムの選択、除外カラムも可能 :)

ちなみに、異なるグループのカラムをループにドロップして、ビジュアルモデルがどのように変化するかを見ることができますが、その場合、画像の保存を実現する必要があります...。

mytarmailS:

はい、私はちょうど予測する方法の数百万があることを示すために、これらのすべてのオプションを書き、その後、すべての1つまたはバイナリ(アップ/ダウン)または増分に固執し、それだ! 私はそれの病気だ...どっちも効かないけど、みんなうんざりしている )

何百万人も...

私の方法を試してみてください - 1または-1 - 反対ベクトルZZチャネルDoncianは、ベクトルの変化点を交差している。ベクトルの変化で入力し、反対側のチャネルと0にトロール -市場に参入 しないでください - フラット。1と-1の分類精度が40%あれば、利益が出ることになります。

単純なものから、私は1k3ピップスまたは任意の1つのリスクで正しいエントリのマーキングとプリミティブターゲットを実装したい - 異なるリスクとのアンサンブルは、総体として良い結果を与えるかもしれないが、それは理論的なものです。

それで、もちろん、さまざまなターゲットを考えなければなりません。

 
Aleksey Vyazmikin:

そうですね、私の方法論を試してみますが、やはり全てに時間がかかりそうですね、組み合わせがたくさんあると。

Rでどれくらいのサンプリングでやっているのか?

ベクトル化すると非常に速いのですが、1小節ずつカウントさせるチェッカーを書くと、遅くなりますが、それでも許容範囲内です。

アレクセイ・ヴャジミキン

面白いかもしれませんね。ただ、ライブラリの何をどう使うか、書いてください。さらにスクリプトでコメントデリミターのカスタマイズ、対象カラムの選択、除外カラムも可能 :)

OK、あなたの属性とターゲットをp-fileに投げ込むフォーマットでファイルを送ってください、私はボックスからそれを動作させるために試してみます。

大きなファイルではなく、目分量で1000行程度でお願いします

ただ、これはあくまで視覚化のためのおもちゃであり、モデル/兆候を確認したい場合は、テストでエラーを見る方が10000%良いということを心に留めておいてください)
 
mytarmailS:

ベクトル化すると非常に速いのですが、1小節ずつカウントさせるチェッカーを書くと、遅くなりますが、それでも許容範囲内です。

ふむ、面白いですね。もしできそうなら、スクリプトを落としてみてください、本当に役に立つかもしれません。今、私は非常に大きな新しい予測変数のプールを作っていて、どうにかしてそれらの間のつながり、つまり相乗効果を探す必要があるのですが、おそらくほとんどの予測変数は捨てられなければならないでしょう...。

mytarmailS:

OK、あなたの特性とターゲットが入ったファイルを、あなたがp-fileに投げるフォーマットで送ってください。

ただ、大きなファイルは勘弁してください。 1,000行もあれば十分です。

フォーマットというものは変化するものなので、コメントにはケチをつけないでください :)

より一般的に使用されている、attachedの変形版。

ファイル:
 
mytarmailS:

時間か無視か?

また、最後の決算の欄も無視してください。タイミングはプレディクターにある。

 
Aleksey Vyazmikin:

無視する。また、最後の列には、決算結果を記載する。タイミングはプレディクターにある。

はいはい、もう見ましたよ(笑)

 

ターゲットについては、動画でも言っているように、入力データを変更する方法がない場合に変更するべきだと思います。データが収集され、それを変更する方法がない場合。そうでなければ、様々な入力変数がある場合、デフォルトのターゲットを取って、入力データを掘り下げるべきです。

忘れてはならないのは、もしターゲットが意図的にエラーを含んでいて、より良い学習結果が得られた場合、モデルもターゲットに応じたエラーを起こすということです。IMHO

理由: