トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Mihail Marchukajtes 2016.08.08 19:06 #941

ヴィザード_。
"Gopher "が見つからず、しくじりました))そして、これらの演習は何のためにあるのか...。ヒッピーなら誰でもわかる。

正直言って理解できない......。

Dr. Trader 2016.08.08 19:10 #942

mytarmailS:

しかし、それは正しくありません。良い予測変数は、ターゲット変数を説明するものであり、それ自体を説明するものではありません。ターゲット変数と比較せずに、予測変数の品質を知ることができるのか、私にはわかりません...。

問題のどちらにアプローチするかによります。当初は、目的の予測変数も、目的変数もわからない。そして、トレードを成功させるためには、その両方を知る必要があるのです。同時に両方を知ることは不可能なので、ターゲットとする変数に応じて予測変数を選択する必要があるわけです。あるいは、優れた予測因子を集め、その経験に基づいて、その因子で何が起こりうるかを予測することもできます。

最初のアプローチ例えば、次のバーでの価格の上昇/下降というターゲット変数があります。ターゲット変数が良いからというわけではなく、どこかから始めなければならないので、簡単なものを取りました :)次に、たくさんの指標をとって、今は「たくさんの指標」の上でモデルを教えて「上昇・下降」を認識させようとしています。ランダムに選んだターゲット変数が予測可能である保証はなく、予測者が予測するのに十分な情報を持っている保証もないので、少なくとも多少は効果があったようでよかったと思います。この場合のForeCAは、データを前処理して、ニューラルネットワークが学習しやすい形にするだけである。例えば、データの代わりに正規化したり、隣接する値の差分を取ったり、それらからPCA成分を作ったりすることができる。このように前処理されたデータを使って学習することで、neuronkaの仕事はより簡単になります。この場合、ForeCAに求められるのは、類似のクラスを何らかの方法でグループ化することです。しかし、ForeCAがこれに役立つかは定かではありません。運と利用可能な予測因子とターゲット変数に依存するのです。
つまり、この場合、ターゲットとなる変数とモデル、予測変数が奇跡的に一致し、少なくともある程度の予測力を持つことになるのです。

もうひとつのアプローチ予測因子の束を取り、「信頼性」に応じて並べ替え、無関係なものを削除します。例えば、常に一定の値を持つインジケータは明らかに無駄である。予測値が random() 関数で生成された場合、それも無意味になります。つまり、本当に情報を持っている予測因子を残すことが重要なのです。あまり詳しくないのですが、唯一覚えているのは、PCAコンポーネントに対する予測変数の重要度を求める方法（キャレットのpruneSigパラメータ）で、適切な推定値だと思われます。この場合、ForeCAはフライとカツをふるい分け、信頼できる予測因子を見つけるのに役立つはずです。これらのパッケージは、何が重要で何が重要でないかをどうやって知るのかは謎ですが、ノイズの多いランダムな予測因子を見つけ、それを拒否することができるのです。質の高い予測器とは、ランダムでノイズの少ないものである。
次に、質の高い予測変数のセットを手に入れたら、それらを使って何かを予測することを試してみてください。例えば、コウホネン地図を作り、コウホネン地図の中のクラスに対する市場行動の依存性を見つけることができる。どのクラスで取引して、どのクラスで取引しないかという結論を出し、それによって自分の新しいターゲット変数を構築する。ターゲットとなる変数は、予測変数の上に構築されるため予測率が高くなる、聞こえは良いですが、それなりの問題や落とし穴があるかと思います。

СанСаныч Фоменко 2016.08.08 19:48 #943

Dr.トレーダー

問題のどちらにアプローチするかによります。当初、我々は望ましい予測因子も、ターゲット変数も知らない。そして、トレードを成功させるためには、その両方を知る必要があるのです。同時に両方を知ることは不可能なので、ターゲットとする変数に応じて予測変数を選択する必要があるわけです。あるいは、質の良い予測因子を選択し、それを使って何が予測できるかを見る。

ファーストアプローチ......。

もうひとつのアプローチ...。

アプローチは様々だが、取引はするのか？

何を交換するんだ？

トレンド？

偏差値？

レベル？

注文は「買い」「売り」の2つしかないことを肝に銘じてください。それとも、ある一定の種類があるのでしょうか？買いの入力/買いの終了/売りの入力/売りの終了

これらはターゲット変数の変種である。

それとも、ターゲットとトレーディングシステムの考え方に何らかのギャップがあり、それがエラーになっているのでしょうか？

などなど。

しかし、まずは「何を取引しているか」から始めなければなりません。

Vizard_ 2016.08.08 20:21 #944

ミハイル・マルキュカイツ
変数 v2 にラグを掛けて、v3 で割る必要があります。

次の列（v2; Lag1_v2; v3; v11（ターゲット）、および式 v2*Lag1_v2/v3 を持つ列）を持つ10行を表示します。

v2;Lag1_v2;v3;v11(цель);v2*Lag1_v2/v3

ファイルを含むアーカイブをダウンロードする必要はありません。

Vizard_ 2016.08.08 20:44 #945

ミハイル・マルキュカイツ
lagはネットワークを見ません。

空いた線を切り取って、好きなところに貼り付ける......。

Dr. Trader 2016.08.08 21:06 #946

サンサニッチ・フォメンコ

取引内容を正確に把握すること。選択肢はたくさんありますが、改めて予測不可能なものを選び、予測不可能なことを学ぶために多くの時間を費やすのもいいでしょう。利用可能な予測因子で予測しやすいものを選ぶことが必要である。どうすればいいのか、いろいろと考えなければなりません。

ForeCAを使った予測のテストコードを作成しました。最後の列にターゲット変数を持つtrainDataテーブルが必要です。列で2分割してトレーニング／バリデーションを行う（厳密には真ん中で分割する予定）。予測モデルはlmで、なぜか例題ではいつもPCAと一緒に使われていますが、ここでも使えると思います。コード中のlm(...)関数を他のモデルに置き換えることができます。
ForeCAでは、cov()の後にフルランクを持つ行列のデータが必要です。これを事前にチェックし、固有値の低い列を削除するコードを添付しました。すべてループになっていて、実行に時間がかかるし、おそらくもっとシンプルにできたはずです。この方法でプレディクターが一部削除されましたが、良いのか悪いのかわかりません。
今のところ結果は出ていませんが、パッケージは5ギガの絶望を喰らい、長い間、試してみよう、もしかしたら誰かに良い予言を与えるかもしれない、と思っていました。

ファイル:

ForeCA_lm_example.txt 3 kb

Mihail Marchukajtes 2016.08.09 04:49 #947

ヴィザード_。
これらの列（v2;Lag1_v2;v3;v11（ターゲット）と式v2*Lag1_v2/v3を持つ列）で10行を表示します。

v2;Lag1_v2;v3;v11(цель);v2*Lag1_v2/v3

ファイルを含むアーカイブは、ダウンロードする必要はありません。

正直、このゲームの意味がわからない...。入力データの狡猾でない変換に基づいて出力変数を構築する、そこに意味がありません。TCがうまく機能するのであれば、ネットワークを使う必要はない。もうひとつ、オプティマイザーが学習ファイルを一行ずつではなく、全体として分析するのはどうだろう、と考えています。列間だけでなく、任意の列の過去の値にも相関を見出すことで、その列の価値を高める。その結果、非常に興味深いものになることがあります。データの正規化だけでなく、データの前処理も行われ、正規化式だけでなく、次のような前処理式も生成されます。正規化する前に、v2にlag1 v5などを乗じる必要がある。そうすれば、検索がもっと面白くなると思うんです。というか、前処理によって変換式が得られる、一種のプリ・オプティマイザーですね。そして、この数式をデータに適用して別のデータを得て、それをオプティマイザーに突っ込んでモデルを構築する......。そんなあなたには、こんなのはどうでしょう......？列間だけでなく、過去の値との関係も含めて、ある種の多次元的な依存関係を検索することができる。どなたか、MKULでの編成方法を教えてください！！！？試してみようと思います :-)

Mihail Marchukajtes 2016.08.09 05:10 #948

例えば、モデルを作る前に、オプティマイザーMKULを使って、出力に対する各入力を最適化します。つまり、杖を使うのであれば、モデルを作る前に、学習区間で杖のパラメータを選んで、なるべく利益の出る信号を出すように、それぞれの入力で、それを全部オプティマイザにかける......イヤーンド......ということですね。を使えば、モデルはより安定します。モデルは安定していますが、MKULでの最適化中の述語のそれぞれが50％より大きい有益な取引の数をまれに与えるので、汎化の約50％または少し多くなります。ただ、入力ごとに個別にやっていて、主に平均化パラメータとラグをある区間で選択しており、他の入力との関連性はありません。上に書いたように、この相関関係をオプティマイザーで探索するとしよう。そして、データ間の関係のパラメータを取得する。それをデータに適用して、オプティマイザーに全部詰め込むこと。そうすれば、モデルは適切な一般化レベルを獲得することができると思います。でも、どうアレンジしたらいいのかわからない...。思うに...どんなアイデアでも歓迎です ............。MKULのシンプルなニューラルネットワークは、テストセット上のすべての信号を正しく表現できるような曲線を作ることができ、それによってReshetov基本オプティマイザで良いモデルを作るのに役立つと思います（誰が何に座るかの問題です）。MKULにはシンプルなメッシュがある?

mytarmailS 2016.08.09 07:31 #949

Dr.トレーダー

ForeCAを使った予報のテストコードを作ってみた......。

わたしも簡単なものを作ろうと思い、虹彩を採取し、ノイズを含む10個の予測因子を追加しました。

そして、Forestを学習させた後、同じ日付からforecaを使って4つの予測変数に減らし、再度Forestを学習させました。

の結果です。

新しいデータについて

Prediction   setosa versicolor virginica

  setosa         16          0         0
  versicolor      0         15         1
  virginica       0          0        18

Overall Statistics

Accuracy : 0.98

フォレストはデータのノイズに気づかなかった・・・。

とフォーカスの方が悪い

Prediction   setosa versicolor virginica
  setosa          6          6         4
  versicolor      5         10         1
  virginica       8          5         5

Overall Statistics
                                          
               Accuracy : 0.42

ファイル:

code.txt 1 kb

СанСаныч Фоменко 2016.08.09 08:08 #950

mytarmailS:

私もです...。手っ取り早く修正しようと思い、ノイズを含む10個の予測因子を追加しました。

その後、同じ日付にノイズを加え、foreCAを用いて予測変数の次元を4つに減らし、その上で再度Forestを学習させました。

の結果です。

新しいデータについて

フォレストはデータのノイズに気づかなかった・・・。

そしてフォーカスの場合はもっとひどい。

真実も良いが、幸せはもっと良い!

真実＝42％、デポにおおいに期待しています。

幸せに暮らすことは可能ですが、デポがゼロでも

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 95