トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 129

 
アンドレイ・ディク

ここでは、その内容を正確に綴っています。

詳細については:現在のバーで買いシグナルは、買いのように、前方未来にバーの最少数をカウントし、貿易はそうでない場合は、近いように、有益であるかどうかをチェック - 前方1以上のバーをカウントして再度確認します。そして、この方法で最大数のバーに到達し、最終的に閉じます。これは、学習のメカニズムです。

何が明確でないのか?ファンタジーではなく、まさに今の私です。目標機能は、最小のドローダウンで最大限の利益を得ることです。自分の遺伝子を使ったトレーニングをしています。

私たちは何を教えているのでしょうか?単純に実装することも可能なんですね。
 

サンサニッチ・フォメンコ
1.何を教えるか?

2.実装すればいいんでしょう?

1.目標とする機能は、最小のドローダウンで最大の 利益を得ることである。遺伝子の力を借りて教えています。

2.はい、とてもシンプルです。

 
Rパッケージがどの言語で書かれているかを調べる方法をご存知の方はいらっしゃいますか?
 
mytarmailS:
Rパッケージがどの言語で書かれているかを調べる方法をご存知の方はいらっしゃいますか?

ドキュメンテーションRのヘルプから開きます。

  • R拡張の書き方
  • R インターナル

さらに、Cpとの連携方法についても詳しく解説されています。

 

皆さん、私からの新しい課題です。

以下は、.R 形式のデータセットである。https://drive.google.com/open?id=0B_Au3ANgcG7CcjZVRU9fbUZyUkE

約40,000行、101列がセットになっています。一番右の列がターゲット変数です。左側が100入力。

最初の2万件のオブザベーションで、残りの100列に基づいて101列目の値を予測する回帰モデルを構築してみることをお勧めします。

残りの20,000以上のオブザベーションについて、構築されたモデルは 少なくとも0.5のR^2を 示すはずである。

そして、そのデータの生成方法を明らかにし、解決策を提示します。

ヒントは、時系列データです。入力は100サンプル、予測は1先。価格や相場、その派生商品ではありません。

アレクセイ

 
このデータをcsvで投稿することも可能です。予測因子の有意性について、コリラックマの意見を聞いてみるのも面白いかもしれませんね。

繰り返しになりますが、このデータは純粋に合成されたもので、純粋に楽しむためのものです。
 

vtreatパッケージで予測変数の重要度を調べようとしました。しかし、このパッケージは予測因子間の関係を検索することができず、予測因子とターゲットの間の直接的な関係のみを考慮するため、このタスクにはあまり適していません。

treatments <- designTreatmentsN(dat_ready[1:20000,], colnames(dat_ready)[1:100], tail(colnames(dat_ready),1))
treatments$scoreFrame #важность  предикторов определяется через колонку "sig"
treatments$scoreFrame[order(treatments$scoreFrame$sig),] #предикторы  отсортированы по важности

vtreatの重要度で判断すると、lag_diff_51とlag_diff_52が最も有用である。受け取ったリストから少しずつ他の予測式を追加していき、forestのトレーニングデータでのR^2の伸びを見た。最後に、51、52、53、54、55、17、68という予測変数で止まってしまいましたが、おそらくこれらは目標値を計算するために使われているのでしょう。トレーニングデータでのR^2は0.9以上ですが、テストデータ、検証データではすべて悪い結果でした。あとは、これらの予測因子でさまざまな数学的操作を試し、数式を選択するなどして、クロスバリデーションでR^2も増加するようにする必要があります。これ以上探すことはないでしょう :)

後で完成させました。
もう少し実験して、既存の予測器から新しい予測器をたくさん作り、異なる数学的演算を行いました。vtreatもforestも、sum(51,52)とaverage(51,52)という2つの組み合わせがとても気に入っています。でも、目標値の計算式は出てこないんです。そして、これらの予測因子で学習したモデルも、十分に予測することはできません。

 

100件ですか?それは強いですね。

なぜ1000人でないのか?

あなたたちは、ネットワークの神経を使うことを全く分かっていない。

 
Dr.トレーダー

vtreatパッケージで予測変数の重要度を調べようとしました。しかし、このパッケージは予測因子間の相関を検索することができず、予測因子とターゲットの間の直接的な依存関係のみを考慮するため、このタスクにはあまり適していません。

vtreatの重要度で判断すると、lag_diff_51とlag_diff_52が最も有用である。受け取ったリストから少しずつ他の予測式を追加していき、forestのトレーニングデータでのR^2の伸びを見た。最後に、51、52、53、54、55、17、68という予測変数で止まってしまいましたが、おそらくこれらは目標値を計算するために使われているのでしょう。トレーニングデータでのR^2は0.9以上ですが、テストデータ、検証データではすべて悪い結果でした。あとは、これらの予測因子でさまざまな数学的操作を試し、数式を選択するなどして、クロスバリデーションでR^2も増加するようにする必要があります。これ以上探すことはないでしょう :)

後で完成させました。
もう少し実験して、既存の予測器から新しい予測器をたくさん作り、異なる数学的演算を行いました。vtreatもforestも、sum(51,52)とaverage(51,52)という2つの組み合わせがとても気に入っています。でも、目標値の計算式は出てこないんです。そして、これらの予測因子で学習したモデルも、十分に予測することはできません。

近くを歩いていても、通り過ぎてしまう。すべてが指摘されているわけではありません。出力と入力の間には線形相関がある。でも、あまり役に立ちません。

森を鍛えすぎたんだな。履歴書を見たほうがいい。データの秘密は後ほどお話します。シンプルであるべきなんです。入力に冗長性がある。
 

また、0.9はオーバートレーニングになります。トレーニングセットでのR^2が0.6以上であることが現実的な最大値です。

もうひとつ、インタラクションについて覚えておいてください。単一の接続は誤った方向に導く可能性があります。

私自身、自分の課題を解決しようとしています。単層NSを適用しています。R^2検定が0.148を超えない 適合しない

理由: