トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

СанСаныч Фоменко 2016.08.27 13:14 #1281

アンドレイ・ディク

ここでは、その内容を正確に綴っています。

詳細については：現在のバーで買いシグナルは、買いのように、前方未来にバーの最少数をカウントし、貿易はそうでない場合は、近いように、有益であるかどうかをチェック - 前方1以上のバーをカウントして再度確認します。そして、この方法で最大数のバーに到達し、最終的に閉じます。これは、学習のメカニズムです。

何が明確でないのか？ファンタジーではなく、まさに今の私です。目標機能は、最小のドローダウンで最大限の利益を得ることです。自分の遺伝子を使ったトレーニングをしています。

私たちは何を教えているのでしょうか？単純に実装することも可能なんですね。

Andrey Dik 2016.08.27 13:17 #1282

サンサニッチ・フォメンコ
1.何を教えるか？

2.実装すればいいんでしょう？

1.目標とする機能は、最小のドローダウンで最大の利益を得ることである。遺伝子の力を借りて教えています。

2.はい、とてもシンプルです。

mytarmailS 2016.08.28 15:35 #1283

Rパッケージがどの言語で書かれているかを調べる方法をご存知の方はいらっしゃいますか？

СанСаныч Фоменко 2016.08.28 16:00 #1284

mytarmailS:
Rパッケージがどの言語で書かれているかを調べる方法をご存知の方はいらっしゃいますか？

ドキュメンテーションRのヘルプから開きます。

R拡張の書き方
R インターナル

さらに、Cpとの連携方法についても詳しく解説されています。

Alexey Burnakov 2016.09.01 17:52 #1285

皆さん、私からの新しい課題です。

以下は、.R 形式のデータセットである。https://drive.google.com/open?id=0B_Au3ANgcG7CcjZVRU9fbUZyUkE

約40,000行、101列がセットになっています。一番右の列がターゲット変数です。左側が100入力。

最初の2万件のオブザベーションで、残りの100列に基づいて101列目の値を予測する回帰モデルを構築してみることをお勧めします。

残りの20,000以上のオブザベーションについて、構築されたモデルは 少なくとも0.5のR^2を 示すはずである。

そして、そのデータの生成方法を明らかにし、解決策を提示します。

ヒントは、時系列データです。入力は100サンプル、予測は1先。価格や相場、その派生商品ではありません。

アレクセイ

Alexey Burnakov 2016.09.01 21:07 #1286

このデータをcsvで投稿することも可能です。予測因子の有意性について、コリラックマの意見を聞いてみるのも面白いかもしれませんね。

繰り返しになりますが、このデータは純粋に合成されたもので、純粋に楽しむためのものです。

Dr. Trader 2016.09.01 23:41 #1287

vtreatパッケージで予測変数の重要度を調べようとしました。しかし、このパッケージは予測因子間の関係を検索することができず、予測因子とターゲットの間の直接的な関係のみを考慮するため、このタスクにはあまり適していません。

treatments <- designTreatmentsN(dat_ready[1:20000,], colnames(dat_ready)[1:100], tail(colnames(dat_ready),1))
treatments$scoreFrame #важность  предикторов определяется через колонку "sig"
treatments$scoreFrame[order(treatments$scoreFrame$sig),] #предикторы  отсортированы по важности

vtreatの重要度で判断すると、lag_diff_51とlag_diff_52が最も有用である。受け取ったリストから少しずつ他の予測式を追加していき、forestのトレーニングデータでのR^2の伸びを見た。最後に、51、52、53、54、55、17、68という予測変数で止まってしまいましたが、おそらくこれらは目標値を計算するために使われているのでしょう。トレーニングデータでのR^2は0.9以上ですが、テストデータ、検証データではすべて悪い結果でした。あとは、これらの予測因子でさまざまな数学的操作を試し、数式を選択するなどして、クロスバリデーションでR^2も増加するようにする必要があります。これ以上探すことはないでしょう :)

後で完成させました。
もう少し実験して、既存の予測器から新しい予測器をたくさん作り、異なる数学的演算を行いました。vtreatもforestも、sum(51,52)とaverage(51,52)という2つの組み合わせがとても気に入っています。でも、目標値の計算式は出てこないんです。そして、これらの予測因子で学習したモデルも、十分に予測することはできません。

削除済み 2016.09.02 03:46 #1288

100件ですか？それは強いですね。

なぜ1000人でないのか？

あなたたちは、ネットワークの神経を使うことを全く分かっていない。

Alexey Burnakov 2016.09.02 08:16 #1289

Dr.トレーダー

vtreatパッケージで予測変数の重要度を調べようとしました。しかし、このパッケージは予測因子間の相関を検索することができず、予測因子とターゲットの間の直接的な依存関係のみを考慮するため、このタスクにはあまり適していません。

vtreatの重要度で判断すると、lag_diff_51とlag_diff_52が最も有用である。受け取ったリストから少しずつ他の予測式を追加していき、forestのトレーニングデータでのR^2の伸びを見た。最後に、51、52、53、54、55、17、68という予測変数で止まってしまいましたが、おそらくこれらは目標値を計算するために使われているのでしょう。トレーニングデータでのR^2は0.9以上ですが、テストデータ、検証データではすべて悪い結果でした。あとは、これらの予測因子でさまざまな数学的操作を試し、数式を選択するなどして、クロスバリデーションでR^2も増加するようにする必要があります。これ以上探すことはないでしょう :)

後で完成させました。
もう少し実験して、既存の予測器から新しい予測器をたくさん作り、異なる数学的演算を行いました。vtreatもforestも、sum(51,52)とaverage(51,52)という2つの組み合わせがとても気に入っています。でも、目標値の計算式は出てこないんです。そして、これらの予測因子で学習したモデルも、十分に予測することはできません。

近くを歩いていても、通り過ぎてしまう。すべてが指摘されているわけではありません。出力と入力の間には線形相関がある。でも、あまり役に立ちません。

森を鍛えすぎたんだな。履歴書を見たほうがいい。データの秘密は後ほどお話します。シンプルであるべきなんです。入力に冗長性がある。

Alexey Burnakov 2016.09.02 09:54 #1290

また、0.9はオーバートレーニングになります。トレーニングセットでのR^2が0.6以上であることが現実的な最大値です。

もうひとつ、インタラクションについて覚えておいてください。単一の接続は誤った方向に導く可能性があります。

私自身、自分の課題を解決しようとしています。単層NSを適用しています。R^2検定が0.148を超えない適合しない

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 129