トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 510

 
Dr.トレーダー

記事中のコードを実行したところ、すべて一回目で動作しました。
Rのバージョンは3.4.2ですが、あまり関係ないような気がします。


Rを開いている...きっとそのせいだ。

 
アレクセイ・テレンテフ
ただ、ここでは価格を分類している人がいます。それは彼らのためです。

分類の種類は先生が決めるので、気をつけないといけないですね。

グルがトレンド(トレンドモデル)なら、上も下も(だいたい)同じくらいあるはず。 でも、横ばいがどこなのかがはっきりしない......。また、横並びであれば、何がアップで何がダウンなのか、はっきりしない。トレンドに行き詰まりを感じている。

したがって、最も有望なのは、そしてここで議論されているのは、物価上昇の予測である。でも、それ用と先生は別で、トレンド用とは違うんです。

ちなみに、ここでは誰も価格の分類はしていません。


時系列予測に 興味がある人は、記事を読んだ方がいいと思います。

リンク先は静止時系列のみ?指数平滑化で判断すると、そうですね。金融市場には定常的な時系列は 存在しない。

あなたが紹介した記事は、予測とは何の関係もなく、曲線を分析的に外挿したものです。ギャップがあったらどうする?ドラギとかいたらどうするんだ?

 

RMSEが最も小さい3種類の属性のオートサンプリング期間、市場における属性の重要度は、絶対値でも 他の属性との相対値でも、時間の経過とともに大きく変化していることがわかる。時折、属性の同じ周期が保持されたり、わずかに変動する安定期があるが、一般的には変動幅が大きい。これはほんの一部を切り取ったものです。予測変数はすべて定常形である。

2017.10.20 16:56:12.405 2017.06.05 03:15:00   39 48 45
2017.10.20 16:56:13.105 2017.06.05 03:30:00   40 49 46
2017.10.20 16:56:13.793 2017.06.05 03:45:00   41 49 47
2017.10.20 16:56:14.481 2017.06.05 04:00:00   42 49 49
2017.10.20 16:56:15.168 2017.06.05 04:15:00   43 49 49
2017.10.20 16:56:15.853 2017.06.05 04:30:00   44 49 49
2017.10.20 16:56:16.538 2017.06.05 04:45:00   45 49 49
2017.10.20 16:56:17.255 2017.06.05 05:00:00   46 49 49
2017.10.20 16:56:17.981 2017.06.05 05:15:00   47 49 49
2017.10.20 16:56:18.673 2017.06.05 05:30:00   48 49 49
2017.10.20 16:56:19.368 2017.06.05 05:45:00   49 49 49
2017.10.20 16:56:20.038 2017.06.05 06:00:00   48 49 49
2017.10.20 16:56:20.760 2017.06.05 06:15:00   49 49 49
2017.10.20 16:56:21.429 2017.06.05 06:30:00   24 6 49
2017.10.20 16:56:22.136 2017.06.05 06:45:00   5 6 49
2017.10.20 16:56:22.824 2017.06.05 07:00:00   5 6 49
2017.10.20 16:56:23.495 2017.06.05 07:15:00   27 7 6
2017.10.20 16:56:24.200 2017.06.05 07:30:00   6 7 5
2017.10.20 16:56:24.901 2017.06.05 07:45:00   5 7 6
2017.10.20 16:56:25.603 2017.06.05 08:00:00   6 6 5
2017.10.20 16:56:26.275 2017.06.05 08:15:00   7 7 5
2017.10.20 16:56:26.963 2017.06.05 08:30:00   4 5 5
2017.10.20 16:56:27.694 2017.06.05 08:45:00   5 6 6
2017.10.20 16:56:28.415 2017.06.05 09:00:00   6 7 7
2017.10.20 16:56:29.118 2017.06.05 09:15:00   13 8 16
2017.10.20 16:56:29.826 2017.06.05 09:30:00   12 12 17
2017.10.20 16:56:30.546 2017.06.05 09:45:00   17 13 19
2017.10.20 16:56:31.242 2017.06.05 10:00:00   18 16 20
2017.10.20 16:56:31.978 2017.06.05 10:15:00   19 18 21

つまり、くだけた統計学的な言い方をすれば、市場に一定のパターンがあるという帰無仮説は確認されないということである

結論:少なくとも2つのモデルを作るべきです。1つは情報量の多い属性をリアルタイムで選択し、もう1つはその属性に基づいて学習と再学習を行います。そのためには、機能を変化させると効果が出るようなシステム、つまり全体をホリスティックなシステムとして扱うことが必要です。

 
マキシム・ドミトリエフスキー

結論:少なくとも2つのモデルを作るべきです。1つは情報量の多い特徴をリアルタイムで選択し、もう1つはその特徴で学習・再学習します。

私にとっては、それは正しい結論ではありません。なぜなら、モデルは常に一歩遅れ、既存の市場特性に対して常に一歩時代遅れだからです... 同じローリング・ラグド平均でも...

 
Dr.トレーダー

分類モデルを学習するためには、クラス「1」の学習例の数とクラス「2」の学習例の数が一致するように、クラスの数をバランスさせる(不要な例を削除する)という考え方がある。

回帰モデルにも同様の要件がありますが、より複雑で、レベル「0.001」のサンプルの数はレベル「-0.001」の学習サンプルの数と等しくなければならないのです。
0.002をターゲットとする例の数は、-0.002をターゲットとする例の数と同じでなければならない、など。

このバランスをとるためのスクリプトは以下の通りです。

caretでは、すべてがすでに実装されており、異なるタイプのクラスアライメントがあります。残念ながら、これらの関数がどのように呼ばれているかは覚えていません。
 
mytarmailS:

私が考える限り、モデルは常に一歩遅れ、現在の市場特性との関係で常に時代遅れであるため、結論は間違っています...同じスライディングラギング惨めな平均...


あるにはあるがないにはある

 
エリブラリウス
本来はどういう意味なのでしょうか?
数ヶ月連続でドルが上昇した(トレンドがあった)場合、学習例数を平滑化することで、その間ずっと横ばいであったかのようにNSを表示させます。そして、それに従って、平らであることを学習するのです。これでいいのでしょうか?もしかして、やっぱりトレンドに教えるべき?

新しいデータで価格が下がり始めたらどうする?モデルは上昇すると予想しています。そんな時、私の使っているモデルは少し鈍り始め、オーバーシュートしながら長い間トレードに居座ることになるのです。

 
マキシム・ドミトリエフスキー

うん、でも、いや、ないよりはマシだけどね。

なんと言っても、試してみて、その経験を共有すること、それが読んでいて面白いことです。

すべてのバーでモデルを再トレーニングしてみたのですが...。

はい- 静的なモデル(一度学習させたモデル)よりも、より効果的です。

いいえ - モデルは動作中と呼ぶことはできません

p.s.もっと頑張ってほしいです
 
mytarmailS:

なんと言っても、試してみて、経験を共有すること、それが読んでいて面白いことです。

すべてのバーでモデルを再トレーニングしてみたのですが...。

はい- このモデルは、静的モデル(一度だけ学習させたモデル)よりもうまく機能します。

いいえ - モデルは動作中と呼ぶことはできません

p.s. もっと頑張ってほしいです。

私はモデルを全く再トレーニングしないようにし、オプティマイザーで特定のパラメータを調整するようにしていますが、常に同じ結果を出す別のモデルを通して特徴をフィッティングしています。しかし、特徴の周期が変わるため、マーケットによって、より多くまたはより少なく異なる方向のシグナルを出します。例えば、横ばい相場では予測値の期間が小さいものが良いが、トレンド相場では長いものが良い。まだタイムラグがあることは明らかですが、問題はそれがどの程度致命的なものであるかということです。しかし、ある期間、すべてを累積的に最適化するため、超適応型が得られる。

まあ、要するに私の妄想です、完成したらお見せします )

 
マキシム・ドミトリエフスキー

私はモデルを再学習させるのではなく、オプティマイザーで特定のパラメータを調整するようにしていますが、別のモデルで常に特徴をフィッティングしているので、最初のモデルは常に同じ結果をもたらしますが、特徴の周期が変わるので、マーケットによって異なる方向のシグナルを多く出したり、少なくしたりします。例えば、横ばい相場では予測値の期間が小さいものが良いが、トレンド相場では長いものが良い。しかし、その遅れがどの程度であるかが問題です。

まあ、これは私の妄想なので、完成したらお見せします )


特徴量・予測量の期間」とはどういう意味ですか?)

理由: