トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

mytarmailS 2022.02.06 18:47 #25741

Aleksey Nikolayev#:

この記事では、生成されたデータに対してカルマンがテストされています。実データでLSスライド式より良くなるとは思えません。

いやいや、実データ上では、すべて公平です Y_。

head(Y_)
                EWH      EWZ
2000-08-01 1.947204 2.298111
2000-08-02 1.971071 2.285039
2000-08-03 1.994382 2.278438
2000-08-04 1.994382 2.317404
2000-08-07 2.012648 2.317404
2000-08-08 1.985123 2.317404

こちらはY_ データのミューと ガンマ です。

Kalman <- estimate_mu_gamma_Kalman(Y_)

とY_のデータでバックテストを行う。

return_Kalman <- pairs_trading(Y_["::2003-03"], Kalman$gamma["::2003-03"], Kalman$mu["::2003-03"], 
                               "Kalman", plot = TRUE)

でも、要は、estimate_mu_gammaで......ボソッ

Regressionとrolling regressionはtraceとtestに分かれていて、新しいデータ（新しいスプレッド）を予測するモデルがあるようなのですが、calmanについてはそれがなく、中の仕組み、calmanで新しいデータでスプレッドを構築する方法がよく分かりません。コードが不明瞭で目から血が出そうです。

Andrei Trukhanovich 2022.02.06 18:48 #25742

mytarmailS#:

このカルマンでは何もわからない((

カルマンと同じ原理で、時間に対する適応性があるのですが、よりシンプルなのです。

mytarmailS 2022.02.06 18:56 #25743

Andrei Trukhanovich（アンドレイ・トルハノビッチ） #:

カルマンも同じ原理で、時間に対する適応性があるのですが、よりシンプルなのです。

いや、アンドレイ、2つ目はとてもうまくいかないんだ。

また、非常に良いペアが撮影されています。現実を受け止めれば、神の思し召しで、そのカルマンが何かを示してくれるはずです。

Aleksey Nikolayev 2022.02.06 19:07 #25744

mytarmailS#:

いいえ、アンドレイ、2つ目は非常に悪い動作です。

とても良いペアが撮れました ...現実を受け止めれば、カルマンが何かを示すことは神のみぞ知る、である。

ということで、この写真はシミュレーションデータでの比較です。実際のデータでは、最後と前半でカルマンがさらに若干悪くなっています。

大雑把に言うと、カルマンに対していくつかの先験的な仮定がなされ、それが現実に正しいならカルマンがずっと良くなるし、その逆もまた然りである。

mytarmailS 2022.02.06 19:29 #25745

アレクセイニコラエフ#:

大雑把に言うと、カルマンに対していくつかの先験的な仮定がなされ、それが現実に正しければカルマンがより良くなり、逆もまた然りということである。

そんなことはないだろう。面白半分にデータをシミュレートしていただけなのですが...。

実際の Y_ データでのモデルの学習はこちらです。

LS <- estimate_mu_gamma_LS(Y_)
rolling_LS <- estimate_mu_gamma_rolling_LS(Y_)
Kalman <- estimate_mu_gamma_Kalman(Y_)

であれば、スプレッドを取得します。

spread_LS <- compute_spread(Y_, LS$gamma, LS$mu, "LS")
spread_rolling_LS <- compute_spread(Y_, rolling_LS$gamma, rolling_LS$mu, "rolling-LS")
spread_Kalman <- compute_spread(Y_, Kalman$gamma, Kalman$mu, "Kalman")

の後、バックテストを行います。

実際のバックテストの前に、合成データでカルマンをトレーニングしていないんですね。

Aleksey Nikolayev 2022.02.06 19:53 #25746

mytarmailS#:

そんなことはないだろう。彼は、面白半分にデータをシミュレートしていただけなのです。

実際の Y_ データでのモデルの学習はこちらです。

そして、スプレッドを取得する。

の後、バックテストを行います。

実際のバックテストの前に、合成データでカルマンをトレーニングしていないんですね。

先験的な仮定は、第一にパッケージに格納されている線形モデル（カルマンセクションの冒頭で説明）、第二にこのモデルの初期化パラメータは、一般的には、天井から取得されるものである。

Andrei Trukhanovich 2022.02.06 20:14 #25747

mytarmailS#:

いいえAndrei、2番目のローリングLSは 非常に悪いです。

そうでもないんです。先ほどのグラフを見ると、サンプルの3分の1を過ぎたあたりから、実際に「転がり」が発生していることがわかります。実際のデータでは、履歴があれば、このような問題は発生しません。

でも、タキカルマンの方がまだマシかもしれませんが、やはりストーブと割り切った方がいいと思います。

Maxim Dmitrievsky 2022.02.06 20:46 #25748

mytarmailS#:

ああ...特に人道主義者ならね。

アヤメにフォレストじゃないんだから（笑)。

このカルマンでは何もわからない((

その結果得られたスプレッドのMA（別名カルマン）をカウントし、もちろん「ノイズ」を平滑化します

mytarmailS 2022.02.06 20:51 #25749

Maxim Dmitrievsky#:
MAshku (aka Kalman) counts on the resulting spread, smoothing out the "noise", of course

https://datascienceplus.com/kalman-filter-modelling-time-series-shocks-with-kfas-in-r/

カルマンってマシュカじゃないんだ！？

Kalman Filter: Modelling Time Series Shocks with KFAS in R | DataScience+

Python and R tutorials
datascienceplus.com

When it comes to time series forecasts, conventional models such as ARIMA are often a popular option. While these models can prove to have high degrees of accuracy, they have one major shortcoming – they do not typically account for “shocks”, or sudden changes in a time series. Let’s see how we can potentially alleviate this problem using a...

Maxim Dmitrievsky 2022.02.06 21:01 #25750

mytarmailS#:

https://datascienceplus.com/kalman-filter-modelling-time-series-shocks-with-kfas-in-r/

以前、レナとトラクターで、1気圧での予測例を紹介しました ))))笑っちゃいますね。

一方は先行し、他方は後行する。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2575