トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2575

 
Aleksey Nikolayev#:

この記事では、生成されたデータに対してカルマンがテストされています。実データでLSスライド式より良くなるとは思えません。

いやいや、実データ上では、すべて公平です Y_。

head(Y_)
                EWH      EWZ
2000-08-01 1.947204 2.298111
2000-08-02 1.971071 2.285039
2000-08-03 1.994382 2.278438
2000-08-04 1.994382 2.317404
2000-08-07 2.012648 2.317404
2000-08-08 1.985123 2.317404

こちらはY_ データのミューと ガンマ です。

Kalman <- estimate_mu_gamma_Kalman(Y_)

Y_のデータで バックテストを行う。

return_Kalman <- pairs_trading(Y_["::2003-03"], Kalman$gamma["::2003-03"], Kalman$mu["::2003-03"], 
                               "Kalman", plot = TRUE)



でも、要は、estimate_mu_gammaで......ボソッ

Regressionとrolling regressionはtraceとtestに分かれていて、新しいデータ(新しいスプレッド)を予測するモデルがあるようなのですが、calmanについてはそれがなく、中の仕組み、calmanで新しいデータでスプレッドを構築する方法がよく分かりません。コードが不明瞭で目から血が出そうです。

 
mytarmailS#:

このカルマンでは何もわからない((

カルマンと同じ原理で、時間に対する適応性があるのですが、よりシンプルなのです。

 
Andrei Trukhanovich(アンドレイ・トルハノビッチ #:

カルマンも同じ原理で、時間に対する適応性があるのですが、よりシンプルなのです。

いや、アンドレイ、2つ目は とてもうまくいかないんだ。

また、非常に良いペアが撮影されています。現実を受け止めれば、神の思し召しで、そのカルマンが何かを示してくれるはずです。

 
mytarmailS#:

いいえ、アンドレイ、2つ目は 非常に悪い動作です。

とても良いペアが撮れました ...現実を受け止めれば、カルマンが何かを示すことは神のみぞ知る、である。

ということで、この写真はシミュレーションデータでの比較です。実際のデータでは、最後と前半でカルマンがさらに若干悪くなっています。

大雑把に言うと、カルマンに対していくつかの先験的な仮定がなされ、それが現実に正しいならカルマンがずっと良くなるし、その逆もまた然りである。

 
アレクセイ ニコラエフ#:

大雑把に言うと、カルマンに対していくつかの先験的な仮定がなされ、それが現実に正しければカルマンがより良くなり、逆もまた然りということである。

そんなことはないだろう。面白半分にデータをシミュレートしていただけなのですが...。

実際の Y_ データでのモデルの学習はこちらです。

LS <- estimate_mu_gamma_LS(Y_)
rolling_LS <- estimate_mu_gamma_rolling_LS(Y_)
Kalman <- estimate_mu_gamma_Kalman(Y_)

であれば、スプレッドを取得します。

spread_LS <- compute_spread(Y_, LS$gamma, LS$mu, "LS")
spread_rolling_LS <- compute_spread(Y_, rolling_LS$gamma, rolling_LS$mu, "rolling-LS")
spread_Kalman <- compute_spread(Y_, Kalman$gamma, Kalman$mu, "Kalman")

の後、バックテストを行います。


実際のバックテストの前に、合成データでカルマンをトレーニングしていないんですね。

 
mytarmailS#:

そんなことはないだろう。彼は、面白半分にデータをシミュレートしていただけなのです。

実際の Y_ データでのモデルの学習はこちらです。

そして、スプレッドを取得する。

の後、バックテストを行います。


実際のバックテストの前に、合成データでカルマンをトレーニングしていないんですね。

先験的な仮定は、第一にパッケージに格納されている線形モデル(カルマンセクションの冒頭で説明)、第二にこのモデルの初期化パラメータは、一般的には、天井から取得されるものである。

 
mytarmailS#:

いいえAndrei、2番目のローリングLSは 非常に悪いです。

そうでもないんです。先ほどのグラフを見ると、サンプルの3分の1を過ぎたあたりから、実際に「転がり」が発生していることがわかります。実際のデータでは、履歴があれば、このような問題は発生しません。

でも、タキカルマンの方がまだマシかもしれませんが、やはりストーブと割り切った方がいいと思います。

 
mytarmailS#:

ああ...特に人道主義者ならね。

アヤメにフォレストじゃないんだから(笑)。


このカルマンでは何もわからない((

その結果得られたスプレッドのMA(別名カルマン)をカウントし、もちろん「ノイズ」を平滑化します
 
Maxim Dmitrievsky#:
MAshku (aka Kalman) counts on the resulting spread, smoothing out the "noise", of course

https://datascienceplus.com/kalman-filter-modelling-time-series-shocks-with-kfas-in-r/

カルマンってマシュカじゃないんだ!?
Kalman Filter: Modelling Time Series Shocks with KFAS in R | DataScience+
  • Python and R tutorials
  • datascienceplus.com
When it comes to time series forecasts, conventional models such as ARIMA are often a popular option. While these models can prove to have high degrees of accuracy, they have one major shortcoming – they do not typically account for “shocks”, or sudden changes in a time series. Let’s see how we can potentially alleviate this problem using a...
 

以前、レナとトラクターで、1気圧での予測例を紹介しました ))))笑っちゃいますね。

一方は先行し、他方は後行する。

理由: