交易中的机器学习:理论、模型、实践和算法交易 - 页 2575

 
Aleksey Nikolayev#:

在文章中,卡尔曼在生成的数据上进行了测试。我不确定它在实际数据上是否会比LS的滑动版本更好。

不,不,在真实数据上,一切都很公平 Y_

head(Y_)
                EWH      EWZ
2000-08-01 1.947204 2.298111
2000-08-02 1.971071 2.285039
2000-08-03 1.994382 2.278438
2000-08-04 1.994382 2.317404
2000-08-07 2.012648 2.317404
2000-08-08 1.985123 2.317404

这是Y_ 数据的mugamma

Kalman <- estimate_mu_gamma_Kalman(Y_)

以及用Y_数据 进行的回测。

return_Kalman <- pairs_trading(Y_["::2003-03"], Kalman$gamma["::2003-03"], Kalman$mu["::2003-03"], 
                               "Kalman", plot = TRUE)



但问题是,在估计_mu_gamma....blahblah

回归和滚动回归分为跟踪和测试,好像有一个模型可以预测新的数据(新的传播),但是对于卡尔曼来说,它并不存在,我不明白里面是怎么运作的,如何用卡尔曼的新数据来建立传播。代码太不清楚了,我的眼睛都在流血。

 
mytarmailS#:

我不明白这个卡尔曼()有什么用。

反正这三种策略都要解开,在卡尔曼之前解开第二种可能更容易--它有同样的原理--时间上的适应性,但它更简单。

 
Andrei Trukhanovich#:

反正这三种策略都要破解,在卡尔曼之前破解第二种策略可能更容易--它有相同的原理--时间上的适应性,但它更简单。

不,安德烈,第二种方式 效果很差。

也有非常好的对子采取...如果你把现实,上帝保佑,那卡尔曼会显示一些东西。

 
mytarmailS#:

不,安德烈,第二种 效果很差。

有一些非常好的对子被拍到......如果我们采取现实,上帝保佑,卡尔曼显示了一些东西。

所以这张图是对模拟数据的比较。在真实的数据上,他们进一步下降,在他们的前半部分,卡尔曼甚至略差。

粗略地说,对卡尔曼做了一些先验的假设,如果这些假设在现实中是真实的,那么卡尔曼就会好很多,反之亦然。

 
Aleksey Nikolayev#:

粗略地说,对卡尔曼做了一些先验的假设,如果这些假设在现实中是真实的,那么卡尔曼会好得多,反之亦然。

我不这么认为。他只是为了好玩而模拟数据...

这是模型在真实 Y_ 数据上的训练情况。

LS <- estimate_mu_gamma_LS(Y_)
rolling_LS <- estimate_mu_gamma_rolling_LS(Y_)
Kalman <- estimate_mu_gamma_Kalman(Y_)

然后获取价差。

spread_LS <- compute_spread(Y_, LS$gamma, LS$mu, "LS")
spread_rolling_LS <- compute_spread(Y_, rolling_LS$gamma, rolling_LS$mu, "rolling-LS")
spread_Kalman <- compute_spread(Y_, Kalman$gamma, Kalman$mu, "Kalman")

然后进行回测。


在真正的回测之前,你并没有在合成数据上训练卡尔曼。

 
mytarmailS#:

我不这么认为。他只是为了好玩而模拟数据。

这是模型在真实 Y_ 数据上的训练情况。

然后得到差价。

然后进行回测。


在真正的回测之前,你并没有在合成数据上训练卡尔曼。

先验假设首先是存储在软件包中的线性模型(在卡尔曼部分的开头描述),其次是这个模型的初始化参数,一般来说,从天花板上取。

 
mytarmailS#:

不,Andrei,第二个滚动LS 非常糟糕。

并非如此。如果你看一下前面的图表,你可以看到实际的 "滚动 "是在~三分之一的样本过后触发的。在真实的数据上,如果有一个历史,这样的问题就不会发生。

但塔基-卡尔曼可能还是比较好,但我还是认为把它从炉子里分出来比较好。

 
mytarmailS#:

是的......特别是如果你是一个人道主义者。

这不是鸢尾花上的森林)。


这个卡尔曼没有任何东西是清楚的()

对所产生的价差的MA(又称卡尔曼)进行计算,当然是平滑掉 "噪音"。
 
Maxim Dmitrievsky#:
MAshku(又名Kalman)对所产生的传播进行计数,当然要抹去 "噪音"。

https://datascienceplus.com/kalman-filter-modelling-time-series-shocks-with-kfas-in-r/

卡尔曼不是马什卡!
Kalman Filter: Modelling Time Series Shocks with KFAS in R | DataScience+
  • Python and R tutorials
  • datascienceplus.com
When it comes to time series forecasts, conventional models such as ARIMA are often a popular option. While these models can prove to have high degrees of accuracy, they have one major shortcoming – they do not typically account for “shocks”, or sudden changes in a time series. Let’s see how we can potentially alleviate this problem using a...
 

我们以前和瑞纳和拖拉机一起走过这条路,有他们1条预测的例子 ))))) 我在笑

一种情况是领先,另一种情况是落后,总共是50/50。