交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2022.02.06 18:47 #25741

Aleksey Nikolayev#:

在文章中，卡尔曼在生成的数据上进行了测试。我不确定它在实际数据上是否会比LS的滑动版本更好。

不，不，在真实数据上，一切都很公平 Y_。

head(Y_)
                EWH      EWZ
2000-08-01 1.947204 2.298111
2000-08-02 1.971071 2.285039
2000-08-03 1.994382 2.278438
2000-08-04 1.994382 2.317404
2000-08-07 2.012648 2.317404
2000-08-08 1.985123 2.317404

这是Y_ 数据的mu 和gamma。

Kalman <- estimate_mu_gamma_Kalman(Y_)

以及用Y_数据进行的回测。

return_Kalman <- pairs_trading(Y_["::2003-03"], Kalman$gamma["::2003-03"], Kalman$mu["::2003-03"], 
                               "Kalman", plot = TRUE)

但问题是，在估计_mu_gamma....blahblah

回归和滚动回归分为跟踪和测试，好像有一个模型可以预测新的数据（新的传播），但是对于卡尔曼来说，它并不存在，我不明白里面是怎么运作的，如何用卡尔曼的新数据来建立传播。代码太不清楚了，我的眼睛都在流血。

Andrei Trukhanovich 2022.02.06 18:48 #25742

mytarmailS#:

我不明白这个卡尔曼()有什么用。

反正这三种策略都要解开，在卡尔曼之前解开第二种可能更容易--它有同样的原理--时间上的适应性，但它更简单。

mytarmailS 2022.02.06 18:56 #25743

Andrei Trukhanovich#:

反正这三种策略都要破解，在卡尔曼之前破解第二种策略可能更容易--它有相同的原理--时间上的适应性，但它更简单。

不，安德烈，第二种方式效果很差。

也有非常好的对子采取...如果你把现实，上帝保佑，那卡尔曼会显示一些东西。

Aleksey Nikolayev 2022.02.06 19:07 #25744

mytarmailS#:

不，安德烈，第二种 效果很差。

有一些非常好的对子被拍到......如果我们采取现实，上帝保佑，卡尔曼显示了一些东西。

所以这张图是对模拟数据的比较。在真实的数据上，他们进一步下降，在他们的前半部分，卡尔曼甚至略差。

粗略地说，对卡尔曼做了一些先验的假设，如果这些假设在现实中是真实的，那么卡尔曼就会好很多，反之亦然。

mytarmailS 2022.02.06 19:29 #25745

Aleksey Nikolayev#:

粗略地说，对卡尔曼做了一些先验的假设，如果这些假设在现实中是真实的，那么卡尔曼会好得多，反之亦然。

我不这么认为。他只是为了好玩而模拟数据...

这是模型在真实 Y_ 数据上的训练情况。

LS <- estimate_mu_gamma_LS(Y_)
rolling_LS <- estimate_mu_gamma_rolling_LS(Y_)
Kalman <- estimate_mu_gamma_Kalman(Y_)

然后获取价差。

spread_LS <- compute_spread(Y_, LS$gamma, LS$mu, "LS")
spread_rolling_LS <- compute_spread(Y_, rolling_LS$gamma, rolling_LS$mu, "rolling-LS")
spread_Kalman <- compute_spread(Y_, Kalman$gamma, Kalman$mu, "Kalman")

然后进行回测。

在真正的回测之前，你并没有在合成数据上训练卡尔曼。

Aleksey Nikolayev 2022.02.06 19:53 #25746

mytarmailS#:

我不这么认为。他只是为了好玩而模拟数据。

这是模型在真实 Y_ 数据上的训练情况。

然后得到差价。

然后进行回测。

在真正的回测之前，你并没有在合成数据上训练卡尔曼。

先验假设首先是存储在软件包中的线性模型（在卡尔曼部分的开头描述），其次是这个模型的初始化参数，一般来说，从天花板上取。

Andrei Trukhanovich 2022.02.06 20:14 #25747

mytarmailS#:

不，Andrei，第二个滚动LS 非常糟糕。

并非如此。如果你看一下前面的图表，你可以看到实际的 "滚动 "是在~三分之一的样本过后触发的。在真实的数据上，如果有一个历史，这样的问题就不会发生。

但塔基-卡尔曼可能还是比较好，但我还是认为把它从炉子里分出来比较好。

Maxim Dmitrievsky 2022.02.06 20:46 #25748

mytarmailS#:

是的......特别是如果你是一个人道主义者。

这不是鸢尾花上的森林）。

这个卡尔曼没有任何东西是清楚的()

对所产生的价差的MA（又称卡尔曼）进行计算，当然是平滑掉 "噪音"。

mytarmailS 2022.02.06 20:51 #25749

Maxim Dmitrievsky#:
MAshku（又名Kalman）对所产生的传播进行计数，当然要抹去 "噪音"。

https://datascienceplus.com/kalman-filter-modelling-time-series-shocks-with-kfas-in-r/

卡尔曼不是马什卡!

Kalman Filter: Modelling Time Series Shocks with KFAS in R | DataScience+

Python and R tutorials
datascienceplus.com

When it comes to time series forecasts, conventional models such as ARIMA are often a popular option. While these models can prove to have high degrees of accuracy, they have one major shortcoming – they do not typically account for “shocks”, or sudden changes in a time series. Let’s see how we can potentially alleviate this problem using a...

Maxim Dmitrievsky 2022.02.06 21:01 #25750

mytarmailS#:

https://datascienceplus.com/kalman-filter-modelling-time-series-shocks-with-kfas-in-r/

我们以前和瑞纳和拖拉机一起走过这条路，有他们1条预测的例子 ))))) 我在笑

一种情况是领先，另一种情况是落后，总共是50/50。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2575