交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2019.02.21 04:11 #13531

Yuriy Asaulenko:

保存档案。见附件。

Learn.csv - 输入。每一行中的第一个数字是历史的约束，它应该被删除。

Cell.scv - 目标。

对这一数据的训练应产生以下图表。

滤波器大约等于EMA(16)，预测 - 5分钟。

我将在以后需要时进行测试。

我不确定这个图是训练图还是测试图。

这是测试中的CatBoost--最后的100个数值。

偏差的柱状图。

我取了4000个用于训练，2000个用于验证，还有100行用于测试。我训练了1000棵深度为6的树，RMSE公式（用Poisson 代替）。

附上样本和设置，如果要播放，你需要下载CB并把它放在设置目录中。

在训练样本上，同样的分布并不像你的那样

新增：模型的应用不正确--概率图变成了...

附加的文件：

Setup.zip 587 kb

Yuriy Asaulenko 2019.02.21 04:48 #13532

阿列克谢-维亚兹米 金。

我不太清楚，你是在哪个样本上得到这个图的--是在训练中还是在测试中？

这是测试中的CatBoost--最后的100个数值。

偏差的柱状图。

我取了4000个用于训练，2000个用于验证，还有100行用于测试。我训练了1000棵树，深度为6，RMSE公式。

附上样本和设置，如果要播放，你需要下载CB并把它放在设置目录中。

在训练样本上，其分布也不像你的那样

我的图表只对整个样本进行训练。这一次没有做测试。将与训练大致相同。

X轴图上的负值去了哪里？而X值的范围与Y值不一样？怎么说呢？

我有一个比较预测值和实际值（目标）的图表。没有分配。

Aleksey Vyazmikin 2019.02.21 04:58 #13533

尤里-阿索连科。
我的图表只对整个样本进行训练。我还没有做过这方面的测试。将与培训大致相同。

图中X轴上的负值在哪里？而X值的范围与Y值不一样？怎么说呢？

我有一个比较预测值和实际值的图表。

是的，我以前没有做过回归，有很多不明显的适配函数，相对于分类来说，给出的结果不同，我取错了值。

这里是测试样本。

这是训练样本--4,000行。

测试样本的偏差柱状图

下面是3个样本的总体图。

用来训练测试样本的指标

他说，我们本可以在250次迭代时停止训练，模型被重新训练。

Yuriy Asaulenko 2019.02.21 05:08 #13534

阿列克谢-维亚兹米 金。

是的，我以前没有做过回归，有很多模糊的适配函数，不像分类，会有不同的结果，我取错了值。

这里是测试样本。

这里是训练样本--4000行。

测试样本的偏差柱状图

下面是3个样本的一般图表

似乎没有问题。在测试中，也是如此。虽然经过了重新培训）。

Aleksey Vyazmikin 2019.02.21 05:10 #13535

Yuriy Asaulenko:
看起来不错。

嗯，是的，如果你愿意，你可以改进它--我只是对回归模型没有经验。

因此，主要的预测因素是工作工具 :)

我附上了带有设置的最终版本--它训练了10个具有不同种子的模型。

附加的文件：

Setup.zip 588 kb

Yuriy Asaulenko 2019.02.21 05:20 #13536

阿列克谢-维亚兹米 金。

嗯，是的，如果你想，它可以被改进--我只是没有回归模型的经验。

因此，主要的预测因素是工作工具 :)

有一个按比例的价格系列作为输入。- 20个近似值，仅此而已。这不是关于预测器的问题，而是问题的表述--它是可以解决的。而你的森林会自己想出预测因素）。

Aleksey Vyazmikin 2019.02.21 06:37 #13537

尤里-阿索连科。
在输入处有一个按比例的价格系列。- 有20个近似值，仅此而已。这不是预测者的问题，而是问题的表述--它可以被解决。而你的森林会自己想出预测因素）。

是的，这与问题的陈述有关，我同意。只是，我不认为价格是塑造馅饼的面团，需要预测因素来塑造这些馅饼。

Aleksey Vyazmikin 2019.02.21 06:38 #13538

马克西姆-德米特里耶夫斯基。

可以改善一个模型的经典技术之一。或者说，找到最佳的一个。蒙特卡洛的原始应用。

https://en.wikipedia.org/wiki/Importance_sampling

你在你的文章中没有应用这种方法吗？

Aleksey Vyazmikin 2019.02.21 06:39 #13539

马克西姆-德米特里耶夫斯基。

对于非政策性（政策梯度）RL

https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6

你能用俄语，用你自己的话解释一下这个想法吗？可以这么说，是用英语）。

Forester 2019.02.21 18:11 #13540

尤里-阿索连科。

我们对LPF滤波器的预测相当成功。即使现在我们两个人，甚至不只是NS，而是森林。现在让我们试着预测价格，这完全是一个毫无意义的练习）。我们宁可预测价格预期变化的低频部分，而这（预期）目前是未知的。而在这里，在各种运动的背景下，高频震荡和其他一切。

所以我们得到了以下结果：预测时间是1米TF上的5米。

像往常一样：X是预测值，Y是实际值。好吧，倾斜45度，它看起来像一个长方形，谢谢你没有成为一个圆。如果你在x上向零的右边-左边移动一点，你甚至可以玩到50%多一点的概率（见区域）。

当然，如果能建立各种回归线和分布就更好了，但有必要做切片，至少要做几片--这是后话。

PS 好吧，还有一个使用稍加修改的算法的预测。同样的5分钟在时间框架1米。

已经好多了）。从预测>2和<-2的х开始，如果我们简单地在5分钟内关闭，几乎不会出现亏损的交易。

第二张照片真的很好!算法的哪些变化使之成为可能？

交易中的机器学习：理论、模型、实践和算法交易 - 页 1354