交易中的机器学习:理论、模型、实践和算法交易 - 页 1354

 
Yuriy Asaulenko:

保存档案。见附件。

Learn.csv - 输入。每一行中的第一个数字是历史的约束,它应该被删除。

Cell.scv - 目标。

对这一数据的训练应产生以下图表。

滤波器大约等于EMA(16),预测 - 5分钟。

我将在以后需要时进行测试。

我不确定这个图是训练图还是测试图。

这是测试中的CatBoost--最后的100个数值。

偏差的柱状图。

我取了4000个用于训练,2000个用于验证,还有100行用于测试。我训练了1000棵深度为6的树,RMSE公式(用Poisson 代替)。

附上样本和设置,如果要播放,你需要下载CB并把它放在设置目录中。

在训练样本上,同样的分布并不像你的那样

新增: 模型的应用不正确--概率图变成了...

附加的文件:
Setup.zip  587 kb
 
阿列克谢-维亚兹米 金。

我不太清楚,你是在哪个样本上得到这个图的--是在训练中还是在测试中?

这是测试中的CatBoost--最后的100个数值。

偏差的柱状图。

我取了4000个用于训练,2000个用于验证,还有100行用于测试。我训练了1000棵树,深度为6,RMSE公式。

附上样本和设置,如果要播放,你需要下载CB并把它放在设置目录中。

在训练样本上,其分布也不像你的那样

我的图表只对整个样本进行训练。这一次没有做测试。将与训练大致相同。
X轴图上的负值去了哪里?而X值的范围 与Y值不一样?怎么说呢?
我有一个比较预测值和实际值(目标)的图表。没有分配。
 
尤里-阿索连科
我的图表只对整个样本进行训练。我还没有做过这方面的测试。将与培训大致相同。
图中X轴上的负值在哪里?而X值的范围 与Y值不一样?怎么说呢?
我有一个比较预测值和实际值的图表。

是的,我以前没有做过回归,有很多不明显的适配函数,相对于分类来说,给出的结果不同,我取错了值。

这里是测试样本。

这是训练样本--4,000行。

测试样本的偏差柱状图

下面是3个样本的总体图。

用来训练测试样本的指标

他说,我们本可以在250次迭代时停止训练,模型被重新训练。

 
阿列克谢-维亚兹米 金。

是的,我以前没有做过回归,有很多模糊的适配函数,不像分类,会有不同的结果,我取错了值。

这里是测试样本。

这里是训练样本--4000行。

测试样本的偏差柱状图

下面是3个样本的一般图表

似乎没有问题。在测试中,也是如此。虽然经过了重新培训)。
 
Yuriy Asaulenko:
看起来不错。

嗯,是的,如果你愿意,你可以改进它--我只是对回归模型 没有经验。

因此,主要的预测因素是工作工具 :)

我附上了带有设置的最终版本--它训练了10个具有不同种子的模型。

附加的文件:
Setup.zip  588 kb
 
阿列克谢-维亚兹米 金。

嗯,是的,如果你想,它可以被改进--我只是没有回归模型的经验。

因此,主要的预测因素是工作工具 :)
有一个按比例的价格系列作为输入。- 20个近似值,仅此而已。这不是关于预测器的问题,而是问题的表述--它是可以解决的。而你的森林会自己想出预测因素)。
 
尤里-阿索连科
在输入处有一个按比例的价格系列。- 有20个近似值,仅此而已。这不是预测者的问题,而是问题的表述--它可以被解决。而你的森林会自己想出预测因素)。

是的,这与问题的陈述有关,我同意。只是,我不认为价格是塑造馅饼的面团,需要预测因素来塑造这些馅饼。

 
马克西姆-德米特里耶夫斯基

可以改善一个模型的经典技术之一。或者说,找到最佳的一个。蒙特卡洛的原始应用。

https://en.wikipedia.org/wiki/Importance_sampling

你在你的文章中没有应用这种方法吗?

 
马克西姆-德米特里耶夫斯基

对于非政策性(政策梯度)RL

https://medium.com/@jonathan_hui/rl-importance-sampling-ebfb28b4a8c6

你能用俄语,用你自己的话解释一下这个想法吗?可以这么说,是用英语)。

 
尤里-阿索连科

我们对LPF滤波器的预测相当成功。即使现在我们两个人,甚至不只是NS,而是森林。现在让我们试着预测价格,这完全是一个毫无意义的练习)。我们宁可预测价格预期变化的低频部分,而这(预期)目前是未知的。而在这里,在各种运动的背景下,高频震荡和其他一切。

所以我们得到了以下结果:预测时间是1米TF上的5米。

像往常一样:X是预测值,Y是实际值。好吧,倾斜45度,它看起来像一个长方形,谢谢你没有成为一个圆。如果你在x上向零的右边-左边移动一点,你甚至可以玩到50%多一点的概率(见区域)。

当然,如果能建立各种回归线和分布就更好了,但有必要做切片,至少要做几片--这是后话。

PS 好吧,还有一个使用稍加修改的算法的预测。同样的5分钟在时间框架1米。

已经好多了)。从预测>2和<-2的х开始,如果我们简单地在5分钟内关闭,几乎不会出现亏损的交易。

第二张照片真的很好!算法的哪些变化使之成为可能?