交易中的机器学习:理论、模型、实践和算法交易 - 页 510

 
交易员博士

执行了文章中的代码,第一次时一切正常。
R的版本是3.4.2,但我认为这没有多大关系。


我把R打开了......这一定是故障。

 
阿列克谢-特伦特夫
只是这里有些人在对价格进行分类。这是给他们的。

分类的类型是由老师决定的,你必须非常小心。

如果大师是趋势(趋势模式),应该有等量的(大致)上升和下降。 但不清楚哪里是横向的...而如果有横向的,就不清楚:什么是涨,什么是跌。趋势出现了僵局。

因此,最有希望的,也就是这里所讨论的,是预测价格上涨。但对于它和老师是不同的,不一样的是对于趋势。

顺便说一下,没有人在这里对价格进行分类。


如果你对时间序列预测 感兴趣,最好是阅读这些文章。

你的链接只有静止的时间序列?根据指数平滑法判断,是的。金融市场上没有静止的时间序列

你提到的文章与预测无关--它是以分析形式对曲线进行的推断。如果有差距怎么办?如果有德拉吉之类的人呢?

 

通过最低RMSE对3个不同属性的自动取样期,可以看出,属性在市场中的重要性随着时间的推移有很大的变化,无论是绝对值 还是相对于其他属性。偶尔会有稳定的时期,即属性相同的时期,或略有不同,但总的来说,变化性很大。这只是一小段剪报。所有的预测因子都有一个固定的形式。

2017.10.20 16:56:12.405 2017.06.05 03:15:00   39 48 45
2017.10.20 16:56:13.105 2017.06.05 03:30:00   40 49 46
2017.10.20 16:56:13.793 2017.06.05 03:45:00   41 49 47
2017.10.20 16:56:14.481 2017.06.05 04:00:00   42 49 49
2017.10.20 16:56:15.168 2017.06.05 04:15:00   43 49 49
2017.10.20 16:56:15.853 2017.06.05 04:30:00   44 49 49
2017.10.20 16:56:16.538 2017.06.05 04:45:00   45 49 49
2017.10.20 16:56:17.255 2017.06.05 05:00:00   46 49 49
2017.10.20 16:56:17.981 2017.06.05 05:15:00   47 49 49
2017.10.20 16:56:18.673 2017.06.05 05:30:00   48 49 49
2017.10.20 16:56:19.368 2017.06.05 05:45:00   49 49 49
2017.10.20 16:56:20.038 2017.06.05 06:00:00   48 49 49
2017.10.20 16:56:20.760 2017.06.05 06:15:00   49 49 49
2017.10.20 16:56:21.429 2017.06.05 06:30:00   24 6 49
2017.10.20 16:56:22.136 2017.06.05 06:45:00   5 6 49
2017.10.20 16:56:22.824 2017.06.05 07:00:00   5 6 49
2017.10.20 16:56:23.495 2017.06.05 07:15:00   27 7 6
2017.10.20 16:56:24.200 2017.06.05 07:30:00   6 7 5
2017.10.20 16:56:24.901 2017.06.05 07:45:00   5 7 6
2017.10.20 16:56:25.603 2017.06.05 08:00:00   6 6 5
2017.10.20 16:56:26.275 2017.06.05 08:15:00   7 7 5
2017.10.20 16:56:26.963 2017.06.05 08:30:00   4 5 5
2017.10.20 16:56:27.694 2017.06.05 08:45:00   5 6 6
2017.10.20 16:56:28.415 2017.06.05 09:00:00   6 7 7
2017.10.20 16:56:29.118 2017.06.05 09:15:00   13 8 16
2017.10.20 16:56:29.826 2017.06.05 09:30:00   12 12 17
2017.10.20 16:56:30.546 2017.06.05 09:45:00   17 13 19
2017.10.20 16:56:31.242 2017.06.05 10:00:00   18 16 20
2017.10.20 16:56:31.978 2017.06.05 10:15:00   19 18 21

也就是说,用愚蠢的统计学术语来说,市场中恒定模式的无效假设没有被证实

结论:我们应该创建至少2个模型:一个将实时选择信息属性,另一个将对其进行学习和再训练。这需要一个系统,在这个系统中,改变特征会产生影响,即把整个事物作为一个整体的系统。

 
马克西姆-德米特里耶夫斯基

结论:我们需要做至少2个模型:一个将实时选择信息量大的特征,另一个将对其进行学习和再训练。

对我来说,这不是正确的结论,因为模型总是落后一步,对于现有的市场特征总是过时一步......同样的滚动滞后平均值......

 
交易员博士

有一种观点认为,为了训练一个分类模型,应该平衡类的数量,使 "1 "类的训练实例的数量与 "2 "类的训练实例的数量相吻合(并删除不必要的实例)。

我看到对回归模型有类似的要求,但它更复杂--水平为 "0.001 "的例子数量应该等于水平为"-0.001 "的训练例子数量。
目标为0.002的例子的数量应该等于目标为-0.002的例子的数量,等等。

下面是一个使这种平衡的脚本

在caret中,一切都已经实现了,不同类型的类对齐,不幸的是,我不记得这些函数是如何调用的,我很久以前就搞过了。
 
mytarmailS:

在我看来,这个结论是错误的,因为这个模型总是落后一步,与当前的市场特征相比总是过时一步......同样的滑动滞后悲惨的平均数......


是的,但不是......也就是说,比没有它好。

 
埃利布留斯
它本质上意味着什么?
如果美元连续几个月上涨(有一个趋势),那么通过平滑训练实例的数量,我们将显示NS,就好像在这段时间内它是平的一样。而相应地,它也会把它学得很平。这是否正确?也许,我们还是应该把它教给潮流?

如果价格随着新的数据开始下跌怎么办?该模型预计它将上升。在这种情况下,我使用的模型开始变得有点沉闷,并在交易中坐了很久,超额完成任务。

 
马克西姆-德米特里耶夫斯基

是的,但是没有......我的意思是,它比没有它好。

我能说什么呢,试试吧,分享你的经验,这才是有趣的阅读。

我试着在每根柱子上重新训练模型...

是的--该模型比静态模型的效果更好(一旦训练好了)。

- 该模型不能被称为工作

p.s. 我希望你能做得更好
 
mytarmailS:

我能说什么呢,试试吧,分享你的经验,这才是有趣的阅读。

我试着在每根柱子上重新训练模型...

是的--该模型比静态模型(一次性训练)效果更好。

- 该模型不能被称为工作

p.s. 我希望你做得更好。

我让模型完全不重新训练,并在优化器中调整某些参数,但有通过另一个模型不断拟合特征,总是给出相同的结果,但由于特征的变化期,它要么给出更多或更少的不同方向的信号,这取决于市场的情况。例如,小周期的预测器对平坦的市场有好处,但较长的预测器对趋势有好处。很明显,仍然有一个滞后,但问题是它有多关键。但由于一切都在一定时期内累积优化,我们获得了一种超级适应性的风格。

好吧,简而言之,这是我的幻想,我完成后会告诉你 )

 
马克西姆-德米特里耶夫斯基

我做的模型根本不是重新训练,而是在优化器中调整某些参数,但通过另一个模型不断地拟合特征,所以第一个模型会一直给出相同的结果,但由于特征的周期变化,它产生的不同方向的信号要么多,要么少,取决于市场。例如,小周期的预测器对平坦的市场有好处,但较长的预测器对趋势有好处。很明显,仍然有一个滞后。 问题是它有多严重。

好吧,这些都是我的幻想,我完成后会给你看的 )


你说的 "特征/预测器的时期 "是什么意思?)