交易中的机器学习：理论、模型、实践和算法交易

Maxim Dmitrievsky 2017.10.20 07:20 #5091

交易员博士。

执行了文章中的代码，第一次时一切正常。
R的版本是3.4.2，但我认为这没有多大关系。

我把R打开了......这一定是故障。

СанСаныч Фоменко 2017.10.20 07:54 #5092

阿列克谢-特伦特夫。
只是这里有些人在对价格进行分类。这是给他们的。

分类的类型是由老师决定的，你必须非常小心。

如果大师是趋势（趋势模式），应该有等量的（大致）上升和下降。但不清楚哪里是横向的...而如果有横向的，就不清楚：什么是涨，什么是跌。趋势出现了僵局。

因此，最有希望的，也就是这里所讨论的，是预测价格上涨。但对于它和老师是不同的，不一样的是对于趋势。

顺便说一下，没有人在这里对价格进行分类。

如果你对时间序列预测感兴趣，最好是阅读这些文章。

你的链接只有静止的时间序列？根据指数平滑法判断，是的。金融市场上没有静止的时间序列。

你提到的文章与预测无关--它是以分析形式对曲线进行的推断。如果有差距怎么办？如果有德拉吉之类的人呢？

Maxim Dmitrievsky 2017.10.20 10:01 #5093

通过最低RMSE对3个不同属性的自动取样期，可以看出，属性在市场中的重要性随着时间的推移有很大的变化，无论是绝对值还是相对于其他属性。偶尔会有稳定的时期，即属性相同的时期，或略有不同，但总的来说，变化性很大。这只是一小段剪报。所有的预测因子都有一个固定的形式。

2017.10.20 16:56:12.405 2017.06.05 03:15:00   39 48 45
2017.10.20 16:56:13.105 2017.06.05 03:30:00   40 49 46
2017.10.20 16:56:13.793 2017.06.05 03:45:00   41 49 47
2017.10.20 16:56:14.481 2017.06.05 04:00:00   42 49 49
2017.10.20 16:56:15.168 2017.06.05 04:15:00   43 49 49
2017.10.20 16:56:15.853 2017.06.05 04:30:00   44 49 49
2017.10.20 16:56:16.538 2017.06.05 04:45:00   45 49 49
2017.10.20 16:56:17.255 2017.06.05 05:00:00   46 49 49
2017.10.20 16:56:17.981 2017.06.05 05:15:00   47 49 49
2017.10.20 16:56:18.673 2017.06.05 05:30:00   48 49 49
2017.10.20 16:56:19.368 2017.06.05 05:45:00   49 49 49
2017.10.20 16:56:20.038 2017.06.05 06:00:00   48 49 49
2017.10.20 16:56:20.760 2017.06.05 06:15:00   49 49 49
2017.10.20 16:56:21.429 2017.06.05 06:30:00   24 6 49
2017.10.20 16:56:22.136 2017.06.05 06:45:00   5 6 49
2017.10.20 16:56:22.824 2017.06.05 07:00:00   5 6 49
2017.10.20 16:56:23.495 2017.06.05 07:15:00   27 7 6
2017.10.20 16:56:24.200 2017.06.05 07:30:00   6 7 5
2017.10.20 16:56:24.901 2017.06.05 07:45:00   5 7 6
2017.10.20 16:56:25.603 2017.06.05 08:00:00   6 6 5
2017.10.20 16:56:26.275 2017.06.05 08:15:00   7 7 5
2017.10.20 16:56:26.963 2017.06.05 08:30:00   4 5 5
2017.10.20 16:56:27.694 2017.06.05 08:45:00   5 6 6
2017.10.20 16:56:28.415 2017.06.05 09:00:00   6 7 7
2017.10.20 16:56:29.118 2017.06.05 09:15:00   13 8 16
2017.10.20 16:56:29.826 2017.06.05 09:30:00   12 12 17
2017.10.20 16:56:30.546 2017.06.05 09:45:00   17 13 19
2017.10.20 16:56:31.242 2017.06.05 10:00:00   18 16 20
2017.10.20 16:56:31.978 2017.06.05 10:15:00   19 18 21

也就是说，用愚蠢的统计学术语来说，市场中恒定模式的无效假设没有被证实

结论：我们应该创建至少2个模型：一个将实时选择信息属性，另一个将对其进行学习和再训练。这需要一个系统，在这个系统中，改变特征会产生影响，即把整个事物作为一个整体的系统。

mytarmailS 2017.10.20 12:59 #5094

马克西姆-德米特里耶夫斯基。

结论：我们需要做至少2个模型：一个将实时选择信息量大的特征，另一个将对其进行学习和再训练。

对我来说，这不是正确的结论，因为模型总是落后一步，对于现有的市场特征总是过时一步......同样的滚动滞后平均值......

mytarmailS 2017.10.20 13:01 #5095

交易员博士。

有一种观点认为，为了训练一个分类模型，应该平衡类的数量，使 "1 "类的训练实例的数量与 "2 "类的训练实例的数量相吻合（并删除不必要的实例）。

我看到对回归模型有类似的要求，但它更复杂--水平为 "0.001 "的例子数量应该等于水平为"-0.001 "的训练例子数量。
目标为0.002的例子的数量应该等于目标为-0.002的例子的数量，等等。

下面是一个使这种平衡的脚本

在caret中，一切都已经实现了，不同类型的类对齐，不幸的是，我不记得这些函数是如何调用的，我很久以前就搞过了。

Maxim Dmitrievsky 2017.10.20 13:42 #5096

mytarmailS:

在我看来，这个结论是错误的，因为这个模型总是落后一步，与当前的市场特征相比总是过时一步......同样的滑动滞后悲惨的平均数......

是的，但不是......也就是说，比没有它好。

Dr. Trader 2017.10.20 13:44 #5097

埃利布留斯。
它本质上意味着什么？
如果美元连续几个月上涨（有一个趋势），那么通过平滑训练实例的数量，我们将显示NS，就好像在这段时间内它是平的一样。而相应地，它也会把它学得很平。这是否正确？也许，我们还是应该把它教给潮流？

如果价格随着新的数据开始下跌怎么办？该模型预计它将上升。在这种情况下，我使用的模型开始变得有点沉闷，并在交易中坐了很久，超额完成任务。

mytarmailS 2017.10.20 14:01 #5098

马克西姆-德米特里耶夫斯基。

是的，但是没有......我的意思是，它比没有它好。

我能说什么呢，试试吧，分享你的经验，这才是有趣的阅读。

我试着在每根柱子上重新训练模型...

是的--该模型比静态模型的效果更好（一旦训练好了）。

不 - 该模型不能被称为工作

p.s. 我希望你能做得更好

Maxim Dmitrievsky 2017.10.20 14:19 #5099

mytarmailS:

我能说什么呢，试试吧，分享你的经验，这才是有趣的阅读。

我试着在每根柱子上重新训练模型...

是的--该模型比静态模型（一次性训练）效果更好。

不 - 该模型不能被称为工作

p.s. 我希望你做得更好。

我让模型完全不重新训练，并在优化器中调整某些参数，但有通过另一个模型不断拟合特征，总是给出相同的结果，但由于特征的变化期，它要么给出更多或更少的不同方向的信号，这取决于市场的情况。例如，小周期的预测器对平坦的市场有好处，但较长的预测器对趋势有好处。很明显，仍然有一个滞后，但问题是它有多关键。但由于一切都在一定时期内累积优化，我们获得了一种超级适应性的风格。

好吧，简而言之，这是我的幻想，我完成后会告诉你 )

mytarmailS 2017.10.20 14:25 #5100

马克西姆-德米特里耶夫斯基。

我做的模型根本不是重新训练，而是在优化器中调整某些参数，但通过另一个模型不断地拟合特征，所以第一个模型会一直给出相同的结果，但由于特征的周期变化，它产生的不同方向的信号要么多，要么少，取决于市场。例如，小周期的预测器对平坦的市场有好处，但较长的预测器对趋势有好处。很明显，仍然有一个滞后。问题是它有多严重。

好吧，这些都是我的幻想，我完成后会给你看的 )

你说的 "特征/预测器的时期 "是什么意思？)

交易中的机器学习：理论、模型、实践和算法交易 - 页 510