交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2018.05.24 14:01 #9511

Dr. Trader:

对于最后一个文件，我与树的关系是这样的。

2016年，培训

	y_pred
y_true	-1	0	1
-1	13392	38844	4472
0	10803	76714	6029
1	7413	37678	7415

2015年，测试。

	y_pred
y_true	-1	0	1
-1	9552	39262	5429
0	11495	72131	7509
1	8581	40377	6835

当预测-1时：-1实际上会比1出现的频率略高。但0将是最频繁的，而且可能都会以损失告终。对 "1 "类也是如此。

树的麻烦出来了。遗传学选择了树的参数cp=0，这给了树一堆分支的权限。不幸的是，我们应该把这个参数限制在某个小的非零值。

是否可以像以前一样，用概率来表示这个数字？也许在测试数据上有更多重要的分支？

Dr. Trader:

我认为数据中没有足够的预测因素来分类为 "0"。例如需要一些平整度的指标。

一般来说，它与树的关系很不好。SanSanych的木材要好得多。

错误的模型设置，以及由此产生的过度训练。

他只拿了2016年的一个文件（顺便说一下2015年少了1个预测器--我纠正了，我可以重新下载），而今年2016年的趋势是上升的!

这棵树紧紧抓住上层TF的数据，而关于它们的统计数据基本上很少，正因为如此，当全球的运动矢量发生变化（2015年向上，2016年向下）或出现完全持平（2017年）时，历史上就会出现一个卡子。

至于平盘，我们有从平盘入市以及反转的目标，我们是否可以尝试以某种方式将它们分开？

像Levl这样的预测器可以很好地识别平面，唯一的麻烦是，树不能把它们连接在一起，至少在一个TF上。

Dr. Trader 2018.05.24 14:09 #9512

你做了一个有利可图的机器人 :)

进入多头 - 只有当预测到 "1"（蓝色）时，其中>90%将是利润（绿色）。
进入空头 - 只有当预测"-1"（红色），其中再次>90％将是利润（绿色）。
预测为 "0 "意味着不开新仓，等待更好的时机，所以在进行这一类的预测之前，实际的准确率是多少根本不重要。

但最好是在2015年的文件上训练森林，并在2016年的文件上检查它。2015年只少了一列，2016年也应该去掉，这样就不会把那个响声混淆了。

Dr. Trader 2018.05.24 14:14 #9513

阿列克谢-维亚兹米 金。

这个数字能否像以前一样用概率来表示？

不，这是一个不同的树状学习模式，只适合于2个班。或者为了回归。

Aleksey Vyazmikin 2018.05.24 14:17 #9514

SanSanych Fomenko:

有什么酷的--再培训，没有别的，他没有一个与他的目标变量有关的预测器--全是噪音。而它却坐在拨浪鼓里，不检查噪音，而是在这里发布垃圾文件。

是的，目标与预测者没有明确的联系，它们只是显示了在某个特定时间点进入市场的财务结果。

你认为如果条目的逻辑与一些预测因子的指标联系在一起，即如果我们在МА交叉点进入，我们定义结果（1或-1），并给出关于MA交叉点进入预测因子的事实的信息，结果是否会更好？

Dr. Trader 2018.05.24 14:37 #9515

Aleksey Vyazmikin:

该树依附于上层TFs的数据，对它们的统计很少，这可能会导致历史上的卡兹恩，当全球运动矢量发生变化（2015年向上，2016年向下）或出现完全持平（2017年）。

至于平盘，我们有从平盘入市以及反转的目标，我们是否可以尝试以某种方式将它们分开？

像Levl这样的预测器可以很好地识别平面，唯一的问题是，树不能把它们连接在一起，至少在一个TF上。

很明显，我们已经有了不同的平面指标，但树无法将它们连接在一起。那么可能就是这样了，这是树的可能性的极限。

昨天我得到的结果几乎一样准确，但进入交易的数量较少。我今天得到的东西并没有好多少。有什么地方出了问题，我会考虑一下哪些设置可能会被纠正。

СанСаныч Фоменко 2018.05.24 14:41 #9516

Aleksey Vyazmikin:

是的，目标与预测因素没有明确的联系，它们只显示了在某个特定时间点进入市场的财务结果。

你认为如果输入的逻辑与一些预测器的指标相联系，即如果我们在MA交叉点输入，我们确定结果（1或-1），如果我们把MA交叉点的事实信息提供给预测器，那么结果会更好吗？

这就是我的观点：输入的垃圾就是输出的垃圾!这些是统计学教科书中的第一句话。

СанСаныч Фоменко 2018.05.24 14:42 #9517

交易员博士。

你做了一个有利可图的机器人 :)

只有在预测到 "1 "时才会做多（蓝色），其中>90%将是盈利的（绿色）。
进入空头 - 只有当预测"-1"（红色），其中再次>90％将是利润（绿色）。
预测 "0 "意味着不开新仓，等待更好的时机，所以在做该类预测之前，那里的实际准确度是多少并不重要。

但最好是在2015年的文件上训练森林，并在2016年的文件上检查它。2015年只有一列缺失，2016年也应该去掉，这样拨浪鼓就不会被混淆了。

我没有建立任何东西--我拿了一个准备好的文件，建立了随机森林，但我太懒了，没有把它分成两个文件。阿列克谢为我做了这件事，并展示了一个致命的结果，这完全涵盖了我的 "成就"。

Aleksey Vyazmikin 2018.05.24 16:30 #9518

交易员博士。

哦，我明白了，已经有各种平面指标，但树不知道如何将它们联系在一起。那么可能就是这样了，这就是树的能力的极限。

我昨天在准确性方面几乎有相同的结果，但进入交易的数量较少。我今天得到的东西并没有好多少。有些地方出了问题，我将考虑哪些设置可能会被纠正。

是的，我认为我们需要一棵可以被帮助的树--来显示预测者之间的可能关系，并为决策的可能比较设定条件。

这里要向大树解释一下，全球的趋势是上升和下降？当然，我可以用同样的工具，画一个通道，做一个百分位数，即明确指出趋势向量的方向，但树可能会简单地忽略这个预测器，而在我看来，它应该按全局趋势向量将整个组至少分成两个。

我不知道，也许我们应该调整（分成几部分）情况样本，对其进行训练，然后在专家顾问中强行识别相同的全球趋势，并根据矢量听从一个或另一个树。

Aleksey Vyazmikin 2018.05.24 16:34 #9519

桑桑尼茨-弗门科。

我的观点是：垃圾进，垃圾出!这些是统计学教科书中的第一句话。

这与垃圾无关--输入实际上是一组事件结果概率，这些概率受到预测因素的影响，而输出是许多不同的独立事件的结果，尽管结果可能是相同的。我将考虑清除输入并删除所有没有信号输入的变体--看到这个结果会很有趣。虽然我在这里仍然无法得到参与者的反馈--如果使用不同的输入策略，我们是否应该在预测器中明确标记输入？

Aleksey Vyazmikin 2018.05.24 16:37 #9520

我们都在寻找进入点，但也许我们应该试着寻找一个平坦的地方？

也许有人有一个指标/脚本来检测历史上的平面？

我认为我们可以采取一个范围为100的回归通道，在每个柱子上移动它，如果斜率大于/小于X，我们可以认为该通道描述的区域是平坦的。你怎么看？

交易中的机器学习：理论、模型、实践和算法交易 - 页 952