交易中的机器学习:理论、模型、实践和算法交易 - 页 952

 
Dr. Trader:

对于最后一个文件,我与树的关系是这样的。

2016年,培训


y_pred

y_true-101
-113392388444472
010803767146029
17413376787415


2015年,测试。


y_pred

y_true-101
-19552392625429
011495721317509
18581403776835

当预测-1时:-1实际上会比1出现的频率略高。但0将是最频繁的,而且可能都会以损失告终。对 "1 "类也是如此。


树的麻烦出来了。遗传学选择了树的参数cp=0,这给了树一堆分支的权限。不幸的是,我们应该把这个参数限制在某个小的非零值。

是否可以像以前一样,用概率来表示这个数字?也许在测试数据上有更多重要的分支?

Dr. Trader:

我认为数据中没有足够的预测因素来分类为 "0"。例如需要一些平整度的指标。

一般来说,它与树的关系很不好。SanSanych的木材要好得多。


错误的模型设置,以及由此产生的过度训练。

他只拿了2016年的一个文件(顺便说一下2015年少了1个预测器--我纠正了,我可以重新下载),而今年2016年的趋势是上升的!

这棵树紧紧抓住上层TF的数据,而关于它们的统计数据基本上很少,正因为如此,当全球的运动矢量发生变化(2015年向上,2016年向下)或出现完全持平(2017年)时,历史上就会出现一个卡子。

至于平盘,我们有从平盘入市 以及反转的目标,我们是否可以尝试以某种方式将它们分开?

像Levl这样的预测器可以很好地识别平面,唯一的麻烦是,树不能把它们连接在一起,至少在一个TF上。

 

你做了一个有利可图的机器人 :)

进入多头 - 只有当预测到 "1"(蓝色)时,其中>90%将是利润(绿色)。
进入空头 - 只有当预测"-1"(红色),其中再次>90%将是利润(绿色)。
预测为 "0 "意味着不开新仓,等待更好的时机,所以在进行这一类的预测之前,实际的准确率是多少根本不重要。

但最好是在2015年的文件上训练森林,并在2016年的文件上检查它。2015年只少了一列,2016年也应该去掉,这样就不会把那个响声混淆了。

 
阿列克谢-维亚兹米 金。

这个数字能否像以前一样用概率来表示?

不,这是一个不同的树状学习模式,只适合于2个班。或者为了回归。

 
SanSanych Fomenko:

有什么酷的--再培训,没有别的,他没有一个与他的目标变量有关的预测器--全是噪音。而它却坐在拨浪鼓里,不检查噪音,而是在这里发布垃圾文件。

是的,目标与预测者没有明确的联系,它们只是显示了在某个特定时间点进入市场 的财务结果。

你认为如果条目的逻辑与一些预测因子的指标联系在一起,即如果我们在МА交叉点进入,我们定义结果(1或-1),并给出关于MA交叉点进入预测因子的事实的信息,结果是否会更好?

 
Aleksey Vyazmikin:

该树依附于上层TFs的数据,对它们的统计很少,这可能会导致历史上的卡兹恩,当全球运动矢量发生变化(2015年向上,2016年向下)或出现完全持平(2017年)。

至于平盘,我们有从平盘入市 以及反转的目标,我们是否可以尝试以某种方式将它们分开?

像Levl这样的预测器可以很好地识别平面,唯一的问题是,树不能把它们连接在一起,至少在一个TF上。

很明显,我们已经有了不同的平面指标,但树无法将它们连接在一起。那么可能就是这样了,这是树的可能性的极限。

昨天我得到的结果几乎一样准确,但进入交易的数量较少。我今天得到的东西并没有好多少。有什么地方出了问题,我会考虑一下哪些设置可能会被纠正。

 
Aleksey Vyazmikin:

是的,目标与预测因素没有明确的联系,它们只显示了在某个特定时间点进入市场 的财务结果。

你认为如果输入的逻辑与一些预测器的指标相联系,即如果我们在MA交叉点输入,我们确定结果(1或-1),如果我们把MA交叉点的事实信息提供给预测器,那么结果会更好吗?

这就是我的观点:输入的垃圾就是输出的垃圾!这些是统计学教科书中的第一句话。

 
交易员博士

你做了一个有利可图的机器人 :)

只有在预测到 "1 "时才会做多(蓝色),其中>90%将是盈利的(绿色)。
进入空头 - 只有当预测"-1"(红色),其中再次>90%将是利润(绿色)。
预测 "0 "意味着不开新仓,等待更好的时机,所以在做该类预测之前,那里的实际准确度是多少并不重要。

但最好是在2015年的文件上训练森林,并在2016年的文件上检查它。2015年只有一列缺失,2016年也应该去掉,这样拨浪鼓就不会被混淆了。

我没有建立任何东西--我拿了一个准备好的文件,建立了随机森林,但我太懒了,没有把它分成两个文件。阿列克谢为我做了这件事,并展示了一个致命的结果,这完全涵盖了我的 "成就"。

 
交易员博士

哦,我明白了,已经有各种平面指标,但树不知道如何将它们联系在一起。那么可能就是这样了,这就是树的能力的极限。

我昨天在准确性方面几乎有相同的结果,但进入交易的数量较少。我今天得到的东西并没有好多少。有些地方出了问题,我将考虑哪些设置可能会被纠正。

是的,我认为我们需要一棵可以被帮助的树--来显示预测者之间的可能关系,并为决策的可能比较设定条件。

这里要向大树解释一下,全球的趋势是上升和下降?当然,我可以用同样的工具,画一个通道,做一个百分位数,即明确指出趋势向量的方向,但树可能会简单地忽略这个预测器,而在我看来,它应该按全局趋势向量将整个组至少分成两个。

我不知道,也许我们应该调整(分成几部分)情况样本,对其进行训练,然后在专家顾问中强行识别相同的全球趋势,并根据矢量听从一个或另一个树。

 
桑桑尼茨-弗门科

我的观点是:垃圾进,垃圾出!这些是统计学教科书中的第一句话。

这与垃圾无关--输入实际上是一组事件结果概率,这些概率受到预测因素的影响,而输出是许多不同的独立事件的结果,尽管结果可能是相同的。我将考虑清除输入并删除所有没有信号输入的变体--看到这个结果会很有趣。虽然我在这里仍然无法得到参与者的反馈--如果使用不同的输入策略,我们是否应该在预测器中明确标记输入?

 

我们都在寻找进入点,但也许我们应该试着寻找一个平坦的地方?

也许有人有一个指标/脚本来检测历史上的平面?

我认为我们可以采取一个范围为100的回归通道,在每个柱子上移动它,如果斜率大于/小于X,我们可以认为该通道描述的区域是平坦的。你怎么看?