交易中的机器学习:理论、模型、实践和算法交易 - 页 890

 
阿列克谢-维亚兹米 金。

这里是准备好的第一个测试对象--2015-2016年的培训,从2017年开始在选定的树形规则上进行纯交易--没有损失--已经不错了?

反对没有NS的交易--培训(唉--调整和优化)2016-2017年


仍然不明白最好的方法是什么--最后是选择规则并把它们变成代码--非常费力的手工工作......。需要某种自动化的过程。


你在训练中的10%的错误,在未来立即变成了50%。

这要么是过度教育,要么是预测者对未来的窥视。
 
Maxim Dmitrievsky:

你已经在没有树的情况下工作了)尝试添加我在森林上的文章中的优化器,也许结果会改善。

尝试使用相互信息来确定重要性。

我看了两篇文章,我不明白你说的脚手架的优化器是什么意思?

我想知道更多的重要性,什么样的相互信息--网和没有网的EA之间,或者买入和卖出信号之间?我需要代码,但我不确定。

 
elibrarius

你在训练上的10%的错误立即变成了在未来的50%。

这要么是过度学习,要么是对未来的预测者进行偷窥。

并非如此,我只手工挑选了25条买入规则和16条卖出规则,这可能还不到所有规则的0.1%。我只是在上面写道,麻烦的是,在我看来,有太多的规则,这并不高效。

窥视是不存在的(在逻辑上是不存在的,如果代码中出现错误,但使用了两个代码--一个在脚本中获取信息,另一个作为指标按规则工作,即错误概率较小)。

重新学习--是的,也许是这样,一般来说,如果从全球来看,我的小说来自 "跟随潮流 "领域,为寻找潮流而创作,而2017年的思几乎是单一的单位,没有全球的趋势--有点不同的市场。

另一方面,我从不同的TF收集筹码,我得到某种从多到少的分类,它看起来像一个倒金字塔,或缩放,即我有条件地把一个月分成两部分,有子集,在每个子集里看相同的星期、日、小时...并因此收集了与其他小说的统计数据,结果发现在样本上是可以重复的。

购买规则


蓝色 - 这是价格在决定时处于东契奇通道 - 从0 - 10 - 10%的步骤 - 当价格上升时建议买入,这在一般情况下是合理的。

绿色--只是计划中的ATR区域日、周、月的大规模--即大的趋势,有一个从-8水平到+8水平的分解,例如可以看到在月度TF上的超卖--水平--6--只有1条购买规则,而增长建议从-3、-1、-2、-4水平--即。也就是说,可能很多人强调美元/卢布期货在月度基础上大多上涨多于下跌,并且在条形图内有翻转(开盘价在强势移动到一边后的反转)。

灰色(?) - RSI在一小时内 - 建议在70水平之外买入(只建议在70水平之外买入1次)。

橙色(根据办公室)--BB_Up--它是价格在新条形图开盘时高于布林上界--25人中有6人喜欢目前超买,作为进场信号,但其他19人喜欢没有超卖,根据BB_Down判断--平静--架子或平坦。

黄色--TimeH--倾向于在10点进入(13个中的4个)--即开盘时立即进入,收盘时--在23点进入(13个中的2个),这并不奇怪,因为在10点提供了尖锐有力的运动,其余的12、15、13、17--正常的每日时段,波动性良好,但20小时反而是一个例外。也许,如果我们增加一周的天数,会有一些规律性的东西,与每周的新闻有关--石油储备和他们的预测对卢布来说是实际的--我会尝试。

 

想保持沉默的午餐,直到我得到一些好的统计数据,但我不能看着你坚持不懈地弄错....。

任何转换都会导致被搜索的系列信息的减少。即使是参数为2的马什卡也开始滞后,并在此过程中损失了少量的科蒂尔信息。NS是一个与实数打交道的微妙工具,任何一个数字,甚至是小数点后10位的数字,都可能对最终解决方案产生决定性影响。你把数字的真实部分切掉,把你的输入从-1到30分类(作为一个例子),你得到31个类别。在现实世界中,-1和30之间的选择数量正好是你在小数点之后的那些数量级。结果是,如果你采取int,你有31种分法的选择,如果你采取doble,分法的选择就多得多。

如果你使用从-1到30的分类输入itnt,数据本身的质量应该很高,这样网络才能从中学习并得到一个好的结果,但由于你的所有数据都是由价格建立的,其质量非常值得怀疑,而且你还削减了itnt中的真实数字,从而扼杀了NS对任何东西的捕捉能力。

如果使用的数据质量已经足够高,可以在输入上使用分类。这基本上使NS的使用在原则上失效了。有了好的分类预测因子,你可以建立一个没有NS.... 的TS。

嗯,它是这样的....只是大声思考...看着你的胡言乱语,我的心在流血......甚至打破了沉默的午餐.....

 

如果我们将一个湖泊与另一个湖泊进行比较,指标真的那么重要吗?不,当然,如果我们不是在与湖泊进行比较,答案可能是不同的--池塘或水坑,但我们应该害怕在去湖泊的路上被水坑弄湿脚吗?就我个人而言,我不认为精确的分类有什么意义,也许它对那个可以上下分析信息的NS很重要,但我没有,对于一棵树来说,它是绰绰有余的,正如我现在看到的。

 
阿列克谢-维亚兹米 金。

如果我们将一个湖泊与另一个湖泊进行比较,指标真的那么重要吗?不,当然,如果我们不是在与湖泊进行比较,答案可能是不同的--池塘或水坑,但我们应该害怕在去湖泊的路上被水坑弄湿脚吗?就我个人而言,我不认为精确的分类有什么意义,也许它对那个能够上下分析信息的NS很重要,但我没有,对于一棵树来说,它是绰绰有余的,正如我现在所看到的。

要使用分类输入。这种投入的质量必须非常好。如果输入的质量很差,最好不要把它们转换为类别,而是把指标本身的真实值输入。因此,NS将有更多的选择来充分地划分这个区域,IMHO!

 

好了,我想特别感谢FOCUSNIC!!!!!

没想到会走到这一步,但你的建议真的变成了准备预测器的关键。因此,为你点赞,婊子。你这狗娘养的!!!!(没有冒犯的意思)

我以后一定会发布一个视频,里面一定会提到你......所以请等待迈克尔的视频:-)在那里我将讲述我对Mo领域的总体理解。我认为这个视频不仅对初学者,而且对有经验的....,都会很有趣。所以......等着看吧!!!!

 
Mihail Marchukajtes:

要使用分类输入。这些投入的质量必须非常好。如果投入的质量不高,最好不要将其转化为类别,而是反馈指标本身的真实价值。这样一来,NS将有更多的选择来充分划分这个区域,IMHO!!。

你建议用什么来衡量质量?

 
Mihail Marchukajtes:

要使用分类输入。这些投入的质量必须非常好。如果投入的质量不高,最好不要将其转化为类别,而是反馈指标本身的真实价值。这样一来,NS将有更多的选择来充分划分这个区域,IMHO!!。

31类......不,它更像是一个有31个步骤的离散化。弗拉基米尔的一篇文章使用了它,结果也不差。
 
阿列克谢-维亚兹米 金。

建议的质量衡量标准是什么?

首先,记录作出决定的时刻。让这成为一个事件。然后准确地在事件发生的这一时刻保存指标的值。

说实话,我不太理解你的桌子。这里面有什么?