交易中的机器学习：理论、模型、实践和算法交易

Forester 2018.05.09 06:46 #8891

阿列克谢-维亚兹米 金。

这里是准备好的第一个测试对象--2015-2016年的培训，从2017年开始在选定的树形规则上进行纯交易--没有损失--已经不错了？

反对没有NS的交易--培训（唉--调整和优化）2016-2017年

仍然不明白最好的方法是什么--最后是选择规则并把它们变成代码--非常费力的手工工作......。需要某种自动化的过程。

你在训练中的10%的错误，在未来立即变成了50%。

这要么是过度教育，要么是预测者对未来的窥视。

Aleksey Vyazmikin 2018.05.09 09:31 #8892

Maxim Dmitrievsky:

你已经在没有树的情况下工作了）尝试添加我在森林上的文章中的优化器，也许结果会改善。

尝试使用相互信息来确定重要性。

我看了两篇文章，我不明白你说的脚手架的优化器是什么意思？

我想知道更多的重要性，什么样的相互信息--网和没有网的EA之间，或者买入和卖出信号之间？我需要代码，但我不确定。

Aleksey Vyazmikin 2018.05.09 10:31 #8893

elibrarius。

你在训练上的10%的错误立即变成了在未来的50%。

这要么是过度学习，要么是对未来的预测者进行偷窥。

并非如此，我只手工挑选了25条买入规则和16条卖出规则，这可能还不到所有规则的0.1%。我只是在上面写道，麻烦的是，在我看来，有太多的规则，这并不高效。

窥视是不存在的（在逻辑上是不存在的，如果代码中出现错误，但使用了两个代码--一个在脚本中获取信息，另一个作为指标按规则工作，即错误概率较小）。

重新学习--是的，也许是这样，一般来说，如果从全球来看，我的小说来自 "跟随潮流 "领域，为寻找潮流而创作，而2017年的思几乎是单一的单位，没有全球的趋势--有点不同的市场。

另一方面，我从不同的TF收集筹码，我得到某种从多到少的分类，它看起来像一个倒金字塔，或缩放，即我有条件地把一个月分成两部分，有子集，在每个子集里看相同的星期、日、小时...并因此收集了与其他小说的统计数据，结果发现在样本上是可以重复的。

购买规则

蓝色 - 这是价格在决定时处于东契奇通道 - 从0 - 10 - 10%的步骤 - 当价格上升时建议买入，这在一般情况下是合理的。

绿色--只是计划中的ATR区域日、周、月的大规模--即大的趋势，有一个从-8水平到+8水平的分解，例如可以看到在月度TF上的超卖--水平--6--只有1条购买规则，而增长建议从-3、-1、-2、-4水平--即。也就是说，可能很多人强调美元/卢布期货在月度基础上大多上涨多于下跌，并且在条形图内有翻转（开盘价在强势移动到一边后的反转）。

灰色(?) - RSI在一小时内 - 建议在70水平之外买入（只建议在70水平之外买入1次）。

橙色（根据办公室）--BB_Up--它是价格在新条形图开盘时高于布林上界--25人中有6人喜欢目前超买，作为进场信号，但其他19人喜欢没有超卖，根据BB_Down判断--平静--架子或平坦。

黄色--TimeH--倾向于在10点进入（13个中的4个）--即开盘时立即进入，收盘时--在23点进入（13个中的2个），这并不奇怪，因为在10点提供了尖锐有力的运动，其余的12、15、13、17--正常的每日时段，波动性良好，但20小时反而是一个例外。也许，如果我们增加一周的天数，会有一些规律性的东西，与每周的新闻有关--石油储备和他们的预测对卢布来说是实际的--我会尝试。

Mihail Marchukajtes 2018.05.09 19:37 #8894

想保持沉默的午餐，直到我得到一些好的统计数据，但我不能看着你坚持不懈地弄错....。

任何转换都会导致被搜索的系列信息的减少。即使是参数为2的马什卡也开始滞后，并在此过程中损失了少量的科蒂尔信息。NS是一个与实数打交道的微妙工具，任何一个数字，甚至是小数点后10位的数字，都可能对最终解决方案产生决定性影响。你把数字的真实部分切掉，把你的输入从-1到30分类（作为一个例子），你得到31个类别。在现实世界中，-1和30之间的选择数量正好是你在小数点之后的那些数量级。结果是，如果你采取int，你有31种分法的选择，如果你采取doble，分法的选择就多得多。

如果你使用从-1到30的分类输入itnt，数据本身的质量应该很高，这样网络才能从中学习并得到一个好的结果，但由于你的所有数据都是由价格建立的，其质量非常值得怀疑，而且你还削减了itnt中的真实数字，从而扼杀了NS对任何东西的捕捉能力。

如果使用的数据质量已经足够高，可以在输入上使用分类。这基本上使NS的使用在原则上失效了。有了好的分类预测因子，你可以建立一个没有NS.... 的TS。

嗯，它是这样的....只是大声思考...看着你的胡言乱语，我的心在流血......甚至打破了沉默的午餐.....

Aleksey Vyazmikin 2018.05.09 19:53 #8895

如果我们将一个湖泊与另一个湖泊进行比较，指标真的那么重要吗？不，当然，如果我们不是在与湖泊进行比较，答案可能是不同的--池塘或水坑，但我们应该害怕在去湖泊的路上被水坑弄湿脚吗？就我个人而言，我不认为精确的分类有什么意义，也许它对那个可以上下分析信息的NS很重要，但我没有，对于一棵树来说，它是绰绰有余的，正如我现在看到的。

Mihail Marchukajtes 2018.05.09 20:00 #8896

阿列克谢-维亚兹米 金。

如果我们将一个湖泊与另一个湖泊进行比较，指标真的那么重要吗？不，当然，如果我们不是在与湖泊进行比较，答案可能是不同的--池塘或水坑，但我们应该害怕在去湖泊的路上被水坑弄湿脚吗？就我个人而言，我不认为精确的分类有什么意义，也许它对那个能够上下分析信息的NS很重要，但我没有，对于一棵树来说，它是绰绰有余的，正如我现在所看到的。

要使用分类输入。这种投入的质量必须非常好。如果输入的质量很差，最好不要把它们转换为类别，而是把指标本身的真实值输入。因此，NS将有更多的选择来充分地划分这个区域，IMHO!

Mihail Marchukajtes 2018.05.09 20:05 #8897

好了，我想特别感谢FOCUSNIC!!!!!

没想到会走到这一步，但你的建议真的变成了准备预测器的关键。因此，为你点赞，婊子。你这狗娘养的!!!!(没有冒犯的意思)

我以后一定会发布一个视频，里面一定会提到你......所以请等待迈克尔的视频:-)在那里我将讲述我对Mo领域的总体理解。我认为这个视频不仅对初学者，而且对有经验的....，都会很有趣。所以......等着看吧!!!!

Aleksey Vyazmikin 2018.05.09 20:26 #8898

Mihail Marchukajtes:

要使用分类输入。这些投入的质量必须非常好。如果投入的质量不高，最好不要将其转化为类别，而是反馈指标本身的真实价值。这样一来，NS将有更多的选择来充分划分这个区域，IMHO！！。

你建议用什么来衡量质量？

Forester 2018.05.09 20:33 #8899

Mihail Marchukajtes:

要使用分类输入。这些投入的质量必须非常好。如果投入的质量不高，最好不要将其转化为类别，而是反馈指标本身的真实价值。这样一来，NS将有更多的选择来充分划分这个区域，IMHO！！。

31类......不，它更像是一个有31个步骤的离散化。弗拉基米尔的一篇文章使用了它，结果也不差。

Mihail Marchukajtes 2018.05.09 20:35 #8900

阿列克谢-维亚兹米 金。

建议的质量衡量标准是什么？

首先，记录作出决定的时刻。让这成为一个事件。然后准确地在事件发生的这一时刻保存指标的值。

说实话，我不太理解你的桌子。这里面有什么？

交易中的机器学习：理论、模型、实践和算法交易 - 页 890