交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2016.08.14 11:22 #1031

Dr.Trader:

Vtreat更好。它从统计学角度评估一切，预测器在预测目标变量方面总体上有多好/多坏，而不对特定的预测模型进行调整。建议使用最大分值为1/（预测器数量）的预测器。例如，如果有200个预测器，你可以只从其中抽取那些评价小于1/200的预测器。可以对预测因子进行估计，如果所有的估计值都高于阈值--与其不成功地尝试教导模型和预测新数据，不如开始寻找其他预测因子。

有几个缺点--该软件包对预测因子逐一进行处理，没有考虑到它们的相互作用。我也不喜欢即使有完全相同或高度相关的预测因子--vtreat也不会删除重复的，有时这很烦人。

实际上相关的预测因素是邪恶的。

也许软件包需要对一般的预测器进行预处理，例如缩放、居中、去除相关的.....，就像在caret中一样。

也许是这样？

СанСаныч Фоменко 2016.08.14 11:25 #1032

桑桑尼茨-弗门科。

实际上相关的预测因素是邪恶的。

也许软件包需要对一般的预测器进行预处理，例如缩放、居中、去除相关的.....，就像在caret中一样。

也许是这样？

顺便说一句，没有人取消了数据挖掘。我们的同事在网站上有一篇关于这个问题的精彩文章。不幸的是，作者没有参与这个话题。

Alexey Burnakov 2016.08.14 11:26 #1033

Dr.Trader:

你为评估启发式方法开发的工具包不错，很扎实。你已经证明了你所开发的模型（委员会）训练方法不适合于外汇，但接下来呢？

你还没有在方法上打上一个点。这很耐人寻味，如果只是因为在训练和测试中，有1/3的最佳模型又经过了5年的验证，有加成。如果每个人都在泄密就好了。

此外，还有一个关于我的图表的想法。如果一个模型非常好，它的95%的值在验证时都在0以上，那么你就可以忘记验证/测试的关系，而采取任何训练过的模型。

这就是寻找强大的模型（具有良好的泛化效果）的意义所在。

[删除] 2016.08.14 11:29 #1034

我总是读到这样的话题（不仅仅是在这个论坛），他们试图建立复杂的交易理论。

遗传算法、神经网络、只有作者明白的复杂公式等等。

而我总是看到，这样的系统在市场上不起作用。监测要么归零，要么归负。

但在下一个主题中，有人通过使用专家顾问在两个滑点上赚钱。而且他们的收入很高。

问题是，这一切有意义吗？

因为根据我的经验，系统越简单、越清晰，就越有利可图。

Alexey Burnakov 2016.08.14 11:30 #1035

桑桑尼茨-弗门科。

....但只有在剔除了噪音之后。而没有噪音的事实是由模型在不同样本上的表现的近似不变性决定的。这不是预测误差的绝对值，而是性能指标近似相等的事实，（相等）可以被解释为没有模型过度训练的证明。

我也想回答你。

在这里，你要看的是指标的平等性。你说这是缺乏过度训练。但是，你有没有尝试过通过用一个更多的样本--延迟的样本--来测试你选择的模型来估计真正缺乏过度训练的情况？在一部分数据上的平等不会退化为对该数据的模型拟合，而该模型会在未来流失吗？我在研究中遵循这样一种模式。

Alexey Burnakov 2016.08.14 12:44 #1036

阅读关于弹性网。它是一种方法和包装。线性模型的混合正则化。预测器的相关性只是在那里处理。

Andrey Dik 2016.08.14 12:56 #1037

有没有人分别训练他们的模特儿，让他们进行补考和自考？

СанСаныч Фоменко 2016.08.14 12:59 #1038

阿列克谢-伯纳科夫。

我也想回答你。

在这里，你要看的是指标的平等性。你说这是缺乏过度训练。你是否尝试过用另一个大样本--延迟样本--来测试你所选择的模型，以评估真正缺乏过度训练的情况？在一部分数据上的平等不会退化为对该数据的模型拟合，而该模型会在未来流失吗？我在研究中遵循这一模式。

我有自己的算法来筛除噪音。

如果应用，在选定的预测器上训练模型，那么在任何样本上，这个模型的性能都是差不多的。我对置信区间的想法来自这里，要摆脱 "大约相等 "的字眼。

我要说的还不止这些。

做法看起来有所不同。

一个人必须在窗口工作。因此，为了在窗口中工作，我开始从我预选的预测器集中通过rfe从caret选择预测器。对于一个特定的窗口，我得到了一些子集，它可以减少5-7%的误差。我每周在H1上做一次。这个子集在下周末改变。我从去年开始就这样生活。

但事先摆脱噪音是必须的。如果我不这样做，我就会看到奇迹。

Dr. Trader 2016.08.14 15:54 #1039

我认为建立两个结果相反的模型是没有意义的。
谁会分别训练他们的模型来进行买卖？

我只预测2类--"买入 "和 "卖出"，这意味着我将永远有一些交易未完成。我只用一个模型工作，我不认为做两个结果正好相反的模型有什么意义。

但我想逐渐改变为3类--"买入"/"关闭所有和不交易"/"出售"。这将使人们有机会用更复杂的策略进行交易。我试过几次，但我在训练模型到三个班级时遇到了问题，特别是如果模型是退步的，然后把结果取整到班级。
我认为值得尝试创建两个模型，第一个模型（只买）的原始1/0/-1类转化为1/0/0，第二个模型（只卖）为0/0/1。这将导致每个模型中的类别不平衡（一个类别的例子数量远远高于另一个），但我已经找到了评价在这种条件下工作的模型的良好指标--F-score和kappa。我还没有在这个方向上做任何事情，但这样的计划看起来很有可能。

Dr. Trader 2016.08.14 16:16 #1040

SanSanych Fomenko:

实际上相关的预测因素是邪恶的。

也许软件包需要对一般的预测器进行预处理，例如缩放、居中、去除相关的.....，就像在caret中一样。

也许是这样？

不，vtreat只是根本不分析预测因子的相互作用，很遗憾。它严格地一个一个地研究它们。这不是一个图形包 :(
我不认为缩放或居中会有任何区别。而如果你启用了Y-aware选项--该软件包将对数据本身进行缩放和居中。

弗拉基米尔的文章很有意思，谢谢你的链接。预测因素之间的互动分析是正确的主题。

交易中的机器学习：理论、模型、实践和算法交易 - 页 104