交易中的机器学习:理论、模型、实践和算法交易 - 页 1532

 
阿列克谢-尼古拉耶夫

或者类似于系统表的组合,并进行滚动重新计算。

我到底应该重新计算什么?

 
阿列克谢-尼古拉耶夫

或者类似于系统列表组合的滑动重新计算的东西。

那么它就是一个多类。做一个第2个模型,将选择哪张是目前最好的交易。优势不明显,更难做。

 
马克西姆-德米特里耶夫斯基

嗯,你必须从理论开始。例如,为销售和购买分别选择模型的意义何在?

所有不买的就是卖,反之亦然。

我的意识形态是对基本交易策略的改进,该策略是趋势跟踪;因此,它没有规定在空处的翻转--从平处入市,而 "不要进入 "基本上消除了假翻转的突破。

此外,我还试验了在长ZZ峰附近关闭盈利头寸的模型,结果并不令人满意,也就是说,要么是那里的预测能力较低,要么是我的预测器在那里效果不好,也可能是两者都有,所以我没有使用反转策略。相反,我认为在这里训练两个不同的模型会更好。

马克西姆-德米特里耶夫斯基

当你可以通过一个更高的阈值来过滤条目时。不交易 "类可以被模型赋予不适当的权重,导致模型误差减少,预测(概括)能力普遍下降。

几乎这种方法,用二进制分类来交易/不交易,其中由模型阈值指定,我在CatBoost的实验中使用,但麻烦的是,模型的建立就像一个吸尘器,吸走所有好的和坏的东西,输出是一个快速的模型,但输入的数量很少。

马克西姆-德米特里耶夫斯基

第二个模型的意义在于,第一个模型会有第一类和第二类的错误--假阳性和假阴性。我们有兴趣清除它们。 要做到这一点,你把相同的特征输入到第二个模型的输入和第一个模型的交易输出,其中0 - 交易是盈利的,1 - 交易是亏损的。训练第二个分类器,只在它显示为0时进行交易,即过滤第一个模型的信号。 亏损交易几乎会在托盘上消失,你必须在测试上进行测试--这就是一个。

你不仅可以在托盘上训练第二个模型,还可以捕捉OOS,然后它将在新数据上纠正交易--这就是两个。然后是测试。

这正是我所做的,只是我没有使用非链接的预测器,而是已经将工作表作为预测器,其中1是预测器中工作表的信号,而目标中的正确分类答案。当然,我的方法不允许找到新的预测者关系,但它确实允许寻找现有关系之间的关系。

我也会试试你的方法,谢谢。然而,在这个概念中,有可能只作为CatBoost模型来实现,以节省时间,但我担心这可能又会把一切都削减得太多。

 
马克西姆-德米特里耶夫斯基

那么它就是一个多类。做一个第2个模型,将选择哪张是目前最好的交易。其优势并不明显,而且更难做。

不,有太多的床单了,这样的分类是行不通的......

 
阿列克谢-维亚兹米 金。

我的意识形态是对基本交易策略的改进,而该策略是趋势跟踪, 所以它没有规定在空旷的地方进行翻转--市场 从平坦处进入,"不要进入 "基本上消除了虚假的平坦破位。

此外,我还试验了在长ZZ峰附近关闭盈利头寸的模型,结果并不令人满意,也就是说,要么是那里的预测能力较低,要么是我的预测器在那里效果不好,也可能是两者都有,所以我没有使用反转策略。相反,我认为在这里训练两个不同的模型会更好。

几乎这种方法,用二进制分类来交易/不交易,其中由模型的阈值指定,我在CatBoost的实验中使用,但麻烦的是,模型的建立就像一个吸尘器,吸走所有好的和坏的东西,输出的是一个智能模型,条目数量少。

因此,这正是我所做的,只是我没有使用未捆绑的预测器,而是用床单作为预测器, 其中1是预测器中床单的信号,而正确的分类答案则在目标中。当然,我的方法不允许找到新的预测者关系,但它确实允许寻找现有关系之间的关系。

我也会试试你的方法,谢谢。然而,有可能在给定的概念中只作为CatBoost模型来实现,可能是为了节省时间,但我担心它会再次强烈地削减一切。

反转不应该是这样的,只会被第二模型的错误信号过滤掉。好吧,这取决于执行情况和你想要什么。

那就奇怪了,为什么会有很多亏损的交易,还是OOS的图片?是的,为了使用第二种模式,应该有很多交易要过滤掉,你甚至可以人为地增加交易来达到这个目的(超采样)。

 
马克西姆-德米特里耶夫斯基

不应该有这样的反转,它只是用第二种模式过滤掉错误的信号。好吧,这取决于执行情况和你想要什么。

那就奇怪了,为什么会有很多亏损的交易,还是OOS的图片?是的,我们应该有足够的交易来过滤第2个模型,我们甚至可以为此人为地增加交易(超额采样)。

上述截图是对没有以任何方式参与模型训练的数据进行的测试。

下面是训练的结果,截图--第一张是我对用于训练的数据的汇编表(只取了1/5部分)。

请注意,有52.86%的多头交易是盈利的。

我们在其他床单答案的基础上增加了一棵树。

而结果也有所改善,盈利的多头交易已经变成79.56%。

总而言之,该方法总体上是有效的,但在现实生活中应用时,其产出却不是那么大--为什么呢,可能是用于学习的一些片材没有稳定的连接,或者这些连接很少。每张样本的回复率在1%-3%之间。

 
我认为另一个选择是尝试回归而不是分类,准确地分离出高产的叶片组合,也许在货币方面会有更好的效果。
 
阿列克谢-维亚兹米 金。

上面的截图是对没有以任何方式参与训练模型的数据进行的测试。

下面是训练的结果,截图是我在训练用的数据上第一次布置的表(只取了1/5部分)。

请注意,有52.86%的多头交易是盈利的。

我们在其他床单答案的基础上增加了一棵树。

而结果也有所改善,盈利的多头交易已经变成79.56%。

总而言之,该方法总体上是有效的,但在现实生活中应用时,输出并不是那么大--为什么呢,可能是用于学习的一些片子没有携带稳定的连接,或者这些连接很少。每张样本的回复率在1%-3%左右。

好吧,如果你只是试图改善你所拥有的东西,那就是福尔德的选择。把它分成几块,第一块训练一些内容,第二块训练其他内容。我曾做过多达500次的犯规。当然,你可以做得更少。某种程度上的改进。

 
马克西姆-德米特里耶夫斯基

好吧,如果你只是试图改善你所拥有的,这就是犯规的选择。把它分成几块,第一块训练一些内容,第二块训练其他内容。我已经做了多达500次的犯规。当然,你可以做得更少。它给予了一些改善。

把样本分成几块,训练多个模型,还是什么?

虽然我的样本只有大约14000行...

 
阿列克谢-维亚兹米 金。

把样本分成几部分,训练多个模型,还是什么?

虽然我只有大约14,000行的样本...

我在上面写道。基本模型在一半的块状物上,第二个修正模型在另一半上

5-10次犯规就够了,也许更多