文章 "CatBoost 模型中的交叉验证和因果推理基础及导出为 ONNX 格式"

 

新文章 CatBoost 模型中的交叉验证和因果推理基础及导出为 ONNX 格式已发布:

本文提出了使用机器学习创建 EA 交易的方法。

正如我们的结论经常是错误的并且需要验证一样,机器学习模型的预测结果也应该经过仔细检查。如果我们将反复检查的过程转向我们自己,我们就能获得自制力。机器学习模型的自我控制归结为在不同但相似的情况下多次检查其预测的错误。如果模型平均犯的错误很少,则意味着它没有过度训练,但如果它经常犯错误,那么它就有问题了。

如果我们在选定的数据上只是对模型进行一次训练,那么它无法进行自我控制。如果我们在随机子样本上多次训练模型,然后检查每个子样本的预测质量并将所有错误加起来,我们就会得到一个相对可靠的图像,其中显示了模型实际错误的情况和经常正确的情况。这些情况可以分为两组,彼此之间相互独立。这类似于进行前向验证或交叉验证,但包含附加元素。这是实现自我控制并获得更为鲁棒的模型的唯一方法。

因此,有必要对训练数据集进行交叉验证,将模型的预测与训练标签进行比较,并对所有结果取平均值。那些平均预测错误的例子应该作为错误的例子从最终训练集中删除。我们还应该对所有数据训练第二个模型,该模型可以区分可预测性高的情况和可预测性低的情况,从而让我们能够更全面地涵盖所有可能的结果。

作者:Maxim Dmitrievsky