交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2023.12.24 19:25 #33541

Maxim Dmitrievsky #:
我希望至少有人能用谷歌搜索一下这个提示。。

即使你在训练中掌握了概率曲线，你还能谈什么新数据。而布斯廷和福雷斯特在这方面罪孽深重。布斯特是过于自信，福雷斯特是信心不足。当然，前提是你打算使用阈值。

我自己观察到，当你提高门槛时，交易的质量并没有提高，甚至在 traine 上也 是如此。那么他们回报的概率是多少呢？一无所获）

不知怎的，您没有注意我的帖子，只关注概率。概率叫什么并不重要，重要的是，如果它没有改善，模型就被过度训练，进入了垃圾箱。OOV、OOS 和 VNU 的预测误差应该差不多。

下面是另一个直方图

虽然标签和预测因子相同，但算法不同，直方图也不同。如果您在寻找某种理论概率，暗示不同的分类算法会产生相同的直方图......我不这么认为，因为你必须使用特定的算法，它们会进行预测，而且必须对它们进行评估，而不是某种理论上的理想。这里的主要评估是模型的过度拟合，而不是概率与某种理论理想的接近程度。

Maxim Dmitrievsky 2023.12.24 19:26 #33542

СанСаныч Фоменко #:

不知为什么，你没有注意我的帖子，只关注概率。概率叫什么并不重要，重要的是如果它没有改善，模型就被过度训练，进入了垃圾箱。OOV、OOS 和 VNE 的预测误差应该差不多。

任何模型都无法给出正确的概率。这就是问题所在。你可能会让预测的标签完全匹配，但概率不会，也不会反映结果的实际概率。

你明白我的意思吗？

СанСаныч Фоменко 2023.12.24 19:32 #33543

Maxim Dmitrievsky #:
这个模型并没有给出正确的概率，任何一个都没有。这就是问题所在。你可能预测出了完全匹配的标签，但概率并不匹配。。

你明白我的意思吗？

添加了我的帖子。任何模型都能给出正确的概率，即分类误差不会波动。

Maxim Dmitrievsky 2023.12.24 19:34 #33544

СанСаныч Фоменко #:

不知为什么，你没有注意我的帖子，只关注概率。概率叫什么并不重要，重要的是如果它没有改善，模型就被过度训练，进入了垃圾箱。OOV、OOS 和 VNU 的预测误差应该差不多。

下面是另一个直方图

算法不同，直方图也不同，尽管标签和预测因子相同。如果你在寻找某种理论概率，暗示不同的分类算法会产生相同的直方图......我不这么认为，因为你必须使用特定的算法，它们会进行预测，而且必须对它们进行评估，而不是某种理论上的理想。这里的主要评估是模型的过度拟合，而不是概率与某种理论理想的接近程度。

放弃？谷歌分类概率校准，它应该在 R 中。

然后对照基准绘制模型的概率曲线。

СанСаныч Фоменко 2023.12.24 19:45 #33545

Maxim Dmitrievsky #:
放弃？谷歌分类概率校准，它应该在 R. 中。

然后对照基准绘制模型的概率曲线。

我们说的是两码事。

我写的是结果，而你写的是中间数据的理想状态。

对我来说，很明显 RF 和 ada 给出的特定标签的概率值是不同的，但对特定标签的预测几乎是一样的。我对概率值不感兴趣，我感兴趣的是预测误差。

如果从理论上讲，很可能无法获得您意义上的类概率，因为您必须证明您的概率满足极限定理，而这是非常值得怀疑的。

Maxim Dmitrievsky 2023.12.24 19:46 #33546

СанСаныч Фоменко #:

我们说的是不同的事情。

我写的是结果，而你写的是中间数据的理想。

RF 和 ada 给出的类别概率值会有所不同，但对具体标签的预测几乎是一样的。我对概率值不感兴趣，我感兴趣的是预测误差。

如果从理论上讲，很可能无法获得您意义上的类概率，因为您必须证明您的概率满足极限定理，而这一点非常值得怀疑。

尽管如此，最初的问题就在那里，没有人回答它。我说的正是我提出的问题。

所以，我们还是有努力的方向的。

СанСаныч Фоменко 2023.12.24 19:48 #33547

Maxim Dmitrievsky #:
不过，最初的问题就在那里，没有人回答。

所以，我们还是有所期待的。

为什么呢？如果从论文....

Maxim Dmitrievsky 2023.12.24 19:49 #33548

СанСаныч Фоменко #:

为什么？如果从论文....。

因为用概率曲线进行交易意味着要承担损失而不是收益。如果是风险敏感型应用，任何分类器都需要校准。

mytarmailS 2023.12.24 19:51 #33549

什么是校准

https://stats.stackexchange.com/questions/552146/probability-calibration-of-statistical-models

如何校准

https://www.tidymodels.org/learn/models/calibration/

https://mlr.mlr-org.com/articles/tutorial/classifier_calibration.html

Maxim Dmitrievsky 2023.12.24 19:52 #33550

最后

交易中的机器学习：理论、模型、实践和算法交易 - 页 3355