交易中的机器学习:理论、模型、实践和算法交易 - 页 3355

 
Maxim Dmitrievsky #:
我希望至少有人能用谷歌搜索一下这个提示。 。

即使你在训练中掌握了概率曲线,你还能谈什么新数据。而布斯廷和福雷斯特在这方面罪孽深重。布斯特是过于自信,福雷斯特是信心不足。当然,前提是你打算使用阈值。

我自己观察到,当你提高门槛时,交易的质量并没有提高,甚至在 traine 上也 是如此。那么他们回报的概率是多少呢?一无所获)

不知怎的,您没有注意我的帖子,只关注概率。概率叫什么并不重要,重要的是,如果它没有改善,模型就被过度训练,进入了垃圾箱。OOV、OOS 和 VNU 的预测误差应该差不多。

下面是另一个直方图

虽然标签和预测因子相同,但算法不同,直方图也不同。如果您在寻找某种理论概率,暗示不同的分类算法会产生相同的直方图......我不这么认为,因为你必须使用特定的算法,它们会进行预测,而且必须对它们进行评估,而不是某种理论上的理想。这里的主要评估是模型的过度拟合,而不是概率与某种理论理想的接近程度。

 
СанСаныч Фоменко #:

不知为什么,你没有注意我的帖子,只关注概率。概率叫什么并不重要,重要的是如果它没有改善,模型就被过度训练,进入了垃圾箱。OOV、OOS 和 VNE 的预测误差应该差不多。

任何模型都无法给出正确的概率。这就是问题所在。你可能会让预测的标签完全匹配,但概率不会,也不会反映结果的实际概率。
你明白我的意思吗?
 
Maxim Dmitrievsky #:
这个模型并没有给出正确的概率,任何一个都没有。这就是问题所在。你可能预测出了完全匹配的标签,但概率并不匹配。 。
你明白我的意思吗?

添加了我的帖子。任何模型都能给出正确的概率,即分类误差不会波动。

 
СанСаныч Фоменко #:

不知为什么,你没有注意我的帖子,只关注概率。概率叫什么并不重要,重要的是如果它没有改善,模型就被过度训练,进入了垃圾箱。OOV、OOS 和 VNU 的预测误差应该差不多。

下面是另一个直方图

算法不同,直方图也不同,尽管标签和预测因子相同。如果你在寻找某种理论概率,暗示不同的分类算法会产生相同的直方图......我不这么认为,因为你必须使用特定的算法,它们会进行预测,而且必须对它们进行评估,而不是某种理论上的理想。这里的主要评估是模型的过度拟合,而不是概率与某种理论理想的接近程度。

放弃?谷歌分类概率校准,它应该在 R 中。

然后对照基准绘制模型的概率曲线。
 
Maxim Dmitrievsky #:
放弃?谷歌分类概率校准,它应该在 R. 中。

然后对照基准绘制模型的概率曲线。

我们说的是两码事。

我写的是结果,而你写的是中间数据的理想状态。

对我来说,很明显 RF 和 ada 给出的特定标签的概率值是不同的,但对特定标签的预测几乎是一样的。我对概率值不感兴趣,我感兴趣的是预测误差。

如果从理论上讲,很可能无法获得您意义上的类概率,因为您必须证明您的概率满足极限定理,而这是非常值得怀疑的。

 
СанСаныч Фоменко #:

我们说的是不同的事情。

我写的是结果,而你写的是中间数据的理想。

RF 和 ada 给出的类别概率值会有所不同,但对具体标签的预测几乎是一样的。我对概率值不感兴趣,我感兴趣的是预测误差。

如果从理论上讲,很可能无法获得您意义上的类概率,因为您必须证明您的概率满足极限定理,而这一点非常值得怀疑。

尽管如此,最初的问题就在那里,没有人回答它。我说的正是我提出的问题。
所以,我们还是有努力的方向的。
 
Maxim Dmitrievsky #:
不过,最初的问题就在那里,没有人回答。
所以,我们还是有所期待的。

为什么呢?如果从论文....

 
СанСаныч Фоменко #:

为什么?如果从论文....。

因为用概率曲线进行交易意味着要承担损失而不是收益。如果是风险敏感型应用,任何分类器都需要校准。
 
最后