交易中的机器学习：理论、模型、实践和算法交易

Dr. Trader 2016.07.28 22:19 #741

尤里-雷舍托夫。

这就是为什么Dr.Trader无法运行用R语言重写的完整的libVMR--计算量太大，内存消耗太多。

我在大内核转换功能的代码中出现了一个错误。Atach有相同的旧版本3.01，但有修复。内存现在可以了，大内核也可以了。但它会比java慢。

附加的文件：

libVMR.txt 12 kb

Yury Reshetov 2016.07.29 05:50 #742

Dr.Trader:

我的代码中的大内核转换函数有一个错误。Atach有同样的旧版本3.01，但有一个修复。现在内存没问题，大内核机也没问题。但速度比java慢。

这是最令人厌恶的事情，速度在柱子下面。

另外，libVMR是一个二进制分类器，这并不理想。Ternary可以从粪便中制造出一个甜蜜的物体。

Mihail Marchukajtes:
在预测器本身中，数据概括水平为90%，但在未加载的模型中，它只有47%。这不清楚....。而且它在MQL中还没有发挥作用....

也就是说，二元分类器只概括了47%的例子，比随机--50%要差很多。而三元一则过滤掉了垃圾，在剩下的例子上得到了90%的概括能力。

Mihail Marchukajtes 2016.07.29 06:10 #743

慢慢地把模型的泛化水平提高到100%，让我们看看它在未来如何运作 :-)

Yury Reshetov 2016.07.29 06:59 #744

Mihail Marchukajtes:
慢慢地，我把模型的泛化水平提高到了100%，让我们看看它在未来如何发挥作用 :-)

100%的通用性不是极限。我们可以通过按偏向选择预测器来进一步改进。如果两个三元分类器有100%的归纳能力，但偏差不同，那么偏差最小的分类器会更好--它有更多重要的预测因素。

偏差越小，测试样本中用破折号（不确定性）标记的例子就越少。

Mihail Marchukajtes 2016.07.29 07:39 #745

尤里-雷舍托夫。

100%的通用性不是极限。我们可以通过按偏向选择预测者来进一步改进它。如果两个三元分类器具有100%的泛化能力，但偏差不同，那么偏差最小的分类器将是最好的，因为它有更多的重要预测因素。

偏差越小，测试样本中用破折号标记的例子就越少（不确定性）。

长期以来，我一直很感兴趣，可以说我一直对这个问题感到疑惑。雷舍托夫的参数指标及其含义是什么？这意味着什么？而且在我的训练中，在100%的概括中，偏见等于零...

Yury Reshetov 2016.07.29 07:49 #746

Mihail Marchukajtes:
我一直在想，想了很久。Reshetov参数的指标是什么意思，它意味着什么？它是什么意思？

问题是，这对学习能力来说是一个很好的指标，但对概括能力来说却毫无意义。这就是为什么我会在jPrediction的下一个版本中删除它，这样它就不会成为一个麻烦了。

Alexey Burnakov 2016.07.29 08:07 #747

尤里-雷舍托夫。

问题是，对于学习能力来说，这是一个很好的指标，但对于概括能力来说，这没有意义。这就是为什么在jPrediction的下一个版本中，我将删除它，使其不那么令人讨厌。

尤里，一个问题。预测器能否给出概率而不是类别？

Mihail Marchukajtes 2016.07.29 08:11 #748

我不知道这是否会对我们有任何帮助 https://news.mail.ru/society/26600207/?frommail=10

Mihail Marchukajtes 2016.07.29 08:15 #749

阿列克谢-伯纳科夫。
尤里，一个问题。预测器能否给出概率而不是类别？

如果你说的概率是指特征表达的程度，那么是的，它可以。但不是委员会，因为它输出的是0或1或-1，而是二进制的。在整个市场上建立一个模型t，你会看到模型是如何在零点以上跳跃的，零点越高，类的可能性越大。但在百分比方面....mmm......好吧，除非你把最大值作为100%，然后从它开始计算。假设我有一个买入信号，模型在零以上，数值为，比如0.1，最大值为1，我知道这个买入信号的真实状态为10%，像这样....如果这是我所认为的....

Yury Reshetov 2016.07.29 08:34 #750

阿列克谢-伯纳科夫。
尤里，一个问题。预测器能否产生概率而不是类别？

不，在libVMR的早期版本中就计算了概率，但有一个很大的问题，即所有的预测器必须严格地相互独立才能正确地计算出概率值。而在许多应用领域强制执行这样的条件是完全不现实的。例如，交易中几乎所有的指标和振荡器都是相互关联的，也就是说，它们并不独立。此外，算法中的独立条件，在数据中不存在，对概括能力有负面影响。因此，必须放弃这样一个死胡同的方向。

现在，jPrediction并不关注预测因子的独立性，而只关注可推广性的价值。这是因为几个预测器可以相互补充，也就是说，有些例子对某些预测器会有很好的结果，对其他预测器会有很好的结果，对其他预测器的组合会有很好的结果。在这种条件下计算概率会有非常大的、非常值得怀疑的误差范围。

交易中的机器学习：理论、模型、实践和算法交易 - 页 75