交易中的机器学习:理论、模型、实践和算法交易 - 页 75

 
尤里-雷舍托夫

这就是为什么Dr.Trader无法运行用R语言重写的完整的libVMR--计算量太大,内存消耗太多。

我在大内核转换功能的代码中出现了一个错误。Atach有相同的旧版本3.01,但有修复。内存现在可以了,大内核也可以了。但它会比java慢。

附加的文件:
libVMR.txt  12 kb
 
Dr.Trader:

我的代码中的大内核转换函数有一个错误。Atach有同样的旧版本3.01,但有一个修复。现在内存没问题,大内核机也没问题。但速度比java慢。

这是最令人厌恶的事情,速度在柱子下面。

另外,libVMR是一个二进制分类器,这并不理想。Ternary可以从粪便中制造出一个甜蜜的物体。

Mihail Marchukajtes:
在预测器本身中,数据概括水平为90%,但在未加载的模型中,它只有47%。这不清楚....。而且它在MQL中还没有发挥作用....
也就是说,二元分类器只概括了47%的例子,比随机--50%要差很多。而三元一则过滤掉了垃圾,在剩下的例子上得到了90%的概括能力。
 
慢慢地把模型的泛化水平提高到100%,让我们看看它在未来如何运作 :-)
 
Mihail Marchukajtes:
慢慢地,我把模型的泛化水平提高到了100%,让我们看看它在未来如何发挥作用 :-)

100%的通用性不是极限。我们可以通过按偏向选择预测器来进一步改进。如果两个三元分类器有100%的归纳能力,但偏差不同,那么偏差最小的分类器会更好--它有更多重要的预测因素。

偏差越小,测试样本中用破折号(不确定性)标记的例子就越少。

 
尤里-雷舍托夫

100%的通用性不是极限。我们可以通过按偏向选择预测者来进一步改进它。如果两个三元分类器具有100%的泛化能力,但偏差不同,那么偏差最小的分类器将是最好的,因为它有更多的重要预测因素。

偏差越小,测试样本中用破折号标记的例子就越少(不确定性)。

长期以来,我一直很感兴趣,可以说我一直对这个问题感到疑惑。雷舍托夫的参数指标及其含义是什么?这意味着什么? 而且在我的训练中,在100%的概括中,偏见等于零...
 
Mihail Marchukajtes:
我一直在想,想了很久。Reshetov参数的指标是什么意思,它意味着什么?它是什么意思?

问题是,这对学习能力来说是一个很好的指标,但对概括能力来说却毫无意义。这就是为什么我会在jPrediction的下一个版本中删除它,这样它就不会成为一个麻烦了。

 
尤里-雷舍托夫

问题是,对于学习能力来说,这是一个很好的指标,但对于概括能力来说,这没有意义。这就是为什么在jPrediction的下一个版本中,我将删除它,使其不那么令人讨厌。

尤里,一个问题。预测器能否给出概率而不是类别?
 
我不知道这是否会对我们有任何帮助 https://news.mail.ru/society/26600207/?frommail=10
 
阿列克谢-伯纳科夫
尤里,一个问题。预测器能否给出概率而不是类别?
如果你说的概率是指特征表达的程度,那么是的,它可以。但不是委员会,因为它输出的是0或1或-1,而是二进制的。在整个市场上建立一个模型t,你会看到模型是如何在零点以上跳跃的,零点越高,类的可能性越大。但在百分比方面....mmm......好吧,除非你把最大值作为100%,然后从它开始计算。假设我有一个买入信号,模型在零以上,数值为,比如0.1,最大值为1,我知道这个买入信号的真实状态为10%,像这样....如果这是我所认为的....
 
阿列克谢-伯纳科夫
尤里,一个问题。预测器能否产生概率而不是类别?

不,在libVMR的早期版本中就计算了概率,但有一个很大的问题,即所有的预测器必须严格地相互独立才能正确地计算出概率值。而在许多应用领域强制执行这样的条件是完全不现实的。例如,交易中几乎所有的指标和振荡器都是相互关联的,也就是说,它们并不独立。此外,算法中的独立条件,在数据中不存在,对概括能力有负面影响。因此,必须放弃这样一个死胡同的方向。

现在,jPrediction并不关注预测因子的独立性,而只关注可推广性的价值。这是因为几个预测器可以相互补充,也就是说,有些例子对某些预测器会有很好的结果,对其他预测器会有很好的结果,对其他预测器的组合会有很好的结果。 在这种条件下计算概率会有非常大的、非常值得怀疑的误差范围。