交易中的机器学习:理论、模型、实践和算法交易 - 页 235

 
Vizard_
我看到他们已经开始写关于r的书了))))。
allitebooks.com/automated-trading-with-r-2/。
它的拳头是开始写关于 "如何赚钱 "的书,然后这种方法要么不再起作用,要么以前从未起作用。然而,一个指标。也就是说,当一本书中对某一方法的描述比该方法本身更能赚钱时。
 
Vizard_
为了运动,我超越了一点,我就不说了。资源自由一点,根本不想,也没有。

只支持 "分行入场券 "的想法。< 0.69,据猜测,没有太大的问题,可以摆脱。< 0.68 不知道,你必须考虑一下))))。

https://numer.ai


请告诉我,什么模式,你是怎么学会的?
 
lucky_teapot:
请告诉我是哪个模型,是怎么教的?

类别预测误差小于30%。它可以远远低于30%,但低于20%是不可能实现的。但有充分的理由说,这个模型没有被过度训练。重要的是,它没有被过度训练--一个过度训练的模型根本不需要,是危险的垃圾。

模型:随机森林 和阿达。一般来说,模型的选择对结果没有什么影响,如果它被训练的话。在我的预测器上,nnet根本就没有被训练。

 
桑桑尼茨-弗门科

类别预测误差小于30%。它可以远远低于30%,但低于20%是不可能实现的。然而,我们有充分的理由相信,该模型没有被重新训练。最主要的是不要过度训练--过度训练的模型根本就不需要,是危险的垃圾。

模型:随机森林和阿达。一般来说,模型的选择对结果影响不大,如果它是可训练的。在我的预测器上,nnet根本没有被训练。

你那里有什么样的logloss?
 
lucky_teapot:
你那里有什么样的logloss?
什么是logloss?
 
桑桑尼茨-弗门科

类别预测误差小于30%。发生率远低于30%,但低于20%的情况无法实现。然而,我们有充分的理由相信,该模型没有被重新训练。最主要的是不要过度训练--过度训练的模型根本就不需要,是危险的垃圾。

模型:随机森林和阿达。一般来说,模型的选择对结果影响不大,如果它是可训练的。在我的预测器上,nnet根本没有被训练。

桑桑尼茨-弗门科
什么是logloss?

我猜你说的是你在https://numer.ai,但不是用loglose,而是 用哈希(%误差)。但loglose 是个棘手的东西,你不仅要猜测类,还要猜测概率。

 
lucky_teapot:

我理解你在https://numer.ai,但不是以logloss而是 以hemming(%误差)来谈论你的仪表,但logloss 是个棘手的东西,你不仅需要猜测等级,还需要猜测概率。

我在写我的EA。它有一个模型。

我使用软件包,它们有一个粗略的估计,这与logloss没有关系。此外,软件包的结果可以通过其他手段进行估计....。我不记得loglos了。

而类,在我看到的那些软件包中,是由概率衍生出来的,也就是说,在现实中,概率是被计算出来的,然后被校准。它的标准是两个班级各占一半,但你可以进入和转向。

 
桑桑尼茨-弗门科

我在写我的EA。它里面有一个模型。

我使用软件包,其中有一个估值,一看就知道与loglos无关。此外,软件包的结果可以通过其他手段进行评估....。我不记得loglos了。

而类,在我看到的那些软件包中,是由概率派生出来的,也就是说,在现实中,概率是被计算出来的,然后再进行校准。它的标准是两班各一半,但你可以进入和转向。

那就不能说什么了,至少你需要一个数据集,你在这个数据集上得到了这样的结果。Loglos我同意,对于我们的情况来说,这并不是真正正确的选择,这是对kaggle的致敬,没有经过重新训练的20-30%的准确性误差,这在我听来非常强大,坦白说我很难相信。

对于loglos,诀窍是,例如对于两个班级,如果你有0%的错误,那么答案的概率将接近100%和0%,{0,1,0,1....}。当误差为10%时,它不仅影响到错误答案的概率,也影响到正确答案的概率,所以那些正确答案,原来是1和0,现在应该是例如0.8和0.2,当误差为45%时,一切都应该在0.5+-0.1左右震荡,所以对数损失将是最佳的,这样的炼金术....

 
Dr.Trader:

刚好看到lucky_teapot的资料,论坛上有一个主题,里面有一个文章的链接。我认为整个事情是从mql4.com论坛转过来的,我几乎没有研究过这个论坛,如果真的是从那里转过来的,那就感谢MetaQuotes。
这篇文章几乎是9年前的了,但我发现很多有用的东西,现在不妨试试。我想我甚至理解了维度滞后空间,关于这一点阿列克谢已经在这个主题中说过几次了。
这篇文章本身,我觉得非常有用 -https://www.mql5.com/ru/articles/1506

我读了...我对一件事很感兴趣,作者说,你可以对数据进行一些修改,从而增加样本,然后模型会更好地工作,因为模型的知识基础会更广泛...

我正在处理价差问题,与总样本相比,价差仍然很小

我认为,如果我们抽出一个百万分之一的样本,并教模型捕捉反转,会有很多例子,我认为反转的模式在两个市场都是一样的(我是说很多模式 )。

在这里,我有另一个问题,或者说是一个想法,但还没有解决方案......

我想,如果我们把所有的反转从这几百万个值中分离出来,只留下这些作为训练样本,模型将只学习反转本身,这是如此之快,但当我们需要在新的数据中区分反转和非反转时,如果模型不知道什么是非反转,它将如何做?((.

 
mytarmailS:

我读了...我对一件事很感兴趣,作者说,你可以对数据进行一些修改,从而增加样本,然后模型会更好地工作,因为模型的知识基础会更广泛...

我正在处理逆转的问题,与总的样本相比,逆转的数量仍然很少。


什么是支点?像ZZ那样的一个酒吧?

我真的很喜欢这个想法(在这里钓出来的线),当反转被认为是某一序列的条形,之后,在未来,将有一个预定的利润。这种方法将大大减少阶层的不平衡。那是一个。二,这个班级本身会有一个明确的预测属性。