交易中的机器学习:理论、模型、实践和算法交易 - 页 96

 

虹膜花瓣数据不是一个信号,这个表根本不适合做foreca测试。只有时间序列 适合于批处理,你在一定的时间间隔内收到新的数值,并将它们组合成一个向量。由于这个原因,你不能改变foreca的数据表中的行的顺序。而且你不能随意删除一些用于验证的行,一切都必须严格按照顺序进行--先是训练用的数据,然后是验证用的数据。没有样品。

对虹膜来说,最好的办法是使用最大组件数min(dim(forec.dt))=14,但我认为准确率仍将低于100%。

 
Dr.Trader:

对虹膜来说,最好的办法是使用最大的组件数min(dim(forec.dt))=14,但我认为准确率仍将低于100%。

两者都做了,准确率约为85%,而仅仅是forec显示为95%。
 
Dr.Trader:

虹膜花瓣数据不是一个信号,这个表根本不适合做foreca测试。只有时间序列适合于批处理,你在一定的时间间隔内收到新的数值,并将它们组合成一个向量。由于这个原因,你不能改变foreca的数据表中的行的顺序。而且你不能随意删除一些用于验证的行,一切都必须严格按照顺序进行--先是训练用的数据,然后是验证用的数据。没有样品。

对虹膜来说,最好的办法是使用最大组件数min(dim(forec.dt))=14,但我认为准确率仍将低于100%。

我认为关于鸢尾花的帖子非常重要。

问题是,RF非常容易出现过度训练。

而在这里,事实证明,foreCA没有这种倾向。所以这是一个非常有用的软件包。

 
Dr.Trader:


你在那里使用BP的结果如何?
 
桑桑尼茨-弗门科

我觉得关于鸢尾花的帖子非常重要。

事实是,rf非常容易出现过度学习的情况。

而在这里,事实证明,foreCA没有这种倾向。所以这是一个非常有用的软件包。

即使是过度训练,如果你在虹膜的4个预测器上增加10列随机值,森林仍能以几乎100%的准确率预测新数据。我很惊讶,也很高兴森林做得很好。我自己以前没有做过这样的实验,以后会牢牢记住的。

就我而言,我把所有可预测性~1%的预测器称为噪声(包括叶长和来自随机值的预测器),并试图从这一切中提取一些信号。我认为从不应该有信号的地方提取信号是没有用的,这个实验并不能告诉foreca任何东西。

mytarmailS:
你在那里使用BP的结果如何?

该模型仍在学习。我可能已经输入了太多的数据,但我不想取消它,让它工作到最后,我将离开它。然后我将在结束后写下结果。

 
我当然不想出人头地,但雷舍托夫在新版本中做了这样一件很酷的事情....它能在短时间内解决你的问题。我给他出了个主意,但他自己已经在想了,所以傻子都是这样想的,结果是很厉害。你不应该把气撒在他身上.....。
 
Mihail Marchukajtes:
我当然不想出人头地,但雷舍托夫在新版本中做了这么一件很酷的事情.....你不应该批评他.....。

谈论很酷的东西...

而我们是否会看到至少有一个与普遍接受的、众所周知的、公认的比较?

 
桑桑尼茨-弗门科

谈论很酷的东西...

我们甚至会看到与普遍接受的、普遍知道的和公认的一个比较吗?

有一天你会看到一个,为什么不呢.....
 
Dr.Trader:

虽然森林进行了重新训练,但如果我们在4个Iris预测器上再增加10列随机值,森林仍然以几乎100%的准确率预测新数据。我很惊讶,也很高兴森林做得很好。我自己还没有做过这样的实验,我会为将来记住它。

是的,我自己也很惊讶,它如此出色地忽略了噪音,并与预测者区分开来,我也从来没有这样做过,自己也很好奇....。

因此,即使到今天为止,我对进口 功能完全没有信心。

n

但它使我相信了它。

 
在将其用于外汇时,继续不要相信重要性。虹膜是非常简单的数据,现有数据和类别之间有直接的规律性。RF只需找到一个最小的 预测器集合,在此基础上可以定义虹膜类别,就可以了。