交易中的机器学习:理论、模型、实践和算法交易 - 页 2793

 
СанСаныч Фоменко #:

近似地讲,您说得没错,如果您指的是估算模型的性能指标,那么就应该有一个最终的估算值。

但是,有一个细微差别比什么都重要。

通过模型的性能来评估模型是对历史数据的评估。但模型在未来会如何表现呢?

评估阀门前向测试。

 
elibrarius #:

通过测试评估 "向前走"。

这是对整个羊群的评估。劣质的羊会被逐一淘汰。

 
СанСаныч Фоменко #:

这是对整个羊群的评估。劣质绵羊会被逐一淘汰。

50 个特征 = 50 次行走觅食测试,每次去掉 1 个特征。时间很长,但结果将由模型得出。
 

根据大数定律,500 条的估计值根本就不是一个统计量,你可以拟合任何东西

 
elibrarius #:
50 篇小说 = 50 次 valking fovard 测试,每次删除 1 篇小说。虽然时间很长,但结果会通过模型得出。

这样只有在特征完全独立的情况下才能得到结果,而实际情况并非如此。

 
Maxim Dmitrievsky #:

根据大数定律,500 条的估计值根本就不是一个统计量,你可以拟合任何东西

评估预测能力就足够了。利用滑动窗口技术,可以选择出教师预测误差不超过 20% 的样本。

 
СанСаныч Фоменко #:

只有在功能完全独立的情况下,这种方法才能取得成效,但这种方法并不奏效。

你把相同的数据输入到你的软件包中。你也得不到任何结果?
 
elibrarius #:
你把同样的数据输入你的数据包。你也什么都得不到吗?

在预处理中,作为一个步骤,我删除了相关的芯片。在 170 个芯片中,如果相关性不高于 75% (!),大约会保留 50 个。当相关性不高于 50%时,会保留一些碎片。但我并没有设定收集不相关芯片的目标。

 
СанСаныч Фоменко #:

在预处理中,作为一个步骤,我删除了相关特征。在 170 个特征中,如果相关性不高于 75% (!),则会保留约 50 个。如果相关性不超过 50%,则会剩下一些。但我并没有设定收集非相关特征的目标。

这 50 件可以通过模型进行检查。
 
elibrarius #:
这 50 个是你可以用模型检查的。

所以它们是相关的!结果取决于丢弃特征的顺序。