交易中的机器学习：理论、模型、实践和算法交易

Forester 2022.10.19 13:17 #27921

СанСаныч Фоменко #:

近似地讲，您说得没错，如果您指的是估算模型的性能指标，那么就应该有一个最终的估算值。

但是，有一个细微差别比什么都重要。

通过模型的性能来评估模型是对历史数据的评估。但模型在未来会如何表现呢？

评估阀门前向测试。

СанСаныч Фоменко 2022.10.19 13:30 #27922

elibrarius #:

通过测试评估 "向前走"。

这是对整个羊群的评估。劣质的羊会被逐一淘汰。

Forester 2022.10.19 13:52 #27923

СанСаныч Фоменко #:

这是对整个羊群的评估。劣质绵羊会被逐一淘汰。

50 个特征 = 50 次行走觅食测试，每次去掉 1 个特征。时间很长，但结果将由模型得出。

Maxim Dmitrievsky 2022.10.19 15:09 #27924

根据大数定律，500 条的估计值根本就不是一个统计量，你可以拟合任何东西

СанСаныч Фоменко 2022.10.19 15:20 #27925

elibrarius #:
50 篇小说 = 50 次 valking fovard 测试，每次删除 1 篇小说。虽然时间很长，但结果会通过模型得出。

这样只有在特征完全独立的情况下才能得到结果，而实际情况并非如此。

СанСаныч Фоменко 2022.10.19 15:22 #27926

Maxim Dmitrievsky #:

根据大数定律，500 条的估计值根本就不是一个统计量，你可以拟合任何东西

评估预测能力就足够了。利用滑动窗口技术，可以选择出教师预测误差不超过 20% 的样本。

Forester 2022.10.19 15:31 #27927

СанСаныч Фоменко #:

只有在功能完全独立的情况下，这种方法才能取得成效，但这种方法并不奏效。

你把相同的数据输入到你的软件包中。你也得不到任何结果？

СанСаныч Фоменко 2022.10.19 16:17 #27928

elibrarius #:
你把同样的数据输入你的数据包。你也什么都得不到吗？

在预处理中，作为一个步骤，我删除了相关的芯片。在 170 个芯片中，如果相关性不高于 75% （！），大约会保留 50 个。当相关性不高于 50%时，会保留一些碎片。但我并没有设定收集不相关芯片的目标。

Forester 2022.10.19 16:24 #27929

СанСаныч Фоменко #:

在预处理中，作为一个步骤，我删除了相关特征。在 170 个特征中，如果相关性不高于 75% （！），则会保留约 50 个。如果相关性不超过 50%，则会剩下一些。但我并没有设定收集非相关特征的目标。

这 50 件可以通过模型进行检查。

СанСаныч Фоменко 2022.10.19 16:53 #27930

elibrarius #:
这 50 个是你可以用模型检查的。

所以它们是相关的！结果取决于丢弃特征的顺序。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2793