交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2023.04.09 18:46 #30111

Maxim Dmitrievsky #:

在我看来，你说的话还是没人懂 )

根据奥卡姆剃刀的原理，他不用言语就能简单明了地解释清楚。

不，只是当我来到这个主题，开始谈论从树上摘取规则并对其进行评估时，你们嘲笑了我的想法。

我现在已经迈出了下一步--通过评估预测者的量子片段，为创造潜在的高质量规则创造条件，但我再次面对了完全的误解。

Aleksey Vyazmikin 2023.04.09 18:48 #30112

СанСаныч Фоменко #:

我写过几次。

在这里，你必须把同一件事说上一百遍才能被人听到。

Maxim Dmitrievsky 2023.04.09 18:52 #30113

Aleksey Vyazmikin #:

不，只是当我来到这个主题，开始谈论从树上删减规则并对其进行评估时，你对这个想法嗤之以鼻。

我现在又迈出了下一步--通过估算预测器的量子部分，为创建潜在的高质量规则创造条件，但我又一次面对了完全的误解。

所以，仅仅从树上摘取规则并不能让你高兴？从理论上讲，这也是一个运气问题，但以牺牲其（规则）数量为代价，一个人可能会找到一些东西。

这和在优化器中搜索策略参数差不多，但方式更优雅。

Aleksey Vyazmikin 2023.04.09 19:11 #30114

Maxim Dmitrievsky #:

所以，仅仅把规则从树上拔下来还不能让你高兴？

事实证明，这种方法相当不错，只是无法确定规则今后的生命和轮回。在较长的时间间隔内，50% 以上的被选规则显示出了积极的性能结果。

我使用了基因树--如果样本中包含很多预测因子，这种方法就会非常慢。

因此，我决定想办法减少基因树训练所需的信息量。我开始寻找突出潜在有用数据的方法。

另一个问题是，树叶/规则的激活点非常相似。随着树叶基数的增加，很难找到唯一性。

因此，这种设计很有趣，有改进的余地，但在我的案例中却非常缓慢。总的来说，不适合做实验，但如果 TC 结构装置的整体概念已经准备就绪，实施起来还是很有趣的。

当然，我不懂 R，我问过当地的专家，但没人能帮我解决任务。

现在，我想添加根预测器的采样和强制选择（通过列表）以及对已用预测器的阻断。

Maxim Dmitrievsky 2023.04.09 19:19 #30115

Aleksey Vyazmikin #:

结果表明，该方法相当不错，只是无法确定规则的后续寿命和轮回。在较长的时间间隔内，50% 以上的选定规则显示出了积极的性能结果。

我使用了遗传树--如果样本中包含很多预测因子，这种方法就会非常慢。

因此，我决定寻找方法来减少基因树训练所需的信息量。我开始寻找选择潜在有用数据的方法。

另一个问题是，树叶/规则的激活点非常相似。随着树叶基数的增加，很难找到唯一性。

因此，这种设计很有趣，有改进的余地，但在我的案例中却非常缓慢。总的来说，不适合做实验，但如果 TC 建筑装置的整体概念已经准备就绪，实施起来还是很有趣的。

当然，我不懂 R，我问过当地的大师，但没人能帮我解决问题。

现在，我想添加根预测器的采样和强制选择（通过列表），并对已使用的根预测器进行阻断。

为什么需要 catbust？

为什么不采用一棵简单的树，然后通过规则从根到顶，降低复杂规则的权重（对规则复杂性的惩罚）？

在测试器中对新数据运行每条规则，事先扔掉错误较多的规则。

ZY，从直觉上讲，我还是不喜欢这种方法，我还没想出原因。

mytarmailS 2023.04.09 19:32 #30116

Aleksey Vyazmikin #:

当然，我也不认识 R、

我已经听了一年多了。

你可以在一周内学会 R 。

Aleksey Vyazmikin 2023.04.09 19:34 #30117

Maxim Dmitrievsky #:

你为什么需要它，你也能从中获得规则吗？

CatBoost 是检查思路方向是否正确的重要工具。

我可以从第一棵树中提取规则，但当然，它们的平均结果要弱得多（也有好的规则，但很少），所以我暂时放弃了这个想法。现在有了另一种构建树的方法，也许那里的规则更强，但如果没有 python，就不可能在 MQL5 中使用这种模型。

总的来说，我有自己的想法，如何建立一个创建速度较慢的模型，但却能使用与选择树叶相同的检查方法。也许有一天我会用代码实现它。

Aleksey Vyazmikin 2023.04.09 19:37 #30118

Maxim Dmitrievsky #:

为什么不采用一棵简单的树，按规则从树根到树顶，降低复杂规则的权重（对规则复杂性的惩罚）？

在测试器中对新数据运行每条规则，事先扔掉错误较大的规则。

ZY，我直觉上还是不喜欢这种方法，我还没想明白为什么

本质上，区别只在于应用模型时的数据量和 CPU 负载。

另外，通过分组和权重分配，树叶更容易组合（我称之为标本室：）。

许多树被用来创建规则，这意味着信号会重叠，而一棵树则不会出现这种情况。

Aleksey Vyazmikin 2023.04.09 19:40 #30119

mytarmailS #:

我已经听了一年多了。

R 可以在一周内学会

显然，不是每个人都这么有天赋。

而且代码并不简单--我试过重做，但互联网上没有足够的信息来解决问题。

R 语言的另一个缺点是没有简单的解决方案来实现计算机之间的并行计算。

Maxim Dmitrievsky 2023.04.09 19:41 #30120

Aleksey Vyazmikin #:

两者的区别主要在于应用模型时的数据量和 CPU 负载。

另外，树叶更容易组合、分组和分配权重（我称之为标本室：）。

许多树都用于创建规则，这意味着信号会重叠，而一棵树则不会出现这种情况。

我意识到为什么我不喜欢这个想法，因为关联（如规则）！=因果关系:)

交易中的机器学习：理论、模型、实践和算法交易 - 页 3012