交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2021.04.08 07:27 #23841

Maxim Dmitrievsky:

我想Alexey建议计算能力，他喜欢计算长的东西，也许你应该做一个合作项目:)

没有矢量的R仍然会很慢。你可以使用某种快速数据库

我已经把慢的部分矢量化了，算法的逻辑应该优化，我现在正在想办法，我已经试过5次加速了，我已经重写了代码...

更多的迹象是如此的少，如此的原始，我也应该用它做一些事情，我不太喜欢目标的那个......

哦，该死...这就像一次修理，自我只能从...

Forester 2021.04.08 07:44 #23842

mytarmailS:

当然你不知道）），即使你知道，也不会对我有任何影响）。

试试吧，但结果最多就是和随机森林一样，也就是没有...

摔跤的输出是被触发的规则的总和，规则没有被过滤掉和拒绝，被拒绝的规则大约是100%)

没有检查规则的可重复性（可能只有一个反应）或充分性（是否有效）；规则只是 被延伸 到数据上（模型适合数据）。

模型随机地逼近训练样本，希望交叉验证能有所帮助，但由于客观原因（市场上的重要事件太少），它不会这样做。

我尝试了一种不同的方法，我不对数据进行模型拟合，而是形成假设并检查它们。

1）我以规则的形式形成可信的（已经过滤的）假设。

2) 假设在小数据上得到检验

3）在小数据上检验过的假设，在大数据上检验。

事实上，一百万条合理的规则中只剩下一条

未经训练的读者很难理解这两种方法的区别，但它们之间的区别是鸿沟

某种哲学。没有具体的东西...

Valeriy Yastremskiy 2021.04.08 07:58 #23843

elibrarius:
某种哲学。没有具体的东西...

好吧，为什么呢，路径是提前宣布的，一切都严格按照计划进行。生成规则并检查它们并不是通常的方法，在这种方法中，规则是根据问题的逻辑/目标来选择的。也就是说，通常情况下，规则最初是为解决方案生成的。这导致了那些不符合逻辑但却能产生结果的规则的丧失。

mytarmailS 2021.04.08 08:10 #23844

elibrarius:
某种哲学。没有具体的东西...

许多事情对我们来说是不可理解的，不是因为我们的概念薄弱；而是因为这些事情不在我们概念的范围之内。

Valeriy Yastremskiy:

为什么呢，这条道路早些时候就已经宣布了，而且一切都严格按照计划进行。生成规则并对其进行检查不是通常的方法，在这种方法中，规则是根据任务的逻辑/目标来选择的。也就是说，通常情况下，规则最初是为解决方案生成的。这导致了那些不符合逻辑但却能产生结果的规则的丧失。

+++

Forester 2021.04.08 08:16 #23845

mytarmailS:

许多事情我们不明白，不是因为我们的概念薄弱；而是因为这些事情不在我们理解的范围之内。

+++

多一点哲学））。

Aleksey Nikolayev 2021.04.08 08:20 #23846

典型的情况是，这种方法的结果可以被传统地称为 "反仓鼠"--意思是说，仓鼠被看到了，但没有被看到。这对于类似于SB实现的行来说是非常典型的。

Valeriy Yastremskiy 2021.04.08 08:26 #23847

Aleksey Nikolayev:
这种方法的典型结果可以被传统地称为 "反仓鼠"--意思是仓鼠被看到但没有被看到。这是很典型的类似于SB实现的行。

我不同意。大量的规则和选择逻辑的问题当然是存在的。这两种方法的目标都是一样的。

而那条路是完全错误的，好吧，我们正在检查规则和纠正路径))))。

Maxim Dmitrievsky 2021.04.08 08:29 #23848

我有一些其他的MO抽象，应该可以准确地找到真正的模式（如果有的话），但它并不确定

我在谷歌上找不到任何共济会或五角大楼的参考资料，所以我暂时把它保密。

我在拍摄向日葵种子时想到了这个抽象的概念。

Valeriy Yastremskiy 2021.04.08 08:42 #23849

Maxim Dmitrievsky:

我有一些其他的MO抽象，应该可以准确地找到真正的模式（如果有的话），但它并不确定

我在谷歌上找不到任何共济会或五角大楼的参考资料，所以我暂时把它保密。

攫取葵花籽时发明的抽象概念

我似乎忘记了：真正的SB模式（如果有的话）))))

Aleksey Vyazmikin 2021.04.08 08:42 #23850

Maxim Dmitrievsky:

我想阿列克谢建议计算能力，他喜欢做长时间的计算，也许你可以做一个合作项目:)

在没有矢量化的情况下，它在R上仍然会很慢。你可以使用一些快速数据库

此外，我多年来一直在做这种方法。

然而，我现在把它搁置了一下，因为它真的非常慢，这使得它无法快速改变目标（寻找一个好的目标），而且个别规则也停止工作，无论你如何在历史上检查它们。

马克西姆，你能不能帮帮忙，用python编写一个脚本，从CSV文件中循环创建模型（或100个模型），然后用标准的CatBoost 工具对它（它们）进行预测器有效性分析，然后在某些条件下禁止/允许使用预测器（CatBoost可以做到），并再次创建新模型。这种方法将允许分配重要的预测因素，从而改进模型。我也在使用类似的方法，但这对我来说真的很不方便，因为在添加/删除预测器后，我必须手动重新启动循环。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2385