交易中的机器学习:理论、模型、实践和算法交易 - 页 2385

 
Maxim Dmitrievsky:

我想Alexey建议计算能力,他喜欢计算长的东西,也许你应该做一个合作项目:)

没有矢量的R仍然会很慢。你可以使用某种快速数据库

我已经把慢的部分矢量化了,算法的逻辑应该优化,我现在正在想办法,我已经试过5次加速了,我已经重写了代码...

更多的迹象是如此的少,如此的原始,我也应该用它做一些事情,我不太喜欢目标的那个......

哦,该死...这就像一次修理,自我只能从...

 
mytarmailS:

当然你不知道)),即使你知道,也不会对我有任何影响)。

试试吧,但结果最多就是和随机森林一样,也就是没有...


摔跤的输出是被触发的规则的总和,规则没有被过滤掉和拒绝,被拒绝的规则大约是100%)

没有检查规则的可重复性(可能只有一个反应)或充分性(是否有效);规则只是 被延伸 到数据上(模型适合数据)。

模型随机地逼近训练样本,希望交叉验证能有所帮助,但由于客观原因(市场上的重要事件太少),它不会这样做。


我尝试了一种不同的方法,我不对数据进行模型拟合,而是形成假设并检查它们。

1)我以规则的形式形成可信的(已经过滤的) 假设。

2) 假设在小数据上得到检验

3)在小数据上检验过的假设,在大数据上检验。

事实上,一百万条合理的规则中只剩下一条

未经训练的读者很难理解这两种方法的区别,但它们之间的区别是鸿沟

某种哲学。没有具体的东西...
 
elibrarius:
某种哲学。没有具体的东西...

好吧,为什么呢,路径是提前宣布的,一切都严格按照计划进行。生成规则并检查它们并不是通常的方法,在这种方法中,规则是根据问题的逻辑/目标来选择的。也就是说,通常情况下,规则最初是为解决方案生成的。这导致了那些不符合逻辑但却能产生结果的规则的丧失。

 
elibrarius:
某种哲学。没有具体的东西...
  • 许多事情对我们来说是不可理解的,不是因为我们的概念薄弱;而是因为这些事情不在我们概念的范围之内。
Valeriy Yastremskiy:

为什么呢,这条道路早些时候就已经宣布了,而且一切都严格按照计划进行。生成规则并对其进行检查不是通常的方法,在这种方法中,规则是根据任务的逻辑/目标来选择的。也就是说,通常情况下,规则最初是为解决方案生成的。这导致了那些不符合逻辑但却能产生结果的规则的丧失。

+++

 
mytarmailS:
  • 许多事情我们不明白,不是因为我们的概念薄弱;而是因为这些事情不在我们理解的范围之内。

+++

多一点哲学))。

 
典型的情况是,这种方法的结果可以被传统地称为 "反仓鼠"--意思是说,仓鼠被看到了,但没有被看到。这对于类似于SB实现的行来说是非常典型的。
 
Aleksey Nikolayev:
这种方法的典型结果可以被传统地称为 "反仓鼠"--意思是仓鼠被看到但没有被看到。这是很典型的类似于SB实现的行。

我不同意。大量的规则和选择逻辑的问题当然是存在的。这两种方法的目标都是一样的。

而那条路是完全错误的,好吧,我们正在检查规则和纠正路径))))。

 

我有一些其他的MO抽象,应该可以准确地找到真正的模式(如果有的话),但它并不确定

我在谷歌上找不到任何共济会或五角大楼的参考资料,所以我暂时把它保密。

我在拍摄向日葵种子时想到了这个抽象的概念。
 
Maxim Dmitrievsky:

我有一些其他的MO抽象,应该可以准确地找到真正的模式(如果有的话),但它并不确定

我在谷歌上找不到任何共济会或五角大楼的参考资料,所以我暂时把它保密。

攫取葵花籽时发明的抽象概念

我似乎忘记了:真正的SB模式(如果有的话)))))

 
Maxim Dmitrievsky:

我想阿列克谢建议计算能力,他喜欢做长时间的计算,也许你可以做一个合作项目:)

在没有矢量化的情况下,它在R上仍然会很慢。你可以使用一些快速数据库

此外,我多年来一直在做这种方法。

然而,我现在把它搁置了一下,因为它真的非常慢,这使得它无法快速改变目标(寻找一个好的目标),而且个别规则也停止工作,无论你如何在历史上检查它们。

马克西姆,你能不能帮帮忙,用python编写一个脚本,从CSV文件中循环创建模型(或100个模型),然后用标准的CatBoost 工具对它(它们)进行预测器有效性分析,然后在某些条件下禁止/允许使用预测器(CatBoost可以做到),并再次创建新模型。这种方法将允许分配重要的预测因素,从而改进模型。我也在使用类似的方法,但这对我来说真的很不方便,因为在添加/删除预测器后,我必须手动重新启动循环。