交易中的机器学习:理论、模型、实践和算法交易 - 页 1279

 
elibrarius

搞清楚和发布是不同的事情。我仍然在做实验。我此刻把预测者混为一谈。也许我会放弃它,就像我因无力应对噪音而放弃NS一样。

这很容易理解。你必须看几个小时的代码,一切都会变得清晰。

是的,当然这是不一样的,但好的手可以做很多事情!"。而我,觉得很难理解别人的代码,所以我甚至不涉足这个领域。

而森林,所以它在其概念中永远是嘈杂的(事实上,白噪声应该与更有信心的集体反应相重叠),因为它的工作不是由于质量,而是数量,我认为我们需要以某种方式控制更多和质量的树木和他们的独特性。

我不明白你为什么不喜欢我从树上收集树叶的想法;你可以去投票,或者试着分配树叶,使它们在采样时不重叠...噪声显然要小一些,但重要的是叶子里的规则要有真正的意义,那么它就会随着时间的推移而稳定。

 
阿列克谢-维亚兹米 金。

我不明白你为什么不喜欢我从树上收集树叶的想法--你可以投票,或者试着分配树叶,使它们在样本中不重叠......如果你没有足够的噪音,重要的是叶子里的规则有真正的意义,那么它将随着时间的推移而稳定。

我还没有完全探索过这片森林。这就是为什么我没有时间为其他事情分心。
 
elibrarius
我还没有完全探索过这片森林。这就是为什么我没有时间为其他事情分心。

我明白了。琢磨一下,写写你的成就--有意思。

 

现在我想把这种奇怪的CatBoost模型(其树的数量不多,为1-30棵)做成一个池子,用于深度学习,评估100-300棵树下的深度学习是否有意义。

有趣的是,用于训练的样本的第一部分(用蓝色突出显示,但比必要的多一点,因为它显示了最后一个平衡高点的分解,他们说它很长)在应用模型后看起来非常平庸,然后有一个开始利用模型的模式,而在测试样本上(在其上选择模型)并不像在考试中(没有参与训练)那么明显。也许这是训练不足的表现,是否比过度训练好是个问题。

 

如果有人感兴趣,我可以通过命令行来铺设电池、取样、设置来运行,好比任何没有像我一样掌握python的人。

 
阿列克谢-维亚兹米 金。

我给出了一个每分钟的变量,并附上测试者的交易报告。

但我对指标进行了一些改进。

夏普比率现在是0.29。

 
elibrarius

最后算上permutation和实际重新计算的森林,去掉了1个预测器。结果一点也不相似。

permutation的作者用6个预测因子进行了实验,而我用65个预测因子进行了实验。也许有了6个预测器,就更容易分离噪声输入。再加上森林仍然是随机的,也许它也把随机性加到了重要性上。

现在我将在相同的数据上再次运行,在早上我将比较4个重要性表。

最相似的是2个排列组合重要性表(只是来自同一数据上的不同运行)。

在去除1个预测因子时,通过重新计算森林得到的重要性表--相互之间不相似,也不相似,也不相似。

 
你好,机械师!

这个时间表是一个圣杯 测试器吗?


 
亚历山大-伊万诺夫
机械师们好!

这张图是一个圣杯测试器?

这是正确的,这里只有试验品,马利森式的芭蕾舞正在由新郎的学徒和公司上演:)

 
凯沙-鲁托夫

是的,这里只有试管婴儿,而马勒森芭蕾舞团是由《新郎的学徒》和公司经营的 :)

凯沙的儿子。

你让我笑了。

思想的深度。

好一个音节。