交易中的机器学习:理论、模型、实践和算法交易 - 页 1710

 
马克西姆-德米特里耶夫斯基

麦克斯!再次提醒我,这些模型叫什么?

1) 模型1被训练

2)根据对模型 1的测试数据的预测 来训练模型2,等等。

叠加?

 
阿列克谢-维亚兹米 金。

是的,奇怪的结果。难道他们不从参与培训的测试样本中抽取概率吗?但似乎有一个错误。

那么样本中总共有多少个单位(目标线)?
没有测试样本。
数据集中总共有891行。

我认为那里使用的是rms,rmse,cls或其他的公式之一。最主要的是,结果在0%、50%和100%时收敛。而在两者之间,它们是弯曲的。按班级拆分通常是在50%的时候进行,这时有一个共同的概率匹配。所以决定不解决这个问题。
 
阿列克谢-维亚兹米
elibrarius

我可以问你一个问题吗?

为什么是ketbust?它有什么是类似物所不具备的?

 
埃利布留斯
没有测试样本。
数据集中总共有891行。

我认为那里使用的是rms,rmse,cls或其他的公式之一。最主要的是,结果在0%、50%和100%时收敛。而在两者之间,它们是弯曲的。按等级划分通常是在50%,在这个地方,有一个正常概率的匹配。所以决定不解决这个问题。

是的,为了理解思想的深度,你必须打破代码。但有趣的是,他们如何给叶子分配权重,考虑到他们已经拥有的叶子。

 
mytarmailS:

我可以问你一个问题吗?

为什么是ketbust?它有什么是类似物所不具备的?

我对它感兴趣,原因如下。

1.支持 - 大量的信息和开发人员的反馈。

2.快速学习--使用所有处理器内核。

3.灵活设置模型的建立和再训练控制--尽管这里有很多需要改进的地方。

4.在MQL5中训练后能够应用二元对称模型,但这不是我的开发。

 
阿列克谢-维亚兹米

谢谢

 

任何人都可能对以下方面感兴趣

有一本关于R语言的时间序列预测的新书,包括比特币预测的例子

https://ranalytics.github.io/tsa-with-r/

 
Aleksey Vyazmikin:

是的,为了理解思想的深度,你必须打破代码。但有趣的是,他们如何给叶子分配权重,同时考虑到现有的叶子。

根据定义
梯度分层的想法是建立一个依次细化彼此的基本 模型的集合。第n个基本模型是在n-1个模型集合的 "错误 "上训练的,模型的答案被加权到一起。这里的"错误 " 用的是倒逗号,因为事实上, 每个连续的模型都接近损失函数的反梯度,它不一定等于实际值和预测值之差(即字面意义上的错误)。

看来,权重是像往常一样决定的--由概率决定。
但分裂显然不仅仅是最好的一个,而是能提高整体结果的一个。但这只是一种推测。由于代码中包含数公里的列表,所以不可能翻阅。它不是来自alglib的4000个字符串。

mytarmailS:

为什么是catbust?它有什么是类似物所没有的?

我同意阿列克谢的观点。我对xgboost 有一些经验。这将有可能在实践中进行比较。
 
elibrarius

我只是问为什么,我看到你在挣扎,从ketbust的这些树木,有一些问题的输出,拐杖...

我对 "规则归纳 "这个主题有了一些了解,我看到R有很多规则生成包或规则组合...


1)规则容易输出,一行就可以了

2)规则对人来说容易阅读

3)规则生成堆的类型,从琐碎的到遗传的

4) 预测的质量与其他任何东西都是一样的


所以我在想,也许你不应该为Ketbust而烦恼。而去找一些更令人愉快的东西或类似的东西......

 
mytarmailS:

麦克斯!再次提醒我,这些模型叫什么?

1) 模型1被训练

2)根据对模型 1的测试数据的预测 来训练模型2,等等。

叠加?

元标德普拉多