交易中的机器学习:理论、模型、实践和算法交易 - 页 1437

 

花了很长时间才搞清楚,但看起来是这样。随着样本量的增加,Alglib森林很容易出现过度学习的情况,因为它是一个不间断的狂欢。因此,如果样本量适中,可能会有很好的概括性,但如果样本量较大,分裂的数量就会离谱,如果不进行修剪,就只是记忆。所以需要进行修剪以增加样本。

我还没有看到他们网站上的新版本是如何工作的。这个缺陷有可能被修复了

 
马克西姆-德米特里耶夫斯基

花了很长时间才搞清楚,但看起来是这样。随着样本量的增加,Alglib森林很容易出现过度学习的情况,因为它是一个不间断的狂欢。因此,如果样本量适中,可能会有很好的概括性,但如果样本量较大,分裂的数量就会离谱,如果不进行修剪,就会变成记忆。所以需要进行修剪以增加样本。

我还没有看到他们网站上的新版本是如何工作的。也许这个缺陷已经被修复。

修剪应该控制完整性,即它应该削减不低于0.5-1%的样本覆盖率。

 
govich

你为什么要折磨上个世纪的软件,在网络论坛上,他们建议使用快五倍的变体。NeyroPro的作者坦言,他放弃了几十年的职位,现在他们正在写一个更优化的代码。

C的多人游戏,不错,不错,是我们马克西姆的培养,他在寻找掠夺MLP的地方,这里是纯C的50行,虽然还不是他的水平。

 
马克西姆-德米特里耶夫斯基

从现在开始,没有人再来了,我已经把最好的方法发到了你的邮箱里,请你在闲暇时阅读 )

好了,不需要回报或任何指标,MO能够在净价中找到依赖关系。我将严格但公平。 就像在现实生活中,或在办公室工作中,在老板与下属的关系中。

 
马克西姆-德米特里耶夫斯基

花了很长时间才搞清楚,但看起来是这样。随着样本量的增加,Alglib森林很容易出现过度学习的情况,因为它是一种不间断的狂欢。因此,如果样本量适中,可能会有很好的概括性,但如果样本量较大,分裂的数量就会离谱,如果不进行修剪,就会变成记忆。所以需要进行修剪以增加样本。

我还没有看到他们网站上的新版本是如何工作的。也许,这个缺点是可以解决的。

不,只是有重写的函数,我想,为了速度。深度仍然是到最后的分割。
自己限制深度--放上计数器(深度或纸张中的例子数量),当超过时,完成划分。在我的实验中,这并没有使OOS得到任何改善,仍然是50+-5%的水平。
 
Maxim Dmitrievsky:

至少在这个过程中,我看到了静止性和与源行的相互信息的存在。有一些异常值,也可以通过某种方式解决,但这取决于你的决定。

这个公式很简单,我在mql上重写了它。

我也思考了一段时间关于使用相互信息的问题,我认为这很有意义,甚至可能是一个圣杯

 
凯沙-鲁托夫

好了,不需要回归者或任何指标,IO能够找到净价中的依赖关系。我将严格但公平,就像在现实生活中,或在办公室工作中,在老板和下属的关系中。

不,凯莎,在现实生活中和在论坛上,你没有足够的权力与你分享任何东西。在这方面下功夫。

 
elibrarius
没有,只是简单地重写了一些函数,我想是为了速度。深度还有到胜利/最后的分裂。
自己限制深度--放一个计数器(深度或纸张中的例子数量),当超过时,完成分割。在我的实验中,它并没有导致对OOS的任何改善,仍然是50+-5%的水平。

我不知道它是如何工作的,但它说它产生的森林数量级更少,也就是说,事实上它要重新训练的次数更少,因为选项的数量更少,即使它的深度相同。

 
elibrarius
不,它只是在那里重写了函数,我想是为了速度。那里的深度仍然取决于获胜者/最后的分裂。
自己限制深度--放一个计数器(深度或表格中的例子数量),当超过时,完成划分。在我的实验中,它并没有导致对OOS的任何改善,仍然是50+-5%的水平。

所以你一定是在使用回报率,因为大家都被外汇贬值者阿廖沙和古怪的向导所鄙视,回报率是独立的,里面没有任何信息了,没有水平和趋势线,纯粹是SB。

 
凯沙-鲁托夫

我也一直在思考相互信息的应用问题,我认为这很有意义,甚至可能是一个圣杯。

这是一种非常正确的思维方式,至少......我成功地从SI改写的lib就是这样的。