交易中的机器学习：理论、模型、实践和算法交易

Maxim Dmitrievsky 2019.04.14 12:59 #14361

花了很长时间才搞清楚，但看起来是这样。随着样本量的增加，Alglib森林很容易出现过度学习的情况，因为它是一个不间断的狂欢。因此，如果样本量适中，可能会有很好的概括性，但如果样本量较大，分裂的数量就会离谱，如果不进行修剪，就只是记忆。所以需要进行修剪以增加样本。

我还没有看到他们网站上的新版本是如何工作的。这个缺陷有可能被修复了

Aleksey Vyazmikin 2019.04.14 13:25 #14362

马克西姆-德米特里耶夫斯基。

花了很长时间才搞清楚，但看起来是这样。随着样本量的增加，Alglib森林很容易出现过度学习的情况，因为它是一个不间断的狂欢。因此，如果样本量适中，可能会有很好的概括性，但如果样本量较大，分裂的数量就会离谱，如果不进行修剪，就会变成记忆。所以需要进行修剪以增加样本。

我还没有看到他们网站上的新版本是如何工作的。也许这个缺陷已经被修复。

修剪应该控制完整性，即它应该削减不低于0.5-1%的样本覆盖率。

Кеша Рутов 2019.04.14 13:25 #14363

govich。

你为什么要折磨上个世纪的软件，在网络论坛上，他们建议使用快五倍的变体。NeyroPro的作者坦言，他放弃了几十年的职位，现在他们正在写一个更优化的代码。

C的多人游戏，不错，不错，是我们马克西姆的培养，他在寻找掠夺MLP的地方，这里是纯C的50行，虽然还不是他的水平。

Кеша Рутов 2019.04.14 13:28 #14364

马克西姆-德米特里耶夫斯基。

从现在开始，没有人再来了，我已经把最好的方法发到了你的邮箱里，请你在闲暇时阅读 )

好了，不需要回报或任何指标，MO能够在净价中找到依赖关系。我将严格但公平。就像在现实生活中，或在办公室工作中，在老板与下属的关系中。

Forester 2019.04.14 13:29 #14365

马克西姆-德米特里耶夫斯基。

花了很长时间才搞清楚，但看起来是这样。随着样本量的增加，Alglib森林很容易出现过度学习的情况，因为它是一种不间断的狂欢。因此，如果样本量适中，可能会有很好的概括性，但如果样本量较大，分裂的数量就会离谱，如果不进行修剪，就会变成记忆。所以需要进行修剪以增加样本。

我还没有看到他们网站上的新版本是如何工作的。也许，这个缺点是可以解决的。

不，只是有重写的函数，我想，为了速度。深度仍然是到最后的分割。
自己限制深度--放上计数器（深度或纸张中的例子数量），当超过时，完成划分。在我的实验中，这并没有使OOS得到任何改善，仍然是50+-5%的水平。

Кеша Рутов 2019.04.14 13:30 #14366

Maxim Dmitrievsky:

至少在这个过程中，我看到了静止性和与源行的相互信息的存在。有一些异常值，也可以通过某种方式解决，但这取决于你的决定。

这个公式很简单，我在mql上重写了它。

我也思考了一段时间关于使用相互信息的问题，我认为这很有意义，甚至可能是一个圣杯。

Maxim Dmitrievsky 2019.04.14 13:30 #14367

凯沙-鲁托夫。

好了，不需要回归者或任何指标，IO能够找到净价中的依赖关系。我将严格但公平，就像在现实生活中，或在办公室工作中，在老板和下属的关系中。

不，凯莎，在现实生活中和在论坛上，你没有足够的权力与你分享任何东西。在这方面下功夫。

Maxim Dmitrievsky 2019.04.14 13:33 #14368

elibrarius。
没有，只是简单地重写了一些函数，我想是为了速度。深度还有到胜利/最后的分裂。
自己限制深度--放一个计数器（深度或纸张中的例子数量），当超过时，完成分割。在我的实验中，它并没有导致对OOS的任何改善，仍然是50+-5%的水平。

我不知道它是如何工作的，但它说它产生的森林数量级更少，也就是说，事实上它要重新训练的次数更少，因为选项的数量更少，即使它的深度相同。

Кеша Рутов 2019.04.14 13:33 #14369

elibrarius。
不，它只是在那里重写了函数，我想是为了速度。那里的深度仍然取决于获胜者/最后的分裂。
自己限制深度--放一个计数器（深度或表格中的例子数量），当超过时，完成划分。在我的实验中，它并没有导致对OOS的任何改善，仍然是50+-5%的水平。

所以你一定是在使用回报率，因为大家都被外汇贬值者阿廖沙和古怪的向导所鄙视，回报率是独立的，里面没有任何信息了，没有水平和趋势线，纯粹是SB。

Maxim Dmitrievsky 2019.04.14 13:34 #14370

凯沙-鲁托夫。

我也一直在思考相互信息的应用问题，我认为这很有意义，甚至可能是一个圣杯。

这是一种非常正确的思维方式，至少......我成功地从SI改写的lib就是这样的。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1437