交易中的机器学习:理论、模型、实践和算法交易 - 页 81

 
mytarmailS:
有一个SER :)

)))

你是否在wewlab进行交易?

 
Alexey Burnakov:

)))

你在wewlab交易吗?

不,是tslab,我从R中输入数据并通过R信号模拟交易到tslab,这比在R-ka中模拟交易更快、更方便、更直观,而且我需要止损、止盈、佣金......所以写这些东西真的很令人头痛。
 
Dr.Trader:

4)如果在训练中做交叉验证,在相同的数据上重复几次,看看结果有多大的变化,选择变化小的模型和预测器。

这就是我现在想到的,但这并不是可能出现的问题的极限。

你会感到惊讶,你肯定会不同意我的观点:) ),但我不相信交叉验证在市场上是有效的,至少在其经典用途上是如此

 
mytarmailS:

你会感到惊讶,而且肯定不同意我的观点(不仅是你:)),但我认为交叉验证在应用于市场时并不有效,至少在其经典应用中是如此。

为什么树这么少?
 
mytarmailS:

你会感到惊讶,而且肯定不同意我的观点(不仅是你:)),但我认为交叉验证在应用于市场时并不有效,至少在其经典应用中是如此。

让我们从你如何理解交叉评价的含义开始,你能告诉我吗?
 
桑桑尼茨-弗门科
为什么树这么少?

我的做法是,树木越多,系统的交易就越少,而且质量也不会提高。

例如,如果我的模型用参数10/5做了500笔交易,然后用参数5/200(5个分叉,200棵树)做了一笔交易或根本没有交易,那么概括性就会下降,模型正在寻找已经发生但将来不会发生的非常清楚的情况。

 
阿列克谢-伯纳科夫
我们先来看看你是如何理解交叉验证的含义的。你能告诉我吗?

我相信这和你是一样的

我们把地图分成5个部分,训练其中的4个部分,检查第5个部分,并通过所有的变体与分段,以便对样本的所有5个部分进行样本外检查,并计算出平均误差

这似乎是如果我没有忘记的话

 
mytarmailS:

我认为,树木越多,系统所做的交易就越少,而且它们的质量一点也没有提高。

例如,如果我的模型用参数10/5做了500笔交易,然后用参数5/200(5个分叉,200棵树)做了一笔交易或根本没有交易,那么概括性就会下降,模型正在寻找曾经发生但将来不会发生的非常清楚的情况。

有趣的想法。事实证明,你是在以树的数量来对抗过度训练?
 
mytarmailS:

我相信这和你是一样的

我们把地图分成5个部分,训练其中的4个部分,检查第5个部分,并通过所有的变体与分段,以便对样本的所有5个部分进行样本外检查,并计算出平均误差

如果我没有忘记的话,似乎就是这样了。

是的,你需要它来做什么?要找到最佳的学习参数。

你不喜欢这种做法的原因是什么?你打算如何选择参数?

 
桑桑尼茨-弗门科
有趣的想法。因此,事实证明,通过树的数量,你正在与过度训练作斗争?

并非如此...

我写的东西只适用于我的方法。

你知道我是如何做我的目标的,它是反转的。

我有三个级别的反转 "向上"、"向下 "和 "无反转"(1 , -1 , 0)。

你也知道,类的偏度是巨大的,"0 "类比"-1 "和 "1 "大几十倍。

这意味着模型最好在 "0 "类上训练,因为它有最多的观测数据,在训练模型时,树越多,"0 "类就被训练得越多,随着 "0 "类变得更好更强,它开始(吸收-挤出)"1","-1 "类。这就是为什么树越多交易越少的原因