交易中的机器学习:理论、模型、实践和算法交易 - 页 1308

 
elibrarius

ISO不是对所有东西都发布的)。在这种情况下,你可以按照国防部盟约中所说的第二节。

在你使用的catbust中,尽管它说的是测试,但他们在解释中写道,它是用于验证的。在其他软件包中,XGBoost、Darch--他们写了验证。

最初,有一个测试集和训练集,出现了交叉验证法,这样的样本被称为验证样本(它实际上是用来交叉验证训练和测试的)。现在有一个提升,它需要样本来停止训练--它被称为测试,它也被验证了,因为它用来测试训练的结果,但它不学习,与交叉验证相反。

我的观点是,在不同的训练方法中,抽样的使用方式可能不同。验证更多的是一种行动,而不是一种采样类型...

 
弗拉基米尔-佩雷文科

验证集参与了训练。它用于在训练期间设置模型参数。有些软件包不需要验证集,在这种情况下,训练集在fit()函数中按一定比例分为训练/验证。但最好是自己指定。

测试套件用于检查训练后的模型的质量,这些数据在训练期间不应该被模型看到。

所以这些都是不同的事情,没有必要混淆。

祝好运

好吧,那就这样吧。我没有统计过一百个人参与创造不同的IR方法的声明,没有想要争论的意思,因为最初我说的是我在头脑中划分概念有多方便,如果对别人不方便,那就让我独自留在我的概念里。

 
阿列克谢-维亚兹米 金。

好吧,那就这样吧。我没有统计过数百人参与创造不同的MO方法的声明,也不想争论,因为我最初谈的是我在头脑中分离概念时很舒服,如果别人不舒服,那就让我独自面对我的概念。

是的,这个话题已经很垃圾了,现在每个人都要发明和自己的术语:)

虽然具体到数据样本的名称,我认为没有必要争论,因为有各种各样的方法来形成和使用它们,而且至关重要的是,IMHO,仍然只有一个事实--这些数据是否参与(In-Sample)或不参与(Out-Of-Sample),在学习过程。
因为所有的IS样本都以这样或那样的方式用来拟合模型,而OOS只是用来评估其质量。


而且为了不含糊,我认为以通常的测试者形式呈现结果是合乎逻辑的,所有在训练中使用的样本--IS来表示为回测,OOS为正向。

 
伊万-内格雷什尼

是的,这个话题已经很杂乱了,现在每个人都要编造自己的术语:)

虽然具体到数据样本的名称,我认为没有必要争论,因为有各种各样的方法来形成和使用它们,而至关重要的,IMHO,仍然只有一个事实--这些数据是否参与了(样本内)、学习过程(样本外)。
因为所有的IS样本都以这样或那样的方式用来拟合模型,而OOS只是用来评估其质量。


为了清楚地理解,我认为以测试者熟悉的形式呈现结果是合乎逻辑的,所有用于训练的样本--IS应该作为回测呈现,而OOS作为正向呈现。


最好是显示单独的图表,因为没有参加培训的样本通常比参加培训的样本小得多,而且从视觉上看,这样的破碎图表没有什么是清晰的,这是我个人的看法。

 
顺便说一下,Catbust有交叉验证功能--那么它就不需要 "测试 "键,而是使用单个样本,以不同的方式进行分解。
 
Aleksey Vyazmikin:
顺便说一下,Catbust有交叉验证功能--那么它就不需要 "测试 "键,而是使用以不同方式分解的单一样本。

科学家们与这样的东西打交道,但他们并不了解神经网络 中发生了什么,更不了解森林中发生了什么,事情究竟是怎样的,为什么会这样,事情在什么时候发生变化,为什么会这样,我们只能相信他们的权威,应用他们的模型,相信更高的力量。

 
凯沙-鲁托夫

科学家们与这样的东西打交道,但他们并不了解神经网络中发生了什么, 更不用说森林了, 事情是怎样的,为什么会这样,事情在什么时候发生变化,为什么,我们只有相信他们的权威,应用他们的模型,相信更高的力量。

森林/树木你显然没有处理过。他们的解决方案很容易被人类解释。任何关于树形算法的基本文章在几页之内都会向你解释。
 
阿列克谢-维亚兹米 金。

好吧,那就这样吧。我没有统计数以百计的参与创建不同方法的国防部的人的声明,没有争论的欲望,因为我最初谈的是我在头脑中分离概念时很舒服,如果别人不舒服,那 就让我独自面对我的概念

倔强的意思与固执的意思接近。我希望它们能帮助你在MO成功实施你的想法。这些都是对研究人员有用的品质。;-)

PS为你的叶子选择系统想到了一个名字:"标本馆"--增加你从树木、森林、树桩、丛林中收集的方法。
 
elibrarius

PS为你的叶子选择系统想到了一个名字:'标本馆'--为你收集的树木、森林、树桩、丛林中的方法添加。

)))我想把它称为伐木工人或锯木厂。

 
凯沙-鲁托夫

科学家们与这样的东西打交道,但他们并不了解神经网络中发生了什么,更不了解森林,不了解一切是如何和出于什么原因完全是这样的,什么地方在什么时刻发生了什么变化,为什么,我们只能相信他们的权威,应用他们的模型,相信更高的权力。

我部分同意,现在是快速计算的时代,虽然人们在接触计算机之前都是在纸上进行计算,但现在信息量和处理信息的方法都非常大,关注结果往往比关注过程更合适。