交易中的机器学习:理论、模型、实践和算法交易 - 页 1323

 

有一个较新的关于提升的讲座(在python中,catbust是一个选项),同一个讲师 - 找不到了。


 
阿列克谢-维亚兹米 金。

Catbust有更多的自定义功能,是XGBoost思想的延伸,主要的优点和缺点是它有固定维度的树,如果树的数量不多,就无法进行再训练。

....

纯粹是一个技术问题。假设我们有3个预测因子--X1、X2、X3。我们还知道,X1-X2、X1-X3、X2-X3也是预测因素,并产生条件。就我对树的熟悉程度而言,这些额外的预测因素也应该被送入模型。

但情况稍差,预测因子是一些a11*x1-b2*x2,a12*x1-a3*x2,等等,产生了类似方程组的东西。当然,系数我也不知道。更复杂的预测器组合也是可能的,这些只是作为一个例子给出。

NS可以处理这样的事情(预测器的线性组合,甚至是非线性组合),我不需要搞得很花哨,所以我只输入x1、x2和x3,不需要费心。

在这种情况下该如何处理树木?在这个问题上,我找不到相当生动的东西。还是树木自己会做?

 

CatBoost 大师班--有链接可以通过视频下载代码,在python中工作。


 
尤里-阿索连科

一个纯粹的技术问题。假设我们有3个预测因子--X1、X2、X3。我们还知道,x1-x2、x1-x3、x2-x3也是预测因素。就我对树的熟悉程度而言,这些额外的预测因素也应该被送入模型。

但情况稍差,预测因子是一些a11*x1-b2*x2,a12*x1-a3*x2,等等。当然,我不知道这些系数。更复杂的预测器组合是可能的,这些只是作为一个例子给出。

NS应对这样的事情(预测器的线性组合),我不必搞得太花哨,我们只把X1、X2和X3送入输入,不用费心。

在这种情况下该如何处理树木?在这个问题上,我找不到相当模糊的东西。还是树木可以自己做?

理论上,一棵树可以描述一个函数,但它会得到一个带有系数(x)的部分,如果改变,但函数本身不会那么有效,因为它用常数存储事件场。这些是我的想法,也许我是错的。对于这样的问题,最好使用NS,给树一些现成的函数答案,它不会因为函数参数 的改变而改变解释的逻辑。因此,最好是给树一个有限的参数集。

只要改变这些X就会导致需要重新训练模型。

一般来说,如果函数的参数在一个已知的范围内,也就是训练样本所代表的范围内,那么这棵树应该能完成工作。但这是一个回归任务,而不是一个分类任务。
 
阿列克谢-维亚兹米 金。

理论上,树可以描述一个函数,但它会变成一个带有系数(x)的图,如果改变了,但函数本身被保留了,就不再那么有效了,因为它记住了带有常数的事件场。这些是我的想法,也许我是错的。对于这样的问题,最好使用NS,给树一些现成的函数答案,它不会因为函数参数 的变化而改变解释逻辑。因此,最好是给树一个有限的参数集。

只要这些X的变化就会导致需要重新训练模型。

在我工作的NS,他们是可以理解的。树的好处是,它们会产生类似if...then.... 的逻辑。一般来说,这就是我们需要的--输出应该是一个是/否的决定。但看起来树木甚至不能处理这种逻辑,即使我们把它全部喂给它们。

Сs11=PredTraid==[] and Stoch[0][i] > Stoch[1][i]+0.3 and Stoch[0][i-1] <= Stoch[1][i-1]
 
尤里-阿索连科

我和NS一起工作,我了解他们。树的魅力在于它能产生类似if...then的逻辑....。一般来说,这就是我们需要的--输出应该是一个是/否的决定。但似乎树木再也无法应付这样的逻辑了,即使我们把这些都作为输入给它们。

有必要对其进行输入和检查--制作样本并进行检查。

 
阿列克谢-维亚兹米 金。

我们需要提交并查看--做一些采样并检查。

不,不幸的例子。这个就可以了)。

 
尤里-阿索连科

不,不幸的例子。它可以被处理)。

当然,它可以应付,但NS使用神经元来获得公式,而树只获得计算结果的解释。我认为,如果我们画出一个难以用函数描述的原始物,比如说,从孩子的画中画出一栋房子,那么NS需要花很长时间才能找到它,而树会很快确定这个物体的坐标,并直接把它们变成矢量。但是,如果你改变比例,树将无法识别这所房子,但NS应该可以。

 
阿列克谢-维亚兹米 金。

CatBoost大师班--有链接可以通过视频下载代码,在python中工作。


好的,解释得很好。

 
马克西姆-德米特里耶夫斯基

很好,解释得很好

是的,基本的设置是很好的,特别是如果你一开始就用python的话。但这对我来说是不够的。