交易中的机器学习:理论、模型、实践和算法交易 - 页 2426

 
mytarmailS:

现在是对第一个问题的回答。

谢谢你!

我试着去弄明白,但很难马上弄明白--虽然代码语法与C++有很大不同。

 
elibrarius:

你不觉得你是在按照测试中最成功的版本调整你的模型吗?

你认为我在什么时候调整测试?抽样 "测试 "是用来停止训练的,在项目 中,除了一个,它根本不存在,然后我在最后的训练中使用了它--好吧,你可以用一个固定数量的树来代替它--50/100/300/500/800,看看所有样本的结果,然后你相信会得到明显更差的结果?

 
Aleksey Vyazmikin:

谢谢你!

我试着弄明白,但很难马上弄明白,因为代码的语法与C++有很大的不同。

大量不熟悉的功能,因为语言是高级的。
但你在C++中用300行写的东西,我可以用3行来写)

 
Aleksey Vyazmikin:

在您看来,我应该在什么时候调整测试?样本 "测试 "是用来停止训练的,在项目 中,除了一个,它根本不存在,然后我在最后的训练中使用了它--好吧,你可以用一个固定数量的树来代替它--50/100/300/500/800,看看所有样本的结果,那么你认为结果会差很多吗?

是的--停止训练也是一种试验性的配合。我不知道你的系统的其他细节,我不能多说什么。
在交叉验证中,所有的数据都是一个测试,所有的数据也都是训练。只是每次都是一个。你只是想把托盘的情节增加40%。
 
mytarmailS:
很多不熟悉的函数,因为语言是高级的。
但你在C++中用300行写的东西,我可以用3行来写))。

我不认为我所有的变态行为都能在R中轻易实现 :)

 
elibrarius:
是的--停止训练也是一种试验性的配合。我不知道你的系统的其他细节,我不能说什么了

我同意这在理论上会增加考试样本的结果,但我是在评估考试样本的结果!"。

好了,我想我已经涵盖了所有的细节,如果你有任何问题请问。

elibrarius:
在交叉验证中,所有的数据都是一个测试,所有的数据也都是一个traine。只是每次都是一个。你只是想把托盘的情节增加40%。

那么,你使用crosvalidation的目的是什么?我认为它的意义在于寻找模型的超参数,因为它将平均显示哪些设置在随机图中是最好的。

 
Aleksey Vyazmikin:

我不认为你能轻易在R中实现我所有的变态行为 :)

Ahahaha))))

如果我可以实现我的变态,你的就像一个休息的地方)

 
Aleksey Vyazmikin:

好的,使用交叉验证的目的是什么?我认为到目前为止,它的目的是 寻找模型的超参数,因为它将平均显示哪些设置在随机图中是最好的。

这正是它的作用。你还有什么需要吗?还有一套特定的功能。对于不同的属性,超参数很可能是不同的。如果你挑选了那些最好的超参数,你需要和它们一起工作。

Aleksey Vyazmikin:
嗯,我想我已经描述了所有的细节,如果你有任何问题。

我懒得说细节。

 
mytarmailS:

Ahahaha))))

如果我可以实施我自己的变态行为,你的就像休息一样)

好吧,我在这里,既然做了一个准备数据的脚本,我还是需要做一个文件,列出排除的列,其中包括。

1.有相关预测因素的列(顺便问一下,如何选择放弃哪一列,比如5个相关的预测因素?)

2.从第一个文件表中丢弃的列,除了有目标的那一列。

另外,带有目标标签的列应该被写入文件,最好是按列名搜索。

该文件的结构是

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary
 
elibrarius:

这正是它的作用。你还有什么需要吗?还有一套特定的功能。对于不同的属性,超参数很可能是不同的。你选择的那些最好的超参数就是你需要投入工作的那些。

我懒得太深入研究。

我需要在更短的时间内选择正确的预测器。如果再去看预测器,就会使处理时间增加一百倍。我的方法是基于这样的逻辑:一个好的预测器(包括适合特定学习方法的预测器)将被模型在所有的采样区间要求,这就排除了对采样区的拟合。