交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2021.07.17 12:22 #24251

mytarmailS:

现在是对第一个问题的回答。

谢谢你!

我试着去弄明白，但很难马上弄明白--虽然代码语法与C++有很大不同。

Aleksey Vyazmikin 2021.07.17 12:28 #24252

elibrarius:

你不觉得你是在按照测试中最成功的版本调整你的模型吗？

你认为我在什么时候调整测试？抽样 "测试 "是用来停止训练的，在项目中，除了一个，它根本不存在，然后我在最后的训练中使用了它--好吧，你可以用一个固定数量的树来代替它--50/100/300/500/800，看看所有样本的结果，然后你相信会得到明显更差的结果？

mytarmailS 2021.07.17 12:53 #24253

Aleksey Vyazmikin:

谢谢你!

我试着弄明白，但很难马上弄明白，因为代码的语法与C++有很大的不同。

大量不熟悉的功能，因为语言是高级的。

但你在C++中用300行写的东西，我可以用3行来写)

Forester 2021.07.17 13:15 #24254

Aleksey Vyazmikin:

在您看来，我应该在什么时候调整测试？样本 "测试 "是用来停止训练的，在项目中，除了一个，它根本不存在，然后我在最后的训练中使用了它--好吧，你可以用一个固定数量的树来代替它--50/100/300/500/800，看看所有样本的结果，那么你认为结果会差很多吗？

是的--停止训练也是一种试验性的配合。我不知道你的系统的其他细节，我不能多说什么。
在交叉验证中，所有的数据都是一个测试，所有的数据也都是训练。只是每次都是一个。你只是想把托盘的情节增加40%。

Aleksey Vyazmikin 2021.07.17 13:52 #24255

mytarmailS:
很多不熟悉的函数，因为语言是高级的。

但你在C++中用300行写的东西，我可以用3行来写））。

我不认为我所有的变态行为都能在R中轻易实现 :)

Aleksey Vyazmikin 2021.07.17 13:59 #24256

elibrarius:
是的--停止训练也是一种试验性的配合。我不知道你的系统的其他细节，我不能说什么了
。

我同意这在理论上会增加考试样本的结果，但我是在评估考试样本的结果！"。

好了，我想我已经涵盖了所有的细节，如果你有任何问题请问。

elibrarius:
在交叉验证中，所有的数据都是一个测试，所有的数据也都是一个traine。只是每次都是一个。你只是想把托盘的情节增加40%。

那么，你使用crosvalidation的目的是什么？我认为它的意义在于寻找模型的超参数，因为它将平均显示哪些设置在随机图中是最好的。

mytarmailS 2021.07.17 14:00 #24257

Aleksey Vyazmikin:

我不认为你能轻易在R中实现我所有的变态行为 :)

Ahahaha))))

如果我可以实现我的变态，你的就像一个休息的地方)

Forester 2021.07.17 14:18 #24258

Aleksey Vyazmikin:

好的，使用交叉验证的目的是什么？我认为到目前为止，它的目的是寻找模型的超参数，因为它将平均显示哪些设置在随机图中是最好的。

这正是它的作用。你还有什么需要吗？还有一套特定的功能。对于不同的属性，超参数很可能是不同的。如果你挑选了那些最好的超参数，你需要和它们一起工作。

Aleksey Vyazmikin:
嗯，我想我已经描述了所有的细节，如果你有任何问题。

我懒得说细节。

Aleksey Vyazmikin 2021.07.17 14:45 #24259

mytarmailS:

Ahahaha))))

如果我可以实施我自己的变态行为，你的就像休息一样)

好吧，我在这里，既然做了一个准备数据的脚本，我还是需要做一个文件，列出排除的列，其中包括。

1.有相关预测因素的列（顺便问一下，如何选择放弃哪一列，比如5个相关的预测因素？）

2.从第一个文件表中丢弃的列，除了有目标的那一列。

另外，带有目标标签的列应该被写入文件，最好是按列名搜索。

该文件的结构是

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary

Aleksey Vyazmikin 2021.07.17 14:51 #24260

elibrarius:

这正是它的作用。你还有什么需要吗？还有一套特定的功能。对于不同的属性，超参数很可能是不同的。你选择的那些最好的超参数就是你需要投入工作的那些。

我懒得太深入研究。

我需要在更短的时间内选择正确的预测器。如果再去看预测器，就会使处理时间增加一百倍。我的方法是基于这样的逻辑：一个好的预测器（包括适合特定学习方法的预测器）将被模型在所有的采样区间要求，这就排除了对采样区的拟合。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2426