交易中的机器学习：理论、模型、实践和算法交易

transcendreamer 2021.12.24 18:25 #25351

Aleksey Nikolayev#:

一位著名的科学家写道，价格必然是对数，所有的理论家都盲目地继续这样做。

约翰-图基？或者博克斯和考克斯？

Aleksey Nikolayev 2021.12.24 18:43 #25352

transcendreamer#:

约翰-图基？或者博克斯和考克斯？

也许是尤金-法马在他的论文中，但不确定。

LenaTrap 2021.12.24 18:51 #25353

Renat Akhtyamov#:

我想它以前就在这里了。

那么，扁平化和趋势化的问题将再次推出

...........

该方法如下。

1)你有某种模型（如线性回归）。

2）你有一套你不确定的观察方法。

然后创造一些随机的噪音，并将其与一组观察结果相结合，重复几次。

然后比较该模型在不同结果集上的行为，并得出一些结论。

另外，我们可以选择最稳定的行为作为首选。

这不是一个魔杖，而只是一个用于分析和可能的轻微改进的工具，它并不意味着错误的模型是正确的。

Dmytryi Nazarchuk 2021.12.24 19:23 #25354

LenaTrap#:

...........

该方法如下。

1)你有某种模型（如线性回归）。

2)一些你不确定的观察结果

然后创造一些随机的噪音，并将其与一组观察结果相结合，重复几次。

然后比较该模型在不同结果集上的行为，并得出一些结论。

另外，我们可以选择最稳定的行为作为首选。

这不是一个魔杖，而只是一个用于分析和可能的轻微改进的工具，它不会把一个错误的模型变成一个正确的。

这一点并不清楚。有一个确定的系列和一个模型，可以100%准确地描述它。你加上噪音，模型的准确度是52%。这一行动的意义何在？

Valeriy Yastremskiy 2021.12.24 20:24 #25355

Dmytryi Nazarchuk#:
不清楚。有一个确定的系列和一个模型，可以100%准确地描述它。你加入了噪音--模型描述的准确性为52%。这个行动的意义是什么？

在摩尔斯电码和通讯器中。它来自于那里。

Valeriy Yastremskiy 2021.12.24 20:27 #25356

LenaTrap#:

...........

该方法如下。

1)你有某种模型（如线性回归）。

2)一些你不确定的观察结果

然后创造一些随机的噪音，并将其与一组观察结果相结合，重复几次。

然后比较该模型在不同结果集上的行为，并得出一些结论。

作为选择，我们可以选择最稳定的行为作为首选。

这不是一个魔杖，而只是一个用于分析和可能的轻微改进的工具，它不会把错误的模型变成正确的。

只有在某些情况下，而且有一组情况是行不通的。唯一的希望是，按照逻辑，并不总是如此，不成功的情况会更少。

LenaTrap 2021.12.24 20:37 #25357

Dmytryi Nazarchuk#:
不清楚。有一个确定的系列和一个模型，可以100%准确地描述它。你加入了噪音--模型描述的准确性为52%。这个行动的意义是什么？

如果你能从这个系列中得到准确的数值，那就没有意义了。如果你只能得到近似值，那么问题就很简单了，要检查模型的结果是否是你对原始（理想）系列不准确的测量的误差。这方面有精确的数学公式和定义，但我不明白。

Valeriy Yastremskiy 2021.12.24 20:42 #25358

LenaTrap#:

如果你能从这个系列中得到准确的数值，那就没有意义了。如果你只能得到近似值，那么问题就很简单了，要检查模型的结果是否是你对原始（理想）系列的不准确测量的错误。这方面有精确的数学公式和定义，但我不明白。

问题的关键是隔离被搜索者的可靠性，而不是数值的准确性。有了想要的，混入10%，选择99，混入50，选择80或20...这完全取决于选择被搜索的数据的算法。

当然，这取决于噪声的质量。如果你知道信号，你可以掩盖任何信号。

Dmytryi Nazarchuk 2021.12.25 06:34 #25359

LenaTrap#:

如果你能从这个系列中得到准确的数值，那就没有意义了。如果你只能得到近似值，那么问题就很简单了，要检查模型的结果是否是你对原始（理想）系列的不准确测量的错误。这方面有精确的数学公式和定义，但我不明白。

这不是为了退步

Aleksey Vyazmikin 2021.12.25 09:07 #25360

elibrarius#:
我随机填写了预测因子和输出。只是为了确保学习是不可能的。确保它是50/50%。
通过报价和TP=SL的目标，也是50/50%。

但如果目标不是随机设置的呢？

在这里，我做了一个实验--我的样本通常被分成三部分，所以我把它们合并成一个样本，用100棵树训练模型，然后检查哪些预测因子没有被使用，并把它们屏蔽。然后我像往常一样训练模型，在第二个样本中停止过度训练，并将第三个样本中的结果与我在不排除预测因素的情况下训练时的变量进行比较。结果发现，在选定的预测器上结果更好，在这里我发现很难得出这种效果，认为 "选择不同的预测器是由于区间上的样本不同，通过对整个样本的训练，我们自动选择了不会随着时间推移而失去意义的预测器。"然而，这是否意味着样本越大，模型在长期范围内越稳健？能否以这种方式选择预测者进行学习，即不会造成过度学习？一般来说，我从CatBoost的创始人那里听到的建议是，必须找到模型的超参数，然后愚蠢地在所有可获得的样本上进行训练，以便在工作中应用模型。

elibrarius#:
有一个误差为47.5%的变体，它看起来很酷，但当我把它连接到MT测试器时，结果是下跌而不是增长。结果发现我没有把佣金考虑在内，它吃掉了那2%的优势。

这里考虑的是如何核算佣金...
我想在差价上加4分。但这是不对的。因为TP和SL有时会被高估的Ask触发，而不是在该条上，在测试器中应该是这样的，因为这个原因，后续交易的顺序可能会改变。
但测试者使用的是栏上的最小点差，也会与实际情况不同。

我还没有想出最好的办法。

如果市场向A的方向移动了100点，那么点差依赖就根本不应该存在--财务结果只取决于点差--我认为在训练中不应该考虑到它。假设我有市场条目，在模型确认或不确认后，在标记它们时，我有可能只是实际上扩大了点差--即如果利润低于指定的点数，那么就不要进入。在模型分析中也考虑到了点差，当结果纯粹通过抽样计算时--我只是从交易的财务结果中减去一个指定的点数。

在Moex上，止损是在价格所在的地方触发的，所以用这个当然更容易。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2536