交易中的机器学习：理论、模型、实践和算法交易

Uladzimir Izerski 2018.04.01 15:57 #8031

尤里-阿索连科。

不要伤心，我知道的）。虽然，如果你觉得更舒服，你可以继续。

但你是对的。

Grigoriy Chaunin 2018.04.02 01:03 #8032

阿列克谢-维亚兹米 金。
请告诉我，在初始阶段寻找与目标数据的关联性是否足够，如果是，应该使用什么关联性阈值？

相关性是一种线性方法。如果有的话，用NS做菜园是没有意义的。线性回归就足够了。

Aleksey Vyazmikin 2018.04.02 01:12 #8033

格里戈里-乔宁。
相关性是一种线性方法。如果它存在，用NS做菜园就没有意义了。线性回归已经足够了。

谢谢你的回答。

通过增加额外的特征，应用线性回归来确定最稳健的关系如何？

Grigoriy Chaunin 2018.04.02 01:34 #8034

我不明白这个问题。然而，线性回归在金融市场上不起作用。

Mihail Marchukajtes 2018.04.02 05:55 #8035

我已经想了很久了....实际上。

我们有一个十乘十的矩阵，我们能对它说些什么呢？

数据量为100。

然后我们可以计算出这个数据的信息量，这也将以一些单位来表示。除了数据量和信息量????，这个数据集还包含什么？我不打算浪费我的时间来回答。知识的数量。所有这些都是与目标有关的自然现象。因此，如果我们看一下因果关系，我们会得到以下模型。

知识的数量 -> 数据的数量 -> 信息的数量。

因此，为了预测，有必要从一组数据中找到关于所需值的知识，而不是信息的数量。

知识本身是一个非常脆弱的东西，可能会因为不熟练的数据转换而丢失。一个不小心的改变，即使是在一个记录中的一小部分，也会大大减少金额，如果不是完全删除的话。

这就是为什么不建议通过转换使输入数据变得更加复杂。转化越复杂，最终结果中留下的知识就越少。

所以...只是大声思考高的问题，有些人不会理解，并将继续他们的方式，而没有达到最后的站....。

revers45 2018.04.02 06:22 #8036

Mihail Marchukajtes:

我已经想了很久了....实际上。

我们有一个十乘十的矩阵，我们能对它说些什么呢？

数据量为100。

然后我们可以计算出这个数据的信息量，这也将以一些单位来表示。除了数据量和信息量????，这个数据集还包含什么？我不打算浪费我的时间来回答。知识的数量。所有这些都是与目标有关的自然现象。因此，如果我们看一下因果关系，我们会得到以下模型。

知识的数量 -> 数据的数量 -> 信息的数量。

因此，为了预测，有必要从一组数据中找到关于所需值的知识，而不是信息的数量。

知识本身是一个非常脆弱的东西，可能会因为不熟练的数据转换而丢失。一个不小心的改变，即使是在一个记录中的一小部分，如果不是完全删除，也会大大减少金额。

这就是为什么不建议通过转换使输入数据变得更加复杂。转化越复杂，最终结果中留下的知识就越少。

所以...只是大声思考高的问题，有些人不会理解，他们将继续他们的方式，而没有达到最后的站....。

更重要的是，你想了又想，把数字四舍五入到几十，失去了一些数据，这一般是有害的想法，而有些人继续...

Maxim Dmitrievsky 2018.04.02 06:36 #8037

阿列克谢-维亚兹米 金。

谢谢你的回答。

通过增加额外的特征，应用线性回归来确定最稳健的关系如何？

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе

2011.12.07
ArtemGaleev
www.mql5.com

Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...

Aleksey Vyazmikin 2018.04.02 06:52 #8038

格里戈里-乔宁。
我不明白这个问题。然而，线性回归在金融市场上不起作用。

所以没有关联性？我认为马克西姆-德米特里夫斯基回答了下面的问题。

马克西姆-德米特里耶夫斯基。

https://www.mql5.com/ru/articles/349

谢谢你的回答。

Grigoriy Chaunin 2018.04.02 07:28 #8039

试着在价格数据上绘制自动更正图，你会立即看到是否有关联性。增加指标是没有用的。该指标是价格的一个函数。因此，我们只在价格数据上建立它。

Maxim Dmitrievsky 2018.04.02 07:55 #8040

对于交叉验证、测试抽样、OOS和其他东西的爱好者，我永远不会厌倦地重复。

特别是SanSanych和Vladimir Perervenko

样本外测试
这是最流行也是最被滥用的验证方法。简而言之，样本外测试需要留出一部分数据，在策略制定后用于测试，获得对未来表现的无偏估计。然而，样本外检验
由于样本较少而降低了测试的力量
如果通过多重比较来制定策略，结果会有偏差
换句话说，样本外检验只在独特假设的情况下有用。对通过数据挖掘制定的策略使用样本外测试，表明对该过程缺乏了解。在这种情况下，测试可以用来拒绝策略，但不能接受任何策略。从这个意义上说，这个测试仍然是有用的，但交易策略开发者知道，通过多重比较开发的策略在样本外的良好表现，在大多数情况下是随机的结果。
已经提出了一些方法来纠正存在多重比较偏差的样本外显著性，但几乎在所有的实际情况下，结果都是不显著的策略。然而，正如我们在参考文献1中用两个对应于两个主要市场制度的例子所表明的那样，即使在对偏差进行修正之后，高度重要的策略也会由于市场的变化而失败。因此，只有在未来收益率与过去收益率分布相同的情况下，样本外测试才是对未来业绩的无偏估计。换句话说，非平稳性可能使任何样本外测试的结果无效。

结论：样本外检验只适用于独特的假设，并假定是静止的。在这种情况下，它们是有用的，但如果不满足这些条件，它们可能会有很大的误导性。

交易中的机器学习：理论、模型、实践和算法交易 - 页 804

ROS只能用于假设的取消，或者只能用于已知的静止问题。

但不是用于搜索策略和选择功能/评估系统的稳定性