交易中的机器学习:理论、模型、实践和算法交易 - 页 804

 
尤里-阿索连科

不要伤心,我知道的)。虽然,如果你觉得更舒服,你可以继续。

但你是对的。

 
阿列克谢-维亚兹米 金。
请告诉我,在初始阶段寻找与目标数据的关联性是否足够,如果是,应该使用什么关联性阈值?
相关性是一种线性方法。如果有的话,用NS做菜园是没有意义的。线性回归 就足够了。
 
格里戈里-乔宁
相关性是一种线性方法。如果它存在,用NS做菜园就没有意义了。线性回归 已经足够了。

谢谢你的回答。

通过增加额外的特征,应用线性回归来确定最稳健的关系如何?

 
我不明白这个问题。然而,线性回归 在金融市场上不起作用。
 

我已经想了很久了....实际上。

我们有一个十乘十的矩阵,我们能对它说些什么呢?

数据量为100。

然后我们可以计算出这个数据的信息量,这也将以一些单位来表示。除了数据量和信息量????,这个数据集还包含什么?我不打算浪费我的时间来回答。知识的数量。所有这些都是与目标有关的自然现象。因此,如果我们看一下因果关系,我们会得到以下模型。

知识的数量 -> 数据的数量 -> 信息的数量。

因此,为了预测,有必要从一组数据中找到关于所需值的知识,而不是信息的数量。

知识本身是一个非常脆弱的东西,可能会因为不熟练的数据转换 而丢失。一个不小心的改变,即使是在一个记录中的一小部分,也会大大减少金额,如果不是完全删除的话。

这就是为什么不建议通过转换使输入数据变得更加复杂。转化越复杂,最终结果中留下的知识就越少。

所以...只是大声思考高的问题,有些人不会理解,并将继续他们的方式,而没有达到最后的站....。

 
Mihail Marchukajtes:

我已经想了很久了....实际上。

我们有一个十乘十的矩阵,我们能对它说些什么呢?

数据量为100。

然后我们可以计算出这个数据的信息量,这也将以一些单位来表示。除了数据量和信息量????,这个数据集还包含什么?我不打算浪费我的时间来回答。知识的数量。所有这些都是与目标有关的自然现象。因此,如果我们看一下因果关系,我们会得到以下模型。

知识的数量 -> 数据的数量 -> 信息的数量。

因此,为了预测,有必要从一组数据中找到关于所需值的知识,而不是信息的数量。

知识本身是一个非常脆弱的东西,可能会因为不熟练的数据转换而丢失。一个不小心的改变,即使是在一个记录中的一小部分,如果不是完全删除,也会大大减少金额。

这就是为什么不建议通过转换使输入数据变得更加复杂。转化越复杂,最终结果中留下的知识就越少。

所以...只是大声思考高的问题,有些人不会理解,他们将继续他们的方式,而没有达到最后的站....。

更重要的是,你想了又想,把数字四舍五入到几十,失去了一些数据,这一般是有害的想法,而有些人继续...

 
阿列克谢-维亚兹米 金。

谢谢你的回答。

通过增加额外的特征,应用线性回归来确定最稳健的关系如何?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
格里戈里-乔宁
我不明白这个问题。 然而,线性回归 在金融市场上不起作用。

所以没有关联性?我认为马克西姆-德米特里夫斯基 回答了下面的问题。

马克西姆-德米特里耶夫斯基

https://www.mql5.com/ru/articles/349

谢谢你的回答。

 
试着在价格数据上绘制自动更正图,你会立即看到是否有关联性。增加指标是没有用的。该指标是价格的一个函数。因此,我们只在价格数据上建立它。
 

对于交叉验证、测试抽样、OOS和其他东西的爱好者,我永远不会厌倦地重复。

特别是SanSanych和Vladimir Perervenko

样本外测试
这是最流行也是最被滥用的验证方法。简而言之,样本外测试需要留出一部分数据,在策略制定后用于测试,获得对未来表现的无偏估计。然而,样本外检验
由于样本较少而降低了测试的力量
如果通过多重比较来制定策略,结果会有偏差
换句话说,样本外检验只在独特假设的情况下有用。对通过数据挖掘制定的策略使用样本外测试,表明对该过程缺乏了解。在这种情况下,测试可以用来拒绝策略,但不能接受任何策略。从这个意义上说,这个测试仍然是有用的,但交易策略开发者知道,通过多重比较开发的策略在样本外的良好表现,在大多数情况下是随机的结果。
已经提出了一些方法来纠正存在多重比较偏差的样本外显著性,但几乎在所有的实际情况下,结果都是不显著的策略。然而,正如我们在参考文献1中用两个对应于两个主要市场制度的例子所表明的那样,即使在对偏差进行修正之后,高度重要的策略也会由于市场的变化而失败。因此,只有在未来收益率与过去收益率分布相同的情况下,样本外测试才是对未来业绩的无偏估计。换句话说,非平稳性可能使任何样本外测试的结果无效。


结论:样本外检验只适用于独特的假设,并假定是静止的在这种情况下,它们是有用的,但如果不满足这些条件,它们可能会有很大的误导性

ROS只能用于假设的取消,或者只能用于已知的静止问题。

但不是用于搜索策略和选择功能/评估系统的稳定性