交易中的机器学习:理论、模型、实践和算法交易 - 页 179

 
Dr.Trader:


你是在说PCA成分分析还是别的什么?我不记得我在这里发过的所有例子了 :)

如果你在谈论PCA,无论如何你不能从垃圾中获得甜头。你必须有相当好的预测因素与坏的预测因素混合在一起,然后PCA可以从好的预测因素中筛选出坏的。

你低估了你的经验的积极成果。不存在什么圣杯。但是,有一个全面的工具来对抗过度训练这样的恶行。

第一步是筛选出彻头彻尾的垃圾--这是对过度训练有决定性影响的东西。而在这第一步,PCA是非常有用的。在这一步之后,与目标变量相关的预测因子将被保留,而所有的幻想将消失。但不要高估这一步的重要性--它是第一步。在它之后,接下来的步骤是必要的。

  • 每次训练前,都会有一个 "RFE"。
  • 在每一个新的酒吧(最好是)或在周末对模型进行重新训练。

而你对rfa的实验将证明是非常有用的。

PS。

请注意,我特意对与模型本身的工作保持沉默。

 
桑桑尼茨-弗门科

你低估了你的经验的积极成果。不存在什么圣杯。有一个全面的工具来对抗过度训练的祸害。

第一步是剔除彻底的垃圾--这是对再培训有决定性影响的东西。而在这第一步,PCA是非常有用的。在这一步之后,与目标变量相关的预测因子将被保留,而所有的幻想将消失。但不要高估这一步的重要性--它是第一步。在它之后,接下来的步骤是必要的。

  • 每次训练前,都会有一个 "RFE"。
  • 在每一个新的酒吧(最好是)或在周末对模型进行重新训练。

而你对rfa的实验将证明是非常有用的。

PS。

请注意,我特意对与模型本身的工作保持沉默。

你能更多地解释一下PCA吗?你如何以这种方式剔除垃圾?
 
桑桑尼茨-弗门科

你低估了你的经验的积极成果。不存在什么圣杯。有一个全面的工具来对抗过度训练的祸害。

第一步是剔除彻底的垃圾--这是对再培训有决定性影响的东西。而在这第一步,PCA是非常有用的。在这一步之后,与目标变量相关的预测因子将被保留,而所有的幻想将消失。但不要高估这一步的重要性--它是第一步。在它之后,接下来的步骤是必要的。

  • 每次训练前,都会有一个 "RFE"。
  • 在每一个新的酒吧(最好是)或在周末对模型进行重新训练

而你对rfa的实验将证明是非常有用的。

PS。

请注意,我特意对与模型本身的工作保持沉默。

对每一栏....,重新训练模型。这是否意味着一个单杠会对整个模型产生影响?鉴于每根钢筋在学习中的重要性,你在再训练中的无尽挣扎变得可以理解......
 
安德烈-迪克
对每一栏....,重新训练模型。这是否意味着一个单杠会影响整个模型?因为训练中的每根钢筋都很重要,它使你在再训练中的无尽挣扎变得清晰起来......

我现在正在努力掌握的模式--我正在,是的,我在每一个新的酒吧都会学到更多。说实话,我没有看到有什么大的影响...有时连续几十条,模型仍然和以前一样(防止模型过拟合的保护机制)。但是,如果一些银行家在新闻中说了一些错误的话,价格就会在某个地方出错--就有希望在几个小节内,模型就能跟上所有最近的变化。将模型适用于每个酒吧的意义不大,但如果有一种方法可以对变化作出快速反应--不使用它是很可惜的。

Mihail Marchukajtes:
你能更多地解释一下PCA吗?你如何以这种方式消除垃圾?

大约一百页之前,Sannych在这个话题中发布了一个 "主成分分析 "的链接。我用它做了一些代码,也在这里输入了它。你必须读很多页才能找到它。

我也喜欢这篇文章,但它既没有R也没有MQL,只包含excel。但它更清楚地解释了运作的原则。http://www.chemometrics.ru/materials/textbooks/pca.htm

 
Mihail Marchukajtes:
我可以多谈谈PCA吗?你如何以这种方式筛选出垃圾呢?

看看主成分法是如何工作 的。

但是,darkAlert 也有一个有趣的评论,解释了为什么这种方法在一些应用任务中不起作用。我引用一下。

"你忘了说,PCA(像其他经典的多变量数据还原方法)只寻找线性依赖关系......"

当应用于交易时,这种方法并不适合,因为以指数值和振荡器的形式输入的预测器属性本身就是非线性的。

Как работает метод главных компонент (PCA) на простом примере
Как работает метод главных компонент (PCA) на простом примере
  • habrahabr.ru
В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно. Математика вообще очень красивая и изящная наука, но порой ее красота скрывается за кучей слоев абстракции...
 

^GSPC取自http://finance.yahoo.com,我认为它是可靠的。

UNRATE、PAYEMS、GDP取自FRED(可能是https://fred.stlouisfed.org/) ,这就是棘手的部分,谢谢你的提醒。

我宁愿以后用金牛座的小时数。

*有人擦了什么东西,那是对所有那些政府指数有时会重新计算并改变其历史价值的回答。

 
Vizard_:
你可以,但我不会说的))
重要性是根据绝望的重量计算的。就这样了。是否使用,
,是否有必要进行降维,是否最终不会把婴儿和水一起扔出去,
,适用于abysmally或预处理。另一个问题...

我没有以更简单的方式进行预处理,删除了一些数据,我认为这不是很好.....。因为有必要将每个信号送入TC而不删除。有一个想法,那就是把输出变量带到输入。这样,就有了一些契合的元素 :-)但

如果考虑到输出变量是由TC的利润数量控制的,那么改变这个参数,在任何情况下,都有可能知道我们的输入数据的质量如何。HM....让我解释一下。有一种选择输出变量的哲学 一个简单的例子,我们有两个信号。

蓝方的收益为1点。在我的设置条件中,它说要用一个超过50点的信号来标记。这个蓝色的将被标记为0,尽管市场倾向于上涨,这个蓝色信号可能被标记为1。通过调整利润参数,我们因此在我们的输出集中包括和排除了额外的,以获得最大的概括能力.....。这可以在负100点点差的范围内进行。用蛮力方法需要很长的时间,即使以10为增量,也应该至少运行 10次......。总之,这个问题仍未解决。

 
Mihail Marchukajtes:
你能详细介绍一下PCA吗?你如何以这种方式筛出垃圾?

我不仅懒得在这个主题中为你找一个链接,而且也不需要找。

如果你能好心地浏览一下这个主题。PCA并不是这样就能筛选出垃圾的--这里面有一个细微的差别。因此,寻找它是有意义的。

 
Dr.Trader:

我现在正在努力掌握的模式--我正在,是的,我在每一个新的酒吧都会学到更多。说实话,我没有看到有什么大的影响...有时连续几十条,模型仍然和以前一样(防止模型过拟合的保护机制)。但是,如果一些银行家在新闻中说了一些错误的话,价格就会在某个地方出错--就有希望在几个小节内,模型就能跟上所有最近的变化。将模型适用于每个酒吧是没有意义的,但如果有一种方法可以对变化做出快速反应,我们就用它吧。


我一再试图推动一个对我来说很明显的想法:没有一个工具可以在不重新训练模型的情况下使用,只要有一点误差就可以了。

我们必须按部就班:清理明显的垃圾,按比例,也许是Voh-Soh,选择预测因素,挑选出一个模型.....,然后发现所有的东西都必须扔掉,因为目标只是一个完全的哑巴....。

在我的实践中,每一步都有字面上的3-5%的减法误差。而如果最初模型给出的误差超过40%,并被重新训练,我设法将未被训练的模型移到20%。大约6个月的工作。

 

好的,这里是否有MQL方面的专家????既然我们都在这里 :-)

你能告诉我如何优化一个变量,使另一个变量达到0 ????或者至少接近于零 .....

一般来说,根据另一个变量来优化一个变量....。