交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2016.10.25 17:49 #1781

Dr.Trader:

你是在说PCA成分分析还是别的什么？我不记得我在这里发过的所有例子了 :)

如果你在谈论PCA，无论如何你不能从垃圾中获得甜头。你必须有相当好的预测因素与坏的预测因素混合在一起，然后PCA可以从好的预测因素中筛选出坏的。

你低估了你的经验的积极成果。不存在什么圣杯。但是，有一个全面的工具来对抗过度训练这样的恶行。

第一步是筛选出彻头彻尾的垃圾--这是对过度训练有决定性影响的东西。而在这第一步，PCA是非常有用的。在这一步之后，与目标变量相关的预测因子将被保留，而所有的幻想将消失。但不要高估这一步的重要性--它是第一步。在它之后，接下来的步骤是必要的。

每次训练前，都会有一个 "RFE"。
在每一个新的酒吧（最好是）或在周末对模型进行重新训练。

而你对rfa的实验将证明是非常有用的。

PS。

请注意，我特意对与模型本身的工作保持沉默。

Mihail Marchukajtes 2016.10.25 18:24 #1782

桑桑尼茨-弗门科。

你低估了你的经验的积极成果。不存在什么圣杯。有一个全面的工具来对抗过度训练的祸害。

第一步是剔除彻底的垃圾--这是对再培训有决定性影响的东西。而在这第一步，PCA是非常有用的。在这一步之后，与目标变量相关的预测因子将被保留，而所有的幻想将消失。但不要高估这一步的重要性--它是第一步。在它之后，接下来的步骤是必要的。

每次训练前，都会有一个 "RFE"。
在每一个新的酒吧（最好是）或在周末对模型进行重新训练。

而你对rfa的实验将证明是非常有用的。

PS。

请注意，我特意对与模型本身的工作保持沉默。

你能更多地解释一下PCA吗？你如何以这种方式剔除垃圾？

Andrey Dik 2016.10.25 18:31 #1783

桑桑尼茨-弗门科。

你低估了你的经验的积极成果。不存在什么圣杯。有一个全面的工具来对抗过度训练的祸害。

第一步是剔除彻底的垃圾--这是对再培训有决定性影响的东西。而在这第一步，PCA是非常有用的。在这一步之后，与目标变量相关的预测因子将被保留，而所有的幻想将消失。但不要高估这一步的重要性--它是第一步。在它之后，接下来的步骤是必要的。

每次训练前，都会有一个 "RFE"。
在每一个新的酒吧（最好是）或在周末对模型进行重新训练。

而你对rfa的实验将证明是非常有用的。

PS。

请注意，我特意对与模型本身的工作保持沉默。

对每一栏....，重新训练模型。这是否意味着一个单杠会对整个模型产生影响？鉴于每根钢筋在学习中的重要性，你在再训练中的无尽挣扎变得可以理解......

Dr. Trader 2016.10.25 18:46 #1784

安德烈-迪克
对每一栏....，重新训练模型。这是否意味着一个单杠会影响整个模型？因为训练中的每根钢筋都很重要，它使你在再训练中的无尽挣扎变得清晰起来......

我现在正在努力掌握的模式--我正在，是的，我在每一个新的酒吧都会学到更多。说实话，我没有看到有什么大的影响...有时连续几十条，模型仍然和以前一样（防止模型过拟合的保护机制）。但是，如果一些银行家在新闻中说了一些错误的话，价格就会在某个地方出错--就有希望在几个小节内，模型就能跟上所有最近的变化。将模型适用于每个酒吧的意义不大，但如果有一种方法可以对变化作出快速反应--不使用它是很可惜的。

Mihail Marchukajtes:
你能更多地解释一下PCA吗？你如何以这种方式消除垃圾？

大约一百页之前，Sannych在这个话题中发布了一个 "主成分分析 "的链接。我用它做了一些代码，也在这里输入了它。你必须读很多页才能找到它。

我也喜欢这篇文章，但它既没有R也没有MQL，只包含excel。但它更清楚地解释了运作的原则。http://www.chemometrics.ru/materials/textbooks/pca.htm

Yury Reshetov 2016.10.25 18:48 #1785

Mihail Marchukajtes:
我可以多谈谈PCA吗？你如何以这种方式筛选出垃圾呢？

看看主成分法是如何工作的。

但是，darkAlert 也有一个有趣的评论，解释了为什么这种方法在一些应用任务中不起作用。我引用一下。

"你忘了说，PCA（像其他经典的多变量数据还原方法）只寻找线性依赖关系......"

当应用于交易时，这种方法并不适合，因为以指数值和振荡器的形式输入的预测器属性本身就是非线性的。

Как работает метод главных компонент (PCA) на простом примере

habrahabr.ru

В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно. Математика вообще очень красивая и изящная наука, но порой ее красота скрывается за кучей слоев абстракции...

Dr. Trader 2016.10.25 23:18 #1786

^GSPC取自http://finance.yahoo.com，我认为它是可靠的。

UNRATE、PAYEMS、GDP取自FRED（可能是https://fred.stlouisfed.org/），这就是棘手的部分，谢谢你的提醒。

我宁愿以后用金牛座的小时数。

*有人擦了什么东西，那是对所有那些政府指数有时会重新计算并改变其历史价值的回答。

Mihail Marchukajtes 2016.10.26 04:49 #1787

Vizard_:
你可以，但我不会说的))
重要性是根据绝望的重量计算的。就这样了。是否使用，
，是否有必要进行降维，是否最终不会把婴儿和水一起扔出去，
，适用于abysmally或预处理。另一个问题...

我没有以更简单的方式进行预处理，删除了一些数据，我认为这不是很好.....。因为有必要将每个信号送入TC而不删除。有一个想法，那就是把输出变量带到输入。这样，就有了一些契合的元素 :-)但

如果考虑到输出变量是由TC的利润数量控制的，那么改变这个参数，在任何情况下，都有可能知道我们的输入数据的质量如何。HM....让我解释一下。有一种选择输出变量的哲学一个简单的例子，我们有两个信号。

蓝方的收益为1点。在我的设置条件中，它说要用一个超过50点的信号来标记。这个蓝色的将被标记为0，尽管市场倾向于上涨，这个蓝色信号可能被标记为1。通过调整利润参数，我们因此在我们的输出集中包括和排除了额外的，以获得最大的概括能力.....。这可以在负100点点差的范围内进行。用蛮力方法需要很长的时间，即使以10为增量，也应该至少运行 10次......。总之，这个问题仍未解决。

СанСаныч Фоменко 2016.10.26 07:50 #1788

Mihail Marchukajtes:
你能详细介绍一下PCA吗？你如何以这种方式筛出垃圾？

我不仅懒得在这个主题中为你找一个链接，而且也不需要找。

如果你能好心地浏览一下这个主题。PCA并不是这样就能筛选出垃圾的--这里面有一个细微的差别。因此，寻找它是有意义的。

СанСаныч Фоменко 2016.10.26 07:58 #1789

Dr.Trader:

我现在正在努力掌握的模式--我正在，是的，我在每一个新的酒吧都会学到更多。说实话，我没有看到有什么大的影响...有时连续几十条，模型仍然和以前一样（防止模型过拟合的保护机制）。但是，如果一些银行家在新闻中说了一些错误的话，价格就会在某个地方出错--就有希望在几个小节内，模型就能跟上所有最近的变化。将模型适用于每个酒吧是没有意义的，但如果有一种方法可以对变化做出快速反应，我们就用它吧。

我一再试图推动一个对我来说很明显的想法：没有一个工具可以在不重新训练模型的情况下使用，只要有一点误差就可以了。

我们必须按部就班：清理明显的垃圾，按比例，也许是Voh-Soh，选择预测因素，挑选出一个模型.....，然后发现所有的东西都必须扔掉，因为目标只是一个完全的哑巴....。

在我的实践中，每一步都有字面上的3-5%的减法误差。而如果最初模型给出的误差超过40%，并被重新训练，我设法将未被训练的模型移到20%。大约6个月的工作。

Mihail Marchukajtes 2016.10.26 09:08 #1790

好的，这里是否有MQL方面的专家????既然我们都在这里 :-)

你能告诉我如何优化一个变量，使另一个变量达到0 ????或者至少接近于零 .....

一般来说，根据另一个变量来优化一个变量....。

交易中的机器学习：理论、模型、实践和算法交易 - 页 179