交易中的机器学习:理论、模型、实践和算法交易 - 页 2017

 
mytarmailS:

有没有人试过用 "圆形水平 "作为标志?

还是作为处理价格的一种方式?

你可以用循环值标记价格,例如...

可以删除一行中相同的数值...

这是一个很好的信息压缩,加上过滤......也许在这样的图表上寻找模式会更容易,对于一个模型......。

我打算做预测器,这里的逻辑是,在级别上有期权罢工,所以对Moex可能有用。

这些图表很有趣,MQL希望能得到一个快速的算法...
 
Aleksey Vyazmikin:

关于干扰--也许我们需要改变纠错的方式。

为什么是黑盒子,如果只有2-3层,那么用系数来解读是很现实的。这里的小系数可以被粗化和清零,这将减少神经元的输入数量。

你说 "也许你应该改变 "是什么意思? 学习数学和激活字体的工作原理。还是网络开发人员太傻了,他们不知道。

为什么在没有学位或数学背景的情况下进入这些东西并重新发明车轮?这是一种愚蠢的时间浪费。有一些技术,而且写明了如何使用这些技术。

 
Maxim Dmitrievsky:

你说的 "可能需要改变 "是什么意思? 学习数学和激活函数的工作原理。或者是网络开发人员太笨了,他们不可能发现这一点。

因为这是在浪费时间,除了猜测,没有任何具体内容。你只是调整了自动编码器,在一个串联或NS上添加了热键,并向我们展示了结果。这就是全部。你不需要详细说明什么。深度架构不是为了被解析而建立的,而是为了减少分析程序。

如果没有学位或数学背景,为什么还要涉足这一切,重新发明轮子?这是一种愚蠢的时间浪费。有一些技术,它被写下来应该如何使用,就是这样。很多人都在努力。

如果现成的开箱即用的解决方案能够解决我为其设定的任务,我就不必再发明什么了。

现在我正在准备大量的样本,并将在CatBoost 上训练许多模型,有一些想法,如何估计模型的质量,以进一步成功地进行实时应用 - 我会分享我的研究结果。

 
Aleksey Vyazmikin:

如果开箱即用的解决方案能够解决我摆在他们面前的任务,就没有必要去发明什么,但是,可惜了。

现在我准备了大的样本,并将在CatBoost上训练大量的模型,有一些想法,如何估计模型的质量,目的是在实时中进一步成功应用 - 我将分享研究的结果。

我不认为catboost是预测时间序列的 最佳解决方案,它对序列不起作用。

你可以玩分类,但它将是无用的
 
Maxim Dmitrievsky:

Catbust不适合用于时间序列 的预测,它对序列不起作用。

纯粹是为了玩分类,但这是没有用的

那么你如何确定它是否有效呢?

我在测试器里有一年内盈利的模型(大约一年前训练的)--你是说它们是随机的吗?

是的,CatBoost不如有后处理叶子的遗传树,但它的训练速度非常快。

而什么是有效的--NS?

 
Aleksey Vyazmikin:

你怎么能知道它是否在工作?

我有一些已经盈利了一年的模型(大约一年前受训)在测试器中--你是在暗示它们是一种侥幸?

是的,CatBoost不如有后处理叶子的遗传树,但它的训练速度非常快。

而什么是有效的--NS?

我没有定义它,架构本身是为其他任务服务的。

是的,这都是随机的。

还没有任何效果 )

 
Aleksey Vyazmikin:

预测器不是赤裸裸的价格--很多相对的点,可能是类似的...

我不确定通过相关性进行筛选是否有效...

为什么不试试呢?负面的结果也是一种结果(在供进一步思考的意义上)。

我曾经甚至提出了相关系数的公式:C = (n1 - n2)/n,其中n是两个系统中至少有一个给出交易信号的条数,n1是两个系统同时给出信号且方向相同的条数,n2 两个系统同时 给出信号且方向相反的条数。

这个矩阵可用于聚类、瘦身和形成投资组合。

 
Maxim Dmitrievsky:

我没有确定,但架构本身是为了其他任务。

是的,这都是随机的。

到目前为止,没有任何效果 )

当然,这里没有时间序列的锐化,所以预测器应该包含X坐标信息,而不仅仅是Y坐标信息。

如果一个人学会了如何识别这种随机模式,他就会成为一个专家。

我在前几年取样的叶子有60%以上在工作,这是非常的,在我看来,证实了数据处理方法分类不当的想法的合理性。如果更多的人致力于这个想法,结果会更好,但每个人都有自己的闪光点。

 
Aleksey Vyazmikin:

当然,这里没有时间序列的锐化,所以预测器应该包含X坐标信息,而不仅仅是Y坐标信息。

如果一个人学会了如何识别这种随机模式,他就会成为一个赢家。

我在前几年取样的叶子有60%以上在工作,这是非常的,在我看来,证实了数据处理方法分类不当的想法的合理性。如果有更多的人在研究这个想法,结果会更好,但每个人都有自己的闪光点。

比如,这篇文章想...勾勒出该方法的要点。我还是不明白你在做什么 :D

我坚持认为,特征应该由模型本身从时间序列(如果有的话)中自动提取。而且不需要手动做任何事情。增量已经足够了。问题是架构。例如像在NLP(神经语言处理)中,神经网络本身决定了单词序列的上下文,即时间序列样本之间的关系。

 
Aleksey Nikolayev:

为什么不试一试呢?负面的结果也是一种结果(在供进一步思考的意义上)。

我相信我曾经甚至提出过相关系数的公式:C = (n1 - n2)/n,其中n是两个系统中至少有一个给出交易信号的条数,n1是两个系统同时给出信号且方向相同的条数,n2 两个系统同时 给出信号且方向相反的条数。

这些比率的矩阵可用于聚类、稀释和形成投资组合。

这与预测器有什么关系?

我对叶子的选择也做了类似的工作,但有一个问题,就是样本中叶子的反应数量是不同的,我们应该考虑到反应相似但长度不同的叶子可能属于同一组。