交易中的机器学习:理论、模型、实践和算法交易 - 页 2474

 
mytarmailS#: 没有人对以下事实感兴趣:它解释了为什么模型在新的数据上不起作用,为什么交易者总是亏损,市场本身的机制被揭示......不? 不感兴趣?

https://www.mql5.com/ru/forum/231011

https://squeezemetrics.com/download/The_Implied_Order_Book.pdf

Кукл :)
Кукл :)
  • 2018.03.07
  • www.mql5.com
Провел миниисследование на тему Кукла :) Если кто не верит в хождение за стопами, то вот вам с вертушки :) Конкретно на рисунке, пытался представит...
 
Evgeniy Ilin#:

这里有一些真理,但我检查了我的模型,那里的主要问题是要知道我们指望的是哪个前锋....。

我不太明白,但这是我的问题,我没有好好学习,我对交易的算法有点不同的看法,更多的是对社会规则和遗传搜索规则或公式,如符号回归等。但如果你设法使简单的模型在新的数据下工作,听到这个消息非常有趣...

谢谢你的阅读...

我也喜欢Maitreid,他的视频大概看了8遍,没有一个多余的字。

至于假人,我认为要简单得多:交易所以佣金为生,如果大多数人想,而这种 购买要求低于目前的 价格,那么交易所就能满足买家的利益,因为他们的数量更多,所以佣金(钱)可以赚得更多,所以价格会下降,反之,卖家也会下降......

它是如何做到的,只是打印价格或操纵滚筒或其他东西,我不知道,但我认为底线是一样的......。

这就是为什么价格与参与者的立场背道而驰。

 
mytarmailS#:

我不太明白你的意思,但这是我的问题,我没有好好学习,我对交易算法的看法有点不同,更倾向于非社会规则和遗传搜索规则或公式,如符号回归等。但如果你设法使常规模型在新数据上发挥作用,听到这个消息非常有趣。

是的,我已经得到了它,质量不像训练图上的那样,但总是有一部分质量被保留下来,我的研究是从10年的历史向前推进,可以达到一年,平均2-3个月就可以达到相当好的质量,相对于训练图的百分比60-70就可以了。神经网络会给出更好的结果,但已经需要增加这些重新训练的标准,输入像权重一样的综合数据,对数据量给予一定的权重,然后是最终backsest的质量,例如期望值或profitka,当然还有最终算法的复杂性,这就是结果(例如所有感知器的所有权重的数量)。为了在神经网络中实现它,神经元的类型应尽可能不同,层数及其组成应是任意的,在这种情况下,它是可能的。基本上每个人都使用固定架构的神经网络,但由于某些原因,他们不明白架构也必须是灵活的,通过破坏这种灵活性,我们破坏了尽量减少再训练的可能性。一般来说,同样的标准当然可以应用于简单的模型,甚至需要,那么你会得到一个很好的前瞻,我的模型给出了几个月的前瞻利润,设置可能在一天内更新。主要的技巧之一是尽可能多的数据(10年的历史或更多),在这种情况下,我们正在寻找全球模式,它们是基于市场的物理学,在大多数情况下,在很长一段时间内都是有效的。

 
Evgeniy Ilin#:

我做了,质量不.....

我需要强壮的铁,我已经有了铁的天花板,但有一个解决这个问题的办法。

如果你没有读过,你会喜欢它的,我相信它对模型质量的标准有有趣的想法。

 
mytarmailS#:

我需要强壮的铁,我也有硬件方面的问题,但这个问题有一个解决办法。

我真的需要服务器),但我没有服务器(我刚刚在死掉的上网本上做了所有这些),我需要漫长而痛苦的时间来阅读。但本身没有其他办法,或者你从某个地方取来电源,并用力加载它们,在这种情况下,你必须至少检查20-30个配置,最好是近百个,并对每个信号进行悬挂和监测,最稳定的将通过自然选择并离开,然后尝试添加更多的电源。没有别的办法,否则就是一条不归路,很多人已经在这里写过了......。它真的可以延伸很多年而不知道在哪里挖掘。另一种选择是在论坛科学中获得学位,并本着普罗科佩科的表演精神,喋喋不休地讨论月相及其对市场的影响)))。如果不是一个秘密,解决方案是什么

 
Evgeniy Ilin#:

如果这不是一个秘密,那么解决方案是什么

在我链接的那本书中,对解决方案的描述更加智能... 我真的推荐你阅读它...

简单来说,解决方案很简单,你需要将问题分割开来,比如将数据聚类,为每个聚类训练不同的模型。

或者更简单的例子:一周有5个交易日,所以我们每天为周一训练一个模型,为周二训练第二个,等等。

 
mytarmailS#:

我链接的那本书更明智地描述了这个解决方案... 我真的推荐你阅读它...

简单来说,解决方案很简单:你需要将问题分割开来,例如对数据进行分组,并为每个分组训练不同的模型。

或者更简单的例子:在一周5个交易日中,我们严格训练一个模型用于周一,第二个用于周二,等等。事实证明,减少5次的训练样本就已经是10年了,还有2年的训练,以此类推就是想象力......

我没有读过,但都已经实现了,我也是出于同样的原因,我需要减少样本量,但仍然能够深入分析历史,但我是在实验中做的,当我明白我的电脑不够强大,我可以做得更好)))),加上多线程之类的东西...都是为了获得最大的收益。

 
Evgeniy Ilin#:

我没有读过,但已经在我家实现了。 我也是出于同样的原因,我必须以某种方式减少采样,但仍然能够深入分析历史,但当我意识到我的电脑不够强大,我可以做得更好)))),再加上多线程之类的东西,我就实验性地来了...都是为了获得最大的收益。

那么

)))


=====

说真的,这本书介绍了如何在不损失质量的情况下更有效地下载,但它不太可能拯救...我认为现在是时候切换到欧亚算法了......

或者类似于知识库的东西,这是最小的分割,我的想法和思路是朝这个方向发展的,因为事件和标志的变体将达到几十GB,而一个有2000万个标志的模型是无法训练的......)所以知识库对我来说是摆脱 "维度诅咒 "的一种方式。

 
mytarmailS#:

或者类似于知识库的东西,那是最小的粉碎,我的想法和思路都是朝着这个方向走的,因为会有几十个千兆字节的事件变体和标志,一个有2000万个标志的模型是无法训练的...)

忘记标志。在我看来,这是一个标量(或者换句话说是一个数学表达式,即使是逻辑上的,也可以简化为数学上的,只是准确性会受到影响)。所有这些标量或逻辑值都来自于价格,因为我们没有其他数据,试图使用额外的数据可能只是让预测变得更糟,因为数据是不同的,可能来自不同的来源,在这种情况下,不清楚哪些数据要优先处理。任何数字系列都可以包含其中的所有其他数字系列,如果使用所有可能的方法来转换该系列...试着理解这一点。在这种情况下,不要给算法这个特征空间,而是让它自己去寻找这些特征......。你不需要任何基础,你需要权力。如果有一个系统,而且至少部分运作,下一步就是分散计算。工人需要联网,数据库会有帮助,但它需要作为共同结果的储存库。这听起来已经像是在采矿。

 
Evgeniy Ilin#:

忘记属性。我的理解是,它是一个标量(或者换句话说是一个数学表达式,即使是逻辑上的,也可以简化为数学上的,只是准确性会受到影响)。所有这些标量或逻辑值都来自于价格,因为我们没有其他数据,试图使用额外的数据可能只是让预测变得更糟,因为数据是不同的,可能来自不同的来源,在这种情况下,不清楚哪些数据要优先处理。任何数字系列都可以包含其中的所有其他数字系列,如果使用所有可能的方法来转换该系列...试着理解这一点。在这种情况下,你不需要给算法这个特征空间,你需要让它自己找到这些特征......你不需要任何基础,你需要权力。如果有一个系统,而且至少部分运作,下一步就是分散计算。工人需要联网,数据库会有帮助,但它需要作为共同结果的储存库。这听起来已经像是在采矿。

我不太理解你的眼光,所以我不会争论...

我把我的算法看作是一个事件序列,事件是一个日志规则,这个序列没有时间限制,要么有,要么没有。

(作为一个交易者设定的水平,价格可能在5分钟或一天内达到,但情况是一样的)

因此,这种工作序列的合奏将是TS。

但要找到这样的 "非维 "序列,我们需要通过数万亿的变体,我看到的解决方案是--在你的硬盘上创建一个知识库......


我认为任何算法在移动窗口中的所有 "典型 "训练都是无效的变种,因为市场并不稳定。 输出将是一个带有过去记忆的移动平均线,由于非平稳性,它在未来永远不会重复。