交易中的机器学习:理论、模型、实践和算法交易 - 页 170

 
阿列克谢-伯纳科夫

再次,我也有几十个模型,我也会对预测因子和参数进行修改。而这些模型在每一个8年的时间里都会有稳固的利润!而这就是测试期。但是,当通过测试选出的 "最佳 "模型被延迟抽样测试时,就会出现意外。这就是所谓的--模型拟合交叉验证。

例如,你对一个延迟的样本进行了验证。假设递延数据上的模型已经合并了。在这种情况下,你会怎么做?如果你开始再次调整参数,以通过对待定样本的验证,你基本上是将待定样本的数据纳入你的交叉验证中,交叉验证也会变得调整。这可以通过增加一个新的递延样本来加以纠正。如果模型在这方面也失败了怎么办?我们是否也应该调整参数以通过新的延迟采样?这是一场无休止的比赛。

在交叉验证中包括一个递延样本,并创建一个新的递延样本并不是答案,而是一个无休止的循环,直到你运气好,模型刚好通过递延验证。然后你可以停下来,但这不是一个外汇解决方案,这只是运气向你微笑,然而从统计学上看,这将是一种消耗。

所以问题是--假设待定数据上的模型已经暴跌了。在这种情况下,你会怎么做?

 
Dr.Trader:

所以问题是--假设待定数据上的模型已经合并了。在这种情况下,你会怎么做?

我认为这个问题太个人化了 :)

最好是这样--如果你的模型在待定样本上测试失败,你是否将待定样本纳入交叉验证,并创建一个新的待定样本?还是你以不同的方式来做?


例如,我把San Sanych已经重复了1000次的内容作为基础--你需要评估预测器的质量。"质量 "是一个有弹性的术语。例如,我是通过这样的交叉验证来做的,与其说是模型参数,不如说是预测因子的选择。如果模型在训练过程中发现任何领域的数据都有相同的依赖性--这就有力地证明了预测器是好的。
,我不喜欢我的方法,我必须对集合进行交易。如果依赖关系是恒定的,只要在最后对选定的预测器训练一个模型,它就会再次找到相同的依赖关系,并可以进行自我交易。但我在选择预测因子时有一些遗漏,一个模型失败了。

 
Dr.Trader:预测器的质量....
从原始的例子来看,目标的属性也同样重要......。
 
我甚至会比这更进一步。在建立一个模型时,目标函数是非常重要的一点,因为正是目标函数将帮助算法进行分割。我多次面临这个问题,但还没有解决,所以我把目标值保留为50点。正好在传播的上方...
 
阿列克谢-伯纳科夫

再次,我也有几十个模型,我也在修补预测器和参数。而这些模型在每一个8年的时间里,都会进入稳固的加分项!而这就是测试期。但是,当通过测试选出的 "最佳 "模型被延迟抽样测试时,就会出现意外情况。这 就是所谓的--模型拟合交叉验证。

当这一点明确后,纯粹的实验继续进行。如果不清楚的话,你会看到现实世界中质量的多重下降。这就是你在99%的时间里看到的情况。

所有这一切的发生是因为市场违背了自己的统计数字,经常发生...

1)首先我告诉你为什么我这么认为,并证明这一点。

2)然后我将解释它为什么会发生,这个过程的力学原理

给我几个小时的时间...

我不会给出任何现成的解决方案,因为我自己没有任何解决方案,但对这个过程的理解本身就是一件事。

1)

==================================================================

我做的第一件事是训练两个具有概率输出的深度网络,事实上,任何网络都可以,主要的是网络的输出不是一个明确的类别答案--"1","0"例如,输出将是 "0,13",这将意味着当前数据属于 "1 "类,概率为 "0,13%"。

一个网络我专门为买入而训练,另一个专门为卖出而训练。

卖出的信号(目标磅)是价格至少有0 .2%的跌幅的点。


й

目标看起来像 "0000000010000000000",其中 "1 "是一个看跌的反转,"0 "不是。

对于一个向上的逆转,一切都一样,分别是......

最后三个 OHLC烛台的所有价格 作为预测因素 ,并建立它们之间的差异的所有可能组合

所以,网络是经过训练的,我们把网络的预测(它们的输出)和价格下面的图表画出来。 下面的图表显示了两个网络在买入和卖出时的输出。 例如,网络的输出显示了在下一个蜡烛的下跌逆转的概率。见FIG。1,买入也一样。

绿色表示买入的出口,红色表示卖出的出口。

ф

如果你仔细看一下图。2你可能注意到,价格图表与这些概率相悖,当向上逆转的概率高于向下逆转的概率时(绿色图表高于红色),价格总是下跌,尽管我们实际上教给网络的是相反的情况,让我们试着以更示范性的方式呈现数据。首先,让我们建立买入和卖出产出的累积总和

Cumsum(buy.neural); Cumsum (sell.neural)

я

燕窝3

现在让我们建立买入网络的累积总和与卖出网络的累积总和之间的差异

Cumsum(buy.neural)- Cumsum (sell.neural)


ц

从图中可以看出。4从蓝图和价格图来看,价格与网络预测(蓝图)完全呈反比关系。为了更清楚地说明问题,我将把蓝色图表的符号倒过来(反转)。

Cumsum(buy.neural)- Cumsum (sell.neural)/ -1

к

观察FIG。我们毫不怀疑,价格与网络预测相反,而且我们还可以得出一个有趣的结论,即使用 神经网络及其统计概率,我们能够完全重建价格,只是基于概率知识,如果在下一个蜡烛上进行反转或不。

这是非常酷的,但事实上是没有用的,因为我们的蓝图没有预测能力,它没有超过价格,而是跟上了价格。 这意味着,事实上看价格或蓝图没有区别,但市场机制很清楚-- "如果下来的概率高于上来的概率,价格就会上升"...

=========================================================================

继续前进....

我正在训练一个隐藏的马尔可夫模型SMM或HMM--隐藏的马尔可夫模型

这是一个特别适用于非平稳数据的概率模型,有传言说它也可以适用于市场...

以同样的方式建立了两个模型,但目标模型不显示反转,而只是捕捉趋势,所以一个模型确定了上升趋势并给出了概率估计,而另一个模型则显示了下降趋势的概率。

н

不要注意交易,我在做实验......

所以下面我们有两个向量,分别是绿色的 上升趋势和 红色的 下降趋势的概率,黑线只是模型给出的峰值概率,它只是标准差,更简单的是布林图

所以你看--当模型开始产生某些事件的峰值概率时(往下超过黑线),它就会做相反的事情...
因此,在这里,我们也基本上得到了一个与我们自己的统计数字相反的价格变动......

现在让我们想一想,如果市场是一头野兽)有这样的行为,MO算法能预测市场吗? 如果事实上,RF、网络、SMM等以这样或那样的方式进行预测,统计....。

基本上这就是 为什么模型在优化后的第二天就坏了的答案 ,即使它(优化)是三次遗传和四次验证的。

该怎么做?还不知道

 
mytarmailS:

1)

==================================================================

我做的第一件事是训练两个具有概率输出的深度网络;事实上,任何网络都可以,主要的是网络的输出不是一个明确的类的答案--"1","0"例如,输出将是 "0,13",这将意味着当前数据属于 "1 "类,概率为 "0,13%"。

一个网络我专门为买入而训练,另一个专门为卖出而训练。

卖出的信号(目标磅)是价格至少有0 .2%的跌幅的点。


目标看起来像 "0000000010000000000",其中 "1 "是卖出反转,"0 "是没有。

对于一个向上的逆转,一切都一样,分别是......

最后三个 OHLC烛台的所有价格 作为预测因素 ,并建立它们之间的差异的所有可能组合

因此,网络被训练,我们采取网络预测(他们的输出),并在价格下方绘制图表。

如果你仔细看一下图。2,你可以看到,价格图与这些概率相悖。

观察FIG。5你没有任何疑问,价格与网络预测相反,这也很有趣,使用 神经网络和他们的统计概率,我们能够完全重建价格,只是基于概率知识,如果在下一个蜡烛的反转预期或不。

我是一个聪明人,开发和训练各种神经网络,但仍然看不到简单的东西。我读了你的帖子,感到相当惊讶。如果我理解正确的话,大致上说,你在某个高点之后找到了所有价格下降0.2%的情况,然后在那个高点附近取了三个蜡烛图,并对它们的价格进行了一些操作,最后在神经网络的帮助下将它们降低到一些概率。但请原谅,你不觉得这样的方法太原始了吗?:)你在所有错误的地方进行挖掘。这就是为什么其结果与现实相反。我想这样描述你的方法:你试图从一张全高清图片中抽取3个像素,根据这3个像素,你可以对整个图片做出一个概念。好吧,不是整个画面,但正确预测至少10%的图像区域的概率是多少?我希望我的例子是清楚的。你不需要看像素就能看到画面。换句话说,你不需要看个别条形图来理解图表,你需要看整个图表。而问题的解决更多在于几何学领域,而不是代数、物理学或生物学,例如。虽然,当我读到这里的人们所做的一些研究时,我有一种强烈的感觉,他们正试图用地理学来理解人类结构。:)
 

BlackTomcat:
1)我读了你的帖子,感到相当惊讶。如果我理解正确的话。

2)在神经网络的帮助下,最终使它们达到一定的概率。但请原谅,你自己不觉得这种方法太原始了吗?:)你在错误的地方挖掘。这就是为什么结果与现实完全相反。

3)我想这样描述你的方法:你试图从一张全高清图片中抽取3个像素,并根据这3个像素对整个图片进行构想。好吧,不是整个画面,但正确预测至少10%的图像区域的概率是多少?我希望我的例子是清楚的。你不需要看像素就能看到画面。

4)换句话说,你不需要看个别条形图来理解图表,你需要看整个图表。而问题的解决更多在于几何学领域,而不是代数、物理学或生物学,例如。虽然,当我读到这里的人们所做的一些研究时,我有一种强烈的感觉,他们正试图用地理学来理解人类结构。:)

1) 对...

2)好的,但为什么概率是相反的,这应该是一个简单的随机,而不是一个反相关。

3)我同意,我需要以最大的压缩形式获取最大的信息,这就是为什么我最近一直在谈论体积剖面,或一些替代方案...

你对如何呈现网络数据有什么建议吗? 请分享,这就是我们都在这里的原因。

4)我绝对同意你的观点,我一直在琢磨怎么做,比如说,我需要记住所有落在当前价格范围内的水平,我怎么做? 我怎么把这些水平输入网中? 另外它们在每个蜡烛上的数量会不同,这不是一个微不足道的任务,尤其对我来说。

p.s. 请不要引用我的整个帖子,只要几个字就足以让人明白你是在和我说话,请删除不必要的东西。

 
BlackTomcat:
聪明的人,他们开发和训练神经网络,但他们没有看到简单的事情。我读了你的帖子,感到相当惊讶。如果我没有理解错的话,大致上说,你在某个高点之后找到了所有价格下降0.2%的情况,然后在那个高点附近取了三个蜡烛图,对它们的价格进行了一些操作,最后在神经网络的帮助下把它们降低到一定的概率。但请原谅,你不觉得这样的方法太原始了吗?:)你在所有错误的地方进行挖掘。这就是为什么其结果与现实相反。我想这样描述你的方法:你试图从一张全高清图片中抽取3个像素,并根据这3个像素对整个图片进行构思。好吧,不是整个画面,但正确预测至少10%的图像区域的概率是多少?我希望我的例子是清楚的。你不需要看像素就能看到画面。换句话说,你不需要看个别条形图来理解图表,你需要看整个图表。而问题的解决更多在于几何学领域,而不是代数、物理学或生物学,例如。虽然,当我读到这里的人们所做的一些研究时,我有一种强烈的感觉,他们正试图用地理学来理解人类结构。:)

我同意。你必须着眼于整个画面。

但这只对静态图片有好处。也就是说,我们可以有条件地把整个画面分成100个部分,从70个部分中学习,从30个部分中获得出色的预测能力。这大约就是我们对市场上的预测所做的事情。那么问题出在哪里呢?为什么已经出现了实时的问题?

而问题是,画面并不是静止的。这是一部电影。当然,在研究并学会了在电影的某一帧中进行预测后,在现实生活中预测画面的邻近区域是没有用的--下一帧已经不同了!"。而且,电影的帧都没有绝对的拷贝,即使你在未来找到与过去相似的帧,这些帧也是跟着其他的帧,而不是过去相似的帧。这就是问题所在。

因此,如果观察一部电影的各个帧,人们甚至可以得出结论,这些帧是随机的,就像许多人相信市场是非常随机的,如果不是100%随机的话。我们知道,看一部电影是有意义的,我们甚至可以预测在电影的结尾会发生什么事那么这有什么意义呢?- 也许这是因为我们必须看得更宽,调查更多的全球模式,这些模式永远不会改变--例如,我曾经检查过价格平均回调多少%,嗯,结果是大约30%(如果我没记错的话),但问题是,这个数字对于所有TF和所有工具(货币对和金属,对于CFD和其他我没有检查,但看起来是一样的)几乎是相同的这真是令人惊讶。这正是要使用的恒定模式,但在没有任何神经网络、支架等的情况下,往往更容易做到,因为为了使用MO,你需要能够识别电影中的意义,而这并不容易,甚至根本不可能。

 
安德烈-迪克

而问题是,画面并不是静止的。这是一部电影。

这里有另一个比喻。

几乎每个人的智能手机上都有一个智能键盘。如果你输入一个词,键盘会建议你输入下一个词。这取决于这个词和之前输入的词。我试过了,你甚至可以从键盘建议的词语中输入相当有意义的文字。词语是模式,一组词语就是一组模式。

但这种技术在市场上将是无能为力的,就像这里考虑的MO一样,因为在市场上 "单词 "会随着时间的推移而改变(个别字母的顺序和组合),个别 "单词 "的含义也会改变。只有整个文本的一些更高的意义仍然存在,当然这不是我们能得到的。

现在人们会问我:我们现在该怎么做?- 我不知道该怎么处理MO,结果还是会很糟糕。

甚至有人会说,"你就是不知道怎么做饭的MO!"- 我想我不知道。但谁知道怎么做呢?谁已经能够在市场上使用MO?有谁知道有这样的成功例子吗?是的,现在他们要举出巴特的例子,但他也在随后的时间里翻了船......。

 
mytarmailS:

2)好的,但为什么概率是相反的,事实上,它应该是一个简单的随机,而不是一个反相关。

你对如何表示网络数据有什么建议吗? 请分享,这就是我们在这里的目的。

对如此巨大的引文表示歉意,但我此刻是用手机写的,这里的编辑选项很有限。你可以开始捣鼓一个报价,然后无法回到一个干净的文本领域。这在电脑上很容易解决,但在手机上会有问题。
关于第2点--我同意你的观点,它应该是完全随机的,但事实上我不确定你在正向测试中得到反向结果的时期紧随在训练的时期之后。你在这些时期之间有时间间隔吗?通常情况下,该模式(如果它在市场上)逐渐停止工作:测试仪中的平衡图首先减少其斜率,然后它下降。这种模式已经用尽,它被认可,很多人开始利用它。正因为如此,它变成了一个反转模式。然而,如果该模式背后有一个合乎逻辑的(市场)理由,那么一段时间后,它可能又开始发挥作用。但在这里,以下情况对我来说似乎是公平的:规律性以前工作的时间越长,"遗忘 "的时间就越长。但我还没有彻底测试过这一点。
我不从事神经网络的工作,所以我不知道如何准备数据来训练它们。图形(几何)方法是用眼睛就能识别的,但它们很难被正式化。现在我正在做一个使用图形方法的TS。在我看来,如果有任何工作模式,那就是这里。
我想对我之前的帖子再做一些评论。我似乎在那里加强了对个别酒吧的分析。但事实上,事实并非如此。对个别条形的分析有存在的权利,但这些关键条形通常不在顶部的区域。