交易中的机器学习:理论、模型、实践和算法交易 - 页 437

 
elibrarius

我还不确定在斜率差异如此之大的情况下,把这两张图看成是相似的是否正确。用同样的例子。

发现的变体给出了从上行趋势点或趋势结束时的回撤,通过将其转移到形态图上,它将给出下降趋势的延续而不是逆转的预测--本质上是一个反向信号。这里有些不对劲....

但是,如果你驱动测试器,它将很少找到斜率差异非常大的模式,这意味着在某个极限,它将是一个上升的模式,但不是一个下降的模式,并且该结构将与当前的结构有很低的相关性,这就是为什么它从未得到任何结果
 
马克西姆-德米特里耶夫斯基
都是真的,只是模式的斜率有很大的不同,如果斜率有很大的不同,你可以限制搜索,不考虑这种变体,但是如果你运行测试器,它很少会发现斜率有很大差异的变体,它说在一定的限度内,它将不是真正的下降模式,而是上升模式,结构将与当前结构有很低的关联性

好吧,10-15度(通过眼睛)少了多少?而且,不发现任何东西比发现假信号要好。

PS.用Photoshop测量 - 18度

 
埃利布留斯
好吧,10-15度(通过眼睛),少多少?而且,不发现任何东西比发现假信号要好。


即使有完美的50%的巧合,他的预测方向也是错误的)。

顺便说一句,是的,这里的预言曲线计算不正确,我在什么地方搞砸了......而且我已经失去了旧的版本

 
马克西姆-德米特里耶夫斯基

他甚至在做一个50%的完美匹配,并预测了错误的方向)。

因为你是在一个变体的基础上进行预测的,如果有一百个类似的变体,预测的准确性就会更高。但平均预测将为零 ))

对一个人和许多人都不好。我应该把这个任务反馈给优化器。

 
埃利布留斯

因为你是在一条线上做预测,如果有一百条类似的线,预测就会更可靠。但平均预测将为零 ))

这对一条线和多条线都是不利的。我们应该把这个任务反馈给优化器。


是的,但首先它应该是正确的,预测不应该这样拉线,它只是显示正确的方向 )

但无论如何,这都是通过相关的废话,这就是为什么我放弃了它...

 
马克西姆-德米特里耶夫斯基

至少,我们需要对图表进行仿生变换,因为图案的斜率角度不同(自仿生结构),其次,在不同的时间段进行搜索。但在使用相关性时,它并没有帮助--它发现了非常不相似的模式

如果相关性的主要问题是"它发现了不是非常相似的模式",那么我们可以简单地对可接受的误差定义更严格的要求,只有非常相似的模式才能被发现。但它不会在每个柱子上出现,而是有时(几个小时一次,就像你的专家顾问的斜率角度)。同样,优化器会选择可接受的误差。
此外,在我的变体中,皮尔逊相关度并不像你的情况那样直接计算,而是计算总误差(筛选出每个条形上的最大可接受误差)。在这种情况下,肯定能找到与该模式最相关的变体,这就是为什么我用相关性来比较。

 
交易员博士

假设有两个价格数组,每个数组有5个价格
第一个是a1,a2,a3,a4,a5
第二个是b1,b2,b3,b4,b5。

1)价格图可以去趋势化,即可以从一些旋转的排列中水平放置。这可以用线性回归 来完成--找到它,并使用误差数组代替原始价格序列。这一步是否有助于模式的寻找,我不知道,我还没有详细研究它的影响。到目前为止,我自己还没有使用这个步骤。

2)把一排价格称为模式是值得怀疑的;必须对这些价格所形成的形状进行数学描述。例如,我们可以找到每个柱子上价格的增长,并将这些增长作为某种模式的描述。
第一个图案由公式a5-a4, a4-a3, a3-a2, a2-a1获得。
第二个是b5-b4,b4-b3,b3-b2,b2-b1。

3)模式的 "相似性"--要么是相关关系(我自己没有检查过),要么是勾股定理的笛卡尔距离(我检查过,结果很好)--
sqrt( ( ((a5-a4)-(b5-b4))^2 + ( (a4-a3)-(b4-b3))^2 + ( (a3-a2)-(b3-b2))^2 + ( (a2-a1)-(b2-b1)) ^2 )
或其他东西,我想一定有更好的选择。

1.你做到了--在深入了解历史时,增加容错率。

2.Lop-side误差计算(每个柱状体上的abs.delta值之和)图表必须在零柱状体上进行初步汇总。
Abs(a5-b5)+ abs(a4-b4)+abs(a3-b3)+abs(a2-b2)+abs(a1-b2)

根据你的变体计算出的误差
abs((a5-a4)-(b5-b4))+abs((a4-a3)-(b4-b3)+....
变换第一要素
abs((a5-a4)-(b5-b4))= abs((a5-b5)+(b4-a4))-

(a5-b5)+(b4-a4)=delta 5 + ( - delta 4),这类似于delta之和,也就是误差。但这不是绝对的delta值的总和,而只是总和,而且是不同符号的delta值的总和。如果相邻的条形图上的误差具有相同的符号,它们就会相互补偿(由于第二个三角洲具有减号的事实)。即使是+1000pts和+1000pts的巨大误差,在你的公式中也会被减为零。它将标记为类似,一个在2个柱子上有+1000点的异常值的图表。尽管在下一个元素上,只计算其中的1个离群值,所产生的误差将抛弃这个变体。
但同样的,这个误差计算功能可能会错过作为一个类似的变体,这样的系列有deltas:0,+10,+15,+12,+5。你的这种组合的公式将比仅仅是每个条形上的绝对delta值的总和(42pt)给出更少的误差(25pt)。

3.这与第2点中的公式相同,有同样的缺点。

 
elibrarius

最简单的方法是在整个序列中逐步移动窗口宽度,并找到delt.的abs.值之和。

0,0,0和1,2,3的误差=(1-0)+(2-0)+(3-0)=6

0,0,1和1,2,3的误差=(1-0)+(2-0)+(3-1)=5

0,1,2和1,2,3的误差=(1-0)+(2-1)+(3-2)=3

1,2,3和1,2,3误差=(1-1)+(2-2)+(3-3)=0

2,3,1和1,2,3误差=(2-1)+(3-2)+Abs(1-3)=4

其中最小的误差就是最大的相似度。


和卷积是一样的,但不是加法和模数,而是一个乘法,并选择最大值,它更快。

0,0,0和1,2,3误差=0*1+0*2+0*3=0

 
吉安尼

和卷积是一样的,但选择的不是加法和模数,而是乘法和最大值,它更快。

0,0,0和1,2,3 = 0*1+0*2+0*3 = 0

你的处理器太酷了!))
我的加减法比乘法更快,只需将第64位等同于零就能找到模数。
 
elibrarius

3.这与第2点的公式相同,缺点也相同。


这都是同样的公式,我只是把它分成三个步骤,使之更加清晰。所以标志不会是一个问题,因为有平方。