交易中的机器学习：理论、模型、实践和算法交易

Maxim Dmitrievsky 2017.06.30 21:40 #4361

elibrarius。

我还不确定在斜率差异如此之大的情况下，把这两张图看成是相似的是否正确。用同样的例子。

发现的变体给出了从上行趋势点或趋势结束时的回撤，通过将其转移到形态图上，它将给出下降趋势的延续而不是逆转的预测--本质上是一个反向信号。这里有些不对劲....

但是，如果你驱动测试器，它将很少找到斜率差异非常大的模式，这意味着在某个极限，它将是一个上升的模式，但不是一个下降的模式，并且该结构将与当前的结构有很低的相关性，这就是为什么它从未得到任何结果

Forester 2017.06.30 21:43 #4362

马克西姆-德米特里耶夫斯基。
都是真的，只是模式的斜率有很大的不同，如果斜率有很大的不同，你可以限制搜索，不考虑这种变体，但是如果你运行测试器，它很少会发现斜率有很大差异的变体，它说在一定的限度内，它将不是真正的下降模式，而是上升模式，结构将与当前结构有很低的关联性

好吧，10-15度（通过眼睛）少了多少？而且，不发现任何东西比发现假信号要好。

PS.用Photoshop测量 - 18度

Maxim Dmitrievsky 2017.06.30 21:46 #4363

埃利布留斯。
好吧，10-15度（通过眼睛），少多少？而且，不发现任何东西比发现假信号要好。

即使有完美的50%的巧合，他的预测方向也是错误的）。

顺便说一句，是的，这里的预言曲线计算不正确，我在什么地方搞砸了......而且我已经失去了旧的版本

Forester 2017.06.30 21:50 #4364

马克西姆-德米特里耶夫斯基。

他甚至在做一个50%的完美匹配，并预测了错误的方向)。

因为你是在一个变体的基础上进行预测的，如果有一百个类似的变体，预测的准确性就会更高。但平均预测将为零 ))

对一个人和许多人都不好。我应该把这个任务反馈给优化器。

Maxim Dmitrievsky 2017.06.30 21:51 #4365

埃利布留斯。

因为你是在一条线上做预测，如果有一百条类似的线，预测就会更可靠。但平均预测将为零 ))

这对一条线和多条线都是不利的。我们应该把这个任务反馈给优化器。

是的，但首先它应该是正确的，预测不应该这样拉线，它只是显示正确的方向 )

但无论如何，这都是通过相关的废话，这就是为什么我放弃了它...

Forester 2017.07.01 07:18 #4366

马克西姆-德米特里耶夫斯基。

至少，我们需要对图表进行仿生变换，因为图案的斜率角度不同（自仿生结构），其次，在不同的时间段进行搜索。但在使用相关性时，它并没有帮助--它发现了非常不相似的模式 。

如果相关性的主要问题是"它发现了不是非常相似的模式"，那么我们可以简单地对可接受的误差定义更严格的要求，只有非常相似的模式才能被发现。但它不会在每个柱子上出现，而是有时（几个小时一次，就像你的专家顾问的斜率角度）。同样，优化器会选择可接受的误差。
此外，在我的变体中，皮尔逊相关度并不像你的情况那样直接计算，而是计算总误差（筛选出每个条形上的最大可接受误差）。在这种情况下，肯定能找到与该模式最相关的变体，这就是为什么我用相关性来比较。

Forester 2017.07.01 07:59 #4367

交易员博士。

假设有两个价格数组，每个数组有5个价格
第一个是a1,a2,a3,a4,a5
第二个是b1,b2,b3,b4,b5。

1）价格图可以去趋势化，即可以从一些旋转的排列中水平放置。这可以用线性回归来完成--找到它，并使用误差数组代替原始价格序列。这一步是否有助于模式的寻找，我不知道，我还没有详细研究它的影响。到目前为止，我自己还没有使用这个步骤。

2）把一排价格称为模式是值得怀疑的；必须对这些价格所形成的形状进行数学描述。例如，我们可以找到每个柱子上价格的增长，并将这些增长作为某种模式的描述。
第一个图案由公式a5-a4, a4-a3, a3-a2, a2-a1获得。
第二个是b5-b4，b4-b3，b3-b2，b2-b1。

3）模式的 "相似性"--要么是相关关系（我自己没有检查过），要么是勾股定理的笛卡尔距离（我检查过，结果很好）--
sqrt( ( ((a5-a4)-(b5-b4))^2 + ( (a4-a3)-(b4-b3))^2 + ( (a3-a2)-(b3-b2))^2 + ( (a2-a1)-(b2-b1)) ^2 )
或其他东西，我想一定有更好的选择。

1.你做到了--在深入了解历史时，增加容错率。

2.Lop-side误差计算（每个柱状体上的abs.delta值之和）图表必须在零柱状体上进行初步汇总。
Abs(a5-b5)+ abs(a4-b4)+abs(a3-b3)+abs(a2-b2)+abs(a1-b2)

根据你的变体计算出的误差
abs((a5-a4)-(b5-b4))+abs((a4-a3)-(b4-b3)+....
变换第一要素
abs((a5-a4)-(b5-b4))= abs((a5-b5)+(b4-a4))-

(a5-b5)+(b4-a4)=delta 5 + ( - delta 4)，这类似于delta之和，也就是误差。但这不是绝对的delta值的总和，而只是总和，而且是不同符号的delta值的总和。如果相邻的条形图上的误差具有相同的符号，它们就会相互补偿（由于第二个三角洲具有减号的事实）。即使是+1000pts和+1000pts的巨大误差，在你的公式中也会被减为零。它将标记为类似，一个在2个柱子上有+1000点的异常值的图表。尽管在下一个元素上，只计算其中的1个离群值，所产生的误差将抛弃这个变体。
但同样的，这个误差计算功能可能会错过作为一个类似的变体，这样的系列有deltas：0，+10，+15，+12，+5。你的这种组合的公式将比仅仅是每个条形上的绝对delta值的总和（42pt）给出更少的误差（25pt）。

3.这与第2点中的公式相同，有同样的缺点。

Женя 2017.07.01 12:08 #4368

elibrarius。

最简单的方法是在整个序列中逐步移动窗口宽度，并找到delt.的abs.值之和。

0,0,0和1,2,3的误差=（1-0）+（2-0）+（3-0）=6

0,0,1和1,2,3的误差=（1-0）+（2-0）+（3-1）=5

0,1,2和1,2,3的误差=（1-0）+（2-1）+（3-2）=3

1,2,3和1,2,3误差=(1-1)+(2-2)+(3-3)=0

2,3,1和1,2,3误差=(2-1)+(3-2)+Abs(1-3)=4

其中最小的误差就是最大的相似度。

和卷积是一样的，但不是加法和模数，而是一个乘法，并选择最大值，它更快。

0,0,0和1,2,3误差=0*1+0*2+0*3=0

Forester 2017.07.01 12:35 #4369

吉安尼。

和卷积是一样的，但选择的不是加法和模数，而是乘法和最大值，它更快。

0,0,0和1,2,3 = 0*1+0*2+0*3 = 0

你的处理器太酷了!))
我的加减法比乘法更快，只需将第64位等同于零就能找到模数。

Dr. Trader 2017.07.01 13:11 #4370

elibrarius。

3.这与第2点的公式相同，缺点也相同。

这都是同样的公式，我只是把它分成三个步骤，使之更加清晰。所以标志不会是一个问题，因为有平方。

交易中的机器学习：理论、模型、实践和算法交易 - 页 437