交易中的机器学习:理论、模型、实践和算法交易 - 页 192

 
尤里-雷舍托夫

整个世界都在屏息等待这一时刻的到来。

而现在它终于发生了!

jPrediction的第12版已经发布,它在MQL中生成训练好的三元分类器的代码。MetaTrader用户不再需要将三元分类器代码从Java移植到MQL。现在,MQL的所有代码都存储在扩展名为mqh的文件中。

(热烈的掌声和 "万岁 "的呼喊声)

但这还不是全部。jPrediction 12现在比以前的版本快了12%左右!

(大声鼓掌,同时抛出帽子)

众多的jPrediction用户可以从我的网站上免费下载和使用第12版(链接在我的个人资料中,在我的主页上的第一个帖子)。

(按键的敲击声和显示器上下载指示灯的移动)

祝贺是以口头和书面形式接受的,你也可以通过WebMoney接受礼物和汇款。

我很尴尬地问你,MKUL的哪个版本?4或5?
 
Mihail Marchukajtes:
我很不好意思地问,为哪个版本的MKUL?4或5?
我在第5版上检查过。但没有OOP和其他典型的只有5版本的功能。这样看来,应该可以与4号机兼容?当然是IMHO,因为我没有检查过4号的情况。
 
尤里-雷舍托夫
我在第5个版本上检查了它。但没有OOP和其他典型的只有第五版的功能。因此,似乎应该与第四届会议有兼容性,对吗?当然,我不这么认为,因为我没有在4号机上检查。

很好,我刚刚检查了Prediction生成的代码和我写的代码,结果是一样的。我只是担心,如果我有一个错误,因为你记得1D,现在我已经检查了,结果是相同的。从今天起,买入的信号选择非常糟糕,我决定离开昨天的那个信号,我没有损失,而且我优化了12个版本,效果更好,但我的条目更少......我只有三个。所以总的来说还可以,但明天需要看到更多细节。因此,明天我将报告更多具体内容....总之,今天的油画...自己判断..... 悲伤的抱怨。让我再解释一下,网络定义为 "我不知道 "的信号(没有箭头的点)。我们通过事实来确定。对于今天来说,这是真的。因此,当网友说 "我不知道 "时,我们的意思是,这是真的......。

 
Yury ReshetovjPrediction 的第12版已经发布...
他给别人的榜样是一门科学。
但是,我的上帝,多么令人厌烦
日日夜夜坐在一个病人身边。
没有一步之遥!
多么低劣的阴险
为了取悦一个半死不活的人。
要调整他的枕头。
要把药悲哀地带给他。
并叹息着在心里想。
当魔鬼带走你的时候!))))。
 
今天和昨天是同一天,所以我决定不重新训练模型,而是对它们进行交易。所以我还不能完全评价第12个版本的工作。但是,当时间到了,我将报告 :-)
 

发现了一个软件包,可以让你更深入地了解国防部的算法,我自己完全不懂,但直觉告诉我这个软件包很好,也许有人会感兴趣......

ч

宴会包

 
.
N+1: научные статьи, новости, открытия
  • nplus1.ru
Чуть больше, чем наука
 

第14个版本的jPrediction已经发布。

新版本有一个改进的算法,用于识别和删除模型中不重要的预测因子

你可以从我的网站上免费下载jPrediction 14,并将其用于分类任务(链接在我的个人资料中,在我的主页上最上方的帖子)。

 

示例(指标)仅用于说明,我不建议使用指标。

让我们暂时想象一下以下情况:我们有5个预测器和价格,我们需要高概率地预测价格走势 比如,超过70%)),我们事先知道,在这些预测器中只有一个模式可以用来预测市场,并具有如此的准确性。这时,RSI 随机指数 在~50区域做了一个小型的之字形下跌


sq

顺便注意一下,这个图案可以说是在两个视觉平面上,数字 的(图案的区域~50)和形象的(之字形-图像),所以在寻找图案时,考虑这样的平面是有意义的......

就这样,在这些预测器中没有更多的工作模式,其他的都是噪音,那前三个指标本来就是噪音,在RSI 随机指数 只有一个模式,其他的在RSI 随机 指数 也是完全的噪音...

现在让我们想想如何在数据中寻找这种模式......传统的MO能做到吗?

答案是否定的,为什么?

因为MO的目标是为了预测所有的运动,它要么是人字形,要么是跟踪色,要么是......烛台或方向或......或......所有目标都迫使MO预测所有的价格走势 ,而这在99%以下的噪声预测器中是不可能的......。

我讲一个有寓意的小故事,我创建了一个由20个预测因子组成的合成样本,4个预测因子相互作用,完全解释了目标,其他16个预测因子只是随机噪音,在新数据上训练后,"OOS" 模型猜测了所有的新值,它显示的误差为0%....这个寓言的寓意是:如果数据中存在可以完全解释目标的预测因子,那么MI和OOS 会有 正常的表现......我们的结果显示正好相反,在我们输入MI的那些样本中,有超过5%的有用信息可以解释5%的目标, 而我们想要100%的信息,你知道乌托邦的方法吗? 这就是为什么MO会过度训练,我们让他们过度训练自己,想要100%预测。

所以回到重点,我们如何寻找这些工作模式?我们如何在数据的 "堆叠" 中找到那根稳健的 "针"?

我建议从原则上摆脱MO,我们所需要的只是将每个预测器分解成类似情况(模式)的小块 通过尝试所有可能的组合并与目标组合进行比较,我们就能找到我们要找的东西. ..现在,如何分解预测器? 用什么?

答案很简单,尽管我没有马上意识到,我们只需要愚蠢地将每个预测器聚类为,比如说,30个聚类。

fd

我们只是把每个预测器划分到这些群组中,并尝试它们之间的不同组合,我们可以找到一些有效的模式,就像图中一样--当随机指数有群组1,RSI有群组2,就会有增长。

现在介绍一下如何搜索工作模式的要领

这是我们假设的样本,目标标签 是目标,比方说,这意味着增长/下降

dat cluster1 cluster2 cluster3 cluster4 cluster5 target.
                                                
                                                  
                                                   
                                                
                                                
                                                 
                                                 
                                                 
                                                  
                                                 
                                                 
                                                 
                                                  
                                                
                                                 
                                                
                                               
                                                 
                                                 
                                                
                                                 标签1        24        5       18       21       16            1
2         2       15       12        7       22            1
3        13       13       16       29       24            0
4        23       28       22       10        4            1
5         6       12       20       25       11            0xml-ph-00
表1

如何寻找增长的例子

我们寻找 在整个抽样中至少重复10次的行,在找到的每一个重复的相同组中,target.label中的 "1 "的数量应该比 "0 "多70%以上


cluster1 cluster2 cluster3 cluster4 cluster5 target.label                               
                                                 
                                                 
                                                 
                                                 
                                                1        24        5       18       21       16            1
2        24        5       18       21       16            1
3        24        5       18       21       16
4        24        5       18       21       16            1
5        24        5       18       21xml-ph-0032@dee
 塔尔布。2

这里是发现的相同的线条,其一多于零...。

这基本上是我们如何发现集群的组合,这是一个工作模式...

此外,不仅需要尝试每个预测器中所有可能的群组号码组合,而且还需要尝试群组本身的组合,即只取1和4个群组或1、3、5个群组等。

与通常的MO相比,方法的优势,或者说甚至不是优势,它是MO中没有的,但常识说它应该是。

1)该方法只解释它能真正解释的目标部分,而不像所有PM那样试图解释所有100%的目标,包括Reshetova

2)该方法是深入的--它不只是选择最好的预测者,而是选择预测者本身的最佳情况,这是一种比其他IR更深入的分析方式。

3) 由于第1)和第2)项的原因,该方法自动找到了以下指标
完美分离的特征平面

qe

4)有一些公平的统计障碍,当我们找到一组相同的情况时(见表2),应该有10个最小值(有可能调节),这个最小值给人以希望,对目标的统计结果将是可靠的,在传统的MO中,可能只有两个类似的情况,对目标的结果是,例如,跌倒和所有!MO已经将其视为一个简短的模式,只有两个观察,明白了令人毛骨悚然的情况?

5)有一个公平的概率障碍 当我们找到一组相同的情况时,见表2,这组中的1的数量(很长)应该比0高70%,这也给人希望,概率很强,不是随机的......同样,我们在正常的MO中没有这种情况,多1%的会被认为是一种渴望的模式,这也是令人毛骨悚然的,不是吗?

6) 算法与预测器中的相关性有关,不是所有的IR都能做到这一点。

7)很容易将发现的模式可视化或程序化,简单地说,你可以简单地理解

解释模式,不是所有的IR都能做到这一点

这些例子(指标)只是为了说明问题,我强烈建议不要使用指标

 
mytarmailS:

我不太清楚你说的 "聚类 "是什么意思。通常情况下,你不会对一个特定的预测器进行聚类,而是采取一打预测器,并在空间中找到这些点聚类的区域。例如,在下图中,有两个预测因子,将其聚类为2个聚类,将得到蓝色和红色聚类。

也许你说的是模式?绿色模式--价格先跌后涨。黄色:价格往上走。红色:向上->向下。你明白吗?