交易中的机器学习：理论、模型、实践和算法交易

Mihail Marchukajtes 2016.11.03 17:46 #1911

尤里-雷舍托夫。

整个世界都在屏息等待这一时刻的到来。

而现在它终于发生了!

jPrediction的第12版已经发布，它在MQL中生成训练好的三元分类器的代码。MetaTrader用户不再需要将三元分类器代码从Java移植到MQL。现在，MQL的所有代码都存储在扩展名为mqh的文件中。

(热烈的掌声和 "万岁 "的呼喊声)

但这还不是全部。jPrediction 12现在比以前的版本快了12%左右!

(大声鼓掌，同时抛出帽子)

众多的jPrediction用户可以从我的网站上免费下载和使用第12版（链接在我的个人资料中，在我的主页上的第一个帖子）。

(按键的敲击声和显示器上下载指示灯的移动)

祝贺是以口头和书面形式接受的，你也可以通过WebMoney接受礼物和汇款。

我很尴尬地问你，MKUL的哪个版本？4或5？

Yury Reshetov 2016.11.03 17:56 #1912

Mihail Marchukajtes:
我很不好意思地问，为哪个版本的MKUL？4或5？

我在第5版上检查过。但没有OOP和其他典型的只有5版本的功能。这样看来，应该可以与4号机兼容？当然是IMHO，因为我没有检查过4号的情况。

Mihail Marchukajtes 2016.11.03 18:11 #1913

尤里-雷舍托夫。
我在第5个版本上检查了它。但没有OOP和其他典型的只有第五版的功能。因此，似乎应该与第四届会议有兼容性，对吗？当然，我不这么认为，因为我没有在4号机上检查。

很好，我刚刚检查了Prediction生成的代码和我写的代码，结果是一样的。我只是担心，如果我有一个错误，因为你记得1D，现在我已经检查了，结果是相同的。从今天起，买入的信号选择非常糟糕，我决定离开昨天的那个信号，我没有损失，而且我优化了12个版本，效果更好，但我的条目更少......我只有三个。所以总的来说还可以，但明天需要看到更多细节。因此，明天我将报告更多具体内容....总之，今天的油画...自己判断..... 悲伤的抱怨。让我再解释一下，网络定义为 "我不知道 "的信号（没有箭头的点）。我们通过事实来确定。对于今天来说，这是真的。因此，当网友说 "我不知道 "时，我们的意思是，这是真的......。

Vizard_ 2016.11.03 21:09 #1914

Yury Reshetov：jPrediction 的第12版已经发布...

他给别人的榜样是一门科学。
但是，我的上帝，多么令人厌烦
日日夜夜坐在一个病人身边。
没有一步之遥!
多么低劣的阴险
为了取悦一个半死不活的人。
要调整他的枕头。
要把药悲哀地带给他。
并叹息着在心里想。
当魔鬼带走你的时候！））））。

Mihail Marchukajtes 2016.11.04 05:50 #1915

今天和昨天是同一天，所以我决定不重新训练模型，而是对它们进行交易。所以我还不能完全评价第12个版本的工作。但是，当时间到了，我将报告 :-)

mytarmailS 2016.11.05 11:18 #1916

发现了一个软件包，可以让你更深入地了解国防部的算法，我自己完全不懂，但直觉告诉我这个软件包很好，也许有人会感兴趣......

宴会包

Server Muradasilov 2016.11.05 14:15 #1917

.

N+1: научные статьи, новости, открытия

nplus1.ru

Чуть больше, чем наука

Yury Reshetov 2016.11.06 08:08 #1918

第14个版本的jPrediction已经发布。

新版本有一个改进的算法，用于识别和删除模型中不重要的预测因子

你可以从我的网站上免费下载jPrediction 14，并将其用于分类任务（链接在我的个人资料中，在我的主页上最上方的帖子）。

mytarmailS 2016.11.06 12:48 #1919

示例（指标）仅用于说明，我不建议使用指标。

让我们暂时想象一下以下情况：我们有5个预测器和价格，我们需要高概率地预测价格走势（比如，超过70%）），我们事先知道，在这些预测器中只有一个模式可以用来预测市场，并具有如此的准确性。这时，RSI 和随机指数在~50区域做了一个小型的之字形下跌。

s

顺便注意一下，这个图案可以说是在两个视觉平面上，数字的（图案的区域~50）和形象的（之字形-图像），所以在寻找图案时，考虑这样的平面是有意义的......

就这样，在这些预测器中没有更多的工作模式，其他的都是噪音，那前三个指标本来就是噪音，在RSI 和随机指数中只有一个模式，其他的在RSI 和随机指数中也是完全的噪音...

现在让我们想想如何在数据中寻找这种模式......传统的MO能做到吗？

答案是否定的，为什么？

因为MO的目标是为了预测所有的运动，它要么是人字形，要么是跟踪色，要么是......烛台或方向或......或......所有目标都迫使MO预测所有的价格走势，而这在99%以下的噪声预测器中是不可能的......。

我讲一个有寓意的小故事，我创建了一个由20个预测因子组成的合成样本，4个预测因子相互作用，完全解释了目标，其他16个预测因子只是随机噪音，在新数据上训练后，"OOS" 模型猜测了所有的新值，它显示的误差为0%....这个寓言的寓意是：如果数据中存在可以完全解释目标的预测因子，那么MI和OOS都会有正常的表现......我们的结果显示正好相反，在我们输入MI的那些样本中，有超过5%的有用信息可以解释5%的目标，而我们想要100%的信息，你知道乌托邦的方法吗？这就是为什么MO会过度训练，我们让他们过度训练自己，想要100%预测。

所以回到重点，我们如何寻找这些工作模式？我们如何在数据的 "堆叠" 中找到那根稳健的 "针"？

我建议从原则上摆脱MO，我们所需要的只是将每个预测器分解成类似情况（模式）的小块，通过尝试所有可能的组合并与目标组合进行比较，我们就能找到我们要找的东西. ..现在，如何分解预测器？用什么？

答案很简单，尽管我没有马上意识到，我们只需要愚蠢地将每个预测器聚类为，比如说，30个聚类。

我们只是把每个预测器划分到这些群组中，并尝试它们之间的不同组合，我们可以找到一些有效的模式，就像图中一样--当随机指数有群组1，RSI有群组2，就会有增长。

现在介绍一下如何搜索工作模式的要领

这是我们假设的样本，目标。标签是目标，比方说，这意味着增长/下降

dat cluster1 cluster2 cluster3 cluster4 cluster5 target.
                                                
                                                  
                                                   
                                                
                                                
                                                 
                                                 
                                                 
                                                  
                                                 
                                                 
                                                 
                                                  
                                                
                                                 
                                                
                                               
                                                 
                                                 
                                                
                                                 标签1        24        5       18       21       16            1
2         2       15       12        7       22            1
3        13       13       16       29       24            0
4        23       28       22       10        4            1
5         6       12       20       25       11            0xml-ph-00

表1

如何寻找增长的例子

我们寻找在整个抽样中至少重复10次的行，在找到的每一个重复的相同组中，target.label中的 "1 "的数量应该比 "0 "多70%以上。

cluster1 cluster2 cluster3 cluster4 cluster5 target.label                               
                                                 
                                                 
                                                 
                                                 
                                                1        24        5       18       21       16            1
2        24        5       18       21       16            1
3        24        5       18       21       16
4        24        5       18       21       16            1
5        24        5       18       21xml-ph-0032@dee
 塔尔布。2

这里是发现的相同的线条，其一多于零...。

这基本上是我们如何发现集群的组合，这是一个工作模式...

此外，不仅需要尝试每个预测器中所有可能的群组号码组合，而且还需要尝试群组本身的组合，即只取1和4个群组或1、3、5个群组等。

与通常的MO相比，方法的优势，或者说甚至不是优势，它是MO中没有的，但常识说它应该是。

1)该方法只解释它能真正解释的目标部分，而不像所有PM那样试图解释所有100%的目标，包括Reshetova。

2)该方法是深入的--它不只是选择最好的预测者，而是选择预测者本身的最佳情况，这是一种比其他IR更深入的分析方式。

3) 由于第1）和第2）项的原因，该方法自动找到了以下指标

完美分离的特征平面

4）有一些公平的统计障碍，当我们找到一组相同的情况时（见表2），应该有10个最小值（有可能调节），这个最小值给人以希望，对目标的统计结果将是可靠的，在传统的MO中，可能只有两个类似的情况，对目标的结果是，例如，跌倒和所有!MO已经将其视为一个简短的模式，只有两个观察，明白了令人毛骨悚然的情况？

5）有一个公平的概率障碍，当我们找到一组相同的情况时，见表2，这组中的1的数量（很长）应该比0高70%，这也给人希望，概率很强，不是随机的......同样，我们在正常的MO中没有这种情况，多1%的会被认为是一种渴望的模式，这也是令人毛骨悚然的，不是吗？

6) 算法与预测器中的相关性有关，不是所有的IR都能做到这一点。

7）很容易将发现的模式可视化或程序化，简单地说，你可以简单地理解

解释模式，不是所有的IR都能做到这一点

这些例子（指标）只是为了说明问题，我强烈建议不要使用指标

Dr. Trader 2016.11.06 13:48 #1920

mytarmailS:

我不太清楚你说的 "聚类 "是什么意思。通常情况下，你不会对一个特定的预测器进行聚类，而是采取一打预测器，并在空间中找到这些点聚类的区域。例如，在下图中，有两个预测因子，将其聚类为2个聚类，将得到蓝色和红色聚类。

也许你说的是模式？绿色模式--价格先跌后涨。黄色：价格往上走。红色：向上->向下。你明白吗？

交易中的机器学习：理论、模型、实践和算法交易 - 页 192