交易中的机器学习：理论、模型、实践和算法交易

Mihail Marchukajtes 2020.06.21 15:26 #18381

mytarmailS:

啊哈哈哈))))大笑！！！"。

婊子就是这样的捣蛋鬼之言。Hare to plogiarize!!!!迫不及待地等待着他....

Forester 2020.06.22 14:43 #18382

我想听听大家的建议。
在Darch软件包中，我发现了以下的模型评估选项：
我们计算轨道和oob部分的误差。
然后总误差计算为：
err = oob_error * comb_err_tr + train_err * (1 - comb_err_tr)。

其中comb_err_tr = 0.62。控制火车和OOB部分的误差贡献的乘数。如果它被设置为0，则仅通过火车进行估计。如果你把它设置为1，估计只针对oob。

0.62意味着在总的模型估计中，OOB误差的权重更大一些。

我使用这个配方有一段时间了，但现在有了疑虑。

oob上的误差通常有一个限制，在火车上，如果过度训练，它可能低至0。
大约是这样。(绿色是根据公式估计的误差)

根据这个公式，由于trn误差的减少，误差将不断减少。而且只有当trn停止下降时，它才会停止下降。同时，当过度训练开始后，oob的误差将开始增加。
在我看来，当按公式计算的错误开始增长时停止学习就太晚了。
即使在OOB误差最小的时候也不是最佳状态。由于一个幸运的随机化，我们意外地通过oob找到了最小值，但这可能是对oob的一个调整。
也许我们应该把oob上的最小误差，算作火车上的误差限制？也就是说，当trn上的误差与ob上的最佳误差相等时（我画的是垂直线），就停止训练模型？oob上的错误会更严重，但它既不适合火车也不适合oob。

Valeriy Yastremskiy 2020.06.22 17:16 #18383

elibrarius:

我想听听大家的建议。
在Darch软件包中，我发现了以下的模型评估选项：
我们计算轨道和oob部分的误差。
然后总误差计算为：
err = oob_error * comb_err_tr + train_err * (1 - comb_err_tr)。

其中comb_err_tr = 0.62。控制火车和OOB部分的误差贡献的乘数。如果它被设置为0，则仅通过火车进行估计。如果你把它设置为1，估计只针对oob。

0.62意味着在总的模型估计中，OOB误差的权重更大一些。

我使用这个配方有一段时间了，但现在有了疑虑。

oob上的误差通常有一个限制，在火车上，如果过度训练，它可能低至0。
大约是这样。(绿色是根据公式估计的误差)

根据这个公式，由于trn误差的减少，误差将不断减少。而且只有当trn停止下降时，它才会停止下降。同时，当再训练开始后，OOB的误差将开始增加。
在我看来，当按公式计算的错误开始增长时停止学习就太晚了。
即使在OOB误差最小的时候也不是最佳状态。由于一个幸运的随机化，我们意外地通过oob找到了最小值，但这可能是对oob的一个调整。
也许我们应该把oob上的最小误差，算作火车上的误差限制？也就是说，当trn上的误差与ob上的最佳误差相等时（我画的是垂直线），就停止训练模型？oob上的错误会更严重，但它既不适合火车也不适合oob。

这里面是有逻辑的。误差率是由概率模型决定的，合理的样本量和再训练次数都有一定的最佳规模，其增加并不能改善结果。

Maxim Dmitrievsky 2020.06.23 03:17 #18384

mytarmailS:

通过一个机器人交易员的眼睛看一个交易系统

R - 你只是apuenen!:)

数字滤波器或电平如何？:D

mytarmailS 2020.06.23 06:24 #18385

Maxim Dmitrievsky:

那么，数字滤波器或水平仪是否显示出任何有趣的东西？:D

我做的最后一件事是寻找模式叠加 ...

我们有一个水平--当价格越过它时，我们固定这个模式，并把它作为训练样本来固定。

模式可以是不同的

我寻找当下出现的任何模式，任何能解决某些问题的独特集合。

为了挖掘模式的规则，我使用了"关联规则"，这种方法与通常的方法不同，因为每个训练实例可能包含任何数量的元素，并且不考虑特征的有序性，这对我来说也是好事。

目标 - 找到一个极值，从这个极值开始，将增加10个点

 x[i]==min(x[(i-1):(i+10)])

不是最好的解决方案，但这是我要写的，到目前为止只买了

来自 "arules "软件包的 "apriori "采矿算法

这是被发现的规则，看起来像这样

inspect(head(rules.sorted,20)) 
     lhs                              rhs   support     confidence lift     count
[1]  {(28)(28)(-1);1,(44)(45)(-1)} => {BUY} 0.001017018 0.5769231  3.046559 15   
[2]  {(25)(23)(-1);1,(5)(3)(-1)}   => {BUY} 0.001084819 0.5517241  2.913491 16   
[3]  {(31)(33)(-1),(8)(6)(-1)}     => {BUY} 0.001084819 0.5000000  2.640351 16   
[4]  {(49)(45)(-1),(54)(52)(-1)}   => {BUY} 0.001017018 0.5000000  2.640351 15   
[5]  {(25)(23)(-1),(82)(84)(-1)}   => {BUY} 0.001017018 0.4838710  2.555178 15   
[6]  {(46)(48)(-1),(56)(56)(-1)}   => {BUY} 0.001017018 0.4838710  2.555178 15   
[7]  {(25)(23)(-1);1,(40)(41)(-1)} => {BUY} 0.001017018 0.4838710  2.555178 15   
[8]  {(29)(30)(-1),(37)(39)(-1)}   => {BUY} 0.001017018 0.4838710  2.555178 15   
[9]  {(34)(32)(-1),(76)(74)(-1)}   => {BUY} 0.001898434 0.4745763  2.506096 28   
[10] {(25)(22)(-1),(7)(6)(-1);3}   => {BUY} 0.001152621 0.4722222  2.493665 17   
[11] {(17)(16)(-1);1,(49)(45)(-1)} => {BUY} 0.001017018 0.4687500  2.475329 15   
[12] {(46)(48)(-1),(62)(60)(-1)}   => {BUY} 0.001017018 0.4687500  2.475329 15   
[13] {(20)(21)(-1),(45)(46)(-1)}   => {BUY} 0.001017018 0.4687500  2.475329 15   
[14] {(19)(18)(-1);1,(60)(57)(-1)} => {BUY} 0.001220422 0.4615385  2.437247 18   
[15] {(25)(23)(-1);1,(47)(45)(-1)} => {BUY} 0.001152621 0.4594595  2.426268 17   
[16] {(40)(41)(-1),(71)(71)(-1)}   => {BUY} 0.001152621 0.4594595  2.426268 17   
[17] {(2)(1)(-1);4,(6)(6)(-1)}     => {BUY} 0.001084819 0.4571429  2.414035 16

这是 "1 "条规则（最好的一条）在新数据上的应用。

没有任何篡改，按原样，按顺序，按原样......

自己决定这是否是一个有趣的话题

延续

那么就有可能在这些输入中加入AMO，就像 "在上面 "一样，对 进入/离开 进行过滤。

在提高模式的数量和质量方面有无限的潜力

也许会有一些很酷的东西出来，但我没有精力和导火线，我已经在创造性地喝酒了（（）。

我认为水平是创建TS的最有希望的工具...

在我的理解中，价格水平不是比尔-威廉姆斯的愚蠢分形，而是一个特定价格的事件，很可能是 "很多动作"。

Maxim Dmitrievsky 2020.06.23 07:53 #18386

mytarmailS:

然后你可以把AMO添加到这些输入中，就像 "在上面 "一样，来过滤 进入/不进入。

在提高模式的数量和质量方面有无限的潜力

也许会有一些很酷的东西出来，但我既没有精力也没有能量，我正在进行创造性的饮酒（（）。

当我有足够的精力时，我将阅读）。

mytarmailS 2020.06.23 08:00 #18387

Maxim Dmitrievsky:

等我开窍了再读）。

谷歌的东西比较短，没有什么可读的。

mytarmailS 2020.06.23 14:07 #18388

哦，真他妈见鬼了......人们不喝酒，从不喝酒，从不，....

Mihail Marchukajtes 2020.06.23 14:11 #18389

mytarmailS:
Oh, how f-cked up...人们不酗酒，从不酗酒，从不，....

我知道你的意思。我自己也在反弹的第二天 :-)

Uladzimir Izerski 2020.06.23 17:52 #18390

我看你是想找到一个模式。这就像一毛不拔一样简单）这就是波浪理论。但它目前还没有进入公共领域。

想象一下，你们已经结婚22年了。你今天或明天离婚的可能性有多大？教会机器学习这种理解，然后才会转到更简单的问题--金融市场。

我意识到我很难接近这个话题。

对优素福的话表示敬意。他对历史的连续性和当前的时刻一直都是正确的。以及对未来的重要性。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1839