交易中的机器学习:理论、模型、实践和算法交易 - 页 1839

 
mytarmailS:

啊哈哈哈))))大笑!!!"。

婊子就是这样的捣蛋鬼之言。Hare to plogiarize!!!!迫不及待地等待着他....
 

我想听听大家的建议。
在Darch软件包中,我发现了以下的模型评估选项:
我们计算轨道和oob部分的误差。
然后总误差计算为:
err = oob_error * comb_err_tr + train_err * (1 - comb_err_tr)。

其中comb_err_tr = 0.62。控制火车和OOB部分的误差贡献的乘数。如果它被设置为0,则仅通过火车进行估计。如果你把它设置为1,估计只针对oob。

0.62意味着在总的模型估计中,OOB误差的权重更大一些。

我使用这个配方有一段时间了,但现在有了疑虑。

oob上的误差通常有一个限制,在火车上,如果过度训练,它可能低至0。
大约是这样。(绿色是根据公式估计的误差)




根据这个公式,由于trn误差的减少,误差将不断减少。而且只有当trn停止下降时,它才会停止下降。同时,当过度训练开始后,oob的误差将开始增加。
在我看来,当按公式计算的错误开始增长时停止学习就太晚了。
即使在OOB误差最小的时候也不是最佳状态。由于一个幸运的随机化,我们意外地通过oob找到了最小值,但这可能是对oob的一个调整。
也许我们应该把oob上的最小误差,算作火车上的误差限制?也就是说,当trn上的误差与ob上的最佳误差相等时(我画的是垂直线),就停止训练模型?oob上的错误会更严重,但它既不适合火车也不适合oob。

 
elibrarius:

我想听听大家的建议。
在Darch软件包中,我发现了以下的模型评估选项:
我们计算轨道和oob部分的误差。
然后总误差计算为:
err = oob_error * comb_err_tr + train_err * (1 - comb_err_tr)。

其中comb_err_tr = 0.62。控制火车和OOB部分的误差贡献的乘数。如果它被设置为0,则仅通过火车进行估计。如果你把它设置为1,估计只针对oob。

0.62意味着在总的模型估计中,OOB误差的权重更大一些。

我使用这个配方有一段时间了,但现在有了疑虑。

oob上的误差通常有一个限制,在火车上,如果过度训练,它可能低至0。
大约是这样。(绿色是根据公式估计的误差)




根据这个公式,由于trn误差的减少,误差将不断减少。而且只有当trn停止下降时,它才会停止下降。同时,当再训练开始后,OOB的误差将开始增加。
在我看来,当按公式计算的错误开始增长时停止学习就太晚了。
即使在OOB误差最小的时候也不是最佳状态。由于一个幸运的随机化,我们意外地通过oob找到了最小值,但这可能是对oob的一个调整。
也许我们应该把oob上的最小误差,算作火车上的误差限制?也就是说,当trn上的误差与ob上的最佳误差相等时(我画的是垂直线),就停止训练模型?oob上的错误会更严重,但它既不适合火车也不适合oob。

这里面是有逻辑的。误差率是由概率模型决定的,合理的样本量和再训练次数都有一定的最佳规模,其增加并不能改善结果。

 
mytarmailS:

通过一个机器人交易员的眼睛看一个交易系统

R - 你只是apuenen!:)

数字滤波器 或电平如何?:D

 
Maxim Dmitrievsky:

那么,数字滤波器 或水平仪是否显示出任何有趣的东西?:D

我做的最后一件事是寻找模式叠加 ...

我们有一个水平--当价格越过它时,我们固定这个模式,并把它作为训练样本来固定。

模式可以是不同的

我寻找当下出现的任何模式,任何能解决某些问题的独特集合。


为了挖掘模式的规则,我使用了"关联规则",这种方法与通常的方法不同,因为每个训练实例可能包含任何数量的元素,并且不考虑特征的有序性,这对我来说也是好事。


目标 - 找到一个极值,从这个极值开始,将增加10个点

 x[i]==min(x[(i-1):(i+10)])

不是最好的解决方案,但这是我要写的,到目前为止只买了


来自 "arules "软件包的 "apriori "采矿算法


这是被发现的规则,看起来像这样

inspect(head(rules.sorted,20)) 
     lhs                              rhs   support     confidence lift     count
[1]  {(28)(28)(-1);1,(44)(45)(-1)} => {BUY} 0.001017018 0.5769231  3.046559 15   
[2]  {(25)(23)(-1);1,(5)(3)(-1)}   => {BUY} 0.001084819 0.5517241  2.913491 16   
[3]  {(31)(33)(-1),(8)(6)(-1)}     => {BUY} 0.001084819 0.5000000  2.640351 16   
[4]  {(49)(45)(-1),(54)(52)(-1)}   => {BUY} 0.001017018 0.5000000  2.640351 15   
[5]  {(25)(23)(-1),(82)(84)(-1)}   => {BUY} 0.001017018 0.4838710  2.555178 15   
[6]  {(46)(48)(-1),(56)(56)(-1)}   => {BUY} 0.001017018 0.4838710  2.555178 15   
[7]  {(25)(23)(-1);1,(40)(41)(-1)} => {BUY} 0.001017018 0.4838710  2.555178 15   
[8]  {(29)(30)(-1),(37)(39)(-1)}   => {BUY} 0.001017018 0.4838710  2.555178 15   
[9]  {(34)(32)(-1),(76)(74)(-1)}   => {BUY} 0.001898434 0.4745763  2.506096 28   
[10] {(25)(22)(-1),(7)(6)(-1);3}   => {BUY} 0.001152621 0.4722222  2.493665 17   
[11] {(17)(16)(-1);1,(49)(45)(-1)} => {BUY} 0.001017018 0.4687500  2.475329 15   
[12] {(46)(48)(-1),(62)(60)(-1)}   => {BUY} 0.001017018 0.4687500  2.475329 15   
[13] {(20)(21)(-1),(45)(46)(-1)}   => {BUY} 0.001017018 0.4687500  2.475329 15   
[14] {(19)(18)(-1);1,(60)(57)(-1)} => {BUY} 0.001220422 0.4615385  2.437247 18   
[15] {(25)(23)(-1);1,(47)(45)(-1)} => {BUY} 0.001152621 0.4594595  2.426268 17   
[16] {(40)(41)(-1),(71)(71)(-1)}   => {BUY} 0.001152621 0.4594595  2.426268 17   
[17] {(2)(1)(-1);4,(6)(6)(-1)}     => {BUY} 0.001084819 0.4571429  2.414035 16 


这是 "1 "条规则(最好的一条)在新数据上的应用。

没有任何篡改,按原样,按顺序,按原样......

自己决定这是否是一个有趣的话题

延续


那么就有可能在这些输入中加入AMO,就像 "在上面 "一样,对 进入/离开 进行过滤。

在提高模式的数量和质量方面有无限的潜力

也许会有一些很酷的东西出来,但我没有精力和导火线,我已经在创造性地喝酒了(()。



我认为水平是创建TS的最有希望的工具...

在我的理解中,价格水平不是比尔-威廉姆斯的愚蠢分形,而是一个特定价格的事件,很可能是 "很多动作"。

 
mytarmailS:

然后你可以把AMO添加到这些输入中,就像 "在上面 "一样,来过滤 进入/不进入

在提高模式的数量和质量方面有无限的潜力

也许会有一些很酷的东西出来,但我既没有精力也没有能量,我正在进行创造性的饮酒(()。

当我有足够的精力时,我将阅读)。

 
Maxim Dmitrievsky:

等我开窍了再读)。

谷歌的东西比较短,没有什么可读的。

 
哦,真他妈见鬼了......人们不喝酒,从不喝酒,从不,....
 
mytarmailS:
Oh, how f-cked up...人们不酗酒,从不酗酒,从不,....
我知道你的意思。我自己也在反弹的第二天 :-)
 

我看你是想找到一个模式。这就像一毛不拔一样简单)这就是波浪理论。但它目前还没有进入公共领域。

想象一下,你们已经结婚22年了。你今天或明天离婚的可能性有多大?教会机器学习这种理解,然后才会转到更简单的问题--金融市场。

我意识到我很难接近这个话题。

对优素福的话表示敬意。他对历史的连续性和当前的时刻一直都是正确的。以及对未来的重要性。