交易中的机器学习:理论、模型、实践和算法交易 - 页 1288

 
马克西姆-德米特里耶夫斯基

也就是说,非稳态性不会被那些废话杀死,模式最好不要被发现。

不要扼杀非平稳性)。要杀死它是不可能的,因为根据定义,你不可能绝对精确地把任何东西从任何BP中分离出来,也不可能把任何完全移动的东西从BP中分离出来,而只能是其中的一部分,而且只有按照你的标准,相当一部分将永远留在BP中,并将产生非平稳性。

一般来说,静止性-非静止性并不是一个很好的标准。

 
尤里-阿索连科

不要扼杀非稳态性)。要杀死它是不可能的,因为根据定义,你不可能将任何东西从任何BP中绝对隔离出来,也不可能将任何移动的东西从BP中隔离出来,而只能是其中的一部分,而且只有按照你的标准,相当一部分将永远留在BP中,并将产生非平稳性。

一般来说,静止性-非静止性并不是什么标准。

在赤裸裸的BP中,规律性只存在于周期性中。这是一个公理。如果周期不能被单列出来,根据定义,没有任何东西是有效的。

导致静止性的同样尝试是试图分离出一个恒定的信号,正如亚历山大所说,这个信号并不存在
 
马克西姆-德米特里耶夫斯基

在赤裸裸的BP中,这种模式只是周期性的。这是一个公理。如果循环不能被隔离,那么根据定义,没有任何东西可以发挥作用。

我认为这个公理是一般的)。以声音、音乐为例,说。那里没有周期,只有一个短期的周期,其余的都是不可预测的。而且,即使在短期的周期性中,你也不是真正可以理解的--整个管弦乐队在演奏,每个人都有自己的角色)。

 
尤里-阿索连科

我认为这个公理是一般的)。以声音、音乐为例,说。那里没有周期性,只有短期,其余的都是不可预测的。而即使是短期的周期性,也很难理解--整个乐团在演奏,每个人都有自己的角色)。

又没有人试图去追踪音乐或声音。有一个循环的,有某种节拍的,还有一个非循环的,是不可预测的。

有可预测的BP,也有不可预测的BP
 

在有效图上拒绝了烫发和去除预测因子的1。完全的随机性,就像在训练图上一样。

通过暴力手段(通过删除1)预测因子的重要性有效
,特征,绝对值,相关值*100
1) 23 0.05544194501249716 100
2) 53 0.04867290288234849 87
3) 32 0.03782135076252724 68
4) 37 0.03541102077687447 63
5) 26 0.03532324097876799 63
6) 33 0.03362697736099274 60
7) 40 0.03278533635676495 59
8) 13 0.03230890464933017 58
9) 60 0.03111487121639406 56
10) 24 0.03067918054294078 55
11) 8 0.02900490852298082 52
12) 10 0.02877257422711971 51
13) 49 0.02715383847459318 48
14) 64 0.02681691125087354 48
15) 38 0.02662037037037041 48
16) 35 0.02532532532532533 45
17) 1 0.02212475633528266 39
18) 57 0.02151192288178594 38
19) 28 0.02077687443541104 37
20) 12 0.01949317738791423 35
21) 11 0.01935357107770902 34
22) 56 0.01921172509407804 34
23) 19 0.01870370370370372 33
24) 27 0.01806684733514002 32
25) 46 0.01805450097021855 32
26) 3 0.0175925925925926 31
27) 42 0.01603966170895305 28
28) 44 0.01603966170895305 28
29) 4 0.01568141958114105 28
30) 54 0.01553166069295103 28
31) 36 0.01553166069295103 28
32) 25 0.01440866453921286 25
33) 63 0.01370370370370372 24
34) 41 0.01329274479959414 23
35) 55 0.01322751322751325 23
36) 15 0.01322751322751325 23
37) 17 0.01289590426080678 23
38) 39 0.01284348864994028 23
39) 7 0.01260422726391314 22
40) 9 0.012243648607285 22
41) 43 0.01221434200157606 22
42) 50 0.01074595722483046 19
43) 62 0.0106090745476935 19
44) 52 0.01058201058201058 19
45) 21 0.009986426216792743 18
46) 59 0.009936766034327027 17
47) 47 0.009652712202287306 17
48) 14 0.009616300104732023 17
49) 58 0.009333730513355176 16
50) 0 0.009109109109109115 16
51) 22 0.008516537928302648 15
52) 5 0.008285913946291301 14
53) 51 0.008285913946291301 14
54) 16 0.007571107018620848 13
55) 6 0.007467144563918782 13
56) 18 0.00722673893405601 13
57) 20 0.006734006734006759 12
58) 45 0.005037037037037062 9
59) 30 0.004840067340067367 8
60) 48 0.003703703703703709 6
61) 29 0.002872678772955772 5
62) 31 0.002849002849002857 5
63) 61 0.001154128632882168 2
64) 34 0.0003138731952291307 0
65) 2 -0.0009033423667569873 -1
根据互换法,预测因子的重要性
0,绝对值,相关值*100
1) 14 0.04838455476753351 99
2) 28 0.04332634521313766 89
3) 40 0.03703703703703703 76
4) 48 0.0356709168184578 73
5) 37 0.03461279461279465 71
6) 26 0.03151827324012757 65
7) 3 0.02880658436213995 59
8) 39 0.02445842068483578 50
9) 34 0.02417848115177496 49
10) 51 0.0228526398739165 47
11) 6 0.02062678062678064 42
12) 52 0.01807496118873364 37
13) 19 0.01765719207579675 36
14) 17 0.01600654282042296 33
15) 50 0.01582491582491585 32
16) 25 0.01527640400043961 31
17) 36 0.01527640400043961 31
18) 44 0.01488195143784271 30
19) 1 0.01475021533161069 30
20) 47 0.01404853128991063 29
21) 33 0.01257220523275571 25
22) 22 0.01227513227513227 25
23) 41 0.01095008051529794 22
24) 7 0.0109137350516661 22
25) 16 0.01020525169131981 21
26) 43 0.009586056644880214 19
27) 4 0.009417989417989436 19
28) 49 0.008301404853129024 17
29) 35 0.007797270955165692 16
30) 27 0.007680976430976427 15
31) 29 0.00753851196329075 15
32) 23 0.00753851196329075 15
33) 59 0.006652765365902091 13
34) 24 0.006644880174291934 13
35) 15 0.006374326849104328 13
36) 13 0.006297363646066811 13
37) 38 0.006224712107065045 12
38) 55 0.005901505901505899 12
39) 10 0.005698005698005715 11
40) 61 0.005642761875448876 11
41) 9 0.005427841634738195 11
42) 42 0.005152979066022578 10
43) 0 0.00490852298081218 10
44) 2 0.003703703703703709 7
45) 30 0.003406967798659233 7
46) 62 0.003122308354866488 6
47) 31 0.003122308354866488 6
48) 64 0.002295252999478359 4
49) 21 0.0008465608465608732 1
50) 11 0.0006224712107065211 1
51) 53 0.0005336748852599049 1
52) 12 0.0005336748852599049 1
53) 58 0.0002916302128900816 0
54) 5 0.0002153316106804914 0
55) 8 -0.0001086130118387874 0
56) 18 -0.0007739082365947891 -1
57) 20 -0.0008417508417508102 -1
58) 54 -0.0009746588693956837 -2 (30)
59) 46 -0.002010582010582018 -4 (25)
60) 32 -0.002348169495143548 -4 (3)
61) 57 -0.003145611364789413 -6 (18)
62) 56 -0.004743162781309929 -9 (22)
63) 45 -0.00597371565113497 -12 (58)
64) 60 -0.007107107107107102 -14 (9)
65) 63 -0.008547008547008517 -17 (33)
在()中为最下面的7--这个预测器的位置被移除1时--你可以看到这个位置是随机的。


而在关于这种方法的文章中,一切都非常好。

为什么会这样呢?

在文章中,所有的预测器(共6个)都很重要,这种方法可以很好地筛除一个噪音预测器。在我的65个预测器中,有一半或大部分可能是噪音。

再加上森林仍然是随机的,在通过去除1来计算误差时,也可能引入随机偏差,这可能会改变预测者在重要程度上的重要性。

另外,使包络法不稳定的是,在实践中,树总是会找到另一个预测器,这几乎是一个好的划分,而包络法有点像删除这个节点(使其工作结果随机化)。

一般来说,在我的数据上,互换(在我的版本中,即通过重新排列被检查的预测器的行)不起作用。

马克西姆你以不同的方式实现它(具有正态分布的东西)。你没有做一个与去除1的比较?还是你把文章中的结果当做信仰?

 
马克西姆-德米特里耶夫斯基

好吧,又没有人试图交易音乐或声音。有周期性的,有某种节拍的,还有非周期性的不可预测的。

声音、音乐的周期性比市场的周期性更强。让我们在音乐上跋涉!我确信,其结果不会比市场上的好)。

 
elibrarius

我已经有了一次1个预测因子的互换和删除。完全的随机性,就像在训练图上一样。
而在关于这种方法的文章中,一切都非常好。

为什么会这样呢?

在文章中,所有的预测因子(共6个)都很重要,这种方法可以很好地消除一个嘈杂的预测因子。在我的65个预测器中,有一半或大部分可能是噪音。

再加上森林仍然是随机的,在通过去除1来计算误差时,也可能存在随机偏差,这可能会改变预测者在重要程度上的重要性。

另外,使包络法不稳定的是,在实践中,树总是会找到另一个预测器,这几乎是一个好的划分,而包络法有点像删除这个节点(使其工作结果随机化)。

一般来说,在我的数据上,互换(在我的版本中,即通过重新排列被检查的预测器的行)不起作用。

马克西姆你以不同的方式实现它(具有正态分布的东西)。你没有做一个与去除1的比较?还是你把文章中的结果当做信仰?

首先,你需要decrelate(如果你还没有这样做的话),即删除所有的相关性,比如说,至少在0.9以上。否则渗透法就不起作用了

我没有真正去比较,我只是看到它减少了错误一,删除了不必要的东西,简化了模型(几乎没有损失),这就是二。

我可能会在python中找到一些其他模型的例子,并与我通过alglib得到的东西进行比较,但我太无聊了。

 
马克西姆-德米特里耶夫斯基

首先,你需要进行decorrelate(如果你还没有这样做的话),即删除所有高于例如至少0.9的相关因素。否则,重新洗牌就不会成功

我没有深入比较,我只是看到这次减少了错误,扔掉了不必要的东西,简化了模型(几乎没有损失),这是两个
我试着用Spearman 0.9去除,没有改善。
 
elibrarius
我用Spearman 0.9试了一下,没有改善。

两种模型的最终误差是多少? 两种模型以及它们在新数据上的工作情况

伙计,这是一个非常深刻的分析。

 
尤里-阿索连科

在声音方面,在音乐方面,比市场上有更多的周期性。让我们在音乐上跋涉!我相信结果不会比市场上的好)。

你可以简单地跑一圈,挥舞手臂,结果也差不多)