Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1288

 
Maxim Dmitrievsky:

d.h. Nicht-Stationarität wird durch den ganzen Mist nicht getötet und Muster werden besser nicht gefunden

Töte die Nicht-Stationarität nicht). Es ist unmöglich, sie zu töten, da man per Definition nichts absolut präzise von irgendeinem BP isolieren kann oder irgendetwas, das sich überhaupt bewegt, von BP isolieren kann, sondern nur einen Teil davon, und nur nach Ihren Kriterien wird ein signifikanter Teil immer in BP bleiben und Nicht-Stationarität erzeugen.

Im Allgemeinen ist Stationarität/Nicht-Stationarität kein sehr gutes Kriterium.

 
Yuriy Asaulenko:

Töten Sie die Nicht-Stationarität nicht). Es ist unmöglich, sie zu töten, weil man per Definition nichts absolut von einem BP isolieren kann oder überhaupt etwas, das sich bewegt, von BP isolieren kann, sondern nur einen Teil davon, und nur nach Ihren Kriterien wird ein signifikanter Teil immer in BP bleiben und Nicht-Stationarität erzeugen.

Im Allgemeinen ist Stationarität/Nicht-Stationarität kein wichtiges Kriterium.

Im nackten BP besteht die Regelmäßigkeit nur in der Zyklizität. Es ist ein Axiom. Wenn sich keine Zyklen ausmachen lassen, funktioniert per Definition nichts.

Der gleiche Versuch, zur Stationarität zu führen, ist ein Versuch, ein konstantes Signal zu isolieren, das es, wie Alexander sagen würde, nicht gibt
 
Maxim Dmitrievsky:

Beim nackten BP ist das Muster nur zyklisch. Dies ist ein Axiom. Wenn Zyklen nicht isoliert werden können, funktioniert per Definition nichts.

Ich denke, das Axiom ist nicht so gut). Nehmen wir zum Beispiel Ton, Musik. Es gibt dort keinen Zyklus, nur einen kurzfristigen, der Rest ist unvorhersehbar. Und selbst in einer kurzfristigen Zyklizität ist man nicht wirklich zu verstehen - ein ganzes Orchester spielt, und jeder hat seinen Teil).

 
Yuriy Asaulenko:

Ich denke, das Axiom ist nicht so gut). Nehmen wir zum Beispiel Ton, Musik. Es gibt dort keine Zyklizität, nur eine kurzfristige, der Rest ist unvorhersehbar. Und selbst bei einer kurzfristigen Zyklizität ist es schwer zu verstehen - es spielt ein ganzes Orchester, und jeder hat seinen eigenen Part).

Es ist ja nicht so, dass jemand versucht hätte, Musik oder Geräusche zurückzuverfolgen. Es gibt eine zyklische, die eine Art von Taktgebern ist, und eine azyklische, die nicht vorhersehbar ist.

es gibt vorhersehbare und unvorhersehbare BPs
 

Abgelehnte Permutation und Entfernung von Prädiktoren um 1 auf dem gültigen Plot. Völlige Zufälligkeit, genau wie auf dem Übungsplatz.

Wichtigkeit der Prädiktoren durch Brute-Force-Verfahren (durch Streichung von 1) gültig
Merkmal, absoluter Wert, Bezugswert * 100
1) 23 0.05544194501249716 100
2) 53 0.04867290288234849 87
3) 32 0.03782135076252724 68
4) 37 0.03541102077687447 63
5) 26 0.03532324097876799 63
6) 33 0.03362697736099274 60
7) 40 0.03278533635676495 59
8) 13 0.03230890464933017 58
9) 60 0.03111487121639406 56
10) 24 0.03067918054294078 55
11) 8 0.02900490852298082 52
12) 10 0.02877257422711971 51
13) 49 0.02715383847459318 48
14) 64 0.02681691125087354 48
15) 38 0.02662037037037041 48
16) 35 0.02532532532532533 45
17) 1 0.02212475633528266 39
18) 57 0.02151192288178594 38
19) 28 0.02077687443541104 37
20) 12 0.01949317738791423 35
21) 11 0.01935357107770902 34
22) 56 0.01921172509407804 34
23) 19 0.01870370370370372 33
24) 27 0.01806684733514002 32
25) 46 0.01805450097021855 32
26) 3 0.0175925925925926 31
27) 42 0.01603966170895305 28
28) 44 0.01603966170895305 28
29) 4 0.01568141958114105 28
30) 54 0.01553166069295103 28
31) 36 0.01553166069295103 28
32) 25 0.01440866453921286 25
33) 63 0.01370370370370372 24
34) 41 0.01329274479959414 23
35) 55 0.01322751322751325 23
36) 15 0.01322751322751325 23
37) 17 0.01289590426080678 23
38) 39 0.01284348864994028 23
39) 7 0.01260422726391314 22
40) 9 0.012243648607285 22
41) 43 0.01221434200157606 22
42) 50 0.01074595722483046 19
43) 62 0.0106090745476935 19
44) 52 0.01058201058201058 19
45) 21 0.009986426216792743 18
46) 59 0.009936766034327027 17
47) 47 0.009652712202287306 17
48) 14 0.009616300104732023 17
49) 58 0.009333730513355176 16
50) 0 0.009109109109109115 16
51) 22 0.008516537928302648 15
52) 5 0.008285913946291301 14
53) 51 0.008285913946291301 14
54) 16 0.007571107018620848 13
55) 6 0.007467144563918782 13
56) 18 0.00722673893405601 13
57) 20 0.006734006734006759 12
58) 45 0.005037037037037062 9
59) 30 0.004840067340067367 8
60) 48 0.003703703703703709 6
61) 29 0.002872678772955772 5
62) 31 0.002849002849002857 5
63) 61 0.001154128632882168 2
64) 34 0.0003138731952291307 0
65) 2 -0.0009033423667569873 -1
Wichtigkeit der Prädiktoren nach der Permutationsmethode
0, absoluter Wert, bezogener Wert * 100
1) 14 0.04838455476753351 99
2) 28 0.04332634521313766 89
3) 40 0.03703703703703703 76
4) 48 0.0356709168184578 73
5) 37 0.03461279461279465 71
6) 26 0.03151827324012757 65
7) 3 0.02880658436213995 59
8) 39 0.02445842068483578 50
9) 34 0.02417848115177496 49
10) 51 0.0228526398739165 47
11) 6 0.02062678062678064 42
12) 52 0.01807496118873364 37
13) 19 0.01765719207579675 36
14) 17 0.01600654282042296 33
15) 50 0.01582491582491585 32
16) 25 0.01527640400043961 31
17) 36 0.01527640400043961 31
18) 44 0.01488195143784271 30
19) 1 0.01475021533161069 30
20) 47 0.01404853128991063 29
21) 33 0.01257220523275571 25
22) 22 0.01227513227513227 25
23) 41 0.01095008051529794 22
24) 7 0.0109137350516661 22
25) 16 0.01020525169131981 21
26) 43 0.009586056644880214 19
27) 4 0.009417989417989436 19
28) 49 0.008301404853129024 17
29) 35 0.007797270955165692 16
30) 27 0.007680976430976427 15
31) 29 0.00753851196329075 15
32) 23 0.00753851196329075 15
33) 59 0.006652765365902091 13
34) 24 0.006644880174291934 13
35) 15 0.006374326849104328 13
36) 13 0.006297363646066811 13
37) 38 0.006224712107065045 12
38) 55 0.005901505901505899 12
39) 10 0.005698005698005715 11
40) 61 0.005642761875448876 11
41) 9 0.005427841634738195 11
42) 42 0.005152979066022578 10
43) 0 0.00490852298081218 10
44) 2 0.003703703703703709 7
45) 30 0.003406967798659233 7
46) 62 0.003122308354866488 6
47) 31 0.003122308354866488 6
48) 64 0.002295252999478359 4
49) 21 0.0008465608465608732 1
50) 11 0.0006224712107065211 1
51) 53 0.0005336748852599049 1
52) 12 0.0005336748852599049 1
53) 58 0.0002916302128900816 0
54) 5 0.0002153316106804914 0
55) 8 -0.0001086130118387874 0
56) 18 -0.0007739082365947891 -1
57) 20 -0.0008417508417508102 -1
58) 54 -0.0009746588693956837 -2 (30)
59) 46 -0.002010582010582018 -4 (25)
60) 32 -0.002348169495143548 -4 (3)
61) 57 -0.003145611364789413 -6 (18)
62) 56 -0.004743162781309929 -9 (22)
63) 45 -0.00597371565113497 -12 (58)
64) 60 -0.007107107107107102 -14 (9)
65) 63 -0.008547008547008517 -17 (33)
in () für die unteren 7 - die Position dieses Prädiktors, wenn er um 1 entfernt wird - Sie können sehen, dass die Position zufällig ist


Und in dem Artikel über diese Methode ist alles sehr schön.

Warum kann das so sein?

In dem Artikel sind alle Prädiktoren (insgesamt 6) wichtig und diese Methode filtert einen Rauschprädiktor gut heraus. Von meinen 65 Prädiktoren kann die Hälfte oder die meisten von ihnen verrauscht sein.

Außerdem ist der Wald immer noch zufällig und bei der Berechnung des Fehlers durch Entfernen von 1 könnten auch zufällige Abweichungen auftreten, die die Bedeutung des Prädiktors auf der Wichtigkeitsskala verschieben könnten.

Was die Permutationsmethode außerdem instabil macht, ist die Tatsache, dass der Baum in der Praxis immer einen anderen Prädiktor finden wird, der eine fast ebenso gute Teilung ist, und die Permutation entfernt diesen Knoten (wodurch das Ergebnis seiner Arbeit zufällig wird).

Bei meinen Daten funktioniert die Permutation (in meiner Version, d. h. durch Neuanordnung der Zeilen des zu prüfenden Prädiktors) im Allgemeinen nicht.

Maxim Sie es anders umgesetzt (etwas mit Normalverteilung). Sie haben keinen Vergleich mit der Entfernung um 1 durchgeführt? Oder haben Sie den Ergebnissen des Artikels Glauben geschenkt?

 
Maxim Dmitrievsky:

Nun, es ist ja nicht so, dass irgendjemand versucht hätte, mit Musik oder Ton zu handeln. Es gibt zyklische in der gleichen Weise, Beats von einer Art, und azyklische unberechenbar.

In der Musik gibt es mehr Zyklizität als auf dem Markt. Auf geht's zum Musik-Trekking! Ich bin sicher, dass die Ergebnisse nicht besser sein werden als auf dem Markt).

 
elibrarius:

Ich habe Permutation und Entfernung von Prädiktoren 1 zu einer Zeit. Völlige Zufälligkeit, genau wie auf dem Übungsplatz.
Und in dem Artikel über diese Methode ist alles sehr schön.

Warum kann das so sein?

In dem Artikel sind alle Prädiktoren (insgesamt 6) wichtig, und diese Methode eliminiert einen verrauschten Prädiktor sehr gut. Von meinen 65 Prädiktoren kann die Hälfte oder die meisten von ihnen verrauscht sein.

Außerdem ist der Wald immer noch zufällig und bei der Berechnung des Fehlers durch Entfernen von 1 könnte es auch zufällige Abweichungen geben, die die Bedeutung des Prädiktors auf der Wichtigkeitsskala verschieben könnten.

Was die Permutationsmethode außerdem instabil macht, ist die Tatsache, dass der Baum in der Praxis immer einen anderen Prädiktor finden wird, der eine fast ebenso gute Teilung ist, und die Permutation entfernt diesen Knoten (wodurch das Ergebnis seiner Arbeit zufällig wird).

Bei meinen Daten funktioniert die Permutation (in meiner Version, d. h. durch Neuanordnung der Zeilen des zu prüfenden Prädiktors) im Allgemeinen nicht.

Maxim Sie es anders umgesetzt (etwas mit Normalverteilung). Sie haben keinen Vergleich mit der Entfernung um 1 durchgeführt? Oder haben Sie den Ergebnissen des Artikels Glauben geschenkt?

Zunächst müssen Sie die Korrelationen entflechten (falls Sie das noch nicht getan haben), d. h. alle Korrelationen entfernen, die mindestens 0,9 betragen. Sonst funktioniert die Permutation nicht

Ich bin nicht wirklich auf Vergleiche eingegangen, sondern habe nur gesehen, dass es Fehler reduziert, unnötiges Zeug entfernt und das Modell vereinfacht (fast keine Verluste), das sind zwei

Ich kann einige Beispiele in Python für andere Modelle finden und mit dem vergleichen, was ich durch alglib bekam, aber ich bin zu langweilig

 
Maxim Dmitrievsky:

Zunächst einmal müssen Sie die Korrelate entzerren (falls Sie das nicht schon getan haben), d. h. alle Korrelate über, sagen wir, mindestens 0,9 entfernen. Andernfalls funktioniert die Umbildung nicht.

Ich habe nicht tief in die Vergleiche, ich sah nur, dass es reduziert Fehler dieser Zeit, wirft unnötige Dinge und vereinfacht Modell (fast ohne Verluste), die zwei ist
Ich habe es mit Entfernung durch Spearman 0.9 versucht, keine Verbesserung.
 
elibrarius:
Ich habe es mit Spearman 0.9 versucht, keine Verbesserung.

wie hoch sind die endgültigen Fehler? beide Modelle und wie sie mit den neuen Daten funktionieren

Mann, das ist eine sehr tiefgreifende Analyse, die man machen muss.

 
Yuriy Asaulenko:

In der Musik gibt es viel mehr Zyklizität als auf dem Markt. Auf geht's zum Musik-Trekking! Ich bin sicher, dass die Ergebnisse nicht besser sein werden als auf dem Markt).

Sie können auch einfach im Kreis laufen und mit den Armen fuchteln, das Ergebnis ist in etwa das gleiche)