Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2131

 

Ich denke dabei an eine "vollständige Suche" nach Regelmäßigkeiten, ohne ein Ziel wie "was wird bei der nächsten Kerze passieren" und dergleichen...

Die Suche besteht darin, nur Regelmäßigkeiten zu suchen, das Ziel ist es, eine Regelmäßigkeit zu finden, und nicht "was wird auf der nächsten Kerze sein", auch können Regelmäßigkeiten in der Zeit gestreckt werden, zum Beispiel, wenn heute "Ereignis 1" war und dann "Ereignis 2", und dann "Ereignis 3"... zum Beispiel, wenn wir heute "Ereignis 1" und dann " Ereignis 3" haben , dann wird es morgen um 14:05 Uhr eine steigende Kerze oder etwas Ähnliches sein))

Ich habe eine bessere Vorstellung davon, wie es aussehen sollte und welchen Algorithmus ich anwenden könnte, aber dazu bräuchte ich wahrscheinlich etwas Rechenleistung, die ich nicht habe (


Übrigens eine Frage: Wie viele Wiederholungen eines Ereignisses sind nötig, um es als Muster zu betrachten?

 
elibrarius:

Theoretisch sollte es dasselbe sein.
Die Anzahl der verschiedenen Optionen in Tagen, Stunden und Minuten entspricht der Anzahl der Optionen in Sinus und Kosinus. In beiden Fällen gibt es 10080 verschiedene Werte in 7 Tagen, die sich einmal pro Minute ändern.
Wenn es eine Randomisierung in der Ausbildung gibt, könnte dies der Grund für den Unterschied sein.

Womit haben Sie trainiert, mit einer Katzenbüste?

Experimente sind immer wichtiger.

Betrachten Sie den ersten Prädiktor T1 (Den_Nedeli_S), genauer gesagt sein Raster

T2


Und Wochentage ohne Zeitumstellung.

Wie Sie sehen, sind die Raster unterschiedlich und es gibt unterschiedliche Deltas zwischen den Ziffern, obwohl die Partitionierungseinstellungen die gleichen sind:

catboost-0.24.1.exe fit  --learn-set train.csv   --test-set test.csv     --column-description %%a        --has-header    --delimiter ;   --model-format CatboostBinary,CPP       --train-dir ..\Rezultat\RS_208\result_4_%%a     --depth 6       --iterations 1000       --nan-mode Forbidden    --learning-rate 0.03    --rsm 1         --fold-permutation-block 1      --boosting-type Plain   --l2-leaf-reg 6         --loss-function Logloss         --use-best-model        --eval-metric Logloss   --custom-metric Logloss         --od-type Iter  --od-wait 100   --random-seed 0         --random-strength 1     --auto-class-weights SqrtBalanced       --sampling-frequency PerTreeLevel       --border-count 208      --feature-border-type MinEntropy        --output-borders-file quant_4_00208.csv         --bootstrap-type Bayesian       --bagging-temperature 1         --leaf-estimation-method Newton         --leaf-estimation-iterations 10        

Das bedeutet, dass Sie den Split genauer anpassen können, was entweder zu einem passenden oder einem besseren Ergebnis führen kann...

 
mytarmailS:

Ich denke dabei an eine "vollständige Suche" nach Regelmäßigkeiten, ohne ein Ziel wie "was wird bei der nächsten Kerze passieren" und dergleichen...

Die Suche besteht darin, nur Regelmäßigkeiten zu suchen, das Ziel ist es, eine Regelmäßigkeit zu finden, und nicht "was wird auf der nächsten Kerze sein", auch können Regelmäßigkeiten in der Zeit gestreckt werden, zum Beispiel, wenn heute "Ereignis 1" war und dann "Ereignis 2", und dann "Ereignis 3"... zum Beispiel, wenn wir heute "Ereignis 1" und dann " Ereignis 3" haben , dann wird es morgen um 14:05 Uhr eine steigende Kerze oder etwas Ähnliches sein))

Ich habe eine bessere Vorstellung davon, wie es aussehen sollte und welcher Algorithmus anzuwenden ist, aber das würde wahrscheinlich eine Menge Rechenleistung erfordern, die ich nicht habe(

Oh, ich werde auch etwas Ähnliches machen :))))


mytarmailS:

Übrigens, eine solche Frage, wie viele Wiederholungen eines Ereignisses, um es als Muster zu betrachten?

Ich verwende das Kriterium - nicht weniger als 1 % der gesamten Stichprobe - und es ist die "Häufigkeit" des Wiederauftretens eines Ereignisses mit demselben Ergebnis, die wichtig ist. Ich weiß nicht, wie man die "Frequenz" messen kann.

 
Aleksey Vyazmikin:

Experimente sind immer wichtiger.

Betrachten Sie den ersten Prädiktor T1 (Den_Nedeli_S), oder besser gesagt sein Raster

T2


Und Wochentage ohne Zeitumstellung

Wie Sie sehen, sind die Raster unterschiedlich und es gibt unterschiedliche Deltas zwischen den Ziffern, obwohl die Partitionierungseinstellungen die gleichen sind:

Das bedeutet, dass Sie den Spalt genauer anpassen können, was entweder zu einem passenden oder einem besseren Ergebnis führen kann...

GUT. Sinus+Cosinus ist nicht nur für NS, sondern auch für Bäume besser.

 
elibrarius:

Gut. Sinus+Kosinus ist nicht nur für NS, sondern auch für Bäume besser.

Ich würde keine voreiligen Schlüsse ziehen - bis jetzt können wir sagen, dass das Ergebnis nicht identisch ist.

 

Rad der Zeit


.

 
mytarmailS:

Ich überlege, eine "Vollsuche" durchzuführen .....

Ich gebe einfach die Uhrzeit und den Wochentag sowie die Farbe der Kerze ein...

Daten als eine einzige Woche, insgesamt vierzig Wochen, und suchte nach Mustern darin


Freitag_18:20_dw bedeutet Freitag - 18:20 - fallende Kerze


Konfidenz - Prozentsatz der funktionierenden Regel 1 ist 100%

Anzahl - wie viele solcher Regeln wurden gefunden

 lhs                          rhs           support confidence coverage lift     count
[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[2]  {Пт_16:15_up}             => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[3]  {Пн_21:0_dw}              => {Пт_5:0_dw}   0.500   1          0.500    1.290323 20   
[4]  {Ср_12:50_dw}             => {Чт_22:55_up} 0.525   1          0.525    1.538462 21   
[5]  {Пт_18:40_dw,Ср_22:15_dw} => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[6]  {Пн_0:0_dw,Пн_9:20_dw}    => {Пн_23:55_dw} 0.500   1          0.500    1.428571 20   
[7]  {Вт_20:40_up,Пн_0:0_dw}   => {Вт_21:5_up}  0.500   1          0.500    1.481481 20   
[8]  {Вт_9:40_dw,Пн_14:50_up}  => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   
[9]  {Пн_0:0_dw,Чт_1:10_dw}    => {Чт_2:55_dw}  0.500   1          0.500    1.379310 20   
[10] {Пт_9:25_up,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[11] {Пн_14:50_up,Пт_9:25_up}  => {Ср_2:5_dw}   0.500   1          0.500    1.538462 20   
[12] {Вт_13:0_dw,Ср_2:5_dw}    => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[13] {Чт_23:55_dw,Чт_4:20_dw}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[14] {Вт_18:55_dw,Пт_1:0_up}   => {Пн_14:50_up} 0.500   1          0.500    1.290323 20   
[15] {Вт_18:55_dw,Чт_1:0_up}   => {Пн_14:50_up} 0.525   1          0.525    1.290323 21   
[16] {Вт_2:45_up,Пн_9:50_dw}   => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   
[17] {Вт_2:45_up,Ср_20:40_up}  => {Пн_0:0_dw}   0.500   1          0.500    1.250000 20   


diese Vorschrift

[1]  {Пт_18:20_dw}             => {Чт_1:0_up}   0.500   1          0.500    1.290323 20   

Das bedeutet, wenn am Donnerstag um 1 Uhr morgens eine steigende Kerze zu sehen war, wird sie am Freitag um 18:20 Uhr fallen. Es wurden 20 Regeln gefunden, also hat die Regel in 20 von 20 Fällen funktioniert.

IDD...

 
Aleksey Vyazmikin:


Ich verwende das Kriterium von mindestens 1 % der gesamten Stichprobe, und die "Häufigkeit" eines Ereignisses mit demselben Ergebnis ist wichtig. Ich weiß nicht, wie man die "Häufigkeit" messen kann.

Gleiche Ereignisse sind Ereignisse mit gleichem Ausgang.

100% der Probe / % Wiederholung. 1 % ist eine Häufigkeit, aber keine Regelmäßigkeit. Das ist der Punkt, an dem es knifflig wird. Wir unterteilen sie in Zeiträume und sehen, wie regelmäßig die Ereignisse sind. Sie können einfach das Minimum und das Maximum in einem Zeitraum verwenden und das Minimum durch das Maximum teilen, um eine relative Regelmäßigkeit zu erhalten, und Sie können den quadratischen Mittelwert verwenden).

 
Oleg avtomat:

das Rad der Zeit

Wenn man weitere harmonische Minuten hinzufügt und die Sinuskurven addiert, erhält man eine Kurve, die die drei Vorzeichen beschreibt

Was ist mit den Wochenenden und Feiertagen, das muss man alles berücksichtigen, was soll das bringen?
 
mytarmailS: Übrigens, wie oft muss ein Ereignis wiederholt werden, damit es als Regelmäßigkeit gilt?

Ich habe meine eigene Metrik ausprobiert, aber sie funktioniert nur für SL=TP, für andere Verhältnisse muss man Hearst zählen.