Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1292

 
Gral:

Die Volumina helfen bei der Vorhersage des Zustandswechsels von Trend zu flach, aber nicht "ohne Schwierigkeiten", im Allgemeinen ist die Vorhersage des Zustands "Trend/flach" nicht viel genauer als die Richtung des nächsten Inkrements, pro Zeiteinheit, irgendwo um 57% in der Genauigkeit, was über einige unglaubliche Zahlen gesagt wurde, eindeutig das Ergebnis eines Fehlers.

Wie lauten diese Zahlen?

 

Maschinelles Lernen ist ein seltsames und unberechenbares Geschäft. Ich setze die Debugging-Arbeit mit CatBoost fort und habe ein Modell, das wie folgt funktioniert (Training+Test+Prüfung)

Vielleicht nicht viele Geschäfte (346) von 2014-2019, aber es ist 1299 Drawdown für alle Zeit, die weniger als 10% ist. Natürlich gab es im Jahr 2014 einen starken Anstieg, der sich vielleicht nicht wiederholen wird, aber danach ist es ziemlich ruhig.

Nachfolgend ein Diagramm nur für die Prüfungsstichprobe (bedingt, da die Stichprobe kleiner ist als dieser Test)

Aber ich zeige nicht nur Diagramme, das ist hier nicht ungewöhnlich, und ich möchte sagen, dass ich sehr überrascht war, als ich mir den Inhalt des Modells ansah - nur 4 von 38 Prädiktoren werden dort verwendet!

ZeitH - Zeit in Stunden

DonProcVisota_M15 - Relative Breite des Donchian-Kanals bei M15

LastBarPeresekD_Down_M15 - Anzahl der Balken seit der letzten Durchquerung des Donchian-Kanals

BB_PeresekN_Total_M1 - Anzahl der Überschreitungen der iDelta-Levels durch den Kurs während der letzten x Bars

Natürlich habe ich eine große Anzahl von Prädiktoren in meiner Stichprobe, ich fraktioniere sie und dann sippe ich sie, und das alles passt zu meiner Theorie, dass die Aufteilung einer Stichprobe durch Gier nicht immer effektiv ist - es ist nur eine Methode, die nichts garantiert.

Das ist die Art von Modellen, die ich sammeln und sammeln möchte.

 
Aleksey Vyazmikin:

Maschinelles Lernen ist ein seltsames und unberechenbares Geschäft. Ich setze die Debugging-Arbeit mit CatBoost fort und habe ein Modell, das wie folgt funktioniert (Training+Test+Prüfung)

Vielleicht nicht viele Angebote (346) von 2014-2019, aber ich habe 1299 Drawdown für alle Zeit, die weniger als 10% ist. Natürlich gab es im Jahr 2014 einen starken Anstieg, der sich vielleicht nicht wiederholen wird, aber danach ist es ziemlich ruhig.

Nachfolgend ein Diagramm nur für die Prüfungsstichprobe (bedingt, da die Stichprobe kleiner ist als dieser Test)

Aber ich zeige nicht nur Diagramme, das ist hier nicht ungewöhnlich, und ich möchte sagen, dass ich sehr überrascht war, als ich mir den Inhalt des Modells ansah - nur 4 von 38 Prädiktoren werden dort verwendet!

ZeitH - Zeit in Stunden

DonProcVisota_M15 - Relative Breite des Donchian-Kanals bei M15

LastBarPeresekD_Down_M15 - Anzahl der Balken seit der letzten Durchquerung des Donchian-Kanals

BB_PeresekN_Total_M1 - Anzahl der Überschreitungen der iDelta-Levels durch den Kurs während der letzten x Bars

Natürlich habe ich eine große Anzahl von Prädiktoren in meiner Stichprobe, ich fraktioniere sie und dann sippe ich sie, und das alles passt zu meiner Theorie, dass die Aufteilung einer Stichprobe durch Gier nicht immer effektiv ist - es ist nur eine Methode, die nichts garantiert.

Das ist die Art von Modellen, die ich sammeln und sammeln möchte.

Erwartungsgemäß sind die meisten Prädiktoren in Wirklichkeit Rauschen oder miteinander korreliert.

Was ist Gehweggehen? Yandex spricht nur über die Verbreitung von Torrents.
 
elibrarius:
Erwartungsgemäß sind die meisten Prädiktoren in Wirklichkeit Rauschen oder miteinander korreliert.

Was bedeutet "seitwärts"? Yandex spricht nur über die Verbreitung von Torrents.

Der Gedanke ist nicht, dass es sich um Rauschen handelt, sondern dass einige Prädiktoren andere überlagern - die gebildeten Beziehungen sind wichtig und müssen hergestellt werden.

Sideways, das ist natürlich ein Begriff, den ich für mich selbst erfunden habe - ich verwende das Flag--random-seed mit einem bestimmten Zahlenwert. Ich weiß zwar nicht, welche Spannen dieser Wert hat, aber ich sehe, dass er sich signifikant auf das Lernen auswirkt, und diese kontrollierte Randomisierung kommt mir sehr entgegen.

 
Hallo, Leute. Ich möchte den Indikator kennen, der ein Fondsdiagramm nach den Ergebnissen der Strategietests im Tester erstellt. Ich kann es nicht finden... Ich erinnere mich daran. Wenn jemand sie zur Hand hat, kann er sie mir zukommen lassen. Danke!
 
Aleksey Vyazmikin:

Sitzen ist natürlich ein Begriff, den ich für mich selbst erfunden habe - ich wende das Flag--random-seed mit einem bestimmten numerischen Wert an. Ich weiß zwar nicht, welche Spannweite dieser Wert hat, aber ich sehe, dass er sich signifikant auf das Lernen auswirkt, und diese kontrollierte Randomisierung kommt mir sehr entgegen.

Behebung von Zufälligkeiten. Normalerweise wird dies für die Reproduzierbarkeit der Ergebnisse bei Wiederholungen verwendet.
Vorzugsweise sollte es das Ergebnis nicht zu sehr beeinflussen. Andernfalls erhalten Sie eine Anpassung an eine bestimmte Zufälligkeit. D.h. es tritt eine weitere (wesentlich beeinflussende) Eigenschaft auf, die optimiert werden muss.
 
Renat Akhtyamov:

Was für Zahlen?

Ich glaube, ich habe oben jemanden gesehen, der sagte, dass Trends/Flats zu fast 90 % vorhergesagt werden, ich glaube, es war der Enkel oder Lehrling von jemandem.

 
Gral:

Ich glaube, ich habe oben jemanden gesehen, der sagte, dass Trends/Flats zu fast 90 % vorhergesagt werden, der Enkel oder Lehrling von jemandem hat das gesagt

Ja, 100 %, dass es einen Trend nach einer Wohnung geben wird. Was gibt es vorherzusagen?
 
Gral:

Ich glaube, ich habe oben jemanden gesehen, der sagte, dass Trends/Floats zu fast 90 % vorhergesagt werden, ich glaube, es war jemandes Enkel oder Lehrling.

Aah!

Nun, wenn es keine Ticks gibt, ist der Markt wahrscheinlich in einem Flat, 100%.

und wenn es eine Menge Zecken gibt, ist es keine Wohnung
 
elibrarius:
Behebung von Zufälligkeiten. Dies wird in der Regel für die Reproduzierbarkeit der Ergebnisse bei Neustarts verwendet.
Vorzugsweise sollte sie das Ergebnis nicht zu sehr beeinflussen. Andernfalls erhalten Sie eine Anpassung an eine bestimmte Zufälligkeit. D.h. es tritt eine weitere (wesentlich beeinflussende) Eigenschaft auf, die optimiert werden muss.

Ja, ich brauche sie, um das Ergebnis später zu reproduzieren und um generell Ergebnisse zu generieren.

Es ist nur nicht ganz klar, wie es funktioniert. Ich verstehe, dass dieser Parameter für die Zufälligkeit der Split-Ergebnisse bei der Auswahl der besten Option verantwortlich ist, aber ich kann nirgendwo die Details finden.

Und was die Anprobe betrifft... Wir müssen davon ausgehen, dass alles ein potenzieller Fit ist, und wir können nur die Stabilität der Verbindungen im Laufe der Zeit überprüfen und die Effektivität dieser Verbindungen überwachen, z. B. besteht dieses Modell aus 4 Bäumen, von denen jeder auch 4 tief ist, d. h. aufgrund der geringen Anzahl von Kombinationen ist der Fit hier sehr effektiv und kann daher eine Art Regelmäßigkeit und nicht nur eine Stichprobenbeschreibung sein.