Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2805

 
https://habr.com/ru/post/695276/ kann für einige Leute nützlich/interessant sein
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

Manchmal ist es sinnvoll, das Bilanzdiagramm (blau) mit dem Preisdiagramm (orange) zu überlagern

In diesem Fall ist zum Beispiel deutlich zu erkennen, dass das Modell seit 10 Jahren nur bei fallenden Kursen Gewinne erzielt hat

Das verfeinerte Modell lernt in ähnlicher Weise, vor allem bei Kursrückgängen zu verdienen, während es bei Aufwärtsbewegungen und Konsolidierungen weniger Gewinn macht. Da der Markt in allen 10 Jahren gefallen ist, ist die Trainingsstichprobe verzerrt


 
elibrarius #:

Sind Sie sicher, dass die Priors zufällig ausgewählt werden? Ich habe nicht gecatcht, ich habe mir den Code der grundlegenden Bousting-Beispiele angesehen. Dort werden alle Prädiktoren verwendet. Das heißt, es wird der beste genommen. Der korrelierte Prädiktor liegt daneben, ist aber etwas schlechter. Aber auf anderen Split-Ebenen oder in Korrekturbäumen kann ein anderer der korrelierten Prädiktoren besser sein.

Es gibt einen separaten Parameter, der es ermöglicht, nur einen Teil der Prädiktoren für die Schätzung zu verwenden - er wird nach dem Zufallsprinzip ausgewählt - dies erhöht die Anzahl der Modellbäume, beschleunigt aber theoretisch das Training.

Ich wäre mir sicher, wenn ich ihren Code geparst hätte, also spreche ich nur über das, was sie deklariert haben - es besteht eine kleine Chance, dass ich die Entwickler falsch verstanden habe.

Was sie also meinen, ist, dass sie die Randomisierung zur Split-Auswertung hinzufügen und dadurch das Lernen verbessert haben.

Dass es eine Vorverarbeitung gibt, um korrelierte Prädiktoren zu eliminieren - davon habe ich noch nichts gehört.

Ich stimme zu, dass ein anderer Prädiktor besser oder nützlicher sein kann, aber mein Ziel ist es, so viele verschiedene Modelle wie möglich zu trainieren. Ich möchte, dass sie etwas lernen.

 
Maxim Dmitrievsky #:
Geben Sie mir also ein paar informative Formeln, die ich ausprobieren kann.

Ich verstehe es nicht, soll ich es zu Ihnen oder zum Datensatz werfen? Wenn im Datensatz, wie hängt es mit der Gruppierung ähnlich oder Korrelation, weil das Ziel nicht in diesem Prozess beteiligt ist?

 
Aleksey Vyazmikin #:

Ich verstehe nicht, soll ich es zu Ihnen oder zum Datensatz werfen? Wenn im Datensatz, wie hat dies etwas mit Ähnlichkeitsgruppierung oder Korrelation zu tun, weil das Ziel nicht in diesem Prozess beteiligt ist?

Formeln für die Berechnung von guten Fiches, die in Python und Mql reproduziert werden können. Ich werde die Tags selbst aufheben.

nur um zu schauen, weil ich nur Inkremente verwende.

Ich kann Bots für sie nach dem Training hochladen.
 
Maxim Dmitrievsky #:

Manchmal ist es sinnvoll, ein Gleichgewichtschart (blau) über ein Preisdiagramm (orange) zu legen.

In diesem Fall ist z.B. deutlich zu erkennen, dass das Modell seit 10 Jahren nur an einem fallenden Markt verdient

Das verfeinerte Modell lernt in ähnlicher Weise, vor allem bei Kursrückgängen zu verdienen, aber weniger bei Anstiegen und Konsolidierungen. Da der Markt in allen 10 Jahren gefallen ist, ist die Trainingsstichprobe verzerrt


Basiert der Kurs auf dem Prinzip der Deltas zwischen Schluss- und Eröffnungsgeschäften oder handelt es sich um eine Art Zeitrationierung?

 
Aleksey Vyazmikin #:

Basiert der Preis auf dem Prinzip des Deltas zwischen dem Abschluss und der Eröffnung eines Geschäfts oder handelt es sich um eine Art Zeitrationierung?

Ja, zum Zeitpunkt des Abschlusses eines Geschäfts ist er festgelegt.

 
Maxim Dmitrievsky #:

Formeln für die Berechnung von guten Chips, die in Python und Mql reproduziert werden können. Ich werde die Etiketten selbst abholen.

nur um zu schauen, weil ich nur Inkremente verwende.

Nach dem Training kann ich Bots auf sie hochladen.

Sie wissen, dass die "Güte" eines Merkmals durch sein Ziel bestimmt wird.

Das Prinzip der Erstellung habe ich bereits beschrieben. Der Code in MQL5 ist alles in MQL5, und es gibt keine Frage der Umwandlung durch eine Funktion - es ist nicht möglich, eine Formel zu geben.

Zum Beispiel wird oft die Startzeit des aktuellen Segments ZZ(48) gewählt.

 
Aleksey Vyazmikin #:

Sie wissen, dass die "Güte" eines Merkmals durch das Ziel bestimmt wird.

Ich habe das Prinzip der Erstellung bereits beschrieben. Der Code in MQL5 ist alles in MQL5, und es gibt keine Frage der Umwandlung durch eine Funktion - es ist unmöglich, eine Formel zu geben.

Zum Beispiel wird oft die Startzeit des aktuellen Segments ZZ(48) gewählt.

ah, na ja, meist auf Standardindikatoren und deren Ableitungen?

 
Maxim Dmitrievsky #:

Ja, zum Zeitpunkt der Transaktionen ist festgelegt

Versuchen Sie, einen Aufschlag für Kauf und Verkauf zu machen, indem Sie ein Modell wählen, das durch die Anzahl der Eingaben ausgeglichener ist, und dann die Stichprobe in zwei Teile aufteilen und zwei separate Modelle erstellen.