Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2208
![MQL5 - Sprache von Handelsstrategien, eingebaut ins Kundenterminal MetaTrader 5](https://c.mql5.com/i/registerlandings/logo-2.png)
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
den Link, den ich im Wiki über den Semi angegeben habe. Soweit ich weiß, handelt es sich bei den Markierungen um die Kanten der stabilen Abschnitte.
ZZ geht nicht, weil die Benotung einfach ohne Unterschiede in den Abschnitten weitergeht, und das Lernen geht auf die gleiche Weise weiter, und wenn durch die Benotung ZZ ist es wie zu viele Beispiele mit unterschiedlichen Merkmalen und das Ergebnis des Lernens kann nicht gut sein.
Labels sind bekannte Ziel{Klassen}. Der Rest der Daten ist ohne sie, nur in Form von Merkmalen.
Diese Etiketten sollen eine gewisse Bedeutung haben. Zum Beispiel Etiketten, dass es Katzen oder Krokodile sind
In unserem Fall haben wir keine Ahnung, wo die Katzen sind. Ich meine, wir kennen keine Muster und wissen nicht, wie sie sich unterscheiden, was die Sache noch schwieriger macht.
so dass wir die ursprünglichen Markierungen aushebeln und die Varianten durchgehen können
sind nur die bekannten Ziele/Klassen. Der Rest der Daten ohne sie
Es ist, als würde man die richtige Suchrichtung festlegen.))
Diese Etiketten sollen eine gewisse Bedeutung haben. Zum Beispiel Etiketten, auf denen steht, dass es sich um Katzen oder Krokodile handelt.
In unserem Fall haben wir keine Ahnung, wo die Katzen sind. Das heißt, wir kennen keine Muster und wissen nicht, wie sie sich unterscheiden, was die Aufgabe noch schwieriger macht.
damit wir die ursprünglichen Markierungen erzwingen und die Varianten durchgehen können.
Vollständiges Bruteforcing ist immer besser als unvollständiges. Der Punkt der nicht ganz korrekten Partitionierung war schon immer vorhanden. Und der Fluch der Dimensionalität wird nur gelöst, wenn man die Suchrichtung richtig wählt. Es geht darum, den richtigen Bereich für die Suche nach Varianten zu finden/bestimmen.
Ich habe versucht, die Idee der Akzeptanz kleiner Stichproben für GMM zu erweitern. 6 Monate trainieren, 5 Jahre testen. Ich habe die Tags in n Teile mit fester Größe aufgeteilt. Für jeden Teil habe ich mein eigenes GMM-Modell erstellt, 1000 Stichproben aus jedem Teil generiert, sie aufgestapelt und die Catbust trainiert. Ich habe die Funktionen ausgewählt und folgendes erhalten:
Zweite Version, dieselben Tags, mit derselben Aufteilung, aber mit Vormischung:
X = X.sample(frac=1.0)
In beiden Fällen wurde ein festes Ziel verwendet. Wenn Sie es wünschen, kann ich dieses Experiment reproduzieren. Ich bin nicht gut darin, solche Phänomene zu deuten, vielleicht gibt es eine Erklärung.
Ich habe versucht, die Idee der Akzeptanz kleiner Stichproben für GMM zu erweitern. 6 Monate trainieren, 5 Jahre testen. Ich habe die Tags in n Teile mit fester Größe aufgeteilt. Für jeden Teil habe ich mein eigenes GMM-Modell erstellt, 1000 Stichproben aus jedem Teil generiert, sie aufgestapelt und die Catbust trainiert. Ich wählte die Funktionen aus und erhielt folgendes Ergebnis:
Zweite Version, dieselben Tags, mit derselben Aufteilung, aber mit Vormischung:
In beiden Fällen wurde ein festes Ziel verwendet. Wenn Sie es wünschen, kann ich dieses Experiment reproduzieren. Ich bin nicht sehr bewandert in der Interpretation solcher Phänomene, aber vielleicht gibt es eine Erklärung dafür.
Entschuldigung, Leute, ich habe eine Frage.
Wie hoch ist die Anzahl der Gewichtungsfaktoren in Ihren Rastern, und auf wie viele Berufe wird trainiert?
Ich möchte die Beziehung zwischen diesen Größen verstehen und darüber spekulieren, inwieweit Übertraining von dieser Beziehung abhängt. Ich danke Ihnen.
Ist das Mischen vor dem gmm oder vor dem boost? Sie müssen die Klassenbilanz für Ausbildung/Test überprüfen. Vielleicht gingen Nullen in die Ausbildung und Einsen in die Prüfung. Sie können auch versuchen, die Daten nach Kauf- und Verkaufsmarken zu gruppieren.
Die Mischung erfolgt vor der Erstellung des GMM.
Davor lasse ich Etiketten nach Zustand fallen:
Dies bringt das Klassengleichgewicht immer auf 1/1 mit leichten Abweichungen:
In diesem Fall wurden 115 Tags gemischt und in 4 Teile aufgeteilt. Danach wurden 4 GMMs auf der Grundlage dieser Daten erstellt. Aus jedem dieser Datensätze wurden 1000 Etiketten entnommen und in einem Datenrahmen zusammengefasst. Im nächsten Schritt wird sie in eine Test- und eine Dreifachspur aufgeteilt.
Die Ausgewogenheit der Musterklassen wich etwas vom Ideal ab. Aber die Proben des Zuges und des Tests hatten ungefähr das gleiche Verhältnis
Unten sehen Sie die Simulationsergebnisse mit der gleichen Stichprobe von 115 Tags, aufgeteilt in 4 Teile, aber ohne Vermischung. Die Ausgewogenheit der Klassen ist natürlich etwas besser, aber ich glaube nicht, dass dies die Ergebnisse wesentlich beeinflusst.
Es mag albern klingen, aber ich denke, dass es eine Art zeitliche Korrelation in den Reihen gibt, die GMM-Modelle an verschiedenen Stellen der Reihe finden. Sie verschwindet, wenn Sie die Reihenfolge durch Mischen der Reihe aufheben.
Ich habe nicht an eine getrennte Clusterbildung gedacht, ich werde es heute Abend ausprobieren.
Das Rühren erfolgt vor der Erstellung des GVM.
Bevor ich dies tue, lasse ich die Etiketten nach Bedingung fallen:
Dies bringt das Klassengleichgewicht immer auf 1/1 mit leichten Abweichungen:
In diesem Fall wurden 115 Tags gemischt und in 4 Teile aufgeteilt. Danach wurden 4 GMMs auf der Grundlage dieser Daten erstellt. Von jedem werden 1000 Etiketten abgetrennt und in einem Datenrahmen zusammengeführt. Im nächsten Schritt wird sie in eine Test- und eine Dreifachspur aufgeteilt.
Die Ausgewogenheit der Musterklassen wich etwas vom Ideal ab. Aber die Proben des Zuges und des Tests hatten ungefähr das gleiche Verhältnis
Unten sehen Sie die Simulationsergebnisse mit der gleichen Stichprobe von 115 Tags, aufgeteilt in 4 Teile, aber ohne Vermischung. Die Ausgewogenheit der Klassen ist natürlich etwas besser, aber ich glaube nicht, dass dies die Ergebnisse wesentlich beeinflusst.
Es mag albern klingen, aber ich denke, dass es eine Art zeitliche Korrelation in den Reihen gibt, die GMM-Modelle an verschiedenen Stellen der Reihe finden. Sie verschwindet, wenn Sie die Reihenfolge durch Mischen der Reihe aufheben.
Ich habe nicht an eine getrennte Clusterbildung gedacht, ich werde es heute Abend ausprobieren.
Ich muss es malen, es ist nicht sehr deutlich... Nun, es ist eine Tatsache, dass die Verteilungen in beiden Fällen unterschiedlich sind. Außerdem haben Sie die Serialisierung bereits entfernt. Höchstwahrscheinlich fallen die Verteilungen sehr uninformativ aus, und die neuen Punkte nach der Probenahme liegen an einer unverständlichen Stelle. D.h. die Information in der Reihe geht verloren, ja, da die Zitate nicht unabhängig sind.
Oder machen Sie ein einfaches Beispiel (keine Zitate) und vergleichen Sie dann.
Ich muss malen, es ist nicht ganz klar... Nun, es ist eine Tatsache, dass die Verteilungen in beiden Fällen unterschiedlich sind. Außerdem haben Sie die Serie bereits entfernt. Höchstwahrscheinlich fallen die Verteilungen sehr uninformativ aus, und die neuen Punkte nach der Probenahme liegen an einer unklaren Stelle. D.h. die Information in der Reihe geht verloren, ja, da die Zitate nicht unabhängig sind.
Oder machen Sie ein einfaches Beispiel (keine Zitate) und vergleichen Sie dann.
Maxim, hi. Es ist lange her, dass ich hier war... Ich habe versucht, damit umzugehen, und ich habe eine Menge Fragen))) Ich nehme an, MARKUP ist ein Spread? Markup ist ein einfacher Vergleich des aktuellen Wertes mit dem aktuellen + einer zufälligen Zahl, je nach Vorzeichen > oder < setzen Sie einen Markup 1 oder 0. richtig? Für einen Test setzen Sie markup=0.0? (wenn das Fach MARKUP=0.00001 ich denke))) richtig?
Maxim, hallo, es ist lange her, dass ich hier war... Ich versuche, es zu verstehen, und ich habe viele Fragen))) Ich nehme an, MARKUP ist ein Spread? Markup ist ein einfacher Vergleich des aktuellen Wertes mit dem aktuellen + einer zufälligen Zahl, je nach Vorzeichen > oder < setzen Sie einen Markup 1 oder 0. richtig? Für einen Test setzen Sie markup=0.0? (für Tablett, ich glaube MARKUP=0.00001)) richtig?
Hallo. Ja, das ist richtig. Das gleiche Markup wird im Tester verwendet. Bei Artikeln ist es wahrscheinlich besser, in den Artikeln zu fragen. An einem Ort zu haben.
Ich analysiere das Feedback und sehe, was verbessert werden kann.