Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 110

 
Yury Reshetov:

Das Problem der kombinatorischen "Explosion" in jPrediction wurde nicht durch das Durchgehen aller möglichen Kombinationen, sondern durch die sequentielle Suchmethode gelöst. Die Methode sieht im Wesentlichen wie folgt aus:

Angenommen, wir haben eine Kombination mit N Prädiktoren mit maximaler Verallgemeinerbarkeit gefunden, indem wir alle möglichen Kombinationen von N und weniger Prädiktoren ausprobiert haben. Wir müssen einen N+1 Prädiktor hinzufügen. Dazu fügen wir nacheinander alle Prädiktoren aus der Stichprobe hinzu, die nicht in der Kombination enthalten waren, und messen ihre Generalisierungsfähigkeit. Wenn wir bei dieser Suche eine Kombination mit N+1 Prädiktoren finden, deren Verallgemeinerungsfähigkeit höher ist als die beste Kombination von N Prädiktoren, können wir auf die gleiche Weise eine Kombination mit N+2 Prädiktoren finden. Und wenn sie es nicht gefunden haben, dann ist es klar, dass es keinen Sinn hat, weiter zu suchen, und der Algorithmus des Ausprobierens von Kombinationen bleibt bei der besten Kombination von N Prädiktoren stehen. Dies hat zur Folge, dass der Algorithmus der Suche nach Kombinationen von Prädiktoren für das Modell im Vergleich zum vollständigen Ausprobieren aller möglichen Kombinationen viel früher aufhört. Eine zusätzliche Einsparung von Rechenressourcen ergibt sich aus der Tatsache, dass die Suche von einer kleinen Anzahl von Prädiktoren ausgeht, um diese Anzahl zu erhöhen. Und je weniger Prädiktoren wir für das Lernen benötigen, desto weniger Zeit und Rechenleistung brauchen wir für die Erstellung von Modellen.

Hallo Juri!

Es gibt Fragen )) über die sequentielle Suche ...

Nehmen wir an, wir haben 10 Prädiktoren

1, 2, 3, 4, 5, 6, 7, 8, 9, 10

die grüne Gruppe ist die Gruppe der Prädiktoren, die die beste Verallgemeinerungsfähigkeit gezeigt hat, genau zu dieser Gruppe werden andere Prädiktoren N+1 hinzugefügt

dierote Gruppe, das ist die Gruppe, die etwas schlechter ist als die grüne unddie nicht an den Tests teilnehmen wird, alle Tests sind bereits auf die grüne Gruppe ausgerichtet

Frage: was ist, wenn sich nach allen Versuchen mit anderen N+1 Prädiktoren nacheinander herausstellt, dass die rote Gruppe im Endergebnis eine größere Generalisierungsfähigkeit hat, ist das auch recht realistisch, oder verstehe ich etwas falsch ???? bitte erläutern

 
SanSanych Fomenko:

Alles gut, bis auf eine Kleinigkeit: Es gibt keinen Vergleich mit anderen Modellen.

Vergleich.

Ich unterstütze... Nehmen Sie die Zitate einfach als Daten und nicht als Irrlichter
 
SanSanych Fomenko:

Alles ist gut, bis auf eine Kleinigkeit: Es gibt keinen Vergleich mit anderen Modellen.

Ich biete meine Dienste zum Vergleich an

1. Sie bereiten eine Excel-Eingabedatei mit Prädiktoren und Zielvariablen vor

2. Sie machen die Berechnung

3. Sie senden die Eingabedatei an mich.

4. Ich führe die Berechnungen mit randomforest, ada, SVM durch

Wir vergleichen.

Keine Notwendigkeit, weit zu gehen, hier ist die Datei mit Forex-Markt-Kurse, durchschnittliche Verallgemeinerung Fähigkeit, wenn mit reshetov Prädiktor von 70% bis 80% trainiert. Nusssss...... Ich warte auf Ihr Ergebnis.

P.s. Benennen Sie die Datei in csv um

Dateien:
 
Mihail Marchukajtes:

Sie brauchen nicht weit zu gehen, hier ist eine Datei mit Devisenkursen, die durchschnittliche Generalisierungsfähigkeit, wenn sie mit Reshetovs Prädiktor trainiert wurde, beträgt 70 bis 80 %. Wellsssss...... Ich warte auf Ihr Ergebnis.

P.s. Benennen Sie die Datei in ksv um

Könnte man es nicht verpacken?

Und ist es nicht möglich, das Ergebnis zu sehen? Die Generalisierung in der Ausbildung hat eigentlich nichts zu bedeuten.

 
mytarmailS:
Unterstützt von... Nehmen Sie einfach Zitate als Daten und nicht irgendwelche Schwertlilien
Es sind die beiden Reshetov-Dateien mit den Ergebnissen des Algorithmus, die von Interesse sind
 
SanSanych Fomenko:

Könnte es nicht gepackt werden?

Können wir das Ergebnis nicht sehen? Die Verallgemeinerbarkeit des Lernens hat eigentlich nichts zu bedeuten.

Ich könnte nicht mehr zustimmen.

 
Mihail Marchukajtes:

Sie brauchen nicht weit zu gehen, hier ist eine Datei mit Devisenkursen, die durchschnittliche Generalisierungsfähigkeit, wenn sie mit Reshetovs Prädiktor trainiert wurde, beträgt 70 bis 80 %. Wellsssss...... Ich warte auf Ihr Ergebnis.

P.s. Benennen Sie die Datei in csv um

Was ist das? 71 Beobachtungen?

Wie haben Sie die Gesamtkapazität überprüft?

 
mytarmailS:

Was ist das? 71 Beobachtungen?

Wie haben Sie überhaupt die Gesamtkapazität überprüft?

Und Sie versuchen immer noch, den Markt für Minuten in 5 Jahren einzudämmen?????? Diese 71 Beobachtungen, zwei Wochen des Handels auf 5 Minuten, wenn alles...... Und nur kaufen. Also los: ..... Oder sind Sie entkräftet?
 
Mihail Marchukajtes:
Und Sie versuchen weiterhin, den Markt für Minuten für 5 Jahre einzudämmen?????? Diese 71 Beobachtungen, zwei Wochen des Handels auf 5 Minuten, wenn alles...... Und nur kaufen. Also los: ..... Oder sind Sie entkräftet?

Wenn Sie ohne europäische Höflichkeit sprechen, schreiben Sie völligen Blödsinn...

Geben Sie zwei normale Dateien mit jeweils mindestens 500 Beobachtungen sowie die Programmergebnisse an.

 
Mihail Marchukajtes:

Die durchschnittliche Verallgemeinerungsfähigkeit beim Training mit Reshetovs Prädiktor beträgt 70 bis 80 %.

Wie ich bereits sagte, ist diese Kennzahl nutzlos.

Die Daten werden nach dem Zufallsprinzip in zwei etwa gleich große Teile aufgeteilt, dann wird das Modell nur für den ersten Teil trainiert und für beide Teile gleichzeitig getestet. Eine Verallgemeinerbarkeit von ~75% bedeutet, dass das Modell am Ende 75% aller Beispiele in der Datei richtig vorhersagt.
Es gibt mehrere Varianten, wie das Modell 75 % erreichen kann:
1) Das Modell wird auf den für das Training verwendeten Daten mit einer Genauigkeit von 100 % trainiert und scheitert bei den neuen Daten aus dem zweiten Teil der Datei, wo es 50 % erreicht (das entspricht dem Werfen einer Münze). Der Durchschnitt würde genau 75 % betragen. Dies ist eine sehr schlechte Entwicklung und wird sich im Handel negativ auswirken.
2) Das Modell wurde mit einer Genauigkeit von 75 % auf die Trainingsdaten trainiert und zeigte dieselbe Genauigkeit von 75 % auf die Testdaten, was wiederum einem Durchschnitt von 75 % entspricht. In dieser Situation besteht im besten Fall die Möglichkeit, etwas zu verdienen.
3) Eine beliebige Zwischenoption zwischen diesen beiden Möglichkeiten.

Ihre Version ist wahrscheinlich näher an der ersten Version. Sie müssen sich sehr auf Glück verlassen, um mit solchen Ergebnissen zu handeln. Ich vermute, dass Sie Ihre Einlage nur dank des Indikators, der als Ihr Hauptsignal dient (Sequent oder was auch immer), noch nicht verloren haben. Ich denke, ein Expert Advisor, der auf diesem einen Indikator basiert, wird genauso gute Ergebnisse liefern wie der Indikator + jPrediction.