Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 81

 
mytarmailS:
es gibt ein ser :)

)))

Handeln Sie zufälligerweise bei wealthlab?

 
Alexey Burnakov:

)))

Handeln Sie bei wealthlab?

Nein, es war tslab, ich füttere die Daten aus R und simuliere den Handel mit R-Signalen in tslab. Es ist schneller, bequemer und visueller als die Simulation von Trades in R-ka, und ich brauche Stop Loss, Take Profit, Kommissionen... also ist es ein echtes Kopfzerbrechen, das alles zu schreiben
 
Dr. Trader:

4) Wenn Sie beim Training eine Kreuzvalidierung durchführen, wiederholen Sie es mehrmals mit denselben Daten, um zu sehen, wie stark die Ergebnisse variieren, und wählen Sie Modelle und Prädiktoren mit geringer Variation.

Das ist es, was mir jetzt in den Sinn kommt, aber das ist nicht die Grenze der möglichen Probleme.

Sie werden überrascht sein und sicher anderer Meinung als ich :) ), aber ich glaube nicht, dass die Gegenprüfung auf dem Markt wirksam ist, zumindest nicht in ihrer klassischen Anwendung

 
mytarmailS:

Sie werden überrascht sein und sicher anderer Meinung sein als ich (und nicht nur Sie :) ), aber ich glaube nicht, dass die Kreuzvalidierung wirksam ist, wenn sie auf dem Markt angewendet wird, zumindest in ihrer klassischen Anwendung

Warum so wenige Bäume?
 
mytarmailS:

Sie werden überrascht sein und sicher anderer Meinung sein als ich (und nicht nur Sie :) ), aber ich glaube nicht, dass die Kreuzvalidierung wirksam ist, wenn sie auf dem Markt angewendet wird, zumindest in ihrer klassischen Anwendung

Beginnen wir damit, wie Sie den Begriff der Querbewertung verstehen. Können Sie das sagen?
 
SanSanych Fomenko:
Warum so wenige Bäume?

Ich habe festgestellt, dass das System umso weniger Handel treibt, je mehr Bäume es gibt, und dass die Qualität der Bäume überhaupt nicht steigt.

Wenn mein Modell z.B. 500 Geschäfte mit dem Parameter 10/5 macht und dann mit dem Parameter 5/200 (5 Splits, 200 Bäume) nur ein Geschäft oder gar kein Geschäft macht, dann sinkt die Verallgemeinerung und das Modell sucht nach sehr klaren Situationen, die bereits passiert sind, aber in der Zukunft nie passieren werden

 
Alexey Burnakov:
Beginnen wir damit, wie Sie die Bedeutung der Kreuzvalidierung verstehen.

Ich bin sicher, es ist dasselbe wie bei Ihnen

Wir unterteilen den Plot in 5 Teile, trainieren 4 davon, prüfen den 5. Teil und gehen alle Varianten mit Plots durch, so dass die Out-of-Sample-Prüfung auf allen 5 Teilen der Stichprobe stattfindet und berechnen den durchschnittlichen Fehler

Das scheint so zu sein, wenn ich es nicht vergessen habe.

 
mytarmailS:

Ich habe festgestellt, dass das System umso weniger Handel treibt, je mehr Bäume es gibt, und dass die Qualität der Bäume überhaupt nicht steigt.

Wenn mein Modell z.B. 500 Geschäfte mit dem Parameter 10/5 macht und dann mit dem Parameter 5/200 (5 Splits, 200 Bäume) nur ein Geschäft oder gar kein Geschäft macht, dann sinkt die Verallgemeinerung und das Modell sucht nach ganz klaren Situationen, die einmal passiert sind, aber in Zukunft nicht mehr passieren werden

Interessanter Gedanke. Es stellt sich heraus, dass Sie mit der Anzahl der Bäume gegen Übertraining ankämpfen?
 
mytarmailS:

Ich bin sicher, es ist dasselbe wie bei Ihnen

Wir teilen den Plot in 5 Teile, trainieren 4 davon, prüfen den 5. Teil und gehen alle Varianten mit Segmenten durch, so dass die Out-of-Sample-Prüfung auf allen 5 Teilen der Stichprobe stattfindet und berechnen den durchschnittlichen Fehler

Das scheint alles zu sein, wenn ich es nicht vergessen habe.

Ja. Wofür brauchen Sie es? Optimale Lernparameter zu finden.

Was missfällt Ihnen an diesem Ansatz? Wie werden Sie die Parameter auswählen?

 
SanSanych Fomenko:
Interessante Idee. Es stellt sich also heraus, dass Sie durch die Anzahl der Bäume gegen Übertraining ankämpfen?

nicht wirklich...

Was ich hier schreibe, gilt nur für meinen Ansatz.

Du weißt, wie ich mein Ziel erreiche, nämlich mit Umkehrungen.

Ich habe drei Klassen von Umkehrungen: "aufwärts", "abwärts" und "keine Umkehrung" (1, -1, 0)

Sie wissen auch, dass die Schiefe der Klassen enorm ist, die Klasse "0" ist dutzendfach größer als "-1" und "1".

und das bedeutet, dass das Modell am besten auf die Klasse "0" trainiert wird, weil sie die meisten Beobachtungen hat und während des Trainings des Modells, je mehr Bäume, desto mehr "0"-Klassen trainiert werden und da die "0"-Klasse besser und stärker wird, beginnt sie die "1"- und "-1"-Klassen zu absorbieren (verdrängen) Deshalb: Je mehr Bäume, desto weniger Geschäfte