Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3282

 
Aleksey Vyazmikin #:

Ich habe eine Stichprobe von 2010 bis 2023 (47k Zeilen) genommen, sie in drei Teile in chronologischer Reihenfolge unterteilt und beschlossen, zu sehen, was passieren würde, wenn wir diese Teile austauschen.

Die Größe der Teilstichproben Zug - 60%, Test - 20% und Prüfung - 20%.

Ich habe diese Kombinationen gebildet (-1) - dies ist die Standardreihenfolge - chronologisch. Jede Teilstichprobe hat ihre eigene Farbe.


Ich habe 101 Modelle mit verschiedenen Seed für jede Gruppe von Proben trainiert und folgendes Ergebnis erhalten


Alle Metriken sind standardisiert, und es ist zu erkennen, dass es schwierig ist, den durchschnittlichen Gewinn der Modelle (AVR Profit) sowie den Prozentsatz der Modelle, deren Gewinn 3000 Punkte übersteigt, für die letzte Probe, die nicht am Training teilgenommen hat, zu bestimmen.

Vielleicht sollte die relative Erfolgsrate der Varianten -1 und 0 in der Trainingsstichprobe reduziert werden? Im Allgemeinen scheint es, dass Recall darauf reagiert.

Sollten Ihrer Meinung nach die Ergebnisse solcher Kombinationen in unserem Fall miteinander vergleichbar sein? Oder sind die Daten unwiederbringlich veraltet?

Noch ein Do-it-yourself...

Es gibt eine Kreuzvalidierung, alles wird durchgekaut und durchgekaut..., weit verbreitet....

 
СанСаныч Фоменко #:

Ein weiterer Selbstläufer...

Es gibt eine Kreuzvalidierung, alles wird gekaut und gekaut..., weit verbreitet.....

Das ist es ja, die Kreuzvalidierung funktioniert hier vielleicht nicht effektiv.

Und was ist der Sinn dieses Selbstentwurfs? Maxim dreht die Stichprobe nach der Chronologie um - in der Annahme, dass das Ergebnis identisch sein wird - mein Experiment zeigt den Trugschluss. Oder alles ist individuell und die Validierung kann ein zufälliges Muster oder Vorkommen in der gesamten Stichprobe offenbaren.

 
Aleksey Vyazmikin #:

Genau das ist der Punkt: Die Kreuzvalidierung funktioniert hier möglicherweise nicht effektiv.

Und wo ist dieser Selbstbetrug? Maxim dreht die Stichprobe chronologisch um - in der Annahme, dass das Ergebnis identisch sein wird - mein Experiment zeigt den Trugschluss. Oder alles ist individuell und die Validierung kann ein zufälliges Muster oder Vorkommen in der gesamten Stichprobe offenbaren.

Sie sollten die Pfeile nicht auf Maxim verschieben, vor allem, wenn er nichts von dem, was vorgeschlagen wurde, getan oder auch nur darüber nachgedacht hat.

 
Maxim Dmitrievsky #:

Sie sollten den Spieß nicht umdrehen, vor allem, wenn Maxim nichts von dem getan hat, was Sie vorgeschlagen haben.

Was soll das heißen, er hat nichts getan? Trainieren Sie das Modell nicht bereits mit der jüngsten Geschichte?

 
fxsaber #:

Wenn keine Matrix damit umgehen kann.

Es dauert drei Sekunden, um ähnliche Zeichenfolgen der Länge 30K in einer Zeichenfolge von 10M zu finden.

Dabei geht es nicht darum, alle möglichen korrelierten Muster zu zählen, sondern die Quelle mit anderen Daten zu vergleichen. Sie brauchen keine Matrix, nur einen Vektor.

 
Aleksey Vyazmikin #:

Was meinen Sie mit "ich habe nicht"? Trainieren Sie das Modell nicht bereits mit der jüngsten Geschichte?

Ich weiß nicht mehr, wer zuerst darauf gekommen ist. Irgendein Nerd. In meinem Fall spielt das keine Rolle.

 
Maxim Dmitrievsky #:

Ich weiß nicht mehr, wer zuerst darauf gekommen ist. In meinem Fall spielt das keine Rolle.

Inwiefern ist Ihr Fall anders als meiner?

 
Aleksey Vyazmikin #:

Wie unterscheidet sich Ihr Fall von meinem?

weil ich nicht gerne mit ungebildeten Sophisten und Psychologen kommuniziere)

solche Leute produzieren keine nützlichen Inhalte

 
Maxim Dmitrievsky #:

weil ich nicht gerne mit ungebildeten Sophisten und Psychologen rede)

Solche Leute produzieren keine nützlichen Inhalte

Beeinflusst Ihre "Liebe" die Daten auf irgendeine magische Weise?

 
Maxim Dmitrievsky #:

Dabei geht es nicht darum, alle möglichen korrelierten Muster zu zählen, sondern die Quelle mit anderen Daten zu vergleichen. Sie brauchen hier keine Matrix, ein Vektor reicht aus.

Dies ist der Kern der zeilenweisen Berechnung der Matrix.