Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1376

 
Aleksey Vyazmikin:

Warum sollten weniger als 10 % der gesamten Stichprobe untersucht werden, sollte eine größere Stichprobe nicht zu einer Verbesserung führen?

Und warum mehr als 5k? Wenn man nicht auf ihnen trainieren kann, kann man auch nicht auf mehr trainieren.

 
Aleksey Vyazmikin:

Warum sollten weniger als 10 % der gesamten Stichprobe trainiert werden, sollte eine Vergrößerung der Stichprobe nicht zu einer Verbesserung führen?

Wie sieht es mit einem übertrainierten System aus, wohin wird es Ihrer Meinung nach führen?

 
Farkhat Guzairov:

Wie sieht es mit einem umgeschulten System aus, wohin wird das Ihrer Meinung nach führen?

Je größer die Stichprobe ist, desto schwieriger ist die Anpassung des Modells, da mehr Blätter/Bäume erforderlich sind.

 
Yuriy Asaulenko:

Durch x - Handelsnummer, durch y - die Höhe des Gewinns in Pips .


Handelt es sich um eine 4-stellige oder eine 5-stellige Zahl?

 
sibirqk:


Ist es ein 4-Zeichen oder ein 5-Zeichen?

Es ist überhaupt kein Zeichen.)
 
Yuriy Asaulenko:
Das ist überhaupt kein Zeichen.))
Was bedeutet dann die Höhe des Gewinns in pps?
 
sibirqk:
Was bedeutet es also, einen Gewinn in Pips auszudrücken?
Dies ist ein Austauschinstrument. Sie zeigt die Gewinnmöglichkeiten des einfachsten Systems auf. Der Rest ist noch nicht wichtig.
 
Vladimir Perervenko:

Das ist nicht ganz richtig. Sie haben zum Beispiel train[2000, ] und test[500, ]. Sie trainieren auf train mit anfänglichen Beispielgewichten = 1,0 und lassen test[] das trainierte Modell vorhersagen. Auf der Grundlage der Qualität der einzelnen Testpräfixe geben Sie ihnen eine Gewichtung. Dann kombiniert man Training und Test und bildet eine neue Trainingsstichprobe, trainiert das Modell, testet es und so weiter, bis alle Trainingsstichproben auf diese Weise Gewichte erhalten haben. Bei älteren Stäben kann man einen Kürzungsfaktor anwenden, aber ich habe es nicht überprüft. All dies dient natürlich der Klassifizierung.

Überprüft mit ELM, ergibt gute Ergebnisse.

Viel Glück!

Mir ist nicht ganz klar, wie dadurch die Leistung des Modells bei neuen Daten verbessert werden kann.

Zum Beispiel, wenn die Klasse nicht richtig bestimmt ist, setzen wir die abnehmende Gewichtung, als die extreme Variante 0. So wird es im weiteren Training gleich sein, diese Zeilen aus der Probe auszulassen und auf dem Praktikum wird alles mit der 100%igen Genauigkeit gut sein, auf den Tests, die in der gleichen Kreiskennzeichnung - auch alles wird gut sein. Aber mit völlig neuen Daten werden wir nicht in der Lage sein, diese Linien zurückzuziehen, und es wird bereits das sein, was das Modell wirklich kann.

Oder umgekehrt, haben Sie das Gewicht für falsche Beispiele erhöht?

 
elibrarius:

Mir ist nicht ganz klar, wie dadurch die Leistung des Modells bei neuen Daten verbessert werden kann.

Wenn z.B. die Klasse nicht korrekt definiert ist, setzen wir ein abnehmendes Gewicht, als Extremvariante 0. Beim anschließenden Training ist es also gleichbedeutend mit dem Weglassen dieser Zeilen aus der Stichprobe und alles wird mit 100%iger Genauigkeit auf dem Tablett in Ordnung sein, bei den Tests, die wir ebenfalls zirkulär markiert haben - alles wird ebenfalls in Ordnung sein. Aber bei völlig neuen Daten werden wir nicht in der Lage sein, Linien zu verwerfen, und es wird sich schon zeigen, wozu das Modell wirklich fähig ist.

Oder haben Sie stattdessen die Gewichtung für die falschen Beispiele erhöht?

Natürlich ist die Herabstufung für "schlechte" Beispiele gedacht. Wenn Sie nach oben gehen, ist das ein klassisches Boosting.

Machen Sie einfach ein Experiment und überprüfen Sie es.

Das tue ich jetzt nicht mehr. Ich entferne oder markiere verrauschte Beispiele beim Preprocessing vor dem Training.

Viel Glück!

 
Yuriy Asaulenko:

Warum brauchen Sie mehr als 5.000? Wenn man damit nicht lernen kann, kann man auch nicht mit mehr lernen.

Das gehört in die Kategorie der dummen Aussagen.

Aleksey Vyazmikin:

Je größer die Stichprobe ist, desto schwieriger ist die Anpassung des Modells, da mehr Blätter/Bäume erforderlich sind.

Genau richtig, je mehr, desto besser (weniger als 100.000 ist Lärm), aber wir müssen bedenken, dass sich der Markt ändert, und wie man das in der Ausbildung berücksichtigt, ist ein großes Geheimnis.