Gibt es ein Muster in diesem Chaos? Lassen Sie uns versuchen, es zu finden! Maschinelles Lernen am Beispiel einer bestimmten Stichprobe. - Seite 3

 
Aleksey Vyazmikin #:

Können Sie das Modell in der Datei exam.csv genau überprüfen?

Haben Sie irgendwelche Manipulationen mit der Stichprobe versucht?

Hier ist der Saldo der Prüfungsstichprobe, nachdem einige der Prädiktoren herausgefiltert wurden.

Natürlich zeigen die Graphen der Antwortverteilung des Modells, dass nur ein wenig trainiert wurde - der Wiedererkennungswert ist sehr niedrig, aber es ist schon ein gutes Ergebnis.

train.csv


prüfung.csv

Es gibt 9046 Zeilen in exam. Ich habe 9000. Es wird fast keinen Unterschied geben.

Ihre Kurve ist viel besser. Ich werde noch etwas an den Parametern herumschrauben.
 
elibrarius #:

Was ist das beste Gleichgewicht, das Sie haben?

Jetzt habe ich in verschiedenen Varianten recherchiert, es stellt sich irgendwie heraus, dass dieses Ergebnis - es gibt auch auf der Runde der Kommission 3 Punkte auf die Idee gebracht werden.


 
elibrarius #:
Es gibt 9.046 Zeilen. Ich habe 9000. Das wird keinen großen Unterschied machen.

Sie haben eine viel bessere Kurve. Ich werde noch etwas an den Parametern herumschrauben.

Nun, wenn es sich um die Daten der Prüfungsdatei handelt, dann ja - es gibt keinen großen Unterschied, ich dachte nur, dass es vielleicht die Zugdatei ist. Haben Sie die drei Dateien ursprünglich zusammengeführt?

Versuchen Sie es.

 
Aleksey Vyazmikin #:

Nun, wenn es die Daten der Prüfungsdatei sind, dann ja - es macht keinen großen Unterschied, ich dachte nur, es könnte die Zugdatei sein. Haben Sie die drei Dateien ursprünglich zusammengeführt?

Probieren Sie es aus.

Ja, ich habe alle 3 Dateien zusammengeführt und dann einfach die Länge der Abschnitte angegeben.
 
elibrarius #:
Ja, ich kombiniere alle drei, und dann gebe ich einfach die Längen der Abschnitte ein.

Ich verstehe, das ist gut.

Ich denke, es gibt eine Möglichkeit, das Training zu verbessern, indem man die Stichprobe verkleinert, z.B. auf 1/10 - das würde es ermöglichen, eine bestimmte Phase/Struktur des Marktes zu trainieren - ich habe es noch nicht gebraucht.

 

Nur durch Änderung der Lernrate war es möglich, zwei von 100 Modellen zu erhalten, die das Kriterium erfüllten.

Das erste.

Das zweite.

Es stellt sich heraus, dass CatBoost in der Tat zu vielem fähig ist, aber es ist notwendig, die Einstellungen aggressiver zu gestalten.

 
Aleksey Vyazmikin #:

Gut, dann ist das in Ordnung.

Ich denke, es gibt eine Möglichkeit, die Ausbildung zu verbessern, indem man die Stichprobe verkleinert, sagen wir auf 1/10 - das würde es ermöglichen, eine bestimmte Phase/Struktur des Marktes zu trainieren - was bisher nicht erforderlich ist.

Ich habe versucht, mit Valking Forward bei 1000 und bei 20000 zu trainieren - alles schlägt fehl.
 
Wo unterrichten Sie eine Klasse Handel/kein Handel?
Oder kaufen und verkaufen Sie getrennt?
 
elibrarius #:
Wo lehren Sie eine Klasse, zu handeln/nicht zu handeln?
Oder kaufen und verkaufen Sie getrennt?

Die Ergebnisse stammen von Proben ohne Zielumwandlung, d.h. ja - handeln und nicht handeln.

Aber tatsächlich wäre es einfacher, getrennte Kauf- und Verkaufsproben zu erstellen.

elibrarius #:
hat versucht zu lernen, indem es bei 1000 und bei 20000 vorwärts gewertet hat - alles verpufft.

Hmm, seltsam. Welche Methode verwenden Sie für das Training - Random Forest?

 
Aleksey Vyazmikin #:

Hmm, seltsam. Welche Methode verwenden Sie für das Training - Random Forest?

Umgestaltet von Alglibow.
Ich lasse jetzt mehr Bäume laufen. Bis morgen früh wird es wohl eine neue Version berechnen.

Oder vielleicht habe ich etwas falsch gemacht, wenn das Ergebnis viel schlechter ist als Ihres.

Grund der Beschwerde: