Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2426

 
mytarmailS:

Nun zur Antwort auf die erste Frage.

Ich danke Ihnen!

Ich werde versuchen, es herauszufinden, aber es ist schwer, es auf Anhieb zu verstehen - die Codesyntax unterscheidet sich doch sehr von C++.

 
elibrarius:

Glauben Sie nicht, dass Sie Ihr Modell auf die erfolgreichste Version im Test abstimmen?

Was denken Sie, wann sollte ich mich auf einen Test einstellen? Sampling "Test" wird verwendet, um die Ausbildung zu stoppen, in Projekte, mit einer Ausnahme, es gibt überhaupt nicht, dann habe ich es in der endgültigen Ausbildung - gut können Sie es mit einer festen Anzahl von Bäumen ersetzen - 50/100/300/500/800 und sehen das Ergebnis auf allen Proben, dann glauben Sie, wird deutlich schlechtere Ergebnisse erhalten?

 
Aleksey Vyazmikin:

Ich danke Ihnen!

Ich werde versuchen, es herauszufinden, aber es ist schwer, es auf Anhieb zu verstehen, weil die Codesyntax ganz anders als in C++ ist.

Viele unbekannte Funktionen, da die Sprache auf hohem Niveau ist.
Aber was Sie in 300 Zeilen in C++ schreiben, kann ich in 3 Zeilen schreiben)

 
Aleksey Vyazmikin:

Zu welchem Zeitpunkt sollte ich Ihrer Meinung nach einen Test durchführen? Die Stichprobe "Test" wird verwendet, um das Training zu beenden, in den Projekten, mit einer Ausnahme, ist sie überhaupt nicht vorhanden, dann habe ich sie im abschließenden Training verwendet - nun, Sie können sie durch eine feste Anzahl von Bäumen ersetzen - 50/100/300/500/800 und das Ergebnis auf allen Stichproben sehen, glauben Sie dann, dass das Ergebnis viel schlechter sein wird?

Ja, auch die Beendigung des Trainings ist ein Testlauf. Ich kenne die anderen Details Ihres Systems nicht, ich kann nicht mehr dazu sagen.
Bei der Crosvalidierung sind alle Daten ein Test und alle sind auch Züge. Es ist immer nur einer auf einmal. Sie wollten nur die Fläche des Tabletts um 40 % vergrößern.
 
mytarmailS:
Viele ungewohnte Funktionen, da die Sprache hochrangig ist.
Aber was Sie in 300 Zeilen in C++ schreiben, kann ich in 3 Zeilen schreiben))

Ich glaube nicht, dass alle meine Perversionen einfach in R implementiert werden können :)

 
elibrarius:
Ja - auch die Beendigung der Ausbildung ist ein Testlauf. Ich kenne keine weiteren Details Ihres Systems, daher kann ich nichts weiter dazu sagen

Ich stimme zu, dass dies theoretisch das Ergebnis der Stichprobe erhöht, aber ich bewerte das Ergebnis der Prüfungsstichprobe!

Nun, ich denke, ich habe alle Details behandelt, wenn Sie Fragen haben, stellen Sie sie bitte.

elibrarius:
Bei der Crosvalidierung sind alle Daten ein Test und alle Daten sind auch ein Praktikum. Es ist nur einer nach dem anderen. Sie wollten nur die Fläche des Tabletts um 40 % vergrößern.

Welchen Zweck verfolgen Sie mit der Crosvalidierung? Ich sehe den Sinn darin, nach Hyperparametern des Modells zu suchen, da es im Durchschnitt zeigen wird, welche Einstellungen auf Zufallsplots am besten sind.

 
Aleksey Vyazmikin:

Ich glaube nicht, dass man alle meine Perversionen einfach in R implementieren kann :)

Ahahaha))))

Wenn ich meine Perversionen verwirklichen kann, sind Ihre wie eine Erholung)

 
Aleksey Vyazmikin:

OK, was ist der Zweck der Kreuzvalidierung? Ich sehe seinen Zweck darin, die Hyperparameter des Modells zu finden, da es im Durchschnitt zeigt, welche Einstellungen auf Zufallsplots die besten sind.

Das ist genau das, wofür es gedacht ist. Brauchen Sie sonst noch etwas? Und eine bestimmte Anzahl von Merkmalen. Bei unterschiedlichen Attributen werden die Hyperparameter wahrscheinlich unterschiedlich sein. Wenn Sie die besten Hyperparameter ausgewählt haben, müssen Sie mit ihnen arbeiten.

Aleksey Vyazmikin:
Nun, ich denke, ich habe alle Einzelheiten beschrieben, falls Sie noch Fragen haben.

Ich bin zu faul, um ins Detail zu gehen.

 
mytarmailS:

Ahahaha))))

Wenn ich meine eigenen Perversionen umsetzen kann, sind Ihre wie ein Rest)

Nun, da ich ein Skript zur Vorbereitung der Daten erstellt habe, muss ich noch eine Datei erstellen, in der die ausgeschlossenen Spalten aufgelistet sind, die Folgendes umfassen:

1. Spalten mit korrelierten Prädiktoren (wie wird übrigens ausgewählt, welche Spalte zu verwerfen ist, z. B. 5 korrelierte Prädiktoren)?

2. Spalten, die aus der ersten Dateitabelle verworfen werden, mit Ausnahme der Spalte mit dem Ziel.

Außerdem sollte die Spalte mit der Zielbezeichnung in die Datei geschrieben werden, wobei vorzugsweise nach dem Spaltennamen gesucht werden sollte.

Der Aufbau der Datei ist

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary
 
elibrarius:

Das ist genau das, wofür es gedacht ist. Brauchen Sie sonst noch etwas? Und eine bestimmte Anzahl von Merkmalen. Bei unterschiedlichen Attributen werden die Hyperparameter wahrscheinlich unterschiedlich sein. Diejenigen, die Sie mit den besten Hyperparametern auswählen, sind diejenigen, die Sie zum Einsatz bringen müssen.

Ich bin zu faul, um mich damit zu befassen.

Ich muss die richtigen Prädiktoren in kürzerer Zeit auswählen. Die Prädiktoren noch einmal durchzugehen, würde die Verarbeitungszeit um das Hundertfache erhöhen. Meine Methode basiert auf der Logik, dass ein guter Prädiktor (einschließlich eines für eine bestimmte Lernmethode geeigneten) vom Modell in allen Stichprobenintervallen verlangt wird, was eine Anpassung an den Stichprobenbereich ausschließt.