Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1710

 
Maxim Dmitrievsky:

Max! Erinnere mich noch einmal daran, wie diese Modelle heißen...

1) Modell 1 wird trainiert

2) Modell 2 wird auf der Grundlage der Vorhersagen für die Testdaten von Modell 1 trainiert usw...

Stapeln ?

 
Aleksey Vyazmikin:

Ja, seltsame Ergebnisse. Wird die Wahrscheinlichkeit nicht aus der an der Ausbildung beteiligten Stichprobe entnommen? Aber es scheint ein Fehler vorzuliegen.

Und wie viele Gesamteinheiten (Ziellinien) sind in der Stichprobe enthalten?
Keine Testprobe.
Der Datensatz enthält insgesamt 891 Zeilen.

Ich denke, eine der Formeln rms,rmse,cls oder etwas anderes wird dort verwendet. Die Hauptsache ist, dass das Ergebnis bei 0 %, 50 % und 100 % konvergiert. Und dazwischen sind sie gekrümmt. Die Aufteilung nach Klassen erfolgt in der Regel zu 50 %, und an dieser Stelle gibt es mit normaler Wahrscheinlichkeit eine Übereinstimmung. Also beschloss ich, das Problem ungelöst zu lassen.
 
Aleksey Vyazmikin:
elibrarius:

Darf ich Ihnen eine Frage stellen?

Warum ketbust? Was hat es, was analoge Produkte nicht haben?

 
elibrarius:
Keine Testprobe.
Der Datensatz enthält insgesamt 891 Zeilen.

Ich denke, eine der Formeln rms,rmse,cls oder etwas anderes wird dort verwendet. Das Wichtigste ist, dass das Ergebnis bei 0%, 50% und 100% konvergiert. Und dazwischen sind sie gekrümmt. Die Aufteilung nach Klassen erfolgt in der Regel zu 50 %, und an diesem Punkt gibt es eine gemeinsame Wahrscheinlichkeitsübereinstimmung. Also beschloss ich, das Problem ungelöst zu lassen.

Ja, um die Tiefe der Idee zu verstehen, muss man den Code knacken. Aber es ist interessant, wie sie die Blätter gewichten und dabei die bereits vorhandenen Blätter berücksichtigen.

 
mytarmailS:

Darf ich Ihnen eine Frage stellen?

Warum ketbust? Was hat es, was die analogen Produkte nicht haben?

Ich bin aus folgenden Gründen daran interessiert:

1. Support - viele Informationen und Rückmeldungen von Entwicklern.

2. schnelles Lernen - Nutzung aller Prozessorkerne.

3. Flexible Einstellungen für die Modellbildung und die Steuerung der Umschulung - obwohl es hier noch viel zu verbessern gibt.

4. Fähigkeit, binäre symmetrische Modelle nach dem Training in MQL5 anzuwenden, aber das ist nicht meine Entwicklung.

 
Aleksey Vyazmikin:

danke

 

Jeder kann interessiert sein an

Es gibt ein neues Buch über Zeitreihenprognosen in R, das auch Beispiele für Bitcoin-Prognosen enthält

https://ranalytics.github.io/tsa-with-r/

 
Aleksey Vyazmikin:

Ja, um die Tiefe der Idee zu verstehen, muss man den Code knacken. Interessant ist jedoch, wie sie den Blättern Gewichtungen zuweisen und dabei die vorhandenen Blätter berücksichtigen.

Per Definition
Die Idee des Gradient Binning besteht darin, ein Ensemble von sich gegenseitig verfeinernden Elementarmodellen zu erstellen. Das n-te Elementarmodell wird anhand der "Fehler" des Ensembles von n-1 Modellen trainiert, und die Antworten der Modelle werden zusammen gewichtet. "Fehler" steht hier in Anführungszeichen, da jedes aufeinanderfolgende Modell den Antigradienten der Verlustfunktion annähert, der nicht notwendigerweise gleich der Differenz zwischen tatsächlichen und vorhergesagten Werten ist (d. h. ein Fehler im wörtlichen Sinne).

Es scheint, dass die Gewichte wie üblich - durch die Wahrscheinlichkeit - bestimmt werden.
Aber die Aufteilung ist offensichtlich nicht nur die beste, sondern auch diejenige, die das Gesamtergebnis verbessert. Aber das ist nur eine Vermutung. Es ist unmöglich, den Code zu durchschauen, da er kilometerlange Listen enthält. Es handelt sich nicht um 4000 Strings aus der Alglib.

mytarmailS:

Warum catbust? Was hat es, was die analogen Produkte nicht haben?

Ich stimme mit Alexey überein. Ich habe einige Erfahrung mit xgboost. Es wird möglich sein, in der Praxis zu vergleichen.
 
elibrarius:

Ich frage nur, warum, ich sehe, Sie kämpfen mit diesen Bäumen von ketbust, es gibt einige Probleme mit der Ausgabe, Krücken ...

Ich habe mich ein wenig mit dem Thema "Regelinduktion" beschäftigt, und ich sehe, dass R viele Regelgenerierungspakete oder Regelensembles hat...


1) Regeln sind einfach auszugeben, eine Zeile

2) die Regeln sind für einen Menschen leicht zu lesen

3) Arten von Regelgenerierungshaufen, von trivial bis genetisch

4) die Qualität der Vorhersage ist gleichwertig mit allem anderen


Deshalb denke ich, dass Sie sich vielleicht nicht mit Ketbust beschäftigen sollten. und etwas Angenehmeres wählen oder so etwas...

 
mytarmailS:

Max! Erinnere mich noch einmal daran, wie diese Modelle heißen...

1) Modell 1 wird trainiert

2) Modell 2 wird auf der Grundlage der Vorhersagen für die Testdaten von Modell 1 trainiert usw...

Stapeln ?

meta-etikettierung de prado