Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1275

 
Maxim Dmitrievsky:

Das ist Unsinn, denn Sie imitieren den Wald- und Boosting-Algorithmus, anstatt die Theorie zu lesen, warum er funktioniert, noch einmal.

Wieder lesen Sie nicht genau - ich verwerfe den Wurzelprädiktor nach einem bestimmten Kriterium, während CatBoost dies willkürlich tut.

Danke für das Bild, als ich die Gelegenheit hatte, mit Doc zu sprechen, war es so.

 
Aleksey Vyazmikin:

Wieder lesen Sie nicht genau - ich verwerfe den Wurzelprädiktor nach einem bestimmten Kriterium, während CatBoost dies willkürlich tut.

Danke für das Bild. Als ich die Gelegenheit hatte, mit Doc zu sprechen, war es auch so.

Es ist mir egal, wonach Sie kratzen, der Algorithmus hängt überhaupt nicht davon ab... er hängt von der Anzahl der Splits pro Merkmal ab, nicht von der Wurzel.

 
Maxim Dmitrievsky:

Der Alphastar-Algorithmus wurde eigens für Revashn von einer vollständigen Kartenansicht in eine Slice-Ansicht geändert, sie haben es nicht richtig gemacht.

man kann sehen, dass der Bot langsam zwischen den Fenstern wechselt, nicht versteht, wo das Prisma ist und hin und her läuft

Es ist ein Fehler.

Ich habe keinen Respekt vor Ihnen.

Kommunizieren Sie nicht mit mir, Maxim, ich zwinge Sie nicht. Ich respektiere jeden, mit dem ich spreche, so lange er nicht unhöflich wird.

Sie beziehen sich wieder auf die Kommentare hinter den Kulissen, wie stellen Sie sich technisch vor, was passiert ist? Glauben Sie nicht, dass die Bildrate der allgemeinen Kartensammlung einfach gesunken ist? Die Visualisierung der Gesamtkarte, angeblich durch die Augen des Netzes, erfolgt durch eine schnelle Bewegung von Bild zu Bild über den Bildschirm, und es kann keine andere Option geben. Und das Gerede von "wie ein Mensch sieht" ist Unsinn und kann nur die Phantasie eines Menschen widerspiegeln, wie er sieht.

Bot sieht eine Einheit und reagiert angemessen, nach dem Algorithmus - schützt die Basis, sein Problem ist, dass er nicht teilen konnte die Truppen - zum Schutz der Basis und Angriff - es gibt eine Vielzahl von Eile überall, und wenn es um die Entwicklung ging, fusionierte der Bot.

 
Maxim Dmitrievsky:

Was auch immer Sie fallen lassen, der Algorithmus hängt davon überhaupt nicht ab... die Bedeutung hängt von der Anzahl der Splits pro Merkmal ab, nicht von der Wurzel.

Das klingt nach Unwissenheit... Wenn Bücher eine solche Methode nicht beschreiben, ist sie offensichtlich schlecht...

 
Aleksey Vyazmikin:

Das klingt nach Unwissenheit... Wenn in den Büchern eine solche Methode nicht beschrieben wird, dann ist sie wissentlich schlecht...

das ist Unwissenheit Ihrerseits... es ist eine Diskussion über etwas, das nicht klar ist und einige spezielle Definitionen und Bedeutungen hat...)

 
Aleksey Vyazmikin:

Quatschen Sie nicht, Maxim, ich zwinge Sie nicht dazu. Ich respektiere alle Gesprächspartner, solange sie nicht unhöflich werden.

Sie beziehen sich wieder auf Kommentare hinter den Kulissen, wie stellen Sie sich technisch vor, was passiert ist? Glauben Sie nicht, dass die Bildrate der allgemeinen Kartensammlung einfach gesunken ist? Die Visualisierung der Gesamtkarte, angeblich durch die Augen des Netzes, erfolgt durch eine schnelle Bewegung von Bild zu Bild über den Bildschirm, und es kann keine andere Option geben. Und das Gerede von "wie ein Mensch sieht" ist Unsinn und kann nur die Phantasie eines Menschen widerspiegeln, wie er sieht.

Bot sieht eine Einheit und reagiert angemessen, nach dem Algorithmus - schützt die Basis, sein Problem ist, dass er nicht teilen konnte die Truppen - zum Schutz der Basis und Angriff - es gibt eine Vielzahl von Rush überall, und wenn es um die Entwicklung ging, fusionierte der Bot.

Shurik, du bist dumm, tut mir leid.

 
Maxim Dmitrievsky:

Shurik, du bist dumm, es tut mir leid.

Ich weiß nicht, warum du so tief sinkst und dich so hysterisch aufführst...

Haben Sie keine Angst, mit dem Kopf zu denken, und verurteilen Sie nicht diejenigen, die das tun.

 
Aleksey Vyazmikin:

Ich weiß nicht, warum du so tief sinkst und dich so hysterisch aufführst...

Haben Sie keine Angst, mit dem Kopf zu denken, und verurteilen Sie nicht diejenigen, die das tun.

Gott vergebe mir.

 
Das Thema hat sich in einen Mülleimer verwandelt :).
 
elibrarius:
Bitte fügen Sie den Code (oder ls), interessant zu sehen. Vielleicht wird ja etwas Neues gefunden.

Übrigens, Alglib verwendet eine zufällige Menge von Prädiktoren (standardmäßig 50% der Gesamtzahl), um die Partitionierung in jedem Knoten zu wählen. Dies scheint ein Standardansatz der Erfinder von Random Forest zu sein. Das Ergebnis ist eine große Vielfalt an Bäumen.
Es ist jedoch schwierig, die besten zu finden, da der Unterschied im endgültigen Fehler nicht mehr als 1 % beträgt. D.h. alle Bäume kommen ungefähr zum gleichen Ergebnis, aber in einem Baum für einen Prädiktor gab es früher eine Aufspaltung, in einem anderen Baum für denselben Prädiktor später (weil er früher von der Liste für die Aufspaltung ausgeschlossen wurde).


Im Allgemeinen gibt es ein Problem bei der Auswahl der Prädiktoren. Ich denke daran, eine vollständige Suche durchzuführen, um 100 Prädiktoren zu prüfen, jeweils 1 hinzuzufügen und die zu belassen, die das Ergebnis verbessern. Wenn Sie den Wurzelprädiktor nach komplexen Berechnungen 40 Mal ausschließen, ist es vielleicht einfacher, mit roher Gewalt vorzugehen? Oder haben Sie dort etwa tausend Prädiktoren?

Der Punkt ist, dass selbst wenn von allen 50% genommen werden, dann gibt es weiterhin eine klare Auswahl aus diesen 50% auf der ersten Wurzel Split (oder in Alglib ist es nicht so?). CatBoost hat nicht nur eine zufällige Auswahl von Prädiktoren, sondern auch eine zufällige Aufteilung (Gewichte werden zufällig zu den Berechnungen hinzugefügt) auf die ersten Bäume.

Ich erhalte unterschiedliche Ergebnisse, und mein Ziel ist es nicht, das gesamte Modell zu schätzen, sondern Blätter zu erhalten, die mit hoher Wahrscheinlichkeit die Mehrheit der Stichprobe beschreiben. Dann werden diese Blätter Jahr für Jahr auf ihre Historie hin getestet, und es wird eine Zusammensetzung daraus erstellt, die vielleicht nicht den gesamten Markt beschreibt, aber ich denke, es ist besser, genauere Antworten auf das zu haben, was man weiß, als in den meisten Fällen mit einer Wahrscheinlichkeit von 50 % zu raten.

Predictors, wird nun in der Größenordnung von 600 liegen, so dass eine vollständige Überschreitung nicht mehr realistisch ist.