Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1537

 
Maxim Dmitrievsky:

Argumente?

Welche Argumente werden benötigt - Parameter 6 ist der Standardwert, er ergibt sich aus der Einstellungstabelle.

Es ist seltsam, denn die Baumtiefe hängt mehr von vollständigen Verknüpfungen zwischen Prädiktoren ab. Deshalb bin ich überrascht, dass man aus diesen beiden unabhängigen Verknüpfungen mit einer Gesamtkomplexität in der Nähe von 200 ein gutes Modell erhält, wenn man die Graphen betrachtet.

 
Aleksey Vyazmikin:

Welche Argumente benötigt werden - standardmäßig Parameter 6 - ergibt sich aus der Einstellungstabelle.

Das ist seltsam, denn die Tiefe des Baums hängt mehr von den vollständigen Verknüpfungen zwischen den Prädiktoren ab. Es ist daher überraschend, dass diese beiden unabhängigen Verknüpfungen mit einer Gesamtkomplexität von etwa 200 ein gutes Modell ergeben, wenn man die Graphen betrachtet.

Deshalb sage ich: Die Daten sind raus. Forest neu trainiert (vielleicht kann man dieses Merkmal des Forests korrigieren, indem man die Merkmale kategorisiert). Jetzt setzen 6 - Umschulung auf trayn geht super, acurasi unter 0,9.

6 für mich zu viel, 2-4 ist normal

Die Analogie mit dem Wald ist einfach, es gibt keine Begrenzung für die Tiefe der Bäume
 
Maxim Dmitrievsky:

Deshalb sage ich ja, dass die Daten herausgenommen werden. Forest neu trainiert (möglicherweise kann dieses Merkmal des Forests durch Kategorisierung der Merkmale behoben werden). Jetzt setzen 6 - Umschulung auf Spur geht erheblich, acurasi unter 0,9.

6 für meine zu viel, 2-4 geht normal

Die Analogie zum Wald ist einfach, denn dort ist die Tiefe der Bäume nicht begrenzt.

Ich verstehe nicht, Sie sagten vorhin, dass Sie Prädiktoren in Form von Inkrementen haben, wie wollen Sie diese dann in kategoriale Prädiktoren umwandeln?

An der Baumdarstellung ändert sich im Grunde nicht viel - ich habe Bäume seziert, es gibt viele einzelne Baumblätter, die im Grunde nur zu einem langen Blatt zusammengefasst sind, und ein sehr großer Teil dieser Blätter ist doppelt vorhanden oder hat bedeutungslose Zwischenwerte/Verknüpfungen, die beschnitten werden können. Im Allgemeinen habe ich bei meiner Stichprobe gesehen, dass die Baumtiefe die Anzahl der Bäume beeinflusst, und man kann das gleiche Ergebnis bei einem Baum mit 4 Splits erhalten.

 
Aleksey Vyazmikin:

Ich verstehe nicht, Sie sagten vorhin, dass Sie Prädiktoren in Form von Inkrementen haben, wie wollen Sie diese dann in kategoriale Prädiktoren umwandeln?

An der Baumdarstellung ändert sich im Grunde nicht viel - ich habe Bäume seziert, es gibt viele einzelne Baumblätter, die im Grunde nur zu einem langen Blatt zusammengefasst sind, und ein sehr großer Teil dieser Blätter ist doppelt vorhanden oder hat bedeutungslose Zwischenwerte/Verknüpfungen, die beschnitten werden können. Im Allgemeinen habe ich bei meiner Stichprobe gesehen, dass die Tiefe des Baums die Anzahl der Bäume beeinflusst, und man kann das gleiche Ergebnis bei einem Baum mit 4 Splits erhalten.

Zuerst in Kategorien aufteilen, z.B. 20 Bereiche-Kategorien. Dann Vanchot-Codierung (über Dummy-Attribute) oder was auch immer, noch unentschieden. Am Ende wird jedes Merkmal binär oder so ähnlich sein.

je mehr unterschiedliche Werte für den Wald vorliegen, desto mehr Übertraining. Mit zunehmender Größe der Trainingsstichprobe nimmt das Übertraining zu. Bei Catbust ist das nicht der Fall. Versuchen Sie also, die Anzahl der Auswahlmöglichkeiten für kontinuierliche Merkmale zu reduzieren, indem Sie sie kategorisieren. Ich bin nicht sicher, ob das hilft, wir werden sehen.

Ich bin mir nicht sicher, ob es dich retten wird, mal sehen.

 
Maxim Dmitrievsky:

Unterteilen Sie sie zunächst in Kategorien, z. B. 20 Ränge. Dann Vanchot-Kodierung (über Dummy-Attribute) oder etwas anderes, ich habe mich noch nicht entschieden. Am Ende wird jedes Merkmal binär oder so ähnlich sein.

Ich weiß nicht, es geht eher darum, die Datenverarbeitung zu beschleunigen, solche Prädiktoren nicht zu fragmentieren, nicht in einer Kette von Blättern miteinander zu vergleichen, ich habe leider keine nennenswerte Wirkung gesehen. Und die Logik ist, dass es sich nicht um vergleichbare Werte handelt, sondern um Vanchoring, das in einer Gruppe zusammengefasst wird, um die Zufallsauswahl auszugleichen.

Maxim Dmitrievsky:
je mehr verschiedene Werte für einen Wald, desto mehr Übertraining. Mit zunehmender Größe der Trainingsstichprobe nimmt das Übertraining zu. Das ist beim Catbust nicht der Fall.

Die Abhängigkeit der Stichprobe von der Ausbildung ist dort auch nicht eindeutig - ich habe ein halbes Jahr oder früher ähnliche Studien gemacht. Vielmehr besteht eine Abhängigkeit von den Daten, die vergleichbar sein sollten.

 
Maxim Dmitrievsky:

Ein einfacher und interessanter Ansatz für die Beschreibung von Mustern für MoD

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

mega-primitiv, es gibt viel genauere Möglichkeiten, ein Muster zu beschreiben

 
mytarmailS:

mega-primitiv, es gibt Möglichkeiten, das Muster viel genauer zu beschreiben

Was zum Beispiel?

 
Alexander_K:
Ich schließe mich den Bitten derer an, die leiden. Ich bitte mit gesenktem Kopf um eine Verbindung zum Gral.
Alexander_K:

Ich bin bereit, einen angemessenen Betrag für den Gral zu zahlen, bestätigt auf der realen (Testberichte interessieren mich nicht) für mindestens 3 Monate Arbeit.

Ich glaube, dass der tatsächliche Wert des Grals = die Summe des aktuellen Eigenkapitals des Händlers ist. D.h. 1000 $ Eigenkapital auf dem Konto, so dass der TS den gleichen Betrag wert ist. Wenn meine Verwendung des Grals auf neuronalen Netzwerktechnologien und/oder physikalischen und mathematischen Modellen, den realen Statistiken und der Bereitschaft, sie zu verkaufen, basiert, zögern Sie bitte nicht, mich zu kontaktieren und wir werden es diskutieren.

Wer wirklich am Markt verdient, wird seine Technologie nicht für Millionen, vielleicht für Hunderte von Millionen verkaufen... D.h. wenn ihnen jemand eine Software-"Blackbox" gibt, die gute Prognosen oder vorgefertigte Signale erstellt, brauchen sie 10-30 $ pro Monat für Daten und die Ausführungsqualität ist sogar noch teurer als die Daten, es ist wie der Vergleich zwischen einem Kind im Sandkasten und einem Goldgräberunternehmen, das Kind will mit seiner Schaufel Gold schürfen, aber es kann es nicht... Vielleicht ein anderer Spachtel? Fragen Sie andere Kinder im Kindergarten, die eine solche Schaufel haben? Höchstwahrscheinlich wird jemand eines haben. Kinder sind oft Träumer:)

 
Aleksey Vyazmikin:

Ich weiß nicht, es geht eher darum, die Datenverarbeitung zu beschleunigen, solche Prädiktoren nicht aufzuteilen, nicht in der gleichen Blattkette miteinander zu vergleichen, ich habe leider keinen nennenswerten Effekt gesehen. Und die Logik ist, dass es sich nicht um vergleichbare Werte handelt, sondern um eine kombinierte Vanchot-Codierung, um die zufällige Auswahl auszugleichen.

Die Abhängigkeit der Stichprobe vom Lernen ist dort auch nicht eindeutig - ich habe ein halbes Jahr oder früher ähnliche Studien gemacht. Vielmehr besteht eine Abhängigkeit von den Daten, die vergleichbar sein sollten.

In dem englischen Artikel geht es genau darum, ja, nicht die Werte einer Variable miteinander zu vergleichen, wenn es viele davon gibt - das führt nur zu Übertraining

Vielleicht liegt es nicht an der Länge, sondern an etwas anderem, ich sage Ihnen nur, was ich sehe. Ich erhöhe das Sampling - bei Trayne wird es schöner, bei Test schlechter. Obwohl die Verallgemeinerung mit zunehmender Größe der Schale zunehmen sollte, ist es im Wald genau andersherum.

 
Maxim Dmitrievsky:

wie zum Beispiel?

dtw, Spektrumanalyse... ein Haufen...

Es ist mir gelungen, einen Algorithmus zu erstellen, der die gleichen Muster unabhängig von ihrer Größe erkennt, so dass der Algorithmus ein Diagramm betrachtet und das Muster sowohl im Ein-Minuten- als auch im Ein-Wochen-Diagramm sieht, indem er nur ein Diagramm betrachtet, und er kann echte Vorhersagen machen, aber ich habe noch viel Arbeit