Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3049

 
Aleksey Nikolayev #:

Ist das Konzept des RL für Handelsaufgaben nicht überflüssig? Wir haben den Einfluss der Umwelt auf den Agenten, aber gibt es auch einen Einfluss des Agenten auf die Umwelt? Es ist möglich, diesen zweiten Einfluss künstlich einzuführen, aber ist das auch sinnvoll?

Zwei (oder drei) Ideen aus dem Artikel sind für uns keineswegs überflüssig - nämlich, dass die Verlustfunktion genau das widerspiegeln sollte, was wir brauchen, und dass sie glatt (und monoton) sein sollte. In unserem Fall sollte es der Gewinn sein, und er sollte gleichmäßig und monoton von den Modellparametern abhängen.

Die Glättung eines Analogons des Gewinns kann wahrscheinlich irgendwie erreicht werden (zum Beispiel durch so etwas wie Kernel-Glättung). Aber ich bezweifle sehr, dass die Monotonie gegeben ist.

Die Grundlage des finanziellen Ergebnisses des Handels ist die Preisbewegung - ein nicht-stationärer Zufallsprozess.

Versuchen wir, einen nicht-stationären Zufallsprozess durch irgendwelche Tricks in einen glatten und monotonen Prozess zu verwandeln? Vielleicht gehen wir auf Distanz? Vor allem, wenn man bedenkt, dass ein Klassifizierungsfehler von weniger als 20 %(!) außerhalb des Trainingssatzes extrem schwer zu erreichen ist. Vielleicht sollten wir zunächst daran arbeiten, den Klassifizierungsfehler zu verringern?

 

Lesen Sie den Artikel.

Was nützt uns dieser Artikel?

Er ist völlig zweifelhaft.

Und zwar aus folgendem Grund.

Ich kann mich an keine Veröffentlichung über KI (MO) erinnern, die die Zukunft vorhersagen würde. Sie bringen einem Modell bei, handgeschriebene Buchstaben zu schreiben. Dann versuchen sie, diese handgeschriebenen Buchstaben zu erkennen. Aber dem Modell wird PRINZIPIELL nicht beigebracht, vorherzusagen, welcher Buchstabe als nächstes geschrieben werden wird.

Das ist das Problem, das wir haben.

Wir versuchen, mit Hilfe von MO (dieselbe Arbeit, die wir mit Candlestick-Kombinationen gemacht haben) einige Muster in den Prädiktoren zu finden, die eine korrekte Vorhersage liefern werden. Es gibt jedoch keine Garantie dafür, dass die gefundenen Muster auch in Zukunft korrekte Vorhersagen liefern werden. "Richtige" Muster werden einen Fehler ergeben und "falsche" Muster werden das Richtige vorhersagen. Der Grund dafür liegt in den Klassifizierungsalgorithmen selbst, die die VERLÄSSLICHKEIT einer Klasse angeben, nicht ihren Wert. Wir verwenden die primitivste Regularisierung von 0,5 zur Einteilung in Klassen. Und wenn beim Training die Wahrscheinlichkeit eines "richtigen" Musters = 0,5000001 ist, warum nehmen wir dann diese Wahrscheinlichkeit als Klassenwert?

Um davon wegzukommen, fangen wir an, einen Gemüsegarten anzubauen, aber die Werte der Prädiktoren, unter denen wir nach Mustern suchen, sind entweder NICHT stationär oder pseudostationär und haben eine entfernte Beziehung zum Preis!

 
Aleksey Nikolayev #:

Wir haben den Einfluss der Umwelt auf den Akteur, aber gibt es auch einen Einfluss des Akteurs auf die Umwelt? Wahrscheinlich ist es möglich, diesen zweiten Einfluss künstlich einzuführen, aber ist das sinnvoll?

Das hängt von der jeweiligen Aufgabe ab.

Wenn wir ein fertiges Ziel vorhersagen, wie es die überwiegende Mehrheit tut, dann haben wir keinen Einfluss auf die Umwelt, und es gibt keinen Bedarf für RL.

Wenn aber z.B. die Aufgabe des Positionsmanagements, Stops, Take-Outs...

Die Vermögensverwaltung ist die Umgebung, die wir (Agenten) verwalten.


Der Agent entscheidet, ob er einen Auftrag erteilt oder nicht.

zu welchem Preis,

und wann er sie herausnimmt oder verschiebt,

und was wird er tun, wenn der aktuelle Verlust auf der aktuellen Position n Pips übersteigt,

und was wird er tun, wenn er fünf Verluste in Folge hat?


Sie sehen, dies ist eine ganz andere Ebene der Aufgabe, mit einer Menge von Zuständen (Ausgängen), nicht ein primitives Auf/Ab in der Klassifizierung


Um es noch einfacher zu machen - wir können den Markt nicht managen, aber wir können Positionen und Risiken managen, weil wir es können!


Aleksey Nikolayev #:

Die Glättung eines Analogons des Gewinns kann wahrscheinlich irgendwie erreicht werden (zum Beispiel durch so etwas wie Kernel-Glättung). Aber ich bezweifle sehr, dass sie monoton ist.

Ich verstehe nicht wirklich, was mit "Glattheit" gemeint ist und warum "Glattheit" notwendig ist....

Vielleicht können wir eine multikriterielle Optimierung verwenden, um die beste Lösung für dieses Problem zu finden.

 
mytarmailS #:

Es kommt auf die jeweilige Aufgabe an.

Wenn wir ein fertiges Ziel prognostizieren, wie es die überwiegende Mehrheit der Menschen tut, dann haben wir keinen Einfluss auf die Umwelt, und es gibt keinen Bedarf für RL selbst....

Wenn aber z.B. die Aufgabe des Positionsmanagements, Stopps, Take-Outs ...

Die Vermögensverwaltung ist die Umwelt, die wir (der Agent) verwalten...


Der Agent entscheidet, einen Auftrag zu erteilen oder nicht zu erteilen.

zu welchem Preis,

und wann er ihn herausnehmen oder verschieben will,

und was wird er tun, wenn der aktuelle Verlust der aktuellen Position n Punkte überschreitet,

und was macht er, wenn er fünf Verluste in Folge hat...


Sie sehen, dies ist eine ganz andere Ebene der Aufgabe, mit einer Menge von Zuständen (Ausgängen), nicht ein primitives Auf/Ab bei der Klassifizierung


Um es noch einfacher auszudrücken: Wir können den Markt nicht managen, aber wir können Positionen und Risiken managen, das können wir!


Ich verstehe nicht wirklich, was es mit der "Glattheit" auf sich hat und warum man sie braucht....

Vielleicht können wir eine multikriterielle Optimierung auf die Suche anwenden.

Wir könnten den Mittelwert des Agenten ermitteln.
 
Valeriy Yastremskiy #:
Es ist möglich, dass ein Agent den Durchschnitt erreicht.
https://www.mql5.com/ru/code/22915
 
СанСаныч Фоменко #:

Die Grundlage des finanziellen Ergebnisses des Handels ist die Preisbewegung - ein nicht-stationärer Zufallsprozess.

Versuchen wir, einen nicht-stationären Zufallsprozess mit einigen Tricks in einen glatten und monotonen Prozess zu verwandeln? Vielleicht gehen wir auf Distanz? Vor allem, wenn man bedenkt, dass ein Klassifizierungsfehler von weniger als 20 %(!) außerhalb der Trainingsmenge extrem schwer zu erreichen ist. Vielleicht sollten wir zunächst daran arbeiten, den Klassifizierungsfehler zu verringern?

Ich habe über die Eigenschaften der Verlustfunktion gesprochen, die durch das Training des Modells minimiert wird. Genauer gesagt, über ihre ideale Form.

 
mytarmailS #:

Ich verstehe nicht wirklich, was die Glätte ausmacht und warum Glätte notwendig ist.

Es geht um die Grundlagen der Optimierung. Die Glätte ermöglicht eine Optimierung mit Hilfe eines Gradienten. Andernfalls bleiben nur brutale Algorithmen übrig.

 
Aleksey Nikolayev #:

Das sind die Grundlagen der Optimierung

Ja, das weiß ich, aber vor kurzem wurde über die Glätte der Kapitalkurve selbst gesprochen, so dass ich mich nicht wirklich mit diesen Diskussionen befasst habe, deshalb frage ich, was Sie meinen.

 

Off-Topic.

eines der besten Angebote überhaupt.

Gold

Risiko/Ertrag 1 zu 24

 
mytarmailS #:

Offtopic...

eines der besten Angebote überhaupt.

Gold

Risiko/Ertrag 1 zu 24

"Wasserkörper" ist ein großartiges Angebot)