Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 185

 
Yury Reshetov:
Reden Sie keinen Blödsinn. In jPrediction verwenden wir einen Algorithmus zur Reduzierung der Dimensionalität der Eingaben, um zu vermeiden, dass ein Modell ausgegeben wird, das auf verrauschten oder unwichtigen Prädiktoren trainiert wurde. Das heißt, es wird eine Auswahl aus einer Vielzahl von Modellen mit verschiedenen Kombinationen von Prädiktoren getroffen, von denen nur dasjenige mit der besten Verallgemeinerbarkeit übrig bleibt.

hypothetische Situation....

Wir haben 100 potenzielle Prädiktoren, der Einfachheit halber sollten es Indikatoren sein.

Angenommen, wir wissen, dass alle diese Prädiktoren nur eine gewinnbringende Situation haben, nämlich dann, wenn der RCI die 90 überschritten hat und die Stochastik gerade unter Null gegangen ist (natürliche Situation von der Obergrenze), Eine solche Situation führt mit 90%iger Wahrscheinlichkeit zu einem Kursrückgang, alle anderen Prädiktoren sind völliges Rauschen, alle anderen Situationen im RSI und in der Stochastik sind ebenfalls völliges Rauschen, und es gibt Hunderte und Aberhunderte von verschiedenen Situationen....

d. h. wir haben ungefähr 0,01 % Nutzsignal zu 99,9 % Rauschen

Angenommen, durch ein Wunder verwirft Ihr MO alle 98 Prädiktoren und lässt nur zwei übrig - RSI und Stochastik

es gibt Hunderte von Situationen mit RSI>0, RSI>13, RSI<85, RSI=0, RSI<145, ............ Da Sie MO darauf trainieren, alle Kursbewegungen zu erkennen, wird MO Modelle erstellen , die alle möglichen Situationen berücksichtigen, die im RSI und in der Stochastik verfügbar sind, und die Wahrscheinlichkeit, dass sie in diesen Situationen funktionieren, ist fast null, aber MO muss sie berücksichtigen und einige Modelle mit ihnen erstellen, trotz der Tatsache, dass dies das wirkliche Rauschen ist, und dass eine funktionierende Situation unter Hunderten von anderen Lösungen verloren geht, das ist Umschulung ....

Wie haben Sie ihn schließlich bekommen?

 

Du bringst das alles durcheinander.

Es gibt verschiedene, unabhängige Themen. ABER SIE SIND WIE BAUSTEINE FÜR EIN HAUS: NUR ALLE ZUSAMMEN ERGEBEN EIN HANDELSSYSTEM.

1. Vorbereitung der Prädiktoren. In dieser Phase gibt es eine große Anzahl von Zielen und entsprechenden Instrumenten. Ich habe das gesamte Problem dieser Phase absichtlich auf die Beseitigung des Rauschens ausgerichtet, d. h. auf die Suche nach solchen Prädiktoren, die eine Vorhersagekraft für diese spezielle Zielvariable haben. Ich werde das Ideal beschreiben. Entnommen aus einem Artikel über Genetik. Aber ich benutze mein eigenes Beispiel.

Nehmen Sie die Zielvariable "Muslime" (zur Verdeutlichung). Der Prädiktor "Kleidung", der zwei Werte "Hose" und "Rock" hat. Ein Teil der Prädiktorwerte "Kleidung" mit dem Wert "Hose" sagt eindeutig die Klasse "männlich" und der andere Teil die Klasse "weiblich" voraus. Wir haben auch Prädiktoren wie den RSI für die Zielvariable "Kaufen/Verkaufen". Wir alle wissen, dass der Indikator oft lügt, aber ein Teil davon sagt die eine Klasse voraus, ein Teil die andere. Daher sollten wir nach Prädiktoren suchen, von denen einige eine Klasse vorhersagen und einige eine andere. Und je geringer die Überschneidungen (falsch-positive Ergebnisse) sind, desto höher ist die Qualität des Prädiktors. Das Ideal ist "Hose/Rock", wenn ein Prädiktor in zwei Teile geteilt werden kann, ohne dass es zu Überschneidungen kommt. Dies gilt jedoch nur für Muslime und für Europäer....

Es gibt algorithmische Methoden (PCA, zum Beispiel, aber nicht klassisch, sondern mit Verfeinerung), aber man muss mit dem Inhalt der Prädiktoren beginnen. Nach inhaltlichen Gesichtspunkten sollte man zunächst Saturnringe, Kaffeesatz und anderes Zeug wegwerfen.... Was zählt, ist NICHT die Korrelation dieser Prädiktoren. Wir nehmen zum Beispiel einige Derivate von kotir - sie sind alle von kotir, aber wir nehmen Open Interest, Volumina... Dann aus irgendeinem Grund andere Währungspaare, Makroökonomie sind nicht konditioniert...

2. Modellanpassung. Dies ist ein separates Problem, und das erste Problem kann mit dem verwendeten Modell nicht gelöst werden. Die Verwirrung wird durch die Tatsache verursacht, dass viele Modellalgorithmen einen eingebauten Algorithmus zur Auswahl von Prädiktoren haben. Mir persönlich ist kein eingebauter Algorithmus bekannt, der das erste Problem löst.

Reshetov behauptet, einen solchen Algorithmus eingebaut zu haben. Aber er hat nie einen Beweis für die fehlende Umschulung mit seinem Algorithmus angeführt.

Der erste Schritt ist obligatorisch. Sie schließt aber nicht aus und empfiehlt vielleicht sogar die Verwendung eingebauter Algorithmen zur Auswahl von Prädiktoren. Aber diese Algorithmen müssen im ersten Schritt vom "Kaffeesatz" verschont bleiben.

3. binär-alternativer Klassifikator. Reschetow hat, wie üblich, das Problem mit seinem Verständnis des ternären Klassifikators verwechselt. Ternär ist, wenn die Zielvariable drei Werte und im Allgemeinen eine beliebige Anzahl von qualitativen (nominalen, kategorialen) Werten hat. Reshetov hat zwei binäre, von denen er bekommt ein funktionierendes Signal, das auf Forex ist sehr wünschenswert - zu einem ternären kaufen / flet / Sell-Signal haben. Ich verwende eine binäre Zielvariable für die Klassifizierung, und für den Handel aus den Ergebnissen der beiden binären Klassifizierungen erhalte ich drei Signale - genau wie Reshetov.

4. DieKombination der Ergebnisse mehrerer Modelle zu einem Handelssignal ist ein separates Problem. Es gibt einen Lösungsvorschlag von Reshetov. Es wurden aber auch andere Lösungen in diesem Thread vorgeschlagen. Dik hat oben vorgeschlagen, die Werte zu berücksichtigen, von denen die Klasse abgeleitet ist. Dieses Problem kann auch bei Ihnen auftreten, vor allem wenn Sie bedenken, dass Klassifizierungsalgorithmen den Wert JEDER Klasse angeben, von der die Klasse abgeleitet ist. Wenn wir die Ergebnisse mehrerer Modelle zu einem Ergebnis zusammenfassen, ist es unvermeidlich, diese Wahrscheinlichkeiten zu berücksichtigen. Es gibt Algorithmen, die diese Wahrscheinlichkeiten nicht halbieren, sondern anders teilen, wodurch der Klassifizierungsfehler verringert wird.

5. Abschließende Modellbewertung. Dies ist etwas, worüber ich mit Burnakov keine Einigung erzielen konnte. Wir nehmen das Modell und lassen es "außerhalb der Stichprobe" laufen, wobei "außerhalb" als außerhalb des Zeitintervalls verstanden wird, in dem Training, Test und Kreuzvalidierung durchgeführt wurden... Dieser Schritt ist nicht konstruktiv, da er uns nicht sagt, was wir tun sollen. Dieser Schritt ist ein Urteil: behalten oder verwerfen. Der Grund für das "Verwerfen" ist nicht ein zu großer Fehler, sondern seine VERÄNDERUNG im Vergleich zu den vorherigen Schritten. Abzulehnen, weil das Modell übertrainiert ist, es ist hoffnungslos und gefährlich. Wenn dieser Schritt überwunden ist, gehen Sie zum Tester über und erhalten von diesem das gleiche Ergebnis "behalten - verwerfen".

 
mytarmailS:

hypothetische Situation....

...

dann wird MO Modelle erstellen , die alle möglichen Situationen berücksichtigen ...

Wenn Sie den MO trainieren, alle Preisbewegungen zu erkennen, wird der MO ...

...

aber MO muss sie berücksichtigen und darauf basierende Modelle erstellen, obwohl dies das eigentliche Rauschen ist und eine funktionierende Situation unter Hunderten von anderen Lösungen untergehen wird, dafür ist das Übertraining da....

Die jPrediction muss nicht jede mögliche Situation berücksichtigen. Es funktioniert viel einfacher, als Sie es sich ausgedacht haben.

Das Prinzip der sequentiellen Auswahl von Prädiktoren (nicht eine vollständige Aufzählung von Kombinationen, wie Sie es versuchen) ist in meinem Beitrag auf pg. 109

Falls Sie unter Gedächtnisschwund leiden, darf ich Sie daran erinnern, dass Sie die Reihenfolge der Auswahl der Prädiktoren für p bereits geklärt haben . 110

 

SanSanych Fomenko:

Reshetov hat, wie immer, die Frage mit seinem Verständnis des ternären Klassifikatorsverwechselt.

...

Ich verwende eine binäre Zielvariable zur Klassifizierung, und um aus den Ergebnissen von zwei binären Klassifizierungen zu handeln, erhalte ich drei Signale - genau wie Reshetov.


Ist Reshetov nicht ein Schurke?

Er hat das Thema so sehr verwirrt, dass nun sogar Fomenko genau wie Reschetow handeln muss.

Shurik Shurikovich, nimm einen Kuchen aus dem Regal. Schließlich haben Sie es sich auf dem Gebiet der Kritik Rettich und böser Mann - Reshetov - redlich verdient.

 
Yury Reshetov:

jPrediction muss nicht jede mögliche Situation berücksichtigen. Es funktioniert viel einfacher, als Sie es sich ausgedacht haben.

Das Prinzip der konsistenten Auswahl von Prädiktoren (und nicht eine vollständige Aufzählung von Kombinationen, wie Sie es versuchen) steht in meinem Beitrag auf pg. 109

Falls Sie unter Gedächtnisschwund leiden, darf ich Sie daran erinnern, dass Sie die Reihenfolge der Auswahl der Prädiktoren für p bereits geklärt haben . 110

Ich spreche darüber, warum IO (any) Features nicht richtig auswählen kann, und Sie sprechen über Green...

 
mytarmailS:

Ich spreche darüber, warum MO (irgendeine) Funktionen nicht richtig auswählen kann, und Sie sprechen über Grün...

jPrediction ist gut geeignet, um Prädiktoren auszusortieren. Wahrscheinlich nicht die idealste Methode, aber für angewandte Aufgaben in Ordnung. Wahrscheinlich ist die Grenze der Perfektion noch nicht erreicht, und es gibt noch Potenzial für weitere Forschung? Das Wichtigste ist, dass es ein positives Ergebnis gibt und Sie damit anfangen können zu tanzen.

Der Punkt ist, dass Sie Ihre eigenen Vorurteile nicht auf die Methoden des maschinellen Lernens projizieren sollten (und das nicht nur im Bereich der MO).

Wenn etwas bei Ihnen nicht funktioniert und das Gleiche bei anderen, heißt das nicht, dass es keine normalen Methoden gibt. Das bedeutet nur, dass Sie diese normalen Methoden nicht anwenden oder sie aufgrund persönlicher Vorurteile falsch anwenden.

 
Yury Reshetov:

Ist dieser Reshetov nicht ein Schurke?

Er hat das Thema so sehr verwirrt, dass jetzt sogar Fomenko genau das tun muss, was Reschetow getan hat.

Shurik Shurikovitch, nimm einen Kuchen aus dem Regal. Sie haben es sich redlich verdient, in Ihrem Bereich der Kritik an einem Radieschen und schlechten Menschen - Reschetow.

Beruhigen Sie sich.

Ich habe NIEMALS daran gedacht, Sie persönlich zu beleidigen, denn wir sind vom gleichen Blut.

Aber Ihr "Unentschlossenheit" ist für mich von unbestreitbarem Interesse.

So sieht es aus. Am Beispiel einer Binärdatei.

Angenommen, die Wahrscheinlichkeit für eine Klasse ist 0,49 und die Wahrscheinlichkeit für die zweite Klasse ist 0,51.

 
Yury Reshetov:

Das dümmste und aussichtsloseste ternäre Fahrrad, wenn auch das primitivste in der Implementierung: dies ist ein ANN mit drei Ausgängen. Wenn jeder dieser Ausgänge einen eigenen Klassifizierungsschwellenwert hat, dann gibt es nicht drei, sondern acht potenziell mögliche Zustände, von denen nur drei eindeutig sind (ein Wert über dem Schwellenwert an nur einem der drei Ausgänge) und fünf unklar zu interpretieren sind (Werte über dem Schwellenwert an mehr als einem der Ausgänge oder unter dem Schwellenwert an allen drei Ausgängen).

Zur Klassifizierung ist es viel einfacher, die Ausgabe mit dem höchsten Wert zu nehmen. Wenn die Ergebnisse an drei Ausgängen (0,1;0,3;0,2) sind, dann ist der größte Wert = 0,4 und Ausgang Nummer 2 ist aktiv.
Das Handelsmodell kann diese Logik haben:
Der höchste Wert bei der ersten Ausfahrt -> Long-Position,
Der höchste Wert im zweiten Exit -> alle Trades beenden und nicht handeln,
Höchster Wert im dritten Exit -> Short-Position.
Das war's, keine Schwellenwerte, keine Staaten, etc.

Dabei handelt es sich nicht um ein Fahrrad, sondern um eine Methode, die in der Neuronik häufig zur Klassifizierung verwendet wird, wenn mehr als zwei Klassen benötigt werden, so dass es beispielsweise bei der Klassifizierung von Bildern mindestens zehn Klassen geben kann.
Ein Ausgang mit einem Schwellenwert in der Mitte reicht für zwei Klassen aus.
 

Dr. Trader:

Das Handelsmodell könnte dieser Logik folgen:


  • Höchster Wert beim ersten Ausgang -> Long-Position,
  • Höchster Wert beim zweiten Exit -> alle Trades beenden und nicht handeln,
  • Der höchste Wert am dritten Exit -> Short-Position.


Das war's, keine Schwellenwerte, keine Staaten, etc.

Auch eine Option. Es ist allerdings nicht sicher, dass ein so trivialer Ansatz eine normale Verallgemeinerbarkeit ergibt. Manchmal ist Einfachheit schlimmer als Diebstahl. D.h. es ist notwendig, empirisch zu prüfen - die Autopsie wird es zeigen.
 
SanSanych Fomenko:

Angenommen, die Wahrscheinlichkeit der einen Klasse ist 0,49 und die Wahrscheinlichkeit der zweiten Klasse ist 0,51. Sind das zwei Klassen oder "on the fence"?

Weil Eiscreme.

Tut mir leid, aber so wie die Frage ist, so ist auch die Antwort.

D.h. ich verstehe den Humor nicht, denn um eine Entscheidung zu treffen, muss man den Ausgangswert des Klassifikators mit etwas vergleichen, z.B. mit einem Schwellenwert. Und da in Ihrer Formulierung des Problems die Vergleichswerte aus irgendeinem Grund unbekannt sind und nur diejenigen bekannt sind, die für die Klassifizierung nicht notwendig sind, wäre es eine gute Idee, Klarstellungen vorzunehmen.