Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 426

 
Iwan Negreshniy:

Sie haben Recht, die Vorhersage des Indikators ist überflüssig. Aber auch die Vorhersage des Preises ist überflüssig, denn das Ziel der Handelsstrategie ist nicht der Preis, sondern der Gewinn.

Dieser Logik folgend sollten wir nicht die Indikatoren und nicht die Preisdiagramme modellieren, sondern das Verhalten des Händlers, und die beste Zielfunktion wären die Indikatoren für sein oder ihr profitables Handeln.

In der Praxis sollten Sie den Handelsverlauf nehmen oder den Expert Advisor im Strategietester laufen lassen und das Modell mit Kursmustern als Eingabe und Transaktionen als Ausgabe anlernen.

Der "Gewinn" ist also die Rendite (Rentabilität, Rendite), d.h. der Anstieg des Preises normalisiert durch seinenabsoluten Wert, und dies ist der berüchtigte "Momentum"-Indikator, wenn man das zukünftige Momentum kennt, ist man der Herrscher des Universums.

 
Maxim Dmitrievsky:

Und was hier jetzt diskutiert wird, ist eine Art Kindergartenanwendung des Zickzacks oder nicht, was macht das schon, wenn der Prognoseansatz selbst von vornherein falsch ist (d.h. nicht zum Erfolg führen wird) :)

Es ist richtig, die Frage liegt im Detail, seien Sie nicht zu voreilig. Und diese "Kinderei" betrifft nicht nur den Zickzackkurs, sie ist eine echte Falle...

 
Aljoscha:

Ich traue mich nicht, das zu tun, weder mit Ihrer Einstellung noch mit der eines anderen. Sie sind nicht allein mit Ihrer Wahnvorstellung.

Es steckt viel Sinn in dem, was Sie geschrieben haben, der Artikel ist großartig, ich sage es aufrichtig, kurz und prägnant. Aber es gibt einen kleinen Fehler, auf den ich hingewiesen habe, da ich selbst lange Zeit auf die gleiche Weise getäuscht wurde.


Lassen Sie mich noch einmal versuchen, meinen Standpunkt zu erläutern.


Der von Ihnen erwähnte Artikel ist Werbematerial für maschinelles Lernen: Er zeigt, dass das Konzept des maschinellen Lernens nicht nur Modelle, sondern auch die Datenaufbereitung für das Modell und die Modellbewertung umfasst. Es zeigt auch, dass jeder, der sich für maschinelles Lernen interessiert, das Ganze mit minimalem Aufwand ausprobieren kann.


Meine Gedanken stehen überhaupt nicht in dem Artikel. Es ist eine Werbung.


Mein Gedanke zu diesem und anderen Forenbeiträgen ist , dass das Wichtigste und Grundlegendste beim maschinellen Lernen NICHT das Modell ist, sondern die Überlegung, dass"die Prädiktoren für die Zielvariable relevant sind".

Es ist "relevant", nicht das Ziel selbst oder ein bestimmter Satz von Prädiktoren. Abgesehen davon habe ich der Bedeutung von "eine Beziehung haben" meine eigene Bedeutung gegeben, die sich von der Bedeutung der "Prädiktoren" unterscheidet.

Ich habe nirgendwo für die Verwendung von ZZ geworben oder sie gerechtfertigt: Ich habe sie lediglich in meinen Beispielen als den prominentesten der Prädiktoren verwendet. Ich habe auch angegeben, dass ich für meine eigenen Prädiktoren einen Vorhersagefehler von weniger als 30 % erhalte - kein schlechtes Ergebnis, sollte ich sagen.

Aber noch einmal: Dieses Ergebnis kommt zustande, weil ich in der Lage bin, Prädiktoren herauszufiltern und diejenigen wegzulassen, die für die Zielvariable "relevant" sind. In meinem Beispiel zum ZZ. Aber bei meiner Methode spielt das Ziel keine Rolle, es geht um die Gesamtheit der "Ziel-Prädiktoren".

 
SanSanych Fomenko:

Abgesehen davon habe ich auch darauf hingewiesen, dass ich persönlich bei den mir zur Verfügung stehenden Prädiktoren einen Vorhersagefehler von weniger als 30 % erhalte - ein sehr gutes Ergebnis, wie ich finde.

Aber noch einmal: Dieses Ergebnis kommt zustande, weil ich in der Lage bin, Prädiktoren herauszufiltern und diejenigen wegzulassen, die für die Zielvariable "relevant" sind. In meinem Beispiel zum ZZ. Aber für meine Methode ist nicht das Ziel wichtig, sondern die Gesamtheit der "Ziel-Prädiktoren".

Es ist kein schlechtes Ergebnis, es ist fantastisch, ich bin sicher, dass selbst Renaissance mit ihren Terabytes an Daten pro Tag nicht einmal annähernd so gut abschneidet. Schauen Sie sich den Live-Score auf numer.ai an und überlegen Sie, warum sie mindestens 45% Fehler haben(logloss~0.69) und Sie 30% haben.

Aber was Sie sagen, ist wahr, Sie haben Ihre synthetische Zielfunktion erstellt, die funktionell mit Merkmalen in einer cleveren (offensichtlich nicht offensichtlich für Sie) Weise verbunden ist, und Sie haben so einen schönen Scan auf Lorn und Test und alles sieht richtig aus... Aber warum sind Sie noch kein Milliardär, obwohl Sie leicht in etwa einem Jahr einer werden könnten, wenn Sie 30% Fehler bei der Vorhersage der nächsten Kerzenfarbe haben, weil Sie nicht die Zukunft vorhersagen, sondern die Vergangenheit mit der Zukunft über einen Indikator vermischt. Versuchen Sie einmal, einen reinen Rückkehrer vorherzusagen, und alles wird sich fügen.

 
Aljoscha:

Das ist kein schlechtes Ergebnis, sondern ein fantastisches Ergebnis. Ich bin sicher, dass selbst Renaissance mit seinen Terabytes an Daten pro Tag nicht annähernd so viel erreicht. Schauen Sie sich den Live-Score auf numer.ai an und überlegen Sie, warum sie mindestens 45% Fehler haben(logloss~0.69) und Sie 30%.

Aber was Sie sagen, ist wahr, Sie haben Ihre synthetische Zielfunktion erstellt, die funktionell mit Merkmalen in einer cleveren (offensichtlich nicht offensichtlich für Sie) Weise verbunden ist, und Sie haben so ein schönes Messgerät auf Lorn und Test, alles sieht richtig aus... Aber Sie sind noch kein Milliardär, obwohl Sie leicht einer in etwa einem Jahr werden könnten, wenn Sie 30% Fehler bei der Vorhersage der nächsten Kerzenfarbe hatten, es ist, weil Sie nicht die Zukunft vorhersagen, sondern die Vergangenheit gemischt mit der Zukunft über Indikator. Versuchen Sie, eine reine Zukunftsrendite vorherzusagen, und alles wird sich fügen.

ZZ ist eine schlechte Zielvariable, da der Anfang und das Ende der Schulter das gleiche Gewicht haben. Wenn man die Zielvariable VOR der Umkehrung und NACH der ZZ-Umkehrung nimmt, konnte ich keine Prädiktoren für eine solche Zielvariable finden - alle mir bekannten Prädiktoren für eine solche Zielvariable sind nur Rauschen. Ich habe mit einem der Forumsteilnehmer zusammengearbeitet, der seine eigenen Prädiktoren hat, und wir sind beide zu demselben Ergebnis gekommen.

Ich bin kein Milliardär, und zwar aus einem ganz einfachen Grund: Die Schätzung des Modells des maschinellen Lernens für mein Modell mit einem Ziel bei ZZ (diese 30 %) ist für die Ergebnisse des Testers irrelevant, da dieser Fehler willkürlich entlang der ZZ-Schulter verteilt ist, d. h. falsche Signale sind mit echten vermischt. Ich handele mit Trends, so scheint es, aber sage die nächste Kerze voraus. Um diesen Widerspruch zu überwinden, habe ich einen Expert Advisor, der mehr als ein Jahr lang erfolgreich gehandelt hat und dann am 7. Oktober einen Stop gesetzt hat, der das maximale Risikoniveau festlegt.

Aber das ist Trendhandel.

Sie schlagen weiterhin vor, mit DIVERSEN zu handeln, nicht mit Trends. Dies ist ein anderer Handel, für den es besser entwickelte Modelle gibt - GARCH. Sehr gut entwickelt, viele fertige Tools, jede Menge Beispiele für den Handel auf den Finanzmärkten, einschließlich Forex. Das ist es, was ich jetzt tue. Machen Sie mit.


PS.

Über den Blick nach vorn auf die ZZ.

Sie müssen sorgfältig schreiben. Wenn Sie trainieren, haben Sie in der Historie immer einen Wert bis zum letzten, ganz rechten Balken. Das ist bei EAs nicht der Fall: Auf der rechten Seite von ZZ gibt es immer eine ungeformte Schulter, und außerdem kann die vorherige Schulter auch überzeichnet sein. Deshalb müssen wir aus der Geschichte lernen. Wechseln Sie dann zu einer neuen Datei und trainieren Sie dort nach und nach das Diagramm neu, wobei Sie nur die bereits gebildeten ZZ-Werte berücksichtigen. Und das sind 100 Takte oder mehr Verzögerung. Und kein "Peeking", sondern das Gegenteil von "Lagging".

 

Ich fasse zusammen, um es für viele .... deutlich zu machen

Es gibt in der Tat komplexe Zielfunktionen, oder der Forscher entscheidet, dass das Problem in der Ausgangsvariablen liegt und beginnt, sie zu verkomplizieren. Das ist früher passiert, ich habe es auch gemacht. Aber mit der Zeit habe ich begriffen, dass das nicht nötig ist. Es reicht aus, Preisänderungen vorherzusagen, und wenn das nicht mit einem angemessenen Qualitätsniveau möglich ist, dann wird auch eine noch kompliziertere Ausgabe die Situation nicht retten.

Was die Gleichgewichtskurve betrifft, so ist sie eine Folge der Qualität der Ausbildung. Die Art dieser Kurve ist entscheidend für die Qualität des Lernens. Zwei Bedingungen.

Gleichmäßiges Wachstum der Gleichgewichtskurve in einem Winkel von 45 Grad

Fehlen von starken Sprüngen und Stürzen.

So....

 
SanSanych Fomenko:

ZZ ist eine schlechte Zielvariable, da der Anfang und das Ende der Schulter das gleiche Gewicht haben. Wenn wir die Zielvariable VOR der Umkehrung und NACH der ZZ-Umkehrung nehmen, konnte ich keine Prädiktoren für diese Zielvariable finden - alle mir bekannten Prädiktoren für diese Zielvariable sind nur Rauschen. Ich habe mit einem der Forumsteilnehmer zusammengearbeitet, der seine eigenen Prädiktoren hat, und wir sind beide zu demselben Ergebnis gekommen.

Ich bin kein Milliardär, und zwar aus einem ganz einfachen Grund: Die Schätzung des maschinellen Lernmodells für mein Modell mit einem Ziel bei ZZ (diese 30 %) ist für die Ergebnisse im Prüfgerät irrelevant, da der Fehler willkürlich entlang der ZZ-Schulter verteilt ist, d. h. falsche Signale sind mit echten vermischt. Ich handele mit Trends, so scheint es, aber sage die nächste Kerze voraus. Um diesen Widerspruch zu überwinden, habe ich einen Expert Advisor, der mehr als ein Jahr lang erfolgreich gehandelt hat und dann am 7. Oktober einen Stop gesetzt hat, der das maximale Risikoniveau festlegt.

Aber das ist Trendhandel.

Sie schlagen weiterhin vor, mit DIVERSEN zu handeln, nicht mit Trends. Dies ist ein anderer Handel, für den es besser entwickelte Modelle gibt - GARCH. Sehr gut entwickelt, viele fertige Tools, jede Menge Beispiele für den Handel auf den Finanzmärkten, einschließlich Forex. Das ist es, was ich jetzt tue. Machen Sie mit.


PS.

Über den Blick nach vorn auf die ZZ.

Sie müssen sorgfältig schreiben. Wenn Sie trainieren, haben Sie in der Historie immer einen Wert bis zum letzten, ganz rechten Balken. Das ist bei EAs nicht der Fall: Auf der rechten Seite von ZZ gibt es immer eine ungeformte Schulter, und außerdem kann die vorherige Schulter auch überzeichnet sein. Deshalb müssen wir aus der Geschichte lernen. Wechseln Sie dann zu einer neuen Datei und trainieren Sie dort nach und nach das Diagramm neu, wobei Sie nur die bereits gebildeten ZZ-Werte berücksichtigen. Und das sind 100 Takte oder mehr Verzögerung. Und kein "Peeking", sondern das Gegenteil von "Lagging".


Was die Inkonsistenz von "Tester" und Vorhersageergebnissen angeht, habe ich oben geschrieben, dass alles perfekt passt, wenn wir Retouren vorhersagen. Ich habe lange darüber nachgedacht, aber ich bin mir sicher, dass es eine eindeutige mathematische Formalisierung der Abhängigkeitsfunktion der ML-Prognose in der Sharpe Ratio gibt, weil die empirische Beziehung ziemlich eindeutig ist. Technisch gesehen ist das Ergebnis des "Testers" nicht viel anders als eine einfache Faltung (Skalarprodukt) einer Reihe von Vorhersagen auf realisierte Renditen (verzeihen Sie mir, HFTs), dementsprechend sind die Ergebnisse des Testers umso besser, je mehr die Vorhersagen mit den Renditen korrelieren, was sich in den Handelskosten widerspiegelt. Natürlich wird eine solche Funktion (predict2Sharp) nicht nach der Genauigkeit, sondern nach dem logloss berechnet, da die Anzahl der Schätzungen an sich weniger wichtig ist als die Multiplikation mit den erratenen Ergebnissen.


Über GARCH Soweit ich weiß, handelt es sich um ein lineares Modell zur Vorhersage der Volatilität, das die Marktrichtung nicht vorhersagt, oder irre ich mich?

 
Aljoscha:

Wie für die Inkonsistenz der "Tester" Ergebnisse und Vorhersagen schrieb ich oben, warum, wenn Sie vorhersagen, returnees, alles passt perfekt, für eine lange Zeit reift Idee, aber ich kann nicht die Zeit, mathematisch formalisieren die Abhängigkeit Funktion Vorhersage ML in Sharpe Ratio, ich bin sicher, es ist eine eindeutige Anzeige, weil die empirische Beziehung ist ziemlich eindeutig. Technisch gesehen ist das Ergebnis des "Testers" nicht viel anders als eine einfache Faltung (Skalarprodukt) einer Reihe von Vorhersagen auf realisierte Renditen (verzeihen Sie mir, HFTs), dementsprechend sind die Ergebnisse des Testers umso besser, je mehr die Vorhersagen mit den Renditen korrelieren, was sich in den Handelskosten widerspiegelt. Natürlich wird eine solche Funktion (predict2Sharp) nicht nach der Genauigkeit, sondern nach dem logloss berechnet, da die Anzahl der Schätzungen an sich weniger wichtig ist als die Multiplikation mit den erratenen Ergebnissen.


Über GARCH Soweit ich weiß, ist es ein lineares Modell zur Vorhersage der Volatilität, es sagt nicht die Marktrichtung voraus, oder irre ich mich?


Ich gestehe, dass ich versucht habe, die Sharpe-Koeffizienten, Sortino-Koeffizienten usw. zu verwenden, um ein Signal von der zugrundeliegenden Strategie zu unterscheiden, und zu dem Schluss gekommen bin, dass alle diese Koeffizienten die Folge der zugrundeliegenden Strategie sind. D.h. das Ergebnis von Sharp ist genau dasselbe, weil das Signal mit diesem und jenem Gewinn geschlossen wurde und nicht mit dem Überlauf..... Allerdings bin ich kein sehr guter Programmierer, so dass ich diese Koeffizienten vielleicht aus Versehen berechnet habe. Aber mein Sharp lag im Bereich von -2 bis 2. Ich denke also, ich habe es richtig gemacht....

 
Mihail Marchukajtes:

Ich gestehe, dass ich versucht habe, Sharpe, Sortino usw. zu verwenden, um das Signal von der zugrundeliegenden Strategie zu unterscheiden, und zu dem Schluss gekommen bin, dass alle diese Koeffizienten eine Folge der zugrundeliegenden Strategie sind. D.h. das Ergebnis von Sharp ist genau dasselbe, weil das Signal mit diesem und jenem Gewinn geschlossen wurde und nicht mit dem Überlauf..... Ehrlich gesagt, bin ich ein sehr schlechter Programmierer, so dass ich diese Koeffizienten vielleicht aus Versehen berechnet habe. Aber mein Sharp lag im Bereich von -2 bis 2, also denke ich, ich habe es richtig gemacht....

Es gibt viele generische SRs, aber die klassische SR ist die einfachste und gebräuchlichste Kennzahl zur Bewertung der Leistung einer Strategie/eines Händlers/eines Fonds. SR <1,5 gilt als beschissen, >=2 ist großartig!

SR ist, grob gesagt, das Verhältnis von Gewinn und Risiko in quantitativer Hinsicht.
 
Aljoscha:

Es gibt viele generische SRs, aber die klassische SR ist die einfachste und gebräuchlichste Kennzahl zur Bewertung der Leistung der Fondsstrategie eines Händlers. SR <1,5 gilt als unheimlich, >=2 ist großartig!

SR ist grob gesagt das Verhältnis von Gewinn zu Risiko, quantitativ gesehen.

Im Prinzip spielt das keine Rolle. Die Vorhersagekraft ist gleich null....