Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 184

 
Andrej Dik:

Ich habe bereits beschrieben, wie ich bei der Einteilung in 3 Klassen vorgehe (verkaufen, verkaufen, kaufen). Die Klasse "Zaun" umfasst alle Fälle, die sich widersprechen oder nicht in Kauf- und Verkaufsklassen unterteilt werden können. Es zeigt sich, dass nur 3-10 % in die Klassen Kaufen und Verkaufen fallen. Das Schöne an diesem Ansatz ist, dass das Netzwerk bei der Arbeit mit unbekannten (realen) Daten mit der Zeit aufhört, Marktsituationen zu erkennen, und sie mehr und mehr dem "Zaun" zuschreibt, d.h. es hört allmählich auf zu handeln. Das ist hundertmal besser, als sich im Laufe der Zeit immer mehr auf den Einstieg zu verlegen.

Aber alles vergeblich, niemand will, niemand hört zu.

Was ist der Zaun, wenn das Netz zum Kaufen auf Kaufen und das Netz zum Verkaufen auf Verkaufen steht?

Es handelt sich um die gleiche Reshetov-Ternäre.

 
Andrej Dik:

Ich habe bereits beschrieben, dass ich mich in 3 Klassen aufteilen möchte (verkaufen, verkaufen, kaufen).

Dies ist bereits in jPrediction implementiert. Aus diesem Grund wird er als ternärer Klassifikator und nicht als binärer Klassifikator bezeichnet.

Die Umsetzung ist sehr trivial:

  1. Training: Training von zwei binären Klassifikatoren auf zwei sich nicht überschneidenden Teilen der Stichprobe.
  2. Kreuzvalidierung: Testen binärer Klassifikatoren an den Teilen der Stichprobe, für die sie nicht trainiert wurden.
  3. Klassifizierung: Wenn die Werte der beiden binären Klassifikatoren übereinstimmen, wird der Ausgangswert eines der beiden Klassifikatoren als Ergebnis verwendet. Wenn die Ergebnisse der binären Klassifikatoren unterschiedlich sind, lautet die Ausgabe: "auf dem Zaun sitzen und Bambus rauchen".

Zuvor sollte die Methode "Fahrrad" verwendet werden:

  1. Trainieren Sie einen binären Klassifikator auf einer Hälfte der Stichprobe
  2. Testen Sie es an der zweiten Hälfte der Probe
  3. Erhöhen Sie mithilfe der ROC-Analyse einen der Schwellenwerte, um die Sensitivität zu erhöhen, und senken Sie den zweiten Schwellenwert, um die Spezifität zu erhöhen.
  4. Klassifizierung: Wenn das zu klassifizierende Muster oberhalb der Empfindlichkeitsschwelle liegt - kaufen. Wenn das Muster unterhalb der Spezifitätsschwelle liegt - verkaufen. Wenn das Muster zwischen den beiden Schwellenwerten liegt, sollten Sie auf dem Zaun sitzen bleiben und Bambus rauchen.

Das oben beschriebene "Rad" erzeugt jedoch aufgrund der fehlenden Kreuzvalidierung mehr Fehlsignale als die Klassifizierung durch zwei Binärdateien, ist aber einfacher zu implementieren.

Das dümmste und nutzloseste ternäre Binärsystem, wenn auch das primitivste in der Umsetzung: Es ist ein ANN mit drei Ausgängen. Wenn jeder dieser Ausgänge einen eigenen Klassifizierungsschwellenwert hat, ergeben sich nicht drei, sondern acht potenziell mögliche Zustände, von denen nur drei eindeutig sind (ein Wert über dem Schwellenwert bei nur einem der drei Ausgänge) und fünf unklar zu interpretieren sind (Werte über dem Schwellenwert bei mehr als einem der Ausgänge oder unter dem Schwellenwert bei allen drei Ausgängen).

 
mytarmailS:

Was ist ein Zaun, wenn auf dem Netz "Kaufen" steht und auf dem Netz "Sitzen"?

Dies ist die gleiche ternäre Reshetov-Formel

Nein. Ich werde keinen Link angeben, schauen Sie nach.
 
Yury Reshetov:

Dies ist bereits in jPrediction implementiert. Aus diesem Grund wird er als ternärer Klassifikator und nicht als binärer Klassifikator bezeichnet.

Die Umsetzung ist sehr trivial:

  1. Training: Wir trainieren zwei binäre Klassifikatoren auf zwei sich nicht überschneidenden Teilen der Stichprobe.
  2. Kreuzvalidierung: Testen binärer Klassifikatoren an den Teilen der Stichprobe, für die sie nicht trainiert wurden.
  3. Klassifizierung: Wenn die Werte der beiden binären Klassifikatoren übereinstimmen, wird der Ausgangswert eines der beiden Klassifikatoren als Ergebnis verwendet. Wenn die Ergebnisse der binären Klassifikatoren unterschiedlich sind, lautet die Ausgabe: "Auf dem Zaun sitzen und Bambus rauchen".

Zuvor sollte die Methode "Fahrrad" verwendet werden:

  1. Trainieren Sie einen binären Klassifikator auf einer Hälfte der Stichprobe
  2. Testen Sie es an der zweiten Hälfte der Probe
  3. Erhöhen Sie mithilfe der ROC-Analyse einen der Schwellenwerte, um die Sensitivität zu erhöhen, und senken Sie den zweiten Schwellenwert, um die Spezifität zu erhöhen.
  4. Klassifizierung: Wenn das zu klassifizierende Muster oberhalb der Empfindlichkeitsschwelle liegt - kaufen. Wenn das Muster unterhalb der Spezifitätsschwelle liegt - verkaufen. Wenn das Muster zwischen den Schwellenwerten liegt, sollten Sie auf dem Zaun sitzen bleiben und Bambus rauchen.

Das oben beschriebene "Fahrrad" erzeugt jedoch mehr Fehlsignale im Vergleich zur Klassifizierung nach zwei Binärwerten, ist aber einfacher zu implementieren.

Das dümmste und nutzloseste ternäre Binärsystem und das primitivste in der Umsetzung: Es ist ein ANN mit drei Ausgängen. Wenn jeder dieser Ausgänge einen eigenen Klassifizierungsschwellenwert hat, dann gibt es nicht drei, sondern acht mögliche Zustände, von denen nur drei eindeutig sind (ein Wert über dem Schwellenwert bei nur einem der drei Ausgänge) und fünf unklar zu interpretieren sind (Werte über dem Schwellenwert bei mehr als einem der Ausgänge oder unter dem Schwellenwert bei allen drei Ausgängen).

Es gibt noch einen anderen Weg, den Sie nicht bedacht haben. Die Ausgabe ist eine vom Neuronkey, aber der Bereich der Werte ist bedingt in drei Bereiche unterteilt. Ich habe es als [-1.5...1.5] gemacht. Der mittlere Wertebereich [-1.0...1.0] ist der "Zaun". Es zeigt sich, dass das neuronale Netz umso aufgeregter ist, je vertrauter ihm die Situation ist, und dass die Werte stärker zu den Extremwerten tendieren. Werte außerhalb des Bereichs [-1.0...1.0] sind geeignete Signale für Kauf und Verkauf.

Aber die Menschen tun sich immer noch schwer mit der binären Klassifizierung.

 
Andrej Dik:

Es gibt noch einen anderen Weg, den Sie nicht bedacht haben. Die Ausgabe des Neuronkeys ist dieselbe, aber der Bereich der Werte ist bedingt in drei Bereiche unterteilt. Ich habe es als [-1.5...1.5] gemacht. Der zentrale Wertebereich [-1.0...1.0] ist der "Zaun".

Ich habe ihn nicht ignoriert, Sie haben ihn nicht aufmerksam gelesen. Siehe Zwei-Schwellen-"Fahrrad"-Methode mit einem binären n. 3 und Abs. 4, und ich zitiere:

Yury Reshetov:
...

Zuvor sollte die "Fahrrad"-Methode angewandt werden:

  1. Trainieren Sie einen binären Klassifikator auf einer Hälfte der Stichprobe
  2. Testen Sie es an der zweiten Hälfte der Probe.
  3. Erhöhen Sie mithilfe der ROC-Analyse einen der Schwellenwerte, um die Sensitivität zu erhöhen, und senken Sie den zweiten Schwellenwert, um die Spezifität zu erhöhen.
  4. Klassifizierung: Wenn das zu klassifizierende Muster oberhalb der Empfindlichkeitsschwelle liegt - kaufen. Wenn das Muster unterhalb der Spezifitätsschwelle liegt - verkaufen. Wenn das Muster zwischen den Schwellenwerten liegt, setzen Sie sich auf den Zaun und rauchen Sie Bambus.
...
 
Yury Reshetov:

Das Problem mit Ihrem Ansatz ist, dass Ihre MOs anfangs (vor der ternären Filterung von Kauf-/Verkaufssignalen) auf Daten trainiert werden, die mehr als 5% aller Daten erklären können, verstehen Sie?

Andrej Dik:

Ich glaube, das ist hier genauso...

==================================

Meine Methode verwendet MO überhaupt nicht zur Entscheidungsfindung und versucht nicht, die gesamte Stichprobe zu erklären, sondern nur das, was sie für eine starke statistische Regelmäßigkeit hält, und wenn solche Daten nur 0,01% aller Daten ausmachen, dann bleiben nur sie...

 
Andrej Dik:

...

Aber die Menschen basteln immer noch an der binären Klassifizierung herum.

Denn die meisten Leute finden es einfacher, ein fertiges Paket mit einer bereits implementierten binären Klassifikation zu nehmen, als mit einer ternären zu experimentieren. Nicht jeder möchte das Rad neu erfinden", denn nicht alle Ideen führen zu guten Ergebnissen. Manchen Menschen fällt es leichter, ein handelsübliches Fahrrad zu fahren, auch wenn es quadratische Räder hat.

Bei der ternären Klassifizierung schlagen die meisten Quellen zum maschinellen Lernen die wenig erfolgversprechende Methode vor: ein ANN mit drei Ausgängen zu trainieren, was einfach zu implementieren, aber in der Praxis völlig ungeeignet ist.

 
Yury Reshetov:

Denn die meisten Leute finden es einfacher, ein fertiges Paket zu nehmen, in dem die binäre Klassifizierung bereits implementiert ist, als mit der ternären zu experimentieren. Nicht jeder erfindet gerne das "Rad" neu, denn nicht alle Ideen bringen gute Ergebnisse. Manche Menschen finden es einfacher, mit einem vorhandenen Fahrrad zu fahren, auch wenn es quadratische Räder hat.

Bei der ternären Klassifizierung schlagen die meisten Quellen zum maschinellen Lernen die wenig erfolgversprechende Methode vor: ein ANN mit drei Ausgängen zu trainieren, was einfach zu implementieren, aber in der Praxis völlig ungeeignet ist.

Ja, ich stimme zu, das ist es.

Aber eines ist sicher (entschuldigen Sie die Taftalogie) - ein Binärsystem ist das Schlimmste, was man für den Markt verwenden kann.

 
mytarmailS:

Das Problem bei Ihrem Ansatz ist, dass Ihre MOs anfangs (vor der ternären Filterung von Kauf-/Verkaufssignalen) auf Daten trainiert werden, die vielleicht 5% aller Daten erklären können, verstehen Sie? vor der ternären Filterung werden die MOs bereits auf Rauschen trainiert und ihre Ausgaben sind entsprechend

Reden Sie keinen Blödsinn. In jPrediction ist ein Algorithmus zur Verkleinerung der Eingaben implementiert, so dass Sie am Ausgang kein Modell erhalten, das auf verrauschten oder unwichtigen Prädiktoren trainiert wurde. Das heißt, es wird eine Auswahl aus einer Vielzahl von Modellen mit verschiedenen Kombinationen von Prädiktoren getroffen, von denen nur dasjenige mit der besten Verallgemeinerbarkeit übrig bleibt.
 
mytarmailS:

Sehen Sie, wir versuchen, die gesamte Stichprobe in Kauf und Verkauf aufzuteilen, und wir wollen jede einzelne Marktbewegung vorhersagen, aber unsere Prädiktoren sind so beschissen, dass sie objektiv nur~3% aller Bewegungen vorhersagen können, was brauchen wir also? wir müssen versuchen, wenigstens diese3% zu nehmenund den Rest untrennbar wegzuwerfen, weil es derselbe Müll beim Einstieg/Rauschen ist , der gesiebt werden sollte/Grund für eine Umschulung usw.. Nennen Sie es, wie Sie wollen, es ist in Ordnung...

Ich kann sehen, dass Sie die Ursache der Probleme verstehen. Aber ich versuche, das Problem anders zu lösen, als Sie es vorschlagen.

Ich neige dazu, den Worten von SanSanych zu folgen - Sie müssen Prädiktoren und Zielpersonen rekrutieren, die nicht unsinnig sind. Mit guten Prädiktoren erhalten Sie einen Graphen mit Trainingsbeispielen, nicht wie ich in meinem letzten Beitrag, sondern wie Vizard_. Es ist viel schwieriger, als widersprüchliche Trainingsbeispiele zu eliminieren, aber ich denke, dass die richtige Auswahl der Prädiktoren am Ende zuverlässiger sein wird.

Zu deiner Methode kann ich nichts sagen, ich bin nicht gut darin, aber ich hoffe, du schaffst es.