Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 43

 
Kombinator:
Was ist mit der Meinung, dass die ohnehin schon geringe Wahrscheinlichkeit, das begehrte 1 % zu erreichen, deutlich sinkt, wenn man den Weg von Sanych geht?

Jeder Indikator enthält einige zusätzliche Informationen, die alle nützlich sind, nicht nur ein Prozent. Für den RSI gibt es keine "Kauf bei >0,99, Verkauf bei <0,01"-Strategie, es war ein unglückliches Beispiel.

Sie können beispielsweise einen Indikator nehmen, einen darauf basierenden Expert Advisor erstellen und dessen Parameter optimieren, um bessere Ergebnisse zu erzielen. Aber ein solcher EA wird in der Zukunft immer scheitern. Damit der EA nicht versagt, brauchen wir Dutzende von Indikatoren (vielleicht sogar weniger, aber für mich ist es nicht so einfach), wobei die Indikatorwerte durch eine komplexe Logik mit verschiedenen Bedingungen getestet werden. Zum Beispiel, wenn MA(20)>MA(16), dann kaufen, wenn RSI>0,3. Und wenn MA(20)<MA(16), dann schauen Sie nicht auf rsi, aber auf stochastic. Die Logik sollte in etwa so aussehen, nur noch komplizierter und verschnörkelter. Das Random-Forest-Modell kann eine solche Logik aufbauen, was sehr gut ist.

Alle Indikatorwerte sind für die Konstruktion des Modells wichtig. Das Modell wird die Schwellenwerte dieser Werte für eine Kauf-/Verkaufsentscheidung und die Bedingungen für ihre Erfüllung selbst aus den Werten anderer Indikatoren bestimmen.

 
Dr. Trader:

Jeder Indikator enthält einige zusätzliche Informationen, und alle sind nützlich, nicht nur ein Prozent.

Kennen Sie das Prinzip des Rasiermessers von Occam?

 

Wenn ein Indikator einen bestimmten Wertebereich hat, dann sagt jeder Wert in diesem Bereich etwas aus und hat seine eigene zusätzliche Bedeutung. Ich empfehle nicht, einfach 1 % der Ober- und Untergrenzen des Indikators zu nehmen und nur innerhalb dieser Grenzen zu handeln. Natürlich können Sie es versuchen, aber es wird sich als unrentabel erweisen, und Sie werden eine Menge anderer Indikatoren benötigen, um der Strategie eine Vielzahl von Bedingungen hinzuzufügen. Das heißt, Sie können entweder in der gesamten Bandbreite der RSI-Werte mit einer Reihe von anderen Indikatoren handeln. Oder Sie können nur in einem bestimmten Bereich von RSI-Werten handeln, mit einer Reihe von weiteren Indikatoren. Ich wüsste nicht, wie mir der zweite Weg einen Vorteil verschaffen sollte.

Aber wenn es anfangs Dutzende von Indikatoren gibt, und alle mit hundert Varianten von Lags oder Parametern, dann müssen einige von ihnen eliminiert werden, hier ist Occams Rasiermesser voll in Kraft. Aus diesem Grund habe ich nur hundert von fast 9000 Prädiktoren (ein Dutzend Indikatoren mit unterschiedlichen Lags (Verschiebung). Und diese verbleibenden Prädiktoren sind zu mindestens 60 % genau.

 
Dr. Trader:

Je mehr verrauschte Prädiktoren Sie haben, desto wahrscheinlicher ist es, dass es unter ihnen ähnliche nützliche Daten gibt.

Das Lernen von vornherein, dessen Fehlen Sanych so rühmt

 
Kombinator:

Je mehr Rauschprädiktoren Sie haben, desto wahrscheinlicher ist es, dass unter ihnen ähnliche nützliche Daten zu finden sind.

Überlernen von vornherein, dessen Fehlen Sanych so sehr rühmt

Ich war ziemlich ungenau, was die Lärmvorhersage betrifft.

Ich rühme mich hier damit, dass ich einen Algorithmus habe, der Rauschvorhersagen herausfiltert. Aber das ist nicht ganz richtig, denn für mich gibt es keine 100% verrauschten und 100% nicht verrauschten Prädiktoren. Alle Prädiktoren, die ich gesehen habe (mehrere hundert, über 10 Sätze von verschiedenen Personen), sind teilweise verrauscht oder teilweise nicht verrauscht. Immer. Ich habe keine anderen gesehen. Ich werde das weiter unten mit Zahlen erläutern.

Wofür kämpfen wir jetzt?

Meinem Algorithmus zufolge liegt die Wahrscheinlichkeit einer korrekten Klassenvorhersage bei 50 %, wenn wir rein verrauschte Prädiktoren verwenden - werfen Sie eine Münze. Der Haken an der Sache ist, dass man beim Training mit reinen Rauschprädiktoren fast immer sehr gute Ergebnisse erzielt, und wenn man die Zeit außerhalb der Stichprobe nutzt, erhält man diese 50 %.

Ich habe jedem Prädiktor einen abstrakten "Rausch"-Wert zugewiesen. Wenn es ein Wert zwischen 0 und 1 ist, dann ist es verrauscht und völlig hoffnungslos. Wenn es 1 bis 2 ist, können Sie es verwenden, aber es ist besser, es nicht zu verwenden. Sie sollten mit meinem Maß über 3 gehen. Mehr als 6 habe ich noch nie gesehen.

Nehmen wir also an, dass Prädiktoren mit meinem Maß für "Rauschen über 3" ausgewählt werden. Wenn Sie ein Modell erstellen, erhalte ich einen Fehler von 25 bis 35 % für verschiedene Sätze von Prädiktoren. Bei allen Arten von Stichproben (Training-Test-Validierung - alle mit Zufallsmischung, und außerhalb der Stichprobe - streng in der Reihenfolge, in der die Balken ankommen) ungefähr gleich, z. B. 32-30-33-35 %. Es gibt keine Möglichkeit, den Fehler bei demselben Satz von Prädiktoren um, sagen wir, die Hälfte zu verbessern. Das heißt, die Größe des Modellfehlers wird durch einen bestimmten Satz von Prädiktoren bestimmt. Wenn Ihnen die Größe des Fehlers nicht gefällt, brauchen Sie einen anderen Satz von Prädiktoren, der möglicherweise einen anderen Fehler ergibt.

Der Fehler, den ich erhielt, ist natürlich groß, gehen für mich ist es wichtig, dass außerhalb der Stichprobe der Fehler ist etwa gleich in der Ausbildung und Prüfung. Aber ich ziehe die wichtigste Schlussfolgerung: Der gegebene Satz von Prädiktoren führt nicht zu einem Übertraining des Modells - in Zukunft werde ich ungefähr den gleichen Vorhersagefehler haben... Dies wurde an verschiedenen Varianten von random scaffolding, ada und SVM getestet. Andere Modelle wurden nicht ausprobiert.

 
Kombinator:

Je mehr Rauschprädiktoren Sie haben, desto wahrscheinlicher ist es, dass unter ihnen ähnliche nützliche Daten zu finden sind.

Übermäßiges Lernen von vornherein, dessen Fehlen Sanych so rühmt

Andreas. Dies wird eindeutig akzeptiert. Alle Schlussfolgerungen beruhen auf einer Validierung. Die Chance, dass ein reiner Rauschprädiktor Tausende von erratenen und unabhängigen Beobachtungen erzeugt, ist sehr gering, vernachlässigbar. Die Schlussfolgerungen werden auch durch die korrekten statistischen Tests, die mir vorliegen, bestätigt.

DieAuswahl von Prädiktoren aus dem Rauschen funktioniert.
 
Vladimir Perervenko:2. Es gibt einelforecast-Funktioninrminer- Sie führt mehrstufige Prognosen durch, indem sie iterativ 1-Ahead-Vorhersagen als Eingaben verwendet. Wenn Sie von mehrstufigen Prognosen sprechen, meinen Sie natürlich die Regression?

Ich weiß es nicht)) Ich brauche ein Tool, das eine Mehrfachvorhersage mit Hilfe einer Matrix mit Prädiktoren macht. Es ist mir egal, auf welche Weise es die Vorhersage macht, Regression nimmt nur die Zeitreihe als Input, das passt mir nicht, ich brauche eine Matrix mit Prädiktoren...

Ich habe mir die Funktion "iforecast" angesehen, sie nimmt eine Zeitreihe für die Regression als Eingabe, das ist nicht dasselbe, oder verstehe ich etwas falsch?

 
Dr. Trader:

Jeder Indikator enthält einige zusätzliche Informationen, die alle nützlich sind, nicht nur ein Prozent. Für den RSI gibt es keine "Kauf bei >0,99, Verkauf bei <0,01"-Strategie, er ist ein unglückliches Beispiel.

Das soll wohl ein Witz sein. Ich schrieb, dass ich übertreibe (ich vereinfache die Dinge bis zum Äußersten) und ich schrieb es zweimal:) Oder wäre es besser, wenn ich ein echtes Beispiel mit 135 Regeln für das System gebe? Obwohl für das, was ich erklären wollte, eine Regel mehr als genug ist.
 

Um das Thema der Auswahl fortzusetzen

Ich habe eine Frage: Wir haben einen Prädiktor (einen von vielen) mit einer Reihe von Werten, z.B. 10 Stück.

teilen Sie den Prädiktor in diese Bereiche X1,X2....X10

Berechnen wir die Wichtigkeit der einzelnen Bereiche im Prädiktor mit einigen Mitteln, die jetzt nicht wichtig sind, wie

erhalten wir eine Tabelle der Wichtigkeit(ich erinnere daran, dass es sich um einen Prädiktor handelt, der in Teilprädiktoren aufgeteilt ist)

Х1 = 0,5%

Х2 = 0,01%

Х3 = 0,003%

Х4 = 0,0033%

Х5 = 0,0013%

Х6 = 0,0039%

Х7 = 0,0030%

Х8 = - 0,0000%

Х9 = - 0,0001%

Х10 = - 0,00002%

Wir sehen, dass nur ein Bereich "X1" wirklich einen starken Einfluss hat, der Einfluss der anderen ist entweder negativ oder einen halben Schritt von negativ entfernt, und es ist sehr zweifelhaft, dass sich diese Bereiche X2....X7 bei neuen Daten zum Besseren wenden werden...

Frage :

Ist es besser, den gesamten positiven Bereich X1...X7 beizubehalten oder nur den Bereich zu belassen, in dem es keinen Zweifel gibt, d.h. nur X1

Noch einmal: Es handelt sich nur um eine Auswahl eines Prädiktors, und wenn wir 200 Prädiktoren bereinigen? auf welchen Daten wird der Algorithmus die neuen Daten besser erkennen oder nicht?

Wer denkt darüber nach?

 
mytarmailS:

Um das Thema der Auswahl fortzusetzen

Ich habe eine Frage: Wir haben einen Prädiktor (einen von vielen) mit einer Reihe von Werten, z.B. 10 Stück.

teilen Sie den Prädiktor in diese Bereiche X1,X2....X10

Berechnen wir die Wichtigkeit der einzelnen Bereiche im Prädiktor mit einigen Mitteln, die jetzt nicht wichtig sind, wie

erhalten wir eine Tabelle der Wichtigkeit(ich erinnere daran, dass es sich um einen Prädiktor handelt, der in Teilprädiktoren aufgeteilt ist)

Х1 = 0,5%

Х2 = 0,01%

Х3 = 0,003%

Х4 = 0,0033%

Х5 = 0,0013%

Х6 = 0,0039%

Х7 = 0,0030%

Х8 = - 0,0000%

Х9 = - 0,0001%

Х10 = - 0,00002%

Wir sehen, dass nur ein Bereich "X1" wirklich einen starken Einfluss hat, der Einfluss der anderen ist entweder negativ oder einen halben Schritt von negativ entfernt und es ist sehr zweifelhaft, dass sich diese Bereiche X2....X7 bei neuen Daten zum Besseren wenden werden...

Frage :

Ist es besser, den gesamten positiven Bereich X1...X7 beizubehalten oder nur den Bereich zu belassen, in dem es keinen Zweifel gibt, d.h. nur X1

Noch einmal: Es handelt sich nur um eine Auswahl eines Prädiktors, und wenn wir 200 Prädiktoren bereinigen? auf welchen Daten wird der Algorithmus die neuen Daten besser erkennen oder nicht?

Wer denkt darüber nach?

A Sie können es versuchen. Manchmal hilft es, die Schwänze der Verteilungen zu entfernen, und manchmal nicht.