Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1778

 
Dmitri:

Und wie wird die Fähigkeit zur Vorhersage bestimmt?

Nun, nicht durch Korrelation...

vielleicht durch Kreuzkorrelation durch Lag-Schätzung...

Dimitri:

Indem man dummerweise alles in der Welt in das Modell hineinschiebt?

Warum nicht? In der Ausbildung wird durch die Kreuzvalidierung herausgefiltert, was nicht benötigt wird, oder einige Statistiken...

Woher wissen Sie, "was was ist"? Wie können Sie wissen, was was ist, bis Sie es überprüfen?

 
Aleksey Vyazmikin:

Sie haben immer noch nicht gesagt, wie man damit handeln soll - ich weiß also nicht, welche Art von TS ich mir ausdenken soll.

Wie? Das liegt auf der Hand)) ZZ oben heißt kaufen, unten heißt verkaufen.

Sie würden die Richtung von ZZ vorhersagen, nicht wahr?

 
mytarmailS:

nicht durch Korrelation...

vielleicht durch Kreuzkorrelation mittels Lag-Schätzung...

Warum nicht? Die Kreuzvalidierung wird das ausmerzen, was Sie in der Ausbildung nicht brauchen, oder einige Statistiken...

Woher wissen Sie, "was was ist"? bis Sie es testen?

Nun, ich würde gerne ausführlich über das Problem der Redundanz sprechen, insbesondere im Zusammenhang mit NS, aber ich bin zu faul.

Dieses Problem ist übrigens oft die Ursache für die schlechte Vorhersagefähigkeit des Modells

 
mytarmailS:

Wie? Das liegt auf der Hand)) ZZ oben ist ein Kauf, unten ist ein Verkauf.

Sie sagen die Richtung von ZZ voraus, nicht wahr?

Das würde sich wahrscheinlich als Zuckung herausstellen.

Haben Sie versucht, den Klassifizierungsindikator mit dem Fenster zu mitteln/glätten, um Ausreißer zu eliminieren?

 
Aleksey Vyazmikin:

Das wird sich wahrscheinlich als Zuckung herausstellen.

Haben Sie versucht, den Klassifizierungsindikator mit dem Fenster zu mitteln/glätten, um Ausreißer zu eliminieren?

In diesem Fall ist die Mittelwertbildung gleich der Verzögerung. Sie müssen die Qualität der Klassifizierung verbessern, Glätten ist keine Option.

Probieren Sie es so, wie es ist!

Dmitriy:

Nun, ich würde gerne ausführlich über das Problem der Redundanz sprechen, insbesondere im Zusammenhang mit NS, aber ich bin zu faul.

Übrigens ist genau dieses Problem oft die Ursache für die schlechte Vorhersagefähigkeit des Modells

Deshalb denke ich, dass in dieser Richtung Zeichen bereits durch AMO oder Arbeitsregeln trainiert werden können, diese Zeichen sollten qualitative, komprimierte Informationen sein und mein Mini-Experiment auf der vorherigen Seite hat das bewiesen.

Aber ich verstehe immer noch nicht, wie man die Korrelation vorhersagen kann (ich weiß es nicht).

 
mytarmailS:


Und wie man durch Korrelation vorhersagen kann, verstehe ich immer noch nicht(

Erneute Vorhersage....

Der Korrelationskoeffizient hilft, die wichtigsten Prädiktoren im Voraus zu ermitteln - je höher die Korrelation zwischen der abhängigen Variable und dem Prädiktor ist, desto wichtiger ist diese Variable für das Modell.

In Ihrem Beispiel gibt es also zwei Möglichkeiten. Die erste besteht darin, einen Prädiktor nach dem anderen in das Modell einzufügen und zu sehen, wie sehr sich die Vorhersagegenauigkeit verbessert. Das ist eine lange Zeit.

Zweitens: Verwenden Sie den Korrelationskoeffizienten, um unwichtige Prädiktoren, die das Modell verzerren, im Voraus auszusieben.


Das Problem der Redundanz besteht einfach darin, dass man dem Modell 100+1 neue Prädiktoren hinzufügen kann, aber 100 Prädiktoren werden die Vorhersagequalität um 0,01 % verbessern, während 1 Prädiktor 10 % beitragen wird. Und es macht keinen Sinn, das Modell mit diesen 100 neuen Prädiktoren zu überfrachten - Overfitting

 
mytarmailS:


Und übrigens, bei einer großen Anzahl von Prädiktoren ist der Baum Mist, Random Forest regiert

 
Dmitri:

Erneute Vorhersage....

Der Korrelationskoeffizient hilft, die wichtigsten Prädiktoren im Voraus zu ermitteln - je höher die Korrelation zwischen der abhängigen Variable und dem Prädiktor ist, desto wichtiger ist diese Variable für das Modell.

In Ihrem Beispiel gibt es also zwei Möglichkeiten. Die erste besteht darin, einen Prädiktor nach dem anderen in das Modell aufzunehmen und zu sehen, wie sehr sich die Vorhersagegenauigkeit verbessert. Das ist eine lange Zeit.

Zweitens: Verwenden Sie den Korrelationskoeffizienten, um unwichtige Prädiktoren, die das Modell verzerren, im Voraus auszusieben.

Nun, die Korrelation ist nur eine der Aussiebungsmöglichkeiten, und sie ist definitiv nicht die beste... Man kann auch Kointegration, Kreuzkorrelation, nichtlineare Korrelation usw. verwenden und es wird sogar noch besser sein, aber sie alle stehen hierarchisch niedriger als der einfache Fehler der Klassifizierung, deshalb habe ich das Kriterium des Vorhersagefehlers eines Merkmals gewählt

Dimitri:

Und übrigens, bei einer großen Anzahl von Prädiktoren ist der Baum Mist, Random Forest regiert

Ich stimme teilweise zu, aber im Großen und Ganzen ist Wald die gleiche Regel, der einzige Unterschied ist die Komplexität.

Es gibt ein Paket in R, das einen Wald von 200 Bäumen auf eine oder drei Regeln komprimieren kann, indem es alles Unnötige und Überflüssige entfernt. Der Qualitätsverlust bei der Klassifizierung beträgt 0,5-2%, dies ist eine Komprimierung von Informationen, die wir anstreben sollten + Interpretierbarkeit

 
mytarmailS:

In diesem Fall ist die Mittelwertbildung gleichbedeutend mit einer Verzögerung. Sie müssen die Qualität der Klassifizierung verbessern, Glätten ist keine Option.

Probieren Sie es so, wie es ist!

Das ist keine Option. In der Wohnung gibt es zu viel Stau.

Natürlich können Sie die Aktivierungsschwelle verschieben: 0,65 - kaufen, 0,35 - verkaufen.


 
Aleksey Vyazmikin:

Das ist keine Option. In der Wohnung wird zu viel gehortet.

Sie könnten natürlich die Aktivierungsschwelle auf 0,65 - Kauf - und 0,35 - Verkauf - verschieben.

Zeigen Sie mir ein Diagramm mit Trades