Diskussion zum Artikel "Scheinkorrelationen in Python"

 

Neuer Artikel Scheinkorrelationen in Python :

Scheinkorrelationen treten auf, wenn zwei Zeitreihen rein zufällig ein hohes Maß an Korrelation aufweisen, was zu irreführenden Ergebnissen bei der Regressionsanalyse führt. In solchen Fällen sind die Variablen zwar scheinbar miteinander verbunden, aber die Korrelation ist zufällig und das Modell kann unzuverlässig sein.

Bevor man in den Bereich des algorithmischen Handels mit maschinellem Lernen eintaucht, muss man sich vergewissern, ob eine sinnvolle Beziehung zwischen den Modelleingaben und der Variablen besteht, die man vorhersagen möchte. Dieser Artikel veranschaulicht den Nutzen der Anwendung von Einheitswurzeltests auf Modellresiduen, um das Vorhandensein einer solchen Beziehung in unseren Datensätzen zu überprüfen.

Leider ist es möglich, Modelle auf der Grundlage von Datensätzen zu konstruieren, die keinen echten Zusammenhang aufweisen. Bedauerlicherweise können diese Modelle beeindruckend niedrige Fehlermetriken liefern, was ein falsches Gefühl der Kontrolle und übermäßig optimistische Aussichten verstärkt. Diese fehlerhaften Modelle werden gemeinhin als „Scheinkorrelationen“ bezeichnet.

In diesem Artikel wird zunächst ein intuitives Verständnis von Scheinregressionen entwickelt. Anschließend werden wir synthetische Zeitreihendaten erzeugen, um eine Scheinregressionen zu simulieren und ihre charakteristischen Auswirkungen zu beobachten. Anschließend werden wir uns mit Methoden zur Identifizierung von Fehlregressionen befassen und unsere Erkenntnisse zur Validierung eines in Python erstellten maschinellen Lernmodells nutzen. Wenn unser Modell validiert ist, werden wir es in ONNX exportieren und eine Handelsstrategie in MQL5 implementieren.

Autor: Gamuchirai Zororo Ndawana