Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading

mytarmailS 2016.08.26 12:26 #1251

Andrej Dik:
Sie scheinen mich missverstanden zu haben. Ich sage dem Netz nicht, wo es eintreten soll, weder mit einem zz noch mit irgendeinem anderen Indikator. Ein trainiertes Netz wählt selbst, wo es eintritt.

Oh Mann... Dann verstehe ich es nicht...

Alexey Burnakov 2016.08.26 12:31 #1252

mytarmailS:

Was sollte mit was zusammenhängen? Wie machen Sie das? Ich verstehe das auch nicht.

Ich glaube, außer Ihnen hat es hier niemand getan.)

Ich möchte Ihnen das noch einmal erklären und Sie ermutigen, sich über die verschachtelte Kreuzvalidierung zu informieren.

Dies ist ein Beispiel aus meiner Arbeit. Ich war dabei, ein Regressionsmodell zu erstellen, das eine Vorhersage für einen technischen Parameter in einem sehr komplexen System macht.

Ich gehe die Trainingsparameter des Modells durch, wähle das beste Modell in den Testfalten der Kreuzvalidierung aus und validiere es dann. Ich habe insgesamt 100 Modelle für den Test ausgewählt (Punkte im Diagramm). Dies sind die besten Modelle in der Testgruppe. Der Unterschied besteht darin, dass sie unterschiedliche Prädiktoren verwenden.

Sie können sehen, dass das untertrainierte Modell im Test auch in der Validierung untertrainiert ist. Das vollständig trainierte Modell wird auf den Test und auf die Validierung trainiert. Der übertrainierte Zustand, bei dem die Testwerte hoch und die Validierungswerte niedrig sind, existiert überhaupt nicht.

Wir haben eine Korrelation zwischen der Leistung der ausgewählten Modelle im Test und der Leistung bei der Validierung.

Indem man die Anzahl der Prädiktoren variiert, wächst das Modell von "underfit" zu "fully fit". Und dieses Wachstum gilt sowohl für die Daten, für die das beste Modell ausgewählt wird, als auch für die Daten, für die das ausgewählte beste Modell validiert wird. Es gibt Konsistenz!

Das heißt, ich habe nicht nur ein Modell ausgewählt, das bei der Validierung (außerhalb der Stichprobe) am besten abgeschnitten hat, sondern ich habe mehrere Modelle trainiert, sie nach Tests ausgewählt und die Qualitätsmetriken bei der Validierung verglichen. Dies ist eine verschachtelte Kreuzvalidierung. Dieses Modell wird nicht neu trainiert. Ich kann das beste Modell der Kreuzvalidierung nehmen und erhalte eine der besten Out-of-Sample-Metriken.

Und wenn ich Variationen in der Modellleistung bei Forex habe, die die Variationen in der Modellleistung bei der Validierung nicht erklären, dann können wir mit den Stichproben, aus denen wir das beste Modell auswählen (in diesem Fall die durchschnittliche Qualität bei den Kreuzvalidierungstests), die Qualitätsleistung außerhalb der Stichprobe nicht vorhersagen.

Indem wir also eine Modellauswahl vornehmen, aber nicht das Auswahlverfahren außerhalb der Stichprobe selbst testen, passen wir ein Modell an.

Ein Bild wie meines ergibt sich bei stationären, konsistenten Daten - sie enthalten stabile Abhängigkeiten. So verschlechtert beispielsweise eine Überhitzung des Sensors den modellierten Wert in allen Fällen, was physikalisch erklärt wird.

Bei der Modellierung von Finanzzeitreihen habe ich bereits anhand von 2.000 ausgewählten Modellen gezeigt, dass ihre Qualitätskennzahlen bei Teststichproben nicht mit den Validierungsstichproben korrelieren.

Die verschachtelte Kreuzvalidierung umfasst das mehrfache Trainieren verschiedener Modelle - oder Modelle mit unterschiedlichen Eingaben oder Parametern - an einzelnen Trainingsstichproben, gefolgt von Tests. Für jede einzelne Probe wird das beste Modell ausgewählt. Anschließend wird es erneut an einer einmaligen Validierungsstichprobe getestet. Dieser Vorgang wird viele Male wiederholt. Eine externe Testebene ist erforderlich, um zu zeigen, dass das Modell selbst und sein Auswahlverfahren zu konsistenten Ergebnissen innerhalb und außerhalb der Stichprobe führen.

Ich habe SanSanych, Dr. und anderen gegenüber darauf hingewiesen. Dr. hat mich verstanden. SanSanSanych hat es nicht verstanden.

Wenn wir also dieses Bild für den Forex- oder einen anderen Finanzmarkt erreichen, können wir das beste Modell in Bezug auf den Test-Cutoff in der Produktion ausführen.

Eröffnen und Schließen von Optimierungstypen - Algorithmisches Trading, Marktausführung - Eröffnen und

СанСаныч Фоменко 2016.08.26 12:51 #1253

Alexey Burnakov:

Ich möchte Ihnen das noch einmal erklären und Sie ermutigen, sich über die verschachtelte Kreuzvalidierung zu informieren.

Dies ist ein Beispiel aus meiner Arbeit. Ich war dabei, ein Regressionsmodell zu erstellen und eine Vorhersage für einen technischen Parameter in einem sehr komplexen System zu machen.