Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 172

 
SanSanych Fomenko:

PS.

Für die glühenden Verfechter von MCL stelle ich fest, dass der Tester ohne all die in diesem Thread besprochenen Maßnahmen und Instrumente überhaupt keinen Anlass gibt, über das künftige Verhalten des Handelssystems zu spekulieren. Der Prüfer sagt: "Das sind die Ergebnisse für diesen Zeitraum". Das ist alles. Der Prüfer gibt genau eine Zahl an, zum Beispiel den Gewinnfaktor, der sich auf einen bestimmten historischen Zeitraum bezieht. Und Statistiken können Sie nur in R erhalten. Und der Tester ist der letzte Teil des Modelldesigns, aber kein Ersatz für den gesamten Entwicklungsprozess.

Blödsinn und Unsinn!

Der Prüfer wird genau so viel herausgeben, wie er verlangt hat. Haben Sie nach dem Gewinnfaktor gefragt? - Hier ist der Gewinnfaktor für Sie. Wenn wir um etwas anderes oder mehrere Dinge bitten, wird es auch eine Antwort darauf geben. Und Statistiken können durch den Aufruf vonTesterStatistics() inOnTester() abgerufen werden, und all dies ist schon seit langem verfügbar. Alle anderen Statistiken können bei Bedarf hinzugefügt werden.

Ihr R wird auch nicht antworten können, wenn Sie nichts haben oder nicht wissen, was Sie fragen sollen.

 
Dr. Trader:

Sie haben zum Beispiel eine Validierung an einer verzögerten Stichprobe vorgenommen. Angenommen, das Modell für die zurückgestellten Daten wurde zusammengeführt. Was tun Sie in diesem Fall? Wenn Sie die Parameter erneut anpassen, um die Validierung der ausstehenden Stichprobe zu bestehen, beziehen Sie im Wesentlichen die Daten der ausstehenden Stichprobe in Ihre Kreuzvalidierung ein, und die Kreuzvalidierung wird ebenfalls angepasst. Dies kann durch Hinzufügen einer neuen aufgeschobenen Probe korrigiert werden. Was ist, wenn das Modell auch hier versagt? Sollten wir die Parameter anpassen, um auch die neue verzögerte Probenahme zu berücksichtigen? Es ist ein endloses Rennen.

Eine aufgeschobene Stichprobe in die Kreuzvalidierung einzubeziehen und eine neue aufgeschobene Stichprobe zu erstellen, ist nicht die Lösung, sondern eine Endlosschleife, bis man Glück hat und das Modell die aufgeschobene Validierung zufällig besteht. Dann können Sie aufhören, aber das ist keine Devisenlösung, sondern nur ein Glücksfall, der allerdings statistisch gesehen ein Verlustgeschäft wäre.

Die Frage ist also: Nehmen wir an, das Modell für die ausstehenden Daten ist stark gesunken. Was tun Sie in einem solchen Fall?

Dr. Trader, ich werde versuchen, es mit einem Bild zu erklären. Keine Sorge, das ist ein komplexes Problem, aber es kann gelöst werden. Sie sollten nicht tun, was Sie vorschlagen, sonst entsteht ein Teufelskreis.

Und noch etwas, ich werde die Aktivitäten in diesem Thread nach und nach abschließen. Ich habe das Forum langsam satt. Besser unter vier Augen und mit Beispielen.

Also:

Modellauswahl für verrauschte Zeitreihenvorhersage und Handel

Schritt für Schritt:

Erlernen des Modells - das Modell zeigt eine gute Leistung

Testen eines Modells - Modelle schneiden bereits merklich schlechter ab. Aber es gibt einige Modelle, die gut funktionieren.

Dies ist der Punkt, an dem Sie die Modelle auswählen müssen. Sie und ich wählen Modelle aus, die im Test besser abschneiden (sie können Validierungsblöcke in der Kreuzvalidierung sein). Und es wird sofort klar, dass wir eine optimistische Wahl treffen, wenn wir ein Modell nach Zeitraum wählen, dessen Merkmale bereits bekannt sind.

Wenn wir eine Kreuzvalidierung haben (die Daten für verschiedene Modelle sind gemischt), können wir sie nicht zu einem Ausschuss für den Test machen (der Test ist gemischt). Stattdessen nimmt man die ausgewählten "besten" Modelle aus dem Test und testet sie an einer verzögerten Stichprobe. Was können wir erwarten? Da wir uns in der realen Anwendung auf die Leistungen der Modelle in Kreuzvalidierungsblöcken (oder in Einzeltests, wenn wir uns nicht mit Kreuzvalidierung befassen wollen) verlassen werden, müssen wir wissen, ob die ausgewählten besten Modelle in Zukunft ähnliche Leistungen zeigen werden (in der aufgeschobenen Stichprobe 1). Wenn es eine Beziehung gibt, ist sie bereits sehr gut. Im Grunde genommen können wir die Studie an diesem Punkt abbrechen und die besten Modelle durch Kreuzvalidierung in der Zukunft auswählen.

Aber wenn wir trotzdem einen Ausschuss bilden wollen, müssen wir uns überlegen, welche Modelle wir für den Ausschuss auswählen. Wir tun dies bei der verzögerten Stichprobe 1, aber nicht nur zufällig. Wir erinnern daran, dass wir uns im wirklichen Leben nur auf Testdaten (die neuesten uns zur Verfügung stehenden Daten) stützen werden. Wir werden also nach und nach die Modelle in den Ausschuss aufnehmen, die im TEST die besten Ergebnisse erzielt haben. Wir maximieren die Leistung des Ausschusses bei der verzögerten Stichprobe.

An diesem Punkt unterliegen Sie der Verzerrung durch die Auswahl mehrerer Modelle, da wir die Wahl des Ausschusses anhand von Daten bewerten, deren Merkmale bereits bekannt sind.

Die endgültige Stichprobe ist für die Validierung des Ausschusses erforderlich.

Wenn wir beim Schritt der Validierung der ausgewählten Modelle (im Test) an der aufgeschobenen Stichprobe feststellen, dass die Merkmale der Modelle schwanken, ist dies bereits fatal, da wir keine Möglichkeit haben, das Modell im Test auszuwählen. Bei diesem Schritt müssen wir etwas an der Vorgehensweise ändern.

Wenn der versammelte Ausschuss bei der letzten aufgeschobenen Stichprobe (dies ist ein einmaliger Test) abstürzt, dann hat sich der Ausschuss an die vorherige Stichprobe angepasst.

Eine Wiederholung der gesamten Prozedur mit unterschiedlichen Parametern, um eine Maximierung von charact. bei den endgültigen aufgeschobenen Stichproben zu erreichen, ist unmöglich, da dies auch eine optimistische Wahl der Modelle wäre.

Wenn in den aufgeschobenen Stichproben alles gut funktioniert hat (d. h. wir haben die Verzerrung der Modellauswahl minimiert), ist es im Allgemeinen gut, das gesamte Verfahren in einer Schleife mit denselben Parametern zu wiederholen und die Verteilung der Ausschussarbeit in der letzten Stichprobe zu erhalten. Es ist klar, dass wir jedes Mal andere (zumindest teilweise) Daten benötigen. Und das ist schon sehr teuer...

Bitte denken Sie an dieses Schema. Sie führt Ihre Einschätzung des Echtzeithandels zu einem möglichen Absolutwert.

 
In der Vergangenheit, als Neurochel noch jung und verfügbar war, wurde mit Papier gehandelt. Ich hoffe, jeder weiß, was es ist, aber wenn man in Echtzeit arbeiten TS begann zu lecken, und dann wurde beschlossen, nicht auf ein Stück Papier Handel zu verwenden, und trainieren das Netzwerk, während ein Stück real, um die Richtigkeit des Netzes zu beurteilen. Ich gehe derzeit folgendermaßen vor: Ich lösche einen Tag, der in Bezug auf das Volumen und das offene Interesse der letzte ist. Bei what???? hat man oft einen solchen Chart gesehen, bei dem der TS am Anfang nach der Optimierung ein wenig gesunken ist und dann anfängt, recht anständige Signale zu geben. Deshalb entferne ich einen Tag, den ich bereits kenne, und TS beginnt am nächsten Tag zu handeln. .... Ich komme ganz gut voran, natürlich nicht ohne Fehler, aber für den Gewinn noch akzeptabel...
 
Mihail Marchukajtes:


Alles richtig, aber dieses Muster ist sehr bekannt, jeder weiß es seit langem, also...

Und nun hätte der einfachste Klassifikator es gefunden, für eine Serie reicht diese Interpretation von Preis, Volumen und OI nicht aus, man braucht mindestens ein Orderbuch und einen Strip mit Handelsrichtungen, und im Falle von Forex, weil diese Informationen nicht existieren, müssen sie von den westlichen liquiden Futures-Märkten genommen werden.

 
Haben Sie schon einmal darüber nachgedacht, was wäre, wenn das Netz die Muster der Zukunft speisen würde? Die Frage ist, wie man sie findet und welche Tage man wählen sollte, um das Netz so zu trainieren, dass es weiß, dass diese Muster am aktuellen Tag vorhanden sein werden. Hier ist die Antwort. Wir wählen die Tage mit dem aktuellen Volumen bzw. OM aus, in der Hoffnung, dass der Kontext des Tages dem der Tage in der Trainingsstichprobe ähnlich ist. Ich sende die Werte von Volumen und OI nicht an den Eingang des Netzwerks, ich wähle nur diese Tage aus, und der Eingang ist AD, Zscore, Kelli, etc. Mit anderen Worten, die Idee ist, eine solche Reihe von Mustern auf die Geschichte und die Reaktion des Marktes auf sie, wie in den heutigen Tag zu wählen. Wenn es Theorien über diese Art der Auswahl mit anderen Techniken gibt, würde ich sie gerne hören....
 
BlackTomcat:
Intelligente Menschen entwickeln und trainieren neuronale Netze, aber sie sehen einfache Dinge nicht. Ich habe Ihren Beitrag gelesen und war ziemlich überrascht. Wenn ich es richtig verstanden habe, haben Sie, grob gesagt, alle Kursrückgänge von 0,2 % nach einem Hoch gefunden, dann drei Kerzen in der Nähe dieses Hochs genommen und einige Manipulationen mit ihren Kursen vorgenommen und sie schließlich mit dem neuronalen Netz auf eine bestimmte Wahrscheinlichkeit reduziert. Aber entschuldigen Sie, halten Sie einen solchen Ansatz nicht für zu primitiv? :) Sie graben an den falschen Stellen. Deshalb ist das Ergebnis das Gegenteil der Realität. Ich würde Ihren Ansatz so charakterisieren: Sie versuchen, 3 Pixel aus einem FullHD-Bild zu nehmen, und auf der Grundlage dieser drei Pixel können Sie sich ein Bild vom gesamten Bild machen. OK, nicht das ganze Bild, aber wie hoch ist die Wahrscheinlichkeit, mindestens 10 % der Bildfläche richtig vorherzusagen? Ich hoffe, mein Beispiel ist klar. Man muss nicht auf die Pixel schauen, um das Bild zu sehen. Mit anderen Worten: Man muss sich nicht einzelne Balken ansehen , um das Diagramm zu verstehen, sondern das gesamte Diagramm . Und die Lösung des Problems liegt eher im Bereich der Geometrie als zum Beispiel in der Algebra, der Physik oder der Biologie. Wenn ich allerdings einige der Forschungsarbeiten lese, die hier durchgeführt werden, habe ich das Gefühl, dass sie versuchen, die menschliche Struktur mit Hilfe der Geografie zu verstehen. :)

+1

Ich würde nicht einmal "Diagramm" sagen, aber Diagramme sind nicht nur Preise, sondern auch...

Die Analogie über 3 Pixel und HD ist meiner Meinung nach sehr relevant für das, was die meisten Leute hier tun.

 

Andrej Dik:

Oder sogar jemand wird sagen: "Du weißt einfach nicht, wie man MO kocht!" - Wahrscheinlich ja, ich kann es nicht. Aber wer weiß wie? Wer hat MO auf dem Markt nutzen können?

Und Sie sind nicht allein, es ist NORMAL, nicht normal, wenn es funktioniert und solche nicht verkaufen Kurse über "erfolgreichen Handel", nicht in Partnerschaften und anderen Unsinn beschäftigt, und klopfen irgendwo wie https://www.rentec.com/Jobs.action?data=true, wenn es keine Lust, mit der Beschaffung von Kapital für den algorithmischen Handel zu stören ist))
Renaissance Institutional
Renaissance Institutional
  • www.rentec.com
RENAISSANCE TECHNOLOGIES, a quantitatively based financial management firm, has openings for programming positions at its Long Island, NY research center. Programming Opportunity We are looking for bright, outstanding programmers who are interested in working in a stimulating and academic environment to implement and support software used in...
 
Auch hier bin ich der festen Überzeugung, dass NS nur dann funktionieren kann, wenn es auf die Muster trainiert wird, die während eines Handels (Tag, Woche) auftreten, und vor allem, wenn die Marktreaktion auf diese Muster dieselbe ist wie während des Trainingszeitraums. Dann erfüllt jedes Perseptron seine Aufgabe. Die Frage ist, wie man den genauen Satz von Mustern, die im Laufe des nächsten Handelstages oder der nächsten Woche sein wird, auswählen????? So wird es gemacht, und Sie müssen kein super komplexes NS oder irgendetwas anderes erfinden, wenn das Netz auf zukünftigen Mustern trainiert wird....
 
Mihail Marchukajtes:
Haben Sie schon einmal darüber nachgedacht, wie es wäre, wenn wir die Netze mit den Mustern füttern würden, die es in Zukunft geben wird? Die Frage ist, wie man sie findet: Welche Tage sollte ich wählen, um dem Netzwerk beizubringen, dass sie am aktuellen Tag sein werden? Hier ist die Antwort. Wir wählen die Tage mit dem aktuellen Volumen bzw. OM aus, in der Hoffnung, dass der Kontext des Tages dem der Tage in der Trainingsstichprobe ähnlich ist. Ich sende die Werte von Volumen und OI nicht an den Eingang des Netzwerks, ich wähle nur diese Tage aus, und der Eingang ist AD, Zscore, Kelli, etc. Mit anderen Worten, die Idee ist, eine solche Reihe von Mustern auf die Geschichte und die Reaktion des Marktes auf sie, wie in den heutigen Tag zu wählen. Wenn es Theorien über diese Art der Auswahl mit anderen Techniken gibt, würde ich sie gerne hören....

Genau so wird es gemacht, wie sollte es auch anders gehen? Im trivialen Fall ist der Trainingsdatensatz eine Vektorfolge von normalisierten Inkrementen des Volumenpreises und der OI, nennen wir vectorSet[][] ein neuronales Netz oder einen anderen Klassifikator input =vectorSet [t][], teach output = vectorSet [t+1][]


Wenn ich die Frage richtig verstehe...
 
Mihail Marchukajtes:
Die Frage ist, wie man genau das Set von Mustern, die während des nächsten Handelstages oder der nächsten Woche sein wird, auswählen?????
Leider habe ich nicht das Recht dazu und ehrlich gesagt möchte ich auch nicht tiefer gehen, da wir uns gegenseitig das Geld stehlen)))) Aber vor 2 Jahren, als ich mit SAM arbeitete, verarbeitete ich mehr als 500 Chips am Eingang des neuronalen Netzes und hatte etwa 30 Ausgaben, aber die Zeit vergeht... ;)