Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 155

 
J.B:

Es handelt sich um eine empirische Schätzung des Klassifizierungsqualitätsgewinns mit - ohne diesen Faktor ist alles einfach, gegenseitige Information und Bestimmung in nichtlinearen Multifaktorensystemen funktionieren unzuverlässig. Und die Zahlen 4-5% sind kein Dogma, man muss nur verstehen, dass man mit Hilfe "aller Märkte" und Informationsflüsse ohne Dynamik des Preises eines bestimmten Instruments dessen Zukunft für einen gewissen Horizont <5% schlechter vorhersagen kann, das ist alles. Das heißt, wenn Sie eine einminütige Wahrscheinlichkeit für die Vorhersage des zukünftigen Anstiegs des Vermögenswerts haben, z. B. 70 %, dann erhalten Sie, wenn Sie den Preis der vorhergesagten Reihe aus den Daten für die Analyse ausschließen, 70 - (70-50)*0,5 = 69 % fast innerhalb der Rauschgrenzen der Differenz. Nun, wenn man natürlich Echtzeitdaten von allen Weltmärkten hat und nicht nur von Märkten, aber ohne Insiderinformationen, und wenn nur der Preis eines Instruments... ach, welche KI man auch immer geschaffen hat, es ist einfacher, einen Terminator zu schaffen, als einen Markt mit solchen Daten zu schlagen.

Nun ja, okay.

Nehmen wir an, ich klassifiziere nicht den Aufwärts-/Abwärtsgewinn, sondern ich erstelle ein Regressionsmodell. R^2 oder eine andere deterministische Metrik (z. B. eine robuste absolute Abweichungsmetrik) ist also in Ordnung.

Was die gegenseitige Information betrifft - ist sie unbegründet oder gibt es starke Beweise dafür, dass die Metrik unzuverlässig funktioniert? Ich habe da so meine Zweifel.

Update: Ich habe viel über synthetische und reale Daten recherchiert und dabei gegenseitige Informationen verwendet. Wenn die Abhängigkeit stationär ist, funktioniert die Metrik überall gut. Wenn die Abhängigkeit am Rande des Rauschens liegt, kann die Metrik eine Nullabhängigkeit aufweisen. Aber im Großen und Ganzen sehe ich keinen Grund, warum es in multivariaten nichtlinearen Systemen schlechter abschneidet als z. B. F1. Sie können es hier nachlesen:https://habrahabr.ru/company/aligntechnology/blog/303750/

Wenn ich jedoch eine inkrementelle Kursbewegung klassifiziert habe, ergab sich ungefähr folgendes Bild (für 5 Währungspaare zusammen, d. h. ein Modell für alle):


Das sind mindestens mittlere Genauigkeitswerte bei 50 anhängigen Stichproben in der Größenordnung von maximal 57 %. Für einzelne Währungspaare erreiche ich eine mittlere Genauigkeit von über 60 %. Dies gilt nur für Zeitreihendaten.

 
Alexey Burnakov:

1) Dies ist keine naive Sichtweise. Es ist die Richtung der Suche. Und nicht unbedingt ein neuronales Netz. Die These lautet: Aus den Vergangenheitswerten einer Zeitreihe von Kursen lassen sich unabhängig vom Zeithorizont des eigentlichen Forward-Tests ausreichend Informationen für einen profitablen (Kosten überwindenden) Handel herausziehen.

Ich werde auch eine Reihe von Diagrammen zu diesem Thema veröffentlichen. Ich bereite derzeit Material für einen Artikel vor.

2) PS: Persönlich, unter Berücksichtigung aller Faktoren, die zu Übertraining, und versuchen, die konservativste und zuverlässige Modell Zustand zu nehmen, stellt sich heraus, dass mehr als 30-40% pro Jahr (mit max. Drawdown 25%) nicht auspressen kann. Aber sie übersteigt bereits die durchschnittliche Rendite von Hedgefonds. All die anderen kosmischen Zinsen, die angeblich auf lange Sicht rein auf der technischen Analyse der Zeitreihen beruhen - das ist eine Lüge.

1) Natürlich müssen wir überall suchen, ich habe nur vorgeschlagen, mehr Informationen zu verwenden und nur das, und außerdem kann ein etablierter Händler nicht in die Irre geführt werden, wir können nur Informationen zu seinem bestehenden Modell hinzufügen.

2) die durchschnittlichen Renditen selbst amerikanischer Hedge-Fonds sind traurig unter den Indizes, die härtesten geben kaum 15-20% im Durchschnitt in 10 Jahren, obwohl Modelle nicht mit sharp* unter 2-3 handeln dürfen und natürlich die Kapazität $10^6-9 ist, nach Berechnungen sollte jeder mindestens 20-30% haben, aber....

 
J.B.:

1) Natürlich muss man überall nachschauen, ich habe nur vorgeschlagen, mehr Informationen zu verwenden, und außerdem kann ein etablierter Händler nicht von seinem eigenen Weg abgebracht werden, man kann nur Informationen zu seinem bestehenden Modell hinzufügen.

2) Median Renditen auch amerikanische Hedge-Fonds sind traurig unter den Indizes, die steilsten kaum 15-20% geben einen Durchschnitt von 10 Jahren, obwohl das Modell nicht erlaubt ist, mit einem Sharpe* unter 2-3 und natürlich die Kapazität dort $10^6-9 zu handeln, sollten die Berechnungen mindestens 20-30% sein, aber....

1) es ist ja

2) Nun ja... aber dieser Sharp 2-3 wie wird er berechnet? Wie berechnen die Fonds, oder besser gesagt, WIE stellen sie fest, dass es sich um eine echte Sharpe-Schätzung für einen echten Handel handelt?

 
Alexey Burnakov:

PS: Ich persönlich habe mit allen Faktoren zu kämpfen, die zu übermäßigem Lernen führen, und versuche, die konservativste und zuverlässigste Modellbedingung zu wählen. Es stellt sich heraus, dass es unmöglich ist, mehr als 30-40% pro Jahr herauszuholen (mit einem maximalen Drawdown von 25%). Aber sie übersteigt bereits die durchschnittliche Rendite von Hedgefonds. Alle anderen kosmischen Zinsen, die angeblich auf lange Sicht rein durch technische Analyse auf der Grundlage von Zeitreihen erhalten werden, sind eine Lüge.

))) Sehr witzig!

Wie viel Einfluss haben Sie auf diese 30-40 % pro Jahr?

 
Dmitri:

))) Sehr witzig!

Wie groß ist die Hebelwirkung, die Sie mit diesen 30-40 % pro Jahr erzielen?

Maximale Pfandbelastung von 10% (1:10).

Nun, ich sollte erwähnen, dass ich manchmal Beispiele dafür gesehen habe, dass man seit Jahren noch mehr verdient. Aber das geschah entweder von Hand oder mit Abzügen am Rande eines Fouls.

 
Alexey Burnakov:

Maximale Pfandbelastung von 10% (1:10).

Nun, ich sollte darauf hinweisen, dass ich manchmal Beispiele dafür gesehen habe, dass man jahrelang mehr als das getan hat. Aber das geschah entweder von Hand oder mit Abzügen am Rande eines Fouls.

Ich meine nicht die Einlagenlast, ich meine die Hebelwirkung - mit welcher Hebelwirkung verdienen Sie diese 30-40% pro Jahr?
 
mytarmailS:

Jungs gibt es eine Idee, es lohnt sich zu überprüfen, ich hatte es vor langer Zeit, wollte ich überprüfen, konnte aber nicht herausfinden, das Paket und irgendwie vergessen und aufgegeben, aber hier habe ich den Zweigder J.B lesen und erinnerte sich, es stellt sich heraus, er hat auch etwas Ähnliches:)

Wir sprechen von Kreuzkorrelation - wir können berechnen, wie stark ein Blutdruck hinter dem anderen zurückbleibt und ob es einen Zusammenhang zwischen ihnen gibt ...

Der Kern meiner Idee war es, gleichzeitig eine große Anzahl von Paaren zu überwachen und so etwas wie eine Kreuzkorrelationsmatrix zu erstellen, um jedes Paar zu vergleichen und Paare zu finden, die einander folgen, aber eines hinterherhinkt, und mit dieser Verzögerung zu handeln, da der Markt nichts Konstanteres als die Zeit hat, denke ich, dass die Berechnungen ständig bei jedem neuen Balken durchgeführt werden sollten, um sofort zu bemerken, wenn eine neue Beziehung entsteht, und auch um sofort zu bemerken, wenn diese Beziehung verschwindet ...

Sie können alles nehmen, jeden Prädiktor, aber ich denke, der beste Ansatz ist Paare, weil Marktmacher, wenn der Preis ihres Instruments ist fast immer von einem oder einem Bündel von anderen Instrumenten geführt, und die klassischen Indikatoren sind unwahrscheinlich zu passen.

ich kann versuchen, ein Neuronennetz mit dynamisch wechselnden Prädiktoren zu trainieren, kurzum, alles ist nur durch die Vorstellungskraft begrenzt ...

Ich würde versuchen, es selbst zu implementieren, aber ich bin mit einem anderen Projekt beschäftigt und möchte mich nicht zu weit aus dem Fenster lehnen.

Die Standardfunktion ccf() der Kreuzkorrelation in P

ist ein fortgeschrittenes Paket, das die Aufteilung des Spektrums in Stufen und die Überprüfung der Übergänge "wavemulcor" vorsieht. und Sie können viele BPs gleichzeitig vergleichen

Leider ist es ein Fehlschlag, Paare gehen von alleine, Entropie ist eine andere Sache, die interessanter ist.
 
Dimitri:
Ich spreche nicht vom Einlagengeschäft, sondern von der Hebelwirkung - mit welcher Art von Hebelwirkung verdienen Sie die 30-40 % pro Jahr?
Oooh, ich sehe, Sie verstehen nicht, was Hebelwirkung ist. In Klammern habe ich eine Hebelwirkung von höchstens 1:10 angegeben (falls sich mehrere Trades auf dem Markt befinden).
 
Und übrigens, ja, ich habe bereits begonnen, einen Artikel zu schreiben, ich werde ihn in diesem Thread veröffentlichen, sobald er fertig ist. Das wird meine Abhandlung sein .... :-)
 
Alexey Burnakov:
Oh, ich sehe, Sie wissen nicht, was eine Hebelwirkung ist. In Klammern habe ich höchstens eine Hebelwirkung von 1:10 angegeben (falls sich mehrere Geschäfte auf dem Markt befinden).

10 % ist die Pfandbelastung.

Wenn Sie eine Einlage von 1.000 $ haben, laden Sie diese um 10 % auf - Sie eröffnen einen Handel für 100 $.

ACHTUNG, je nach dem von Ihrem Broker/Coach angebotenen Hebel können Sie verschiedene Lots kaufen - 10.000 $ (1:100), 5.000 $ (1:50), 20.000 $ (1:200).

P.S. fuckerbaby........