Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 156

 
Und übrigens, kosmische Prozente auf lange Sicht sind auf 5 Minuten verdient, mit einer entsprechenden Erhöhung der Trades, so..... alles passt....
 
Alexey Burnakov:


2) Nun ja... aber dieser Sharpe 2-3, wie wird er berechnet? Wie berechnen die Fonds, oder besser gesagt, WIE stellen sie fest, dass dies die echte Sharpe-Schätzung für einen realen Handel ist?


Der Punkt ist, dass auf den Modellen, die Sharp ist das Verhältnis von Rendite zu Risiko, gibt es viele Variationen, was als Rückkehr, wie dumm Wachstum Prozentsatz oder Regression der Dynamik des Wachstums zu zählen, und das Risiko ist CKO oder maximale Drawdown, usw. Die Unterschiede sind nicht grundlegend, aber wenn 2-3 waren eine Realität, jeder wäre ein Milliardär, in der realen Handel aus mehreren Gründen kommt es viele Male weniger, auch wenn es von PhD-Team getan wird. Wenn viele Modelle für 100.000 $ oder sogar bis zu 10 Mio. $ gehandelt würden, wäre die Situation viel besser, aber das würde nicht einmal die Investitionen und Gehälter mit den Mitarbeiterprämien zurückzahlen.

 
J.B:

Das ist die Sache mit Modellen, Sharpe ist das Verhältnis von Ertrag zu Risiko, gibt es viele Variationen von dem, was als Ertrag, wie dumm Prozent Wachstum oder Regression der Wachstumsdynamik zu zählen, und das Risiko ist CKO oder maximale Drawdown, etc. die Unterschiede sind nicht grundlegend, aber wenn 2-3 waren real jeder wäre ein Milliardär, in realen Handel aus mehreren Gründen kommt es mal weniger, auch wenn von PhD-Team getan. Wenn viele Modelle mit 100.000 $ oder sogar bis zu 10 Mio. $ gehandelt würden, wäre die Situation viel besser, aber dann würden sich nicht einmal die Investitionen und Gehälter mit den Boni für die Mitarbeiter amortisieren.

Der Doktortitel ist kein Indikator. Die Umschulung wird so gut sein wie die von Ms und B. Daher der drastische Rückgang der Metriken für den Real.
 
Alexey Burnakov:

Nun gut, okay.

Angenommen, ich unterteile das Wachstum nicht in Aufwärts- und Abwärtsbewegungen, sondern erstelle ein Regressionsmodell. R^2 oder eine andere deterministische Metrik (z. B. eine robuste absolute Abweichungsmetrik) ist also in Ordnung.

Was die gegenseitige Information anbelangt - ist sie unverschämt oder gibt es starke Hinweise darauf, dass die Metrik unzuverlässig funktioniert? Ich habe da so meine Zweifel.

Update: Ich habe viel über synthetische und reale Daten recherchiert und dabei gegenseitige Informationen verwendet. Wenn die Abhängigkeit stationär ist, funktioniert die Metrik überall gut. Wenn die Abhängigkeit am Rande des Rauschens liegt, kann die Metrik eine Nullabhängigkeit aufweisen. Aber im Großen und Ganzen sehe ich keinen Grund, warum es in multivariaten nichtlinearen Systemen schlechter abschneidet als z. B. F1. Sie können es hier nachlesen:https://habrahabr.ru/company/aligntechnology/blog/303750/

Wenn ich jedoch eine inkrementelle Kursbewegung klassifiziert habe, ergab sich ungefähr folgendes Bild (für 5 Währungspaare zusammen, d. h. ein Modell für alle):


Das sind mindestens mittlere Genauigkeitswerte bei 50 anhängigen Stichproben in der Größenordnung von maximal 57 %. Für einzelne Währungspaare erreiche ich eine mittlere Genauigkeit von über 60 %. Dies gilt nur für Zeitreihendaten.

Sorry, keine Zeit für solide Beweise, Marktdaten sind nicht stationär und Abhängigkeiten sind nicht linear, simulieren Sie zum Beispiel ein 10-dimensionales fraktales Rauschen in 2d wie folgt: rot eine Klasse grün die andere nur in 10d

Wie Sie sehen, sind die Abhängigkeiten nicht gaußförmig, es gibt "Inseln" und so weiter. Berechnen Sie dann, wie effizient die Verwendung der gegenseitigen Information oder von r^2 ist, wenn eine Dimension hinzugefügt oder entfernt wird, da die Klassifizierung abnimmt. R^2 ist im Allgemeinen linear, im Falle einer trennenden Hypersurface mit komplexer Topologie und vielen Inseln ist alles traurig. Auf klassische statistische Kriterien kann man hier nicht verzichten, das kann man selbst überprüfen. Und was ist, wenn es 100d oder 1000d solcher Schweinereien gibt?

 
J.B:

Tut mir leid, keine Zeit für eindeutige Beweise, Marktdaten sind nicht stationär und Abhängigkeiten sind nicht linear, simulieren Sie zum Beispiel 10 dimensionales fraktales Rauschen in 2d wie folgt: rot eine Klasse grün die andere nur in 10d

Wie Sie sehen, sind die Abhängigkeiten nicht gaußförmig, es gibt "Inseln" und so weiter. Berechnen Sie dann, wie effizient die Verwendung der gegenseitigen Information oder von r^2 ist, wenn eine Dimension hinzugefügt oder entfernt wird, da die Klassifizierung abnimmt. R^2 ist im Allgemeinen linear, im Falle einer trennenden Hypersurface mit komplexer Topologie und vielen Inseln ist alles traurig. Auf klassische statistische Kriterien kann man hier nicht verzichten, das kann man selbst überprüfen. Was ist, wenn es 100d oder 1000d solcher Schweinereien gibt?

Es ist nicht beweisbar...

Sie können mich nicht verstehen. Ich sage nur, dass ich nicht klassifiziere, sondern ein Regressionsmodell aufbaue. Was hat die Klassifizierung damit zu tun... Ich verwende keine Hyperplanes. Ich führe eine bedingte Modellierung des Medianwerts des Ziels durch und messe seine Qualität durch eine Residuenanalyse. So wird es immer gemacht.

Wenn es sich um eine Klassifizierung handelt, dann ist die Anforderung der Normalität von etwas nicht notwendig, zum Beispiel, wenn die Wahrscheinlichkeit von etwas nahe Null ist. Nichtlinearität und Mehrdimensionalität sind nur der Umfang der gegenseitigen Information. Ich glaube, Sie sind in dieser Sache nicht ganz auf dem Laufenden...

 
Dimitri:

10 % ist die Pfandbelastung.

Wenn Sie eine Einlage von 1.000 $ haben, laden Sie diese um 10 % auf - Sie eröffnen einen Handel für 100 $.

ACHTUNG, je nach dem von Ihrem Broker/Coach angebotenen Hebel können Sie verschiedene Lots kaufen - 10.000 $ (1:100), 5.000 $ (1:50), 20.000 $ (1:200).

P.S. fuckerbaby........


Fluchen Sie nicht in einem leichten Thema...

Rechnen wir mal nach.

Erstes Beispiel: Ich habe 500 Dollar. Ein Mikrolot ist 1000 Dollar wert. Ich eröffne einen Handel mit einem Mikrolot (weil Käufe größerer Beträge nicht mehr in die inhärente Risikogrenze passen) und verwende daher einen Hebel von 1:2. Da der Händler mir eine maximale Hebelwirkung von 1:100 einräumt, lade ich meine Einlage mit 2% auf, um $1000/100 zu kaufen.

Zweites Beispiel. Wenn ich 5 Geschäfte mit demselben Kapital eröffne, erhöhe ich meine Einlage um 10% und verwende einen Hebel von 1:10 (0,01 * 100000 * 5 / 500).

Das heißt, die maximale Hebelwirkung hängt nur vom Prozentsatz der Einzahlungslast ab und gibt mir die Möglichkeit, den ganzen Schnitt zu öffnen. Die tatsächliche Hebelwirkung liegt in meinem Ermessen. Aber das Minimum ist 1:2 für meine Investitionen.

Ist jetzt alles klar?

 
Alexey Burnakov:

Fluchen Sie nicht in einem leichten Thema...

Rechnen wir mal nach.

Erstes Beispiel: Ich habe 500 $. Ein Kleinstlos kostet 1000 $. Ich eröffne einen Handel mit einem Mikrolot (weil Käufe größerer Beträge nicht mehr in die inhärente Risikogrenze passen) und verwende daher einen Hebel von 1:2. Da der Händler mir eine maximale Hebelwirkung von 1:100 einräumt, lade ich meine Einlage mit 2% auf, um $1000/100 zu kaufen.

Wenn ich 5 Geschäfte mit demselben Kapital eröffne, erhöhe ich die Einlage um 10% und verwende einen Hebel von 1:10 (0,01 * 100000 * 5 / 500).

Sind wir uns jetzt einig?

Sie nutzen dieselbe Hebelwirkung, die Ihnen die Küche bietet. Sie variieren nicht die Hebelwirkung (sie ist gegeben - eine Konstante), sondern die Höhe des Kapitals, das Sie für eine bestimmte Hebelwirkung einsetzen.

Noch einmal: Welche Hebelwirkung bietet Ihnen die Küche für Ihren Kontotyp? 1:100?

 
Dimitri:

Sie nutzen dieselbe Hebelwirkung, die Ihnen die Küche bietet. Es geht nicht um die Hebelwirkung, die Sie einsetzen (sie ist eine feste Konstante), sondern um die Höhe des Kapitals, das Sie für eine bestimmte Hebelwirkung einsetzen.

Noch einmal: Welche Hebelwirkung bietet Ihnen die Küche für Ihren Kontotyp? 1:100?


Maximale Hebelwirkung - ja, 1:100. Aber ich benutze es nicht. Noch einmal.

 
Alexey Burnakov:

Es ist nicht beweiskräftig...

Sie können mich nicht verstehen. Ich sage, ich klassifiziere nicht, ich erstelle ein Regressionsmodell. Was hat die Klassifizierung damit zu tun... Ich verwende keine Hyperplanes. Ich führe eine bedingte Modellierung des Medianwerts des Ziels durch und messe seine Qualität durch eine Residuenanalyse. So wird es immer gemacht.

Wenn es sich um eine Klassifizierung handelt, dann ist die Anforderung der Normalität von etwas nicht notwendig, zum Beispiel, wenn die Wahrscheinlichkeit von etwas nahe Null ist. Nichtlinearität und Mehrdimensionalität sind nur der Umfang der gegenseitigen Information. Ich glaube, Sie sind in dieser Sache nicht ganz auf dem Laufenden...

Nun, wie wäre es mit einer Klassifizierung, z.B. 1000 Faktoren, einem tiefen neuronalen Netz mit z.B. 100 Ausgängen, die Wahrscheinlichkeiten für Aufwärts-/Abwärtsbewegungen eines bestimmten Instruments zu verschiedenen Zeithorizonten liefern. Ist das ein Rückschritt? Bei der Regression wird der Preis vorhergesagt.

Sie können die gegenseitige Information nutzen, während wir einfach die Faktoren durchgehen und den prozentualen Einfluss jedes einzelnen auf die endgültige Prognose für ein bestimmtes Modell berechnen sollten, was noch schlechter ist. googleNet in Bezug auf die Raffinesse. Wir brauchen keine Regression, es ist uns egal, wie viel ein Vermögenswert genau wert sein wird, das verkompliziert das Modell und hat keinen Sinn, die Hauptsache ist, dass er sich für N Sekunden mit einer bestimmten Wahrscheinlichkeit in die richtige Richtung bewegt.

 
Alexey Burnakov:

Die maximale Hebelwirkung beträgt ja 1:100. Aber ich benutze es nicht. Ich sage es noch einmal.

OK, wenn Sie elementare Dinge nicht verstehen, dann hat es keinen Sinn, zu streiten.

Kurz gesagt, Sie müssen Ihren Anteil am Hedgefonds durch etwa 10 teilen.