Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2536

 
Aleksey Nikolayev #:

Ein seriöser Wissenschaftler schrieb, dass der Preis notwendigerweise logarithmisch sein muss, und alle Theoretiker halten blindlings daran fest.

John Tukey? oder Box und Cox?

 
transcendreamer #:

John Tukey? oder Box und Cox?

Vielleicht Eugene Fama in seiner Dissertation, aber ich bin mir nicht sicher.

 
Renat Akhtyamov #:

Ich glaube, es war schon einmal hier.

Nun, das Problem von Flat und Trending wird wieder auftauchen


...........

Die Methode ist wie folgt:

1) Sie haben eine Art von Modell (z. B. lineare Regression)

2) Sie haben eine Reihe von Beobachtungen, bei denen Sie sich nicht sicher sind.

Dann erzeugen Sie ein zufälliges Rauschen und kombinieren es mit einer Reihe von Beobachtungen, was Sie mehrmals wiederholen.

Vergleichen Sie dann das Verhalten des Modells mit den verschiedenen Ergebnismengen und ziehen Sie einige Schlussfolgerungen.

Optional können wir das stabilste Verhalten als das bevorzugte auswählen.

Dies ist kein Zauberstab, sondern nur ein Werkzeug zur Analyse und möglichen leichten Verbesserung, es macht ein falsches Modell nicht richtig.

 
LenaTrap #:

...........

Die Methode ist wie folgt:

1) Sie haben eine Art von Modell (z. B. lineare Regression)

2) Eine Reihe von Beobachtungen, bei denen Sie sich nicht sicher sind

Dann erzeugen Sie ein zufälliges Rauschen und kombinieren es mit einer Reihe von Beobachtungen, was Sie mehrmals wiederholen.

Vergleichen Sie dann das Verhalten des Modells mit den verschiedenen Ergebnismengen und ziehen Sie einige Schlussfolgerungen.

Optional können wir das stabilste Verhalten als das bevorzugte auswählen.

Es handelt sich dabei nicht um einen Zauberstab, sondern lediglich um ein Instrument zur Analyse und möglichen leichten Verbesserung, das ein falsches Modell nicht in ein richtiges verwandelt.

Das ist nicht klar. Es gibt eine deterministische Reihe und ein Modell, das sie mit 100%iger Genauigkeit beschreibt. Wenn man Rauschen hinzufügt, liegt die Genauigkeit des Modells bei 52 %. Was ist der Sinn dieser Aktion?
 
Dmytryi Nazarchuk #:
Nicht klar. Es gibt eine deterministische Reihe und ein Modell, das sie mit 100%iger Genauigkeit beschreibt. Sie fügen Rauschen hinzu - die Genauigkeit der Modellbeschreibung beträgt 52 %. Was ist der Sinn dieser Aktion?

In Morsezeichen und Kommunikatoren. kommt es von dort.

 
LenaTrap #:

...........

Die Methode ist wie folgt:

1) Sie haben eine Art von Modell (z. B. lineare Regression)

2) Eine Reihe von Beobachtungen, bei denen Sie sich nicht sicher sind

Dann erzeugen Sie ein zufälliges Rauschen und kombinieren es mit einer Reihe von Beobachtungen, was Sie mehrmals wiederholen.

Vergleichen Sie dann das Verhalten des Modells mit den verschiedenen Ergebnismengen und ziehen Sie einige Schlussfolgerungen.

Optional können wir das stabilste Verhalten als das bevorzugte auswählen.

Es handelt sich nicht um einen Zauberstab, sondern lediglich um ein Instrument zur Analyse und möglichen leichten Verbesserung, das aus dem falschen Modell nicht das richtige macht.

Nur in bestimmten Situationen, und es gibt eine Reihe von Situationen, in denen das nicht funktioniert. Die einzige Hoffnung ist, dass es durch die Logik, die nicht immer der Fall ist, weniger Situationen gibt, in denen es nicht funktioniert.

 
Dmytryi Nazarchuk #:
Nicht klar. Es gibt eine deterministische Reihe und ein Modell, das sie mit 100%iger Genauigkeit beschreibt. Sie fügen Rauschen hinzu - die Genauigkeit der Modellbeschreibung beträgt 52 %. Was ist der Sinn dieser Aktion?

Wenn Sie exakte Werte aus dieser Reihe erhalten können, hat das keinen Sinn. Wenn Sie nur Näherungswerte erhalten können, ist es einfach zu prüfen, ob das Modellergebnis der Fehler Ihrer ungenauen Messungen der ursprünglichen (idealen) Reihe ist. Es gibt genaue mathematische Formeln und Definitionen dafür, aber ich verstehe sie nicht.

 
LenaTrap #:

Wenn Sie exakte Werte aus dieser Reihe erhalten können, hat das keinen Sinn. Wenn Sie nur ungefähre Werte erhalten können, dann ist der Punkt einfach genug, um zu überprüfen, ob das Modellergebnis ein Fehler Ihrer ungenauen Messungen der ursprünglichen (idealen) Reihe ist. Es gibt genaue mathematische Formeln und Definitionen dafür, aber ich verstehe sie nicht.

Es geht um die Zuverlässigkeit der Isolierung des Gesuchten, nicht um die Genauigkeit der Werte. Da gibt es das Gewünschte, 10 Prozent untermischen, 99 auswählen, 50 untermischen, 80 oder 20 auswählen... Es hängt alles vom Algorithmus für die Auswahl der gesuchten Daten ab.

Nun, das hängt natürlich von der Qualität des Rauschens ab. Man kann jedes Signal verschleiern, wenn man das Signal kennt.
 
LenaTrap #:

Wenn Sie exakte Werte aus dieser Reihe erhalten können, hat das keinen Sinn. Wenn Sie nur ungefähre Werte erhalten können, dann ist der Punkt einfach genug, um zu überprüfen, ob das Modellergebnis ein Fehler Ihrer ungenauen Messungen der ursprünglichen (idealen) Reihe ist. Es gibt genaue mathematische Formeln und Definitionen dafür, aber ich verstehe sie nicht.

Es geht nicht um Regression
 
elibrarius #:
Ich habe die Prädiktoren und die Ausgabe zufällig eingegeben. Nur um sicherzustellen, dass Lernen nicht möglich ist. Ich habe dafür gesorgt, dass es 50/50% sind.
Mit den Kursen und mit dem Ziel bei TP=SL ist es auch 50/50%.

Was aber, wenn das Ziel nicht zufällig festgelegt wird?

Hier habe ich ein Experiment versucht - meine Stichprobe ist normalerweise in drei Teile aufgeteilt, also habe ich sie zu einer Stichprobe zusammengefasst und das Modell mit 100 Bäumen trainiert, dann überprüft, welche Prädiktoren nicht verwendet wurden und diese blockiert. Dann habe ich das Modell wie üblich trainiert, wobei ich das Übertraining in der zweiten Stichprobe gestoppt habe, und die Ergebnisse in der dritten Stichprobe mit der Variante verglichen, wenn ich ohne Ausschluss von Prädiktoren trainiere. Es stellte sich heraus, dass die Ergebnisse bei den ausgewählten Prädiktoren besser waren, und hier finde ich es schwierig, diesen Effekt zu schließen, indem ich denke: "Die Auswahl der verschiedenen Prädiktoren ist auf die unterschiedlichen Stichproben im Intervall zurückzuführen; durch das Training an der gesamten Stichprobe wählen wir automatisch Prädiktoren aus, die ihre Signifikanz im Laufe der Zeit nicht verlieren". Bedeutet dies jedoch, dass das Modell über einen langen Zeitraum umso robuster ist, je größer die Stichprobe ist? Können auf diese Weise Prädiktoren für das Lernen ausgewählt werden, d. h. trägt dies nicht zum Überlernen bei? Im Allgemeinen habe ich die Empfehlung von den Gründern von CatBoost gehört, dass es notwendig ist, Hyperparameter des Modells zu finden, und dann dummerweise auf allen zugänglichen Proben für die Anwendung des Modells in der Arbeit zu trainieren.


elibrarius #:
Es gab eine Variante mit 47,5% Fehler, es sah cool aus, aber als ich es an den MT-Tester anschloss, stellte sich heraus, dass es ein Sturz statt Wachstum war. Es hat sich herausgestellt, dass ich die Provision nicht berücksichtigt habe, sie hat den Vorteil von 2% aufgefressen.

Ich denke darüber nach, wie man die Provisionen abrechnen kann...
Ich wollte 4 Punkte auf den Spread aufschlagen. Aber das ist nicht richtig. Da TP und SL manchmal durch überbewertete Ask ausgelöst werden, und zwar nicht auf dem Balken, auf dem sie im Tester sein sollten, kann sich dadurch die Reihenfolge der nachfolgenden Trades ändern.
Aber der Tester verwendet die Mindestspanne auf dem Balken, sie wird auch von der Realität abweichen.

Ich habe noch nicht herausgefunden, wie es am besten geht.

Wenn sich der Markt um 100 Punkte in Richtung A bewegt, dann sollte die Spread-Abhängigkeit überhaupt nicht bestehen - das finanzielle Ergebnis hängt nur vom Spread ab - und sollte meiner Meinung nach in der Ausbildung nicht berücksichtigt werden. Angenommen, ich habe Markteintritte, nachdem das Modell sie bestätigt hat oder nicht, und wenn ich sie markiere, habe ich die Möglichkeit, den Spread virtuell auszuweiten - d.h. wenn der Gewinn geringer ist als die angegebene Anzahl von Punkten, dann verzichte ich auf den Einstieg. Auch der Spread wird bei der Modellanalyse berücksichtigt, wenn das Ergebnis rein stichprobenartig berechnet wird - ich ziehe einfach eine bestimmte Anzahl von Punkten vom finanziellen Ergebnis des Handels ab.

Bei Moex werden die Stopps dort ausgelöst, wo der Kurs war, was natürlich einfacher ist.