Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3171

 
Aleksey Vyazmikin #:

Ändert sich das Ergebnis bei den Test-/Prüfungsstichproben erheblich, wenn der Preis bei der ersten Iteration zufällig ausgewählt wird?

Ich antworte selbst: Ja, das wird es.

Ich habe das erste Quantensegment nach dem Zufallsprinzip ausgewählt, um das Signal (String) 1000 Mal auszuschließen.

Hier sind ein paar Beispiel-Gifs, wie der Prozess mit verschiedenen zufälligen ersten Quanten-Iterationen verlief (es können Blätter sein).


Und hier sind statische Bilder zum Zeitpunkt der Zwischeniteration - verschiedene Stadien der Auswahl und Zufallsauswahl.

Welche Schlussfolgerungen können gezogen werden?

1. Man kann Glück haben und zufällig ein funktionierendes Muster finden :)

2) Ohne die Anzahl der falschen Muster zu reduzieren, ist es schwierig, ein Modell nur nach dem Prinzip der Gier zu erstellen.

3) Man muss Methoden entwickeln, um die in einem Quantensegment oder -blatt beobachtete Regelmäßigkeit abzuschätzen.

4. Die Zufälligkeit beweist nicht, dass man beim maschinellen Lernen erfolgreich ist.

5. Ein logisch gültiges Modell ist erforderlich, um erfolgreich zu sein.

6. Erfolg bei einer Teststichprobe bedeutet nicht immer Erfolg bei einer Prüfungsstichprobe, und umgekehrt.

Welche weiteren Schlussfolgerungen können gezogen werden?

 
Aleksey Vyazmikin #:
...

Welche Schlussfolgerungen können gezogen werden?

1. Vielleicht haben Sie Glück und finden zufällig ein funktionierendes Modell :)

2) Ohne die Anzahl der falschen Muster zu reduzieren, ist es schwierig, ein Modell nur nach dem Prinzip der Gier zu erstellen.

3) Man muss Methoden entwickeln, um die in einem Quantensegment oder -blatt beobachtete Regelmäßigkeit abzuschätzen.

4. Die Zufälligkeit beweist nicht, dass man beim maschinellen Lernen erfolgreich ist.

5. Ein logisch gültiges Modell ist erforderlich, um erfolgreich zu sein.

6. Erfolg in der Stichprobe bedeutet nicht immer auch Erfolg in der Prüfungsprobe und umgekehrt.

Welche weiteren Schlussfolgerungen können gezogen werden?

Ich habe Ihre Quantisierungsmethode im Laufe des Threads aus den Augen verloren, sorry, bitte erinnern Sie mich daran.

Die Quantisierung von Zeitreihen ist sehr wichtig, wenn man z.B. einen Kurs mit der Renko-Methode quantisiert, erhält man SB (zumindest statistisch relevant), so dass der Ausdruck "quantisiere es, quantisiere es nicht, du wirst immer noch xxx erhalten" zumindest untertrieben scheint, denn wenn es eine Quantisierung gibt, die Informationen zerstört, dann gibt es wahrscheinlich auch eine Quantisierung, die Informationen extrahiert. Vorausgesetzt natürlich, dass es Informationen im Tickstream gibt (was wir inständig hoffen, denn sonst wäre die Anwendung von MO sinnlos).

 

Andrey Dik #:

Quantifiziert man den Preis mit der Renko-Methode, erhält man die SB (zumindest statistisch relevant)

Ich denke, nicht mehr SB als nur Balken.

Andrey Dik #: vorausgesetzt natürlich, dass es Informationen im Tickstream gibt (was wir inständig hoffen, weil die Verwendung von MO sonst sinnlos wäre).
Ich glaube nicht, dass hier schon jemand Ticks mit MO untersucht hat.
 
Forester #:

Ich glaube nicht, dass es mehr SB als nur Bars gibt.

Ich denke, dass die SB viel größer ist, da die Barrenstatistiken sich sehr von der SB-Leistung unterscheiden.

Forester #:

Ich glaube nicht, dass hier schon jemand Tiki mit MO erforscht hat.

laut vielleicht nicht, zumindest nicht bei der Quantifizierung der Serien.

 

Es scheint vielversprechend, "nach der gegenteiligen Methode" zu handeln, d.h. nicht nach Regelmäßigkeiten zu suchen, sondern nach den Zuständen der Preis(tick)serien (ich möchte nicht "Zeitreihen" verwenden), die nie erreicht werden können und in der Geschichte nicht vorkommen.

Dies wird es ermöglichen, Randbedingungen für den Aufbau einer für Händler günstigen Strategie zu verwenden.

 
Andrey Dik #:

Ich habe im Laufe des Threads, Entschuldigung, die Methode Ihrer Quantifizierung übersehen, bitte erinnern Sie mich daran.

Das Konzept des "quantisierten Cutoff" ist einfach: Es handelt sich um den Bereich des Prädiktors, der in jeder Zeile der Stichprobe einen numerischen Wert hat. Alles, was innerhalb dieses Bereichs liegt, wird zu einer Einheit.

Ich verwende sowohl die in CatBoost eingebauten Varianten (die in Bousting häufig verwendet werden, um sowohl den erforderlichen Arbeitsspeicher als auch die Dimensionalität zu reduzieren) als auch einige meiner eigenen Methoden, z. B. verschiedene numerische Sequenzen.

Nachdem der Prädiktor unter Verwendung des erhaltenen Rasters auf die eine oder andere Weise in Bereiche unterteilt wurde, wird jedes Segment der Reihe nach genommen und auf den Wert der darin enthaltenen Informationen hin bewertet.

Eine Verschiebung der Wahrscheinlichkeit der Zugehörigkeit zu einer Klasse um 5 % oder mehr gegenüber dem Durchschnittswert der Stichprobe wird als wertvolle Information betrachtet, und auch die Anzahl der Signale und ihre Verteilung in der Stichprobe werden berücksichtigt.

Wenn die Stichprobe ein binäres Ziel hat, erhalten wir zwei Gruppen von Quantensegmenten, in denen die Wahrscheinlichkeit, 0 oder 1 zu treffen, entsprechend verschoben ist.

Wir erstellen eine neue Stichprobe, bei der jedes Quantensegment eine eigene Spalte hat - wenn ein Signal im Bereich liegt - schreiben wir "1", wenn nicht - "0".

 
Was hindert Sie daran, eine Reihe zu transformieren/quantisieren, wie ich es hier getan habe https://www.mql5.com/ru/forum/86386/page3166#comment_48559717.
oder etwas Ähnliches, und ein gutes Ergebnis zu erhalten.
 
Aleksey Vyazmikin #:

Die Antwort darauf lautet: Ja, das wird sie.

Ich habe das erste Quantensegment zufällig ausgewählt, um das Signal (die Zeichenkette) 1000 Mal auszuschließen.

Hier sind ein paar Beispiele von gifs, wie der Prozess ging mit verschiedenen zufälligen ersten Quantensegmente (es kann Blätter sein).


Und hier sind statische Bilder zum Zeitpunkt der Zwischeniteration - verschiedene Stadien der Auswahl und Zufallsauswahl.

Welche Schlussfolgerungen können gezogen werden?

1. Vielleicht haben Sie Glück und finden zufällig ein funktionierendes Modell :)

2) Ohne die Anzahl der falschen Muster zu reduzieren, ist es schwierig, ein Modell nur nach dem Prinzip der Gier zu erstellen.

3) Man muss Methoden entwickeln, um die in einem Quantensegment oder -blatt beobachtete Regelmäßigkeit abzuschätzen.

4. Die Zufälligkeit beweist nicht, dass man beim maschinellen Lernen erfolgreich ist.

5. Ein logisch gültiges Modell ist erforderlich, um erfolgreich zu sein.

6. Erfolg in der Stichprobe bedeutet nicht immer auch Erfolg in der Prüfungsprobe und umgekehrt.

Welche anderen Schlussfolgerungen können gezogen werden?

Sie könnten zu dem Schluss kommen, dass Sie ein paar Jahre lang geschwindelt haben. Oder Sie haben einfach nur eine Zufallsstichprobe gezogen, was Sie jetzt tun.
 
Aleksey Vyazmikin #:

Eine Verschiebung der Wahrscheinlichkeit, einer Klasse anzugehören, um 5 % oder mehr gegenüber dem Mittelwert der Stichprobe gilt als wertvolle Information, ebenso wie die Anzahl der Signale und ihre Verteilung über die Stichprobe.

IMHO sieht das nach Pi-Hacking aus, worüber Maxim kürzlich geschrieben hat. Solange keine statistischen Tests verwendet werden, um die Signifikanz der zugewiesenen Quanten zu bestimmen, ist es definitiv er.

Ich habe einmal ein einfaches Beispiel gegeben, als die beste Stunde der Woche für den Handel auf SB ausgewählt wurde (obwohl es sie offensichtlich nicht gibt). Es gab nur 5*24=120 Varianten, aber es reichte völlig aus, dass eine solche Stunde immer gefunden wurde (das Zeitintervall betrug ein halbes Jahr, glaube ich). Auch hier gibt es eine "Stichprobenstabilität".

 
Andrey Dik #:

Es scheint vielversprechend, "nach der gegenteiligen Methode" zu handeln, d. h. nicht nach Regelmäßigkeiten zu suchen, sondern nach den Zuständen der Preis(tick)serien (ich möchte nicht "Zeitreihen" verwenden), die niemals erreichbar sind und in der Geschichte nicht vorkommen.

Auf diese Weise lassen sich die Randbedingungen für den Aufbau einer für die Händler günstigen Strategie nutzen.

Der einzig gültige Ansatz bei der Zeitreihenanalyse ist die Suche nach Mustern und der Ausschluss von Ausreißern :) mit allen Mitteln.

Wenn es sich um eine zeitlose Reihe oder gar keine Reihe handelt, sondern, sagen wir, um einen Stapel oder ein Bündel, gibt es vielleicht andere Möglichkeiten 😁.