Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3286

 
Andrey Dik #:

Nun, das klingt schon wie die Meinung eines Profis (ob sie richtig oder falsch ist, ist eine andere Frage).
Und es gibt keinen Grund, sich darüber lustig zu machen.
Es ist absolut richtig, und das ist das größte Problem. Wegen des Mangels an Ressourcen für eine korrekte Markierung (die in der Regel am teuersten ist), hat man sogar das aktive Lernen erfunden. Wenn Algorithmen selbst versuchen, einen Datensatz wahrheitsgetreu zu beschriften, und zwar mit Hilfe von Kommentatoren. In unserem Fall, um zu kaufen oder zu verkaufen.

Und dann fummeln sie an ihren eigenen Markup-Fehlern herum. Es ist einfach offensichtlich.
 
Maxim Dmitrievsky #:
Oben habe ich über matstat geschrieben. Davor habe ich über kozul geschrieben. Noch früher habe ich über Oracle-Fehler (Markup-Fehler) geschrieben, wenn die Daten auf eine Weise markiert sind, die man nicht versteht. Was dabei auf jeden Fall herauskommt, ist die Erkenntnis, dass die Ergebnisse bei verschiedenen Trainingseinheiten und -längen unterschiedlich ausfallen werden. Das hängt von den Daten ab, die nicht bereitgestellt oder beschrieben werden.

Genau darum geht es bei dem Experiment - was ist wichtiger: Volumen oder Chronologie.

Der Schwerpunkt liegt auf der Angabe von Daten und nicht nur auf Stichproben mit einigen anderen Beobachtungen unabhängig von der Chronologie. Wenn die Zeit wichtig ist, sollten Methoden der Stichprobenaufteilung, wie z. B. die Kreuzvalidierung, mit Vorsicht eingesetzt werden.

Die Zeit spielt eine Rolle, wenn der Markt sein Verhalten signifikant und unwiderruflich ändert, was dazu führen sollte, dass es unmöglich ist, ein akzeptables Modell zu erhalten, wenn man das Lernen aus einer Stichprobe kontrolliert, die sich in der zeitlichen Entwicklung erheblich unterscheidet.

Die Frage des Aufschlags an sich ist natürlich wichtig, aber sie kann hier ausgeklammert werden.

Wenn Sie sich sehr für das Markup interessieren, es basiert auf der Strategie des Expert Advisors, dessen Code in meinem Artikel zu finden ist.

Ich habe die folgenden Einstellungen verwendet:

А. Tester-Einstellungen:

- Symbol: EURUSD

- Zeitrahmen: M1

- Intervall vom 01.01.2010 bis 01.09.2023

B. CB_Exp EA Strategie-Einstellungen :

- Zeitraum: 104

- Zeitrahmen: 2 Minuten

- Gleitende Methode: Geglättet

- Preisberechnungsbasis: Schlusskurs


Die Prädiktoren sind die gleichen wie in diesem Expert Advisor.

 
Andrey Dik #:

Ich weiß es nicht, aber es ist interessant zu wissen.

Ich bin sehr froh, dass ich meine Gedanken nicht umsonst hier laut ausspreche.

 
Aleksey Vyazmikin #:

Darum geht es bei dem Experiment - was ist wichtiger: Volumen oder Chronologie.

Es gibt kein Problem, was wichtiger ist. Es gibt ein Problem der Aufteilung. Solange Sie das einklammern, werde ich Ihre Bemühungen einklammern.

 
Aleksey Vyazmikin #:

Die Betonung liegt auf den Quotierungsdaten und nicht nur auf einer Stichprobe mit einigen anderen, von der Chronologie unabhängigen Beobachtungen. Wenn die Zeit von entscheidender Bedeutung ist, sollten Methoden zur Aufteilung der Stichprobe, wie z. B. die Kreuzvalidierung, mit Bedacht eingesetzt werden.

Ich verwende Valking Forward aus denselben Gründen.
Und ja, es besteht eine starke Abhängigkeit von der Größe des Zugdiagramms. Zum Beispiel wird bei 20000 Zeilen etwas im Forward gefunden, aber bei 5000 oder 100000 - zufällig.

 
Forester #:

Ich verwende Valking Forward aus denselben Gründen.
Und ja - starke Abhängigkeit von der Größe des Zugteils. Zum Beispiel, auf 20000 Zeilen etwas auf dem Vorwärts gefunden wird, aber auf 5000 oder 100000 - zufällig.

Aber Sie können sich denken, warum das so ist, nicht wahr? ) wegen falscher Partitionierung und zufälligem Fallen in das Intervall, wo es am korrektesten ist :)

das Wort "zufällig" deutet bereits auf matstat hin.
 
Maxim Dmitrievsky #:

Es geht nicht um die Frage, was wichtiger ist. Es gibt ein Problem mit dem Markup. Solange Sie das einklammern, werde ich Ihre Bemühungen einklammern.

Jeder sieht das Problem anders. Und jeder sucht nach seiner eigenen Lösung. Ich suche nach Stabilität in Daten mit jeglichem Markup, und das ist eine andere Richtung, die nicht im Widerspruch zu Ihrer steht.

Für mich ist die wichtigste Frage, wie man die Stabilität mit hoher Wahrscheinlichkeit abschätzen oder ihre Messung mit einer kleinen Anzahl von Beobachtungen überwachen kann. Dies wird es ermöglichen, mit einem beliebigen Aufschlag zu arbeiten.

 
Aleksey Vyazmikin #:

Jeder sieht Probleme anders. Und sucht nach seinen eigenen Lösungen. Ich bin auf der Suche nach Stabilität in den Daten mit einem beliebigen Markup , und das ist eine andere Richtung, die der Ihren nicht widerspricht.

Für mich ist die wichtigste Frage, wie man Stabilität mit hoher Wahrscheinlichkeit schätzen oder ihre Messung mit einer kleinen Anzahl von Beobachtungen überwachen kann. Dies wird es ermöglichen, mit einem beliebigen Aufschlag zu arbeiten.

Es muss eine coole Richtung sein, Katzen als Kamele zu markieren und darin nach Stabilität zu suchen.

Ich habe mich daran gewöhnt, dass jeder Dialog mit Ihnen in einer geistigen Sackgasse endet.

 
Maxim Dmitrievsky #:

Es muss ein cooler Trend sein, Katzen als Kamele zu kennzeichnen und darin Stabilität zu suchen.

Ich habe mich daran gewöhnt, dass jeder Dialog mit Ihnen in eine geistige Sackgasse führt.

Was macht es für einen Unterschied, ob Katzen oder Kamele, wenn man ihre Nützlichkeit außerhalb der Ausbildung beurteilen kann?

Das ist in der Tat eine seltsame Logik.

 
Aleksey Vyazmikin #:

Wen interessiert es, ob es sich um Katzen oder Kamele handelt, wenn man ihren Nutzen außerhalb der Ausbildung beurteilen kann?

😀