Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 130

 

kurz, falls jemand interessiert ist....

Ich habe versucht, den DTW-Algorithmus für das Clustering zu verwenden, und zwar mit einfachen elementaren Daten, nur für mich...

Ich nahm einen Preis und trainierte RF auf seinen Schiebefensterabschnitten, dann nahm ich wieder den gleichen Preis und die gleichen Schiebefensterabschnitte und clusterte den DTW-Algorithmus und trainierte dann RF

Der Fehler beim Training und bei der Erkennung neuer Daten mit dem DTW-Algorithmus war 2-4% niedriger

wenn man eine große Anzahl von Prädiktoren hinzufügt, kann der Fehler meiner Meinung nach noch viel weiter gesenkt werden, aber der Algorithmus ist verdammt langsam

 
mytarmailS:

kurz, falls jemand interessiert ist....

Ich habe versucht, den DTW-Algorithmus für das Clustering zu verwenden, und zwar mit einfachen elementaren Daten, nur für mich...

Ich nahm einen Preis und trainierte RF auf seinen Schiebefensterabschnitten, dann nahm ich wieder den gleichen Preis und die gleichen Schiebefensterabschnitte und clusterte den DTW-Algorithmus und trainierte dann RF

Der Fehler beim Training und bei der Erkennung neuer Daten mit dem DTW-Algorithmus war 2-4% niedriger

wenn man eine große Anzahl von Prädiktoren hinzufügt, kann der Fehler meiner Meinung nach viel niedriger sein, aber der Algorithmus ist verdammt langsam

Eingangspreis... Prädiktoren für die Eingabe...

Zirkus mit Pferden!

 
Vadim Schischkin:

Der Preis für den Eintritt... Prädiktoren vor der Tür...

Zirkus mit Pferden!

Vadim, wenn du etwas Substantielles zu sagen hast, dann sag es...

Und wenn Sie nur einen Spruch aus der fünften Klasse bringen, ist es besser zu schweigen...

zumindest aus Respekt vor denen, die es später lesen werden...

 
mytarmailS:

Vadim, wenn du etwas Substantielles zu sagen hast, dann sag es...

Aber wenn Sie nur eine Bemerkung aus der fünften Klasse machen wollen, ist es besser zu schweigen...

zumindest aus Respekt vor denen, die es später lesen werden...

Wissen Sie, was ein Prädiktor ist?

Warum sollte man einen Preis ins Netz stellen?

 
Vadim Schischkin:

1) Wissen Sie, was ein Prädiktor ist?

2) Warum sollte man einen Preis in ein Netz einspeisen?

1) Nun, ja, die Daten, aus denen das Netz lernt

2) Was ist objektiver als der Preis? Warum also nicht?

 
mytarmailS:

kurz, falls jemand interessiert ist....

Ich habe versucht, den DTW-Algorithmus für das Clustering zu verwenden, und zwar mit einfachen elementaren Daten, nur für mich...

Ich nahm einen Preis und trainierte RF auf seinen Schiebefensterabschnitten, dann nahm ich wieder den gleichen Preis und die gleichen Schiebefensterabschnitte und clusterte den DTW-Algorithmus und trainierte dann RF

Der Fehler beim Training und bei der Erkennung neuer Daten mit dem DTW-Algorithmus war 2-4% niedriger

Wenn man eine große Anzahl von Prädiktoren hinzufügt, könnte der Fehler meiner Meinung nach noch viel weiter gesenkt werden, aber der Algorithmus ist verdammt langsam

Kurz gesagt, warum wird das Clustering von Zeitreihen im Rahmen des RF-Trainings durchgeführt?
 
Alexey Burnakov:
Kurz gesagt, warum wird das Clustering von Zeitreihen im Rahmen des RF-Trainings durchgeführt?

Wenn Sie es kurz machen wollen, antworte ich mit einem Bild...

Wir haben zwei gleich lange Zeilen mit demselben Muster, aber das eine Muster ist nicht ganz identisch mit dem anderen, so dass der DTW-Algorithmus bei der Clusterbildung davon ausgeht, dass es sich um dasselbe Muster handelt, aber RF wird nicht

Das ist natürlich alles sehr grob.

dtw
 
mytarmailS:

1) ja, die Daten, aus denen das Netz lernt

2) und was ist objektiver als der Preis? Warum also nicht?

Erfolg. :)
 
Vadim Schischkin:
Erfolg. :)
danke
 
mytarmailS:

Wenn Sie es kurz machen wollen, antworte ich mit einem Bild...

Wir haben zwei gleich lange Zeilen mit demselben Muster, aber das eine Muster hat nicht genau denselben Index wie das andere, so dass der DTW-Algorithmus beim Clustering davon ausgeht, dass es sich um dasselbe Muster handelt, aber RF nicht

Der DTW-Algorithmus ist nicht so universell, er vergleicht lediglich zwei Zeitreihen anhand ihrer absoluten Werte, d. h. es ist eine Vornormierung der Verschiebung und Skalierung entlang der vertikalen Achse erforderlich, und vieles hängt von der spezifischen Implementierung ab. Hier nimmt https://www.mql5.com/ru/code/10755 zum Beispiel 2 Chunks fester Länge zum Vergleich und berücksichtigt nicht, dass einer davon länger, der andere kürzer sein kann, und der Rechenaufwand stark reduziert werden kann usw. Man kann von Clustering durch DTW-spezifische Parameter sprechen - nicht nur der "Grad der Ähnlichkeit" zweier Fragmente kann berechnet werden, sondern auch das Verhältnis der horizontalen Skalen.