Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 419

 
In Ordnung, ich werde hier ein paar Informationen geben. Die Sache ist, dass ich eine Vorstellung davon, welche Daten verwendet werden sollten, um den Markt vorherzusagen, aber leider kann ich nicht sammeln sie in vollem Umfang und in der richtigen Form, wenn jemand in der Organisation der Sammlung geholfen, würde ich seine Optimierer, gut, und die Strategie als Ganzes zu teilen. Die Daten sind schon gut genug, aber um super zu sein, müssen wir noch etwas hinzufügen. Wer hat gute Programmierkenntnisse und die Fähigkeit, Online-Daten von mehreren Websites in eine CSV-Datei zu übertragen?
 
Mihail Marchukajtes:
In Ordnung, ich stelle die Informationen hier ein. Ich habe eine Vorstellung davon, welche Daten für die Erstellung von Marktprognosen verwendet werden sollten, aber leider kann ich sie nicht vollständig und in der erforderlichen Form sammeln. Ich möchte meinen Optimierer und die Strategie im Allgemeinen mit denjenigen teilen, die mir bei der Organisation dieser Sammlung geholfen haben. Die Daten sind schon gut genug, aber um super zu sein, müssen wir noch etwas hinzufügen. Wer hat gute Programmierkenntnisse und kann die Online-Daten von mehreren Websites in eine CSV-Datei übertragen?
Mein Modell stützt sich auf mehrfach verknüpfte und diversifizierte Daten. Ich habe Erfahrung im Parsing von Daten. Ich würde mich über eine Teilnahme freuen.
 

Ich habe in meinem Blog über die Auswahl der Parameter des neuronalen Netzes geschrieben - SELECTING NEUROSET CONFIGURATION.

Zumindest in der Anfangsphase ist es besser, dies zu tun, d.h. später können Sie, falls erforderlich, den NS vereinfachen.

Das Beispiel der Auswahl im Blog ist abstrakt, aber ich habe die Parameter meines NS aus ähnlichen Überlegungen heraus gewählt. Die Lernergebnisse sind im Allgemeinen nicht schlecht.

Etwas beängstigend ist der Umfang des NS - im Beispiel für 3 MA sind es bereits über 100 Neuronen, und es ist noch kein TS, sondern nur eine Vorlage dafür.

 
Yuriy Asaulenko:

Ich habe in meinem Blog über die Auswahl der Parameter des neuronalen Netzes geschrieben - SELECTING NEUROSET CONFIGURATION.

Zumindest in der Anfangsphase ist es besser, dies zu tun, d.h. später können Sie, falls erforderlich, den NS vereinfachen.

Das Beispiel der Auswahl im Blog ist abstrakt, aber aus ähnlichen Überlegungen heraus habe ich Parameter meines NS gewählt. Die Lernergebnisse sind im Allgemeinen nicht schlecht.

Ein wenig Angst vor dem Umfang der NS - im Beispiel für 3 MA sind es bereits mehr als 100 Neuronen, und es ist noch kein TS, sondern nur eine Vorlage dafür.

Versuchen wir es auf diese Weise - am Wochenende oder in der nächsten Woche werde ich hier interessante Vorhersagen machen, und Sie sagen mir Ihre Meinung dazu. Nur Prädiktoren in Form von Indikatoren in MT5, 4 davon

Ich werde versuchen, sie als Prädiktoren für einige einige Zeit zu verwenden, und ich werde eine Gelegenheit haben, eine Challenge zu machen - wer von denen, die bereit sind, kann NS lehren, durch diese Prädiktoren zu verdienen :) Ich habe sie noch nicht gelernt, aber ich habe bisher auch noch nicht damit experimentiert.

 
Maxim Dmitrievsky:

Versuchen wir es so - am Wochenende oder nächste Woche werde ich hier interessante Vorhersagen posten und Sie geben Ihre Meinung dazu ab...? Nur Prädiktoren in Form von Indikatoren in mt5, 4 von ihnen

Es wird möglich sein, eine Challenge zu organisieren - wer wird in der Lage sein, NS zu lehren, durch diese Prädiktoren zu verdienen :) Aber im Moment kann ich MP nicht beibringen, mit ihnen gewinnbringend zu handeln.

(Nun, ich habe noch einen langen Weg vor mir, bevor ich mit dem echten Handel beginne). Ich mache das schon seit mehr als einem Monat.

Wenn ich Ihre Indikatoren verwenden möchte, wird das interessant sein, aber ich werde meine nicht verwenden. In der Tat, die Basis (die erste Version von 2008) kann hier gefunden werden -ButterworthMoving Average - Indikator für MetaTrader 4. Natürlich wurde jetzt alles anders gemacht.

 
Yuriy Asaulenko:

Nun, ich habe noch einen langen Weg vor mir, bis ich wirklich handeln kann.) Ich mache das jetzt seit mehr als einem Monat.

Wenn Sie einen guten Expert Advisor haben, wird er für mich nützlich sein. Allerdings kann die Basis (die ursprüngliche Version von 2008) hier gefunden werden -ButterworthMoving Average - Indikator für MetaTrader 4. Natürlich ist jetzt alles anders.


Ja, ich werde es tun, denn manchmal wird mein Gehirn zu einer Röhre und ich brauche eine Meinung von außen :)
 

Ich möchte niemanden verärgern, aber leider wissen die meisten von euch nicht, wie man Ziele richtig vorbereitet. All diese inspirierenden Ergebnisse (75-80% Genauigkeit) auf Chips aus langsamen Kerzen (>10min) sind in Wirklichkeit reiner Sweatshop. Die Genauigkeit von 55% ist genug, um Sharpe Ratio höher als 2 zu machen, und 60% Genauigkeit auf langsamen Daten ist der gleiche Gral, der die Legende ist, Sharpe Ratio 3-4, niemand handelt wie das auf realen, nur HFT Jungs, aber sie haben eine andere Skala von Handelskosten, gibt es weniger SR <2 ist unrentabel.

Kurzum...

NICHT DAS ZIEL(Ziel) sehen!

Mit anderen Worten: Sie können bei der Berechnung des Ziels keine Daten verwenden, die JEDOCH bei der Berechnung von Merkmalen verwendet werden, sonst wird das Ergebnis ein Fauxpas sein. Aus offensichtlichen Gründen ist ein solcher "Taschenspielertrick" wie ZZ zur Hölle, er interpoliert zwischen Extrema weit in den Bereich hinein, in dem Merkmale berechnet werden, das Ergebnis ist exorbitant, mindestens 90% Genauigkeit ohne Probleme, aber es ist eine Fälschung. Dies ist die Grundlage für obskurantistische Diskussionen über "die Vorhersage ist nicht die Hauptsache", wir sollten trotzdem TS entwickeln, usw. Diese "90 %" sind also immer noch die gleichen "geliebten" 50 %.


Sei vernünftig :)

 
Aljoscha:


Kurzum...

Sehen Sie das Ziel(dieMerkmale) NICHT!

Mit anderen Worten, bei der Berechnung des Ziels können Sie keine Daten verwenden, die bereits bei der Berechnung von Merkmalen verwendet wurden, da das Ergebnis sonst ein Sweep ist. Aus offensichtlichen Gründen ist ein solcher "Taschenspielertrick" wie ZZ zur Hölle, er interpoliert zwischen Extrema weit in den Bereich hinein, in dem Merkmale berechnet werden, das Ergebnis ist exorbitant, mindestens 90% Genauigkeit ohne Probleme, aber es ist eine Fälschung. Dies ist die Grundlage für obskurantistische Diskussionen über "die Vorhersage ist nicht wichtig", man sollte trotzdem den TS entwickeln usw. Diese "90 %" sind also immer noch die gleichen "geliebten" 50 %.


Sei vernünftig :)

Ich kann Ihren Schlussfolgerungen über ZZ nicht zustimmen, ebenso wenig wie Ihren Schlussfolgerungen im Allgemeinen.

RSI zum Beispiel. Dadurch wird ZZ oder umgekehrt in diesen speziellen Prädiktor interpoliert. Inzwischen kann ich zeigen, dass der RSI als Prädiktor für ZZ keine schlechte Vorhersagekraft hat. Und zum Beispiel hat das Winken keine Vorhersagekraft für ZZ und ist 100% Rauschen für ZZ - völlig unbrauchbar als Prädiktor. Sie können ein auf Mashka basierendes Modell mit weniger als 10 % Fehler erhalten, aber wenn Sie dieses trainierte Modell auf eine neue Datei anwenden, die nicht mit einer Trainingsdatei verbunden ist, erhalten Sie einen willkürlichen Fehler.

Zusätzlich zu dem von Ihnen erwähnten Problem, dass es Prädiktoren unter den Prädiktoren für eine RZ gibt, aus der eben diese RZ abgeleitet wird, gibt es ein weiteres Problem, das grundlegend und unabhängig von der Zielvariablen ist: Es ist das Problem, dass der Prädiktor NICHT mit der Zielvariablen in Verbindung steht, sondern Rauschen für eine bestimmte Zielvariable ist (RZ ist keine Ausnahme). Lärm ist ein sehr geeigneter Prädiktor. Sie können immer Werte unter den Rauschwerten finden, die den Vorhersagefehler verringern. Wenn ich das nicht verstand, bekam ich sehr oft Vorhersagefehler um die 5%.

Wenn man jedoch in der Lage ist, den anfänglichen Satz von Prädiktoren vom Rauschen für eine bestimmte Zielvariable zu bereinigen, ist es extrem schwierig, den Fehler unter 30 % zu senken, zumindest für mich.

Fazit: Rauschprädiktoren, die für eine bestimmte Zielvariable verrauscht sind, führen zu Übertraining, und ZZ ist da keine Ausnahme.

 
SanSanych Fomenko:

Ich kann Ihren Schlussfolgerungen über ZZ nicht zustimmen, auch nicht Ihren Schlussfolgerungen im Allgemeinen.

RSI zum Beispiel. Dadurch wird ZZ oder umgekehrt in diesen speziellen Prädiktor interpoliert. Inzwischen kann ich zeigen, dass der RSI als Prädiktor für ZZ keine schlechte Vorhersagekraft hat. Und zum Beispiel hat das Winken keine Vorhersagekraft für ZZ und ist 100% Rauschen für ZZ - völlig unbrauchbar als Prädiktor. Sie können ein auf Mashka basierendes Modell mit weniger als 10 % Fehler erhalten, aber wenn Sie dieses trainierte Modell auf eine neue Datei anwenden, die nicht mit einer Trainingsdatei verbunden ist, erhalten Sie einen willkürlichen Fehler.

Zusätzlich zu dem von Ihnen erwähnten Problem, dass es Prädiktoren unter den Prädiktoren für eine RZ gibt, aus der eben diese RZ abgeleitet wird, gibt es ein weiteres Problem, das grundlegend und unabhängig von der Zielvariablen ist: Es ist das Problem, dass der Prädiktor NICHT mit der Zielvariablen in Verbindung steht, sondern Rauschen für eine bestimmte Zielvariable ist (RZ ist keine Ausnahme). Lärm ist ein sehr geeigneter Prädiktor. Sie können immer Werte unter den Rauschwerten finden, die den Vorhersagefehler verringern. Wenn ich das nicht verstand, bekam ich sehr oft Vorhersagefehler um die 5%.

Wenn man jedoch in der Lage ist, den anfänglichen Satz von Prädiktoren vom Rauschen für eine bestimmte Zielvariable zu bereinigen, ist es extrem schwierig, den Fehler unter 30 % zu senken, zumindest für mich.

Fazit: Überanpassung wird durch Rauschprädiktoren verursacht, die für eine bestimmte Zielvariable Rauschen sind, und ZZ ist keine Ausnahme.


Gut! Lassen Sie uns eine Debatte über dieses äußerst wichtige Thema führen. Ich schlage vor, dass wir eine Reihe von Experimenten durchführen, um der Sache auf den Grund zu gehen.

So argumentiere ich:

1) Korrekt, Merkmalssynthese und Klassifizierung aus einem zufälligen Bündel von Zeitreihen in 2 Klassen, ergibt 50% Genauigkeit (wie eine Münze), mit genügend Stichproben (von 5-10k). Wenn es eine statistisch signifikante Abweichung in der Genauigkeit gibt (>51%), dann gibt es Fehler im Prozess der Merkmalssynthese und/oder der Klassifizierung.

2) Bei der Verwendung von Zielen, die Daten zur Berechnung von Merkmalen verwenden, kommt es zu einer signifikanten Verzerrung der Genauigkeit (55, 60, 90 %) bei zufälligen Zeitpunkten, die a priori nicht vorhergesagt werden können (50 %). Das bedeutet, dass dieser Kummer falsch ist.

 
Aljoscha:


2) Wenn wir die für die Berechnung der Merkmale verwendeten Targeting-Daten verwenden, erhalten wir eine signifikante Verzerrung der Genauigkeit (55, 60, 90 %) zu zufälligen Zeitpunkten, die nicht a priori vorhergesagt werden kann (50 %). Das bedeutet, dass dieses Maß falsch ist.

Und warum etwas überprüfen? Für mich ist das offensichtlich.

Ich gab ein Beispiel für RSI-ZZ - nichts gemeinsam, und Sie können ein Modell mit weniger als 50% Fehler zu bauen.

Ein weiteres Beispiel: mashka-ZZ - leicht weniger als 10% Fehler. Bei einem Test mit einer neuen Datei ein völlig willkürliches Ergebnis.