Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 245

 
Andrey Dik:
Ich sage vereinfachen, verallgemeinern, aber Sie machen es noch komplizierter und detaillierter.

So wird es sehr oft gemacht. Es werden Informationskriterien verwendet, zum Beispiel Akaika.

Der Punkt ist folgender.

Die Komplexität des Modells wird bestraft. Als Ergebnis der Optimierung wird ein Modell gewählt, das nicht das genaueste, aber das einfachste ist.

Lassen Sie uns ein Beispiel nehmen.

Nehmen wir eine Stichprobe von mehr als 5000 EURUSD-Balken auf H1. Bauen wir einen Zufallswald auf. Legen Sie die maximale Anzahl von Bäumen = 500 fest. Wir betrachten eine Darstellung des Anpassungsfehlers in Abhängigkeit von der Anzahl der Bäume. Es scheint, dass sich der Anpassungsfehler nach 100 Bäumen nur wenig ändert. Außerdem erhöht eine größere Stichprobe nicht die Anzahl der Bäume. Und Bäume sind die begehrten Muster. D.h. EURUSD auf H1 enthält etwa 100 Muster. Aber das Muster ist fast immer übertrainiert.

Eine Vergröberung des Modells und eine radikale Reduzierung der maximalen Anzahl von Bäumen, z. B. 10, kann helfen, Übertraining zu vermeiden.

 
SanSanych Fomenko:


Wenn Sie das Modell vergröbern und die maximale Anzahl von Bäumen, z. B. 10, drastisch reduzieren, kann dies helfen, Übertraining zu vermeiden.

Bei den Waldbäumen entsteht Übertraining nicht durch die Anzahl der Bäume, sondern durch ihre unbegrenzte Tiefe (Modellkomplexität), die Anzahl reduziert die Variation, und Übertraining ist eine Gefahr.
 
DasProblem ist:
Beim Wald entsteht Übertraining nicht durch die Anzahl der Bäume, sondern durch ihre unbegrenzte Tiefe (Modellkomplexität), die Anzahl reduziert die Optionen, und Übertraining ist ein Risiko.
es läuft alles auf eine 50/50 Aufteilung hinaus ... eine Zeitverschwendung.
 

Was ich mich frage, ist.

1. Worauf läuft das Training eines neuronalen Netzes im Algotrading hinaus?

2. Welche Parameter der Marktdynamik werden in der Ausbildung verwendet?

3. Kann das Netz neben der Erkennung von Mustern in der Geschichte auch den spezifischen Charakter der Wertänderung eines Parameters im aktuellen Moment "lernen" und darauf reagieren?

(z. B. ein starker wellenförmiger Anstieg oder ein sanfter Abfall).

 

Ich denke, die Art der aktuellen Änderung des Parameterwertes ist für das Netz nicht erkennbar... Unwahrscheinlich.

Und das sieht nach einer vielversprechenden Vorhersage aus. Schließlich würde es genügen, sich die Übergänge dieser Veränderungen zu merken, um sie später vorhersagen zu können.

 
Itum:
alles läuft auf eine 50/50-Münze hinaus ... eine Zeitverschwendung.

Nein, es gibt ein bisschen Alter. Ich werde es einfach ausdrücken: Sie können viel mehr mit MO als jede andere Art und Weise zu extrahieren, einschließlich "Intuition", gibt es Muster in den Markt, mit MO extrahiert sie am effektivsten.

 
Eidechse_:

Ich habe es gestern kaum über 0,69 (0,68999) geschafft. Das war's, ich hatte meinen Spaß.


Das ist großartig!

Allerdings zustimmen, dass 0,69 ist die Wand, die die Standard-Mittel kann nur kratzen, gibt mir, dass es nicht in der Tiefe des neuronet und nicht die Anzahl der Bäume im Wald, diejenigen, die unter 0,6 sind, gibt es einige Tricks, die wir nicht kennen, und das ist eigentlich sehr motivierend nicht zu entspannen))

 
..:

Super!

Stimmen Sie jedoch zu, dass 0,69

Wie hoch ist diese Zahl? Wo kann ich sie sehen?
 
SanSanych Fomenko:
Wie hoch ist die Zahl? Wo kann ich sie sehen?
loglos auf numer.ai
 

Als jemand, der nur indirekt mit dem Verteidigungsministerium zu tun hat, mische ich mich nicht in die Diskussion ein, aber ich erlaube mir, eine Meinung von meinem "Glockenturm" aus zu äußern.

Ein normales mehrschichtiges neuronales Netz besteht aus Neuronen. Die Aktivierungsfunktion eines Neurons ist eine monotone Funktion, die von -1 bis 1 (oder 0 bis 1, wie auch immer) wächst. Bei minimalem Eingabewert liefert diese Funktion ein minimales Ergebnis, bei maximalem Wert ein maximales Ergebnis.

Wir trainieren ein neuronales Netz mit N Eingängen auf einem Segment (Eingabewolke) im N-dimensionalen Raum. Das neuronale Netz hat keine Ahnung, was es mit Daten außerhalb dieser Wolke anfangen soll. Aber wir füttern es mit diesen Daten und erwarten, dass es ein Ergebnis liefert.


Konow-Tag:

3. Kann das Netz nicht nur Muster in der Geschichte erkennen, sondern auch die spezifische Art der Änderung eines Parameterwerts zu einem bestimmten Zeitpunkt "lernen" und darauf reagieren?

(z. B. ein starker wellenförmiger Anstieg oder ein sanfter Abfall).

Ich glaube, das Netzwerk erkennt die Art der aktuellen Änderung des Parameterwerts nicht... Unwahrscheinlich.

Das sieht nach einer vielversprechenden Vorhersage aus. Schließlich würde es genügen, sich an die Übergänge dieser Veränderungen zu erinnern, um sie später vorhersehen zu können.

Nehmen wir an, es gab eine anormale Situation auf dem Markt und der Preis ist in die Höhe geschnellt. Oder der NS, der auf menschliche Gesichter trainiert wurde, erhält ein Bild einer farbigen Brille als Eingabe. Die Neuronen werden übererregt und ihr Output geht weit in den linken oder rechten Ast des Sigmas. Das bedeutet, dass wir am NS-Ausgang ein unvorhersehbares, aber sehr starkes Signal erhalten.

Wenn es solche Ausschläge in der Trainingsstichprobe gibt (z. B. 1 % aller Daten), "lockert" der Backprop-Algorithmus alle Gewichte, während der NS keine Zeit hat, irgendetwas zu "lernen", aber seine Leistung wird bei 99 % der "normalen" Daten verschlechtert.

Es wäre viel besser, den NS nicht in unmögliche Anforderungen "einzusperren", sondern ihm beizubringen, sich gegen "abnormale" Eingaben zu wehren. Und hier haben wir, IMHO, zwei Möglichkeiten.

1. Eine oder mehrere Schichten von Neuronen mit einer Aktivierungsfunktion in Form einer Gaußkurve anstelle eines Sigmoid einführen. Ein solches Neuron erzeugt ein Ergebnis nahe 1 im begrenzten Bereich der Eingaben und nahe 0 auf dem Rest der numerischen Achse.

2) Ändern Sie die Interpretation der NS-Ausgaben. Anstelle der üblichen binären Interpretation (0 - kein Handelssignal, 1 - Handelssignal) schlagen wir die folgende Interpretation vor: 0 - kein Signal, 0,5 - es gibt ein Signal, 1,0 - kein Signal. Bei unerwarteten Kursbewegungen wird die Ausgabe von NS nahe an einem der Extremwerte - 0 oder 1 - liegen und keine falschen Signale erzeugen.

Geschätzte Experten, werden solche Dinge in der MO-Literatur erwähnt und finden Sie sie nützlich? Kommentare sind willkommen.