Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 377

 
Vladimir Perervenko:

Nach der Aufteilung in Zug/Test/Gültig mischen Sie den Zug. Mischen Sie den Rest der Sätze nicht.
Dies gilt auch für die Klassifizierung durch neuronale Netze. Außerdem wird beim Training von tiefen neuronalen Netzen jedes Minibatch vor dem Einspeisen vermischt.

Viel Glück!


kann ich eine Referenz haben, wo man über das Mischen lesen kann? weil es rein intuitiv keinen Sinn macht) sowie Prädiktoren mit dem Ziel korrelieren (damit haben wir es gelöst, kaum)
 
Vladimir Perervenko:

Nach der Aufteilung in Zug/Test/Gültig mischen Sie den Zug. Mischen Sie den Rest der Sätze nicht.
Dies gilt auch für die Klassifizierung durch neuronale Netze. Darüber hinaus werden beim Training von tiefen neuronalen Netzen die einzelnen Minibatches vor der Eingabe in das neuronale Netz gemischt.

Viel Glück!

Ich habe ein Beispiel für die Vermischung von "train" und "valid" in der Ensemble-Berechnungsfunktion von ALGLIB gefunden. Offensichtlich handelt es sich um eine der Methoden.

Ich schlurfe nur Zug.

Durchschnittlicher Fehler beim Training (80,0%) =0,396 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Validierungsfläche (20,0%) =0,391 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Vollständige Darstellung (Training + Validierung):
Durchschnittlicher Lernfehler=0,395 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Durchschnittlicher Fehler im Test (20%) area=0.398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Der Fehler ist in allen Segmenten gleich, genauso wie beim Mischen von Zug und gültig. Offenbar ist die Wirkung dieselbe.

 
elibrarius:

Ich habe in der ALGLIB-Ensembleberechnungsfunktion ein Beispiel für die Vermischung von Zug und Gültigkeit gefunden. Offenbar ist dies eine der Methoden.

Nur der Zug wird gemischt.

Durchschnittlicher Fehler beim Training (80,0%) plot =0,396 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Validierungsfläche (20,0%) =0,391 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Vollständige Darstellung (Training + Validierung):
Durchschnittlicher Lernfehler=0,395 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Durchschnittlicher Fehler im Test (20%) Abschnitt =0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Der Fehler ist in allen Segmenten derselbe, genauso wie beim Mischen von Zug und gültig. Offenbar ist die Wirkung dieselbe.


Welcher Fehler tritt in der Datei unabhängig davon auf?

 
SanSanych Fomenko:


Welcher Fehler tritt in der Datei unabhängig davon auf?

Auf der Testversion, meinen Sie?

Durchschnittlicher Fehler im Test (20%) Abschnitt =0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Ich habe den Plot für test2 noch nicht erstellt. Ich werde nur test1 durchsuchen. (Vielleicht in der Zukunft).

 
elibrarius:

Auf dem Testgelände, meinen Sie?

Durchschnittlicher Fehler im Test (20%) Abschnitt =0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Ich habe die test2-Darstellung noch nicht erstellt. Ich werde nur test1 durchsuchen. (Vielleicht in der Zukunft).


Außerhalb all dieser Proben
 
SanSanych Fomenko:

Außerhalb all dieser Proben
Draußen gibt es keine, da alle Daten verwendet wurden.
 
elibrarius:
Alle Daten sind bereits verwendet worden.

Ist es möglich, die Quelldatei 80/20 zu teilen? Und dann 80 % aller Übungen, und dann 20 % ohne jede Mischung.
 
SanSanych Fomenko:

Können Sie die Quelldatei durch 80/20 teilen? Und dann 80 % aller Übungen und dann 20 % ohne jede Mischung.

Mit Mischen:

Durchschnittlicher Fehler beim Training (51,0%) Abschnitt =0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Validierungsfläche (13,0%) =0,685 (68,5%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Vollständige Darstellung (Training + Validierung):
Durchschnittlicher Lernfehler=0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler im Test (16,0%) Abschnitt =0,661 (66,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf Testgelände 2 (20,0%) =0,671 (67,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6

Ohne Rühren

Mittlerer Fehler beim Training (51,0%) plot =0,516 (51,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Validierungsfläche (13,0%) =0,376 (37,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Vollständige Darstellung (Training + Validierung):
Durchschnittlicher Lernfehler=0,491 (49,1%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Testseite (16,0%) =0,344 (34,4%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Durchschnittlicher Fehler auf Testgelände 2 (20,0%) =0,326 (32,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6

Nur 2 Umschulungszyklen, für die Geschwindigkeit... bereits Schlafenszeit)

 
elibrarius:

Mit Schlurfen:

Durchschnittlicher Fehler beim Training (51,0%) plot =0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Validierungsfläche (13,0%) =0,685 (68,5%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Vollständige Darstellung (Training + Validierung):
Durchschnittlicher Lernfehler=0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler im Test (16,0%) Abschnitt =0,661 (66,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf Testgelände 2 (20,0%) =0,671 (67,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6

Ohne Rühren

Mittlerer Fehler beim Training (51,0%) plot =0,516 (51,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Validierungsfläche (13,0%) =0,376 (37,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Vollständige Darstellung (Training + Validierung):
Durchschnittlicher Lernfehler=0,491 (49,1%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Mittlerer Fehler auf der Testseite (16,0%) =0,344 (34,4%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Durchschnittlicher Fehler auf Testgelände 2 (20,0%) =0,326 (32,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6

Nur 2 Umschulungszyklen, für die Geschwindigkeit... bereits Schlafenszeit)


Ihr Modell lernt nichts - es ist alles aus dem Ballpark. Irgendwo wird etwas aufgeschnappt und dann stellt sich heraus, dass es irrelevant ist

Beginnen Sie mit Datamining. Ziel, dann Suche nach Prädiktoren, die für das Ziel relevant sind, dann Bestimmung der Vorhersagefähigkeit der ausgewählten Prädiktoren für das spezifische Ziel, und erst dann das Modell


Alles andere ist ein intellektuelles Spiel mit Zahlen.

 

https://www.youtube.com/channel/UCLk-Oih8VlqF-StidijTUnw

er hat etwas für das Wochenende zu tun :) ar für nubas

Und hier ist ein Mann, der algorithmischen Handel betreibt.


Основы анализа данных
Основы анализа данных
  • www.youtube.com
Канал содержит курсы по анализу данных. Все курсы бесплатны и легки в освоении Прохожу обучение в бесплатной школе Дениса Коновалова http://superpartnerka.bi...