Wo verläuft die Grenze zwischen passenden und tatsächlichen Mustern? - Seite 21

 
Reshetov:

Für die besonders Begabten:


1) in russkomazykenetlova osobogodnymi.

Nun, einmal kann man das, aber nicht fünfmal hintereinander auf fünf Seiten.

..............

2) Der Schaden der Aufteilung der Zeiträume.....

и

Der Schaden von OOS-Tests....

sind sich einig, dass dies unterschiedliche Dinge sind.

Verlässliche Informationen sollten nicht falsch dargestellt werden. Es gibt nicht viel davon, schon.... )

 
Reshetov:

Nein, das war es nicht, wenn der Test auf OOS positiv war.

Ein negatives Ergebnis bei OOS bedeutet nicht zwangsläufig, dass die Probe passt - der Markt kann sich ändern. Um sicher zu sein, dass die Probe passt, müssen OOS-Tests vor und nach der Probe durchgeführt werden. Wenn das Ergebnis für beide Vorwärtsrichtungen negativ ist, dann haben wir es bereits mit der bloßen Ausstattung zu tun.

Erfolgreiche Vorwärtstests sind keine Garantie für die Rentabilität des TS in der Zukunft. Ihr Zweck ist es, Anpassungen zu ermitteln.

Um sicherzustellen, dass die TK für den Optimierungszeitraum nicht stumpf eingestellt wird, führen wir einen OOS-Test durch.


Alles ist korrekt. Aber. OOS muss Informationen enthalten, die sich von denen unterscheiden, die im Optimierungszeitraum verfügbar sind, damit wir sicher sein können, dass TS verallgemeinerungsfähig ist (eine gewisse Regelmäßigkeit wird gefunden, und die Ergebnisse werden bei unterschiedlichen Daten ähnlich sein, aber diese Regelmäßigkeit enthalten). Andernfalls wird der Test auf OOS die gleichen Ergebnisse liefern wie auf der Probe, aber er wird nicht bestätigen, dass der TS ein Muster gelernt hat, und in Zukunft wird der TS nicht in der Lage sein, mit den gleichen Ergebnissen zu arbeiten.


Jetzt aufgepasst! Frage: Prüfen Sie, ob OOS andere Daten als S enthält? Wenn ja, wie?

 


Wenn jemand Ungenauigkeiten im Diagramm selbst findet, bitte ich um Mitteilung...

Die Abmessungen stimmen, aber das Bild ist immer noch unscharf. In dem separaten Fenster ist alles klar.

 
Figar0:


Sie sagen, dass Sie Daten für die Ausbildung vorbereiten. Könnten Sie etwas genauer sagen, wie lange Sie diese Techniken schon anwenden? Etwas in Ihren Worten kommt mir sehr bekannt vor. Ich erinnere mich, dass ich vorgeschlagen habe, wie in der Verzweigung über den Kontext, synthetische Daten mit vorläufig erforderlichen Parametern für die Optimierung vorzubereiten, damit Sie die Datenparameter ändern und die Reaktion des TS sehen können. Ich glaube, Sie haben mir nur zugestimmt, aber eine etwas andere Option als die meine vorgeschlagen - Daten aus echten Stücken der Geschichte aufzubereiten, ist das richtig?

 
lasso:

1) in russkomazykenetlova osogodarstvennyy.go.... )

Für die besonders Begabten:

siehe. Wörterbücher und Enzyklopädien über die Académique: Besonders begabt

P.S. Für besonders begabte Kenner der russischen Sprache: In der russischen Sprache gibt es Leerzeichen, um bestimmte Wörter von anderen zu trennen.

 

Wai, wai, wai...

Wie kompliziert du bist...:))

 

lasso, lesen Sie am besten etwas nicht zu Kompliziertes über Nervengitter. Ich glaube, das ist der Ursprung dieser ganzen Terminologie. Vielleicht habe ich mich falsch ausgedrückt, bitte entschuldigen Sie mich, es ist lange her, dass ich es gelesen habe:

1. Beispieldaten: die Trainingsfläche. Dies ist der Abschnitt, aus dem wir die Daten direkt übernehmen und das Netz einlernen.

2. Verifizierungsdaten: Abschnitt Verifizierung. Wir trainieren nicht an diesem Teil, sondern verwenden ihn zur Fehlerabschätzung und zur Kontrolle, wann wir das Training abbrechen sollten. Es gibt eine bekannte Kurve des Überprüfungsfehlers in Abhängigkeit von der Anzahl der Durchläufe. Dies ist eine Kurve mit einem Minimum. Wenn wir zu lange trainieren, d.h. wenn wir nicht rechtzeitig aufhören, wird der Fehler im Trainingsabschnitt immer noch abnehmen, aber der Fehler im Verifikationsabschnitt wird nun zunehmen. Das ist die Anpassung: Wir haben die Daten im Trainingsabschnitt recht gut angenähert, aber wir haben es übertrieben, da der Überprüfungsfehler zu wachsen begann. Der zweite Fehler ist die Bewertung der Qualität des Trainings und der Fähigkeit eines neuronalen Netzes zur Generalisierung.

3. Testdaten. Dies ist eine echte OOS, out of sample.

Der zweite Plot, der Verifizierungsplot, in dem der Fehler bewertet wird, ist nicht OOS, obwohl wir nicht darauf trainieren. Dennoch werden die Daten aus diesem Abschnitt zum Trainieren der Daten aus dem ersten Abschnitt verwendet. Um die Qualität des Trainings (genauer gesagt, der Generalisierung) ordnungsgemäß und völlig unabhängig zu überprüfen, müssen wir Daten nehmen, die wir noch nicht gesehen oder beim Training verwendet haben.

Hier im Testgerät haben wir keine neuronalen Netze. Ein Fehler wird direkt im Abschnitt Probendaten geschätzt. Es gibt also keine Möglichkeit, Nerven-Methoden hier direkt zu übertragen. Obwohl, vielleicht hat xeon mit seinem TestCommander auch hier etwas erfunden...

 
Reshetov:

Für die besonders Begabten:

Siehe. Wörterbücher und Enzyklopädien an der Akademie: Besonders begabt

P.S. Für besonders begabte Russisch-Experten: Es gibt Lücken in der russischen Sprache

Wären Sie so freundlich, Ihre eigene Interpretation des Wortes "begabt" zu geben, damit es keine perversen Auslegungen des Begriffs gibt.
 
joo:
Figar0:


Sie sagen, dass Sie Daten für die Ausbildung vorbereiten. Könnten Sie etwas genauer sagen, wie lange Sie diese Techniken schon anwenden? Etwas in Ihren Worten kommt mir sehr bekannt vor. Ich erinnere mich, dass ich vorgeschlagen habe, wie in der Verzweigung über den Kontext, synthetische Daten mit vorläufig erforderlichen Parametern für die Optimierung vorzubereiten, damit Sie die Datenparameter ändern und die Reaktion des TS sehen können. Ich glaube, Sie haben mir nur zugestimmt, aber eine etwas andere Option als die meine vorgeschlagen - Daten aus echten Stücken der Geschichte aufzubereiten, ist das richtig?


Die Aufbereitung der Daten für das Training nach einer bestimmten Regel bedeutet lediglich die Einführung eines zusätzlichen Filters in das System.
 
Reshetov:

Für die besonders Begabten: Nicht-Stationarität ist das Fehlen statistischer Regelmäßigkeiten, wie z. B. der erwarteten Auszahlung und Varianz.

Legen Sie Bollinger-Hüllkurven auf das Diagramm und Sie werden sehen, was die "Muster" der Nicht-Stationarität sind, denn das Zentrum des Indikators ist die Erwartung, und der Abstand vom Zentrum zu den Hüllkurven ist die Streuung.

Erwartungswert und Varianz sind nur bei einer unendlich großen Stichprobe sinnvoll.