Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1304

 
Maxim Dmitrievsky:

10% Fehler pro Test und Spur für ~10k Beispiele, steigt gleichmäßig mit Zunahme

bei diesem Fehler begannen die Modelle mit der Arbeit an neuen Daten

bei der Validierung anders vorgehen, müssen Sie die Varianten durchlaufen.

Algorithmen werden nicht mehr offengelegt, sondern nur noch kommuniziert

Etwas verdächtig Kleines. In seinen Artikeln über Zickzacklinien hat Perervenko dies nicht erreicht.

Und es ist auch verdächtig, dass der Test und der Auszubildende jeweils 10% haben, aber die Validierung "anders" ist. D.h. mehr oder was? Das Schlimmste sollte der Test sein, nicht die Validierung.

 
elibrarius:

Da ist etwas verdächtig Kleines. Pererwenko hat dies in seinen Artikeln nicht einmal auf Zickzackkursen erreicht.

Und es ist auch verdächtig, dass jeweils 10 % auf Test und Praktikum und Validierung "anders" sind. Das heißt, ist es mehr als das? Das Schlimmste sollte der Test sein, nicht die Validierung.

"Auch auf Zickzackkursen" )))

das Schlimmste sollte nur eine Validierung sein, die nicht in irgendeiner Weise, auch nicht indirekt, am Lernen beteiligt war
 
Maxim Dmitrievsky:

"Auch auf Zickzackkursen" ))))

das Schlimmste kann nur die Validierung sein, die in keiner Weise, auch nicht indirekt, am Lernen beteiligt war
Und warum nicht der Testbereich? Weil sie "in keiner Weise, auch nicht indirekt, an der Ausbildung teilgenommen hat"?
 
elibrarius:
Warum nicht das Testgelände? Schließlich ist sie auch "in keiner Weise am Lernen beteiligt, nicht einmal indirekt".

der test ist immer indirekt am lernen beteiligt, nimm den gleichen catbust... come on

 

А... oder wir nennen die Grundstücke anders.

Ich rufe

1 Zugteil
2 gültig - dies wird in vielen Paketen zur Kontrolle des Lernprozesses und zum vorzeitigen Abbruch verwendet. Und sie heißt Gültig.
3 Test - zur Evaluierung des Systems mit neuen Daten

Sie haben den 2. Abschnitt vielleicht als Testabschnitt bezeichnet.

 
Maxim Dmitrievsky:

der Test ist immer indirekt am Lernen beteiligt, nimm catbust... come on

Catbust Ich weiß es nicht. Hier ist ein Zitat von XGBoost

frühe_anhaltende_Runden
Wenn NULL, wird die Funktion des vorzeitigen Abbruchs nicht ausgelöst. Bei der Einstellung auf eine ganze Zahl k wird das Training
mit einer Validierungsmenge wird abgebrochen, wenn sich die Leistung nicht für k
Runden.

 
elibrarius:

А... oder wir nennen die Grundstücke anders.

Ich rufe

1 Trainingsdatensatz
2 gültig - dies wird in vielen Paketen zur Überwachung während des Trainings und zum vorzeitigen Abbruch verwendet. Sie wird als gültig bezeichnet.
3 Test - zur Evaluierung des Systems mit neuen Daten

Ich sehe, Sie nennen den 2. Teil einen Testteil.

Ich denke, es ist genau umgekehrt: Validierung ist das neue

Ja, nun, Sie verstehen schon.

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

--test-set

Eine durch Kommata getrennte Liste von Eingabedateien, die die Beschreibung des Validierungsdatensatzes enthalten (das Format muss das gleiche sein wie das des Trainingsdatensatzes).

Ausgelassen. Wenn dieser Parameter weggelassen wird, wird der Validierungsdatensatz nicht verwendet.


)))) können Sie schreiben, wie Sie wollen, es heißt

 
Maxim Dmitrievsky:

Ich glaube, es ist umgekehrt, die Validierung ist die neue, wo es heißt

Ja, nun, Sie verstehen schon.

Ich habe es zuerst nicht verstanden.
Denn wir verwenden unterschiedliche Begriffe.

Wir sollten bei einer einzigen Terminologie bleiben.

 
elibrarius:

Zuerst habe ich es nicht verstanden.
Denn wir verwenden unterschiedliche Begriffe.

Wir sollten bei der gleichen Terminologie bleiben.

Zeigen Sie mir die Dokumentation eines Pakets, bei dem der zweite Abschnitt (der für die Lernkontrolle und/oder das frühzeitige Abbrechen verwendet wird) als Test und nicht als Validierung bezeichnet wird.

Ich habe es Ihnen oben gezeigt, hier ist noch mehr

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
Säge)
Insgesamt: Verwirrung über die Terminologie