Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1304

 
Maxim Dmitrievsky:

10% de error por prueba y rastreo para ~10k ejemplos, aumenta suavemente con el incremento

ante este error, los modelos comenzaron a trabajar con nuevos datos

en la validación de manera diferente, tiene que pasar por las variantes.

Los algoritmos ya no se divulgan, sólo se comunican

Algo sospechosamente pequeño. En sus artículos, incluso sobre los zigzags, Perervenko no lo ha conseguido.

Y también es sospechoso que la prueba y el aprendiz tengan un 10% cada uno, pero la validación sea "diferente". ¿Es decir, más o qué? Lo peor debería ser la prueba, no la validación.

 
elibrarius:

Hay algo sospechosamente pequeño. Pererwenko no lo ha conseguido ni siquiera en los zigzags de sus artículos.

Y también es sospechoso que el 10% de cada uno en la prueba y el traine, y la validación es "diferente". Es decir, ¿es más que eso? Lo peor debería ser la prueba, no la validación.

"Incluso en los zigzags" )))

lo peor debería ser una convalidación que no haya participado de ninguna manera, ni siquiera indirecta, en el aprendizaje
 
Maxim Dmitrievsky:

"Incluso en los zigzags" ))))

lo peor sólo puede ser la validación que no participó en el aprendizaje de ninguna manera, ni siquiera indirectamente
¿Y por qué no la sección de pruebas? ¿Porque "no participó en la formación de ninguna manera, ni siquiera indirectamente"?
 
elibrarius:
¿Por qué no el sitio de prueba? Al fin y al cabo, también "no participa en el aprendizaje de ninguna manera, ni siquiera indirectamente".

la prueba uno siempre está involucrado indirectamente en el aprendizaje, tomar el mismo catbust... vamos

 

А... o llamamos a las parcelas de otra manera.

Llamo

1 tramo de tren
2 válido - es lo que se utiliza en muchos paquetes para el control en el proceso de aprendizaje y para la parada temprana. Y se llama Valid.
3 pruebas - para evaluar el sistema con nuevos datos

Es posible que haya llamado a la segunda sección una sección de prueba.

 
Maxim Dmitrievsky:

la prueba uno siempre está indirectamente involucrado en el aprendizaje, tomar catbust... vamos

Catbust no lo sé. Esta es una cita de XGBoost

rondas_de_parada_tempranas
Si es NULL, la función de parada anticipada no se activa. Si se fija en un número entero k, el entrenamiento
con un conjunto de validación se detendrá si el rendimiento no mejora para k
rondas.

 
elibrarius:

А... o llamamos a las parcelas de otra manera.

Llamo

1 conjunto de datos de entrenamiento
2 válidos: es lo que utilizan muchos paquetes para el control durante el entrenamiento y para la parada anticipada. Se llama Valid.
3 pruebas - para evaluar el sistema con nuevos datos

Veo que llama a la 2ª parte una parte de prueba.

Creo que es al revés, la validación es la nueva

Sí, bueno, ya te haces una idea.

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

--test-set

Una lista separada por comas de los archivos de entrada que contienen la descripción del conjunto de datos de validación (el formato debe ser el mismo que el utilizado en el conjunto de datos de entrenamiento).

Omitido. Si se omite este parámetro, no se utiliza el conjunto de datos de validación.


)))) puedes escribirlo como quieras, se llama

 
Maxim Dmitrievsky:

Creo que es al revés, la validación es la nueva, donde está escrito

Sí, bueno, ya te haces una idea.

Al principio no lo entendí.
Porque usamos términos diferentes.

Deberíamos ceñirnos a una sola terminología.

 
elibrarius:

Al principio no lo entendía.
Porque usamos términos diferentes.

Deberíamos ceñirnos a la misma terminología.

Muéstrame la documentación de cualquier paquete, donde la segunda sección (que se utiliza para el control de aprendizaje y / o parada temprana) se llama prueba, no la validación.

Te lo mostré arriba, aquí hay más

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
sierra)
En general, la confusión sobre la terminología