¿Hay algún patrón en el caos? ¡Intentemos encontrarlo! Aprendizaje automático a partir de una muestra concreta. - página 3

 
Aleksey Vyazmikin #:

¿Puede comprobar el modelo exactamente en el archivo exam.csv?

¿Ha intentado alguna manipulación con el muestreo?

Aquí está el balance de la muestra del examen después de eliminar algunos de los predictores.

Por supuesto, los gráficos de la distribución de respuestas del modelo muestran que sólo se hizo un poco de entrenamiento - Recall es muy bajo, pero ya es algún resultado.

entrenar.csv


examen.csv

Hay 9046 líneas en examen. Yo tengo 9000. Casi no habrá diferencia.

Tu curva es mucho mejor. Voy a tratar de jugar un poco más con los parámetros.
 
elibrarius #:

¿Cuál es el mejor equilibrio que tienes?

Ahora he buscado en diferentes variantes, resulta que este resultado - también hay en la ronda de la comisión 3 puntos se toman en la idea.


 
elibrarius #:
Hay 9.046 líneas. Yo tengo 9000. No habrá mucha diferencia.

Tienes una curva mucho mejor. Voy a tratar de jugar un poco más con los parámetros.

Bueno, si se trata de datos de archivo de examen, entonces sí - no hay mucha diferencia, sólo pensé que tal vez es el archivo de tren. ¿Fusionaste los tres archivos originalmente?

Pruébalo.

 
Aleksey Vyazmikin #:

Bueno, si son los datos del archivo del examen, entonces sí - no hay mucha diferencia, sólo pensé que podría ser el archivo del tren. ¿Fusionaste los tres archivos juntos originalmente?

Pruébalo.

Sí, fusioné los 3, luego sólo especifiqué las longitudes de las secciones.
 
elibrarius #:
Sí, combino los tres, luego sólo introduzco las longitudes de las secciones.

Ya veo, eso está bien entonces.

Creo que hay una posibilidad de mejorar la formación mediante la reducción de la muestra, digamos que para entrenar en 1/10 - esto permitirá entrenar algunos una fase / estructura del mercado - No he requerido todavía.

 

Sólo cambiando el ritmo de aprendizaje fue posible obtener dos modelos de 100 que cumplieran el criterio.

El primero.

El segundo.

Resulta que sí, que CatBoost da para mucho, pero es necesario afinar los ajustes de forma más agresiva.

 
Aleksey Vyazmikin #:

Bien, entonces está bien.

Creo que hay una posibilidad de mejorar la formación mediante la reducción de la muestra, digamos que para entrenar en 1/10 - que permitirá capacitar a algunos una fase / estructura del mercado - no es necesario todavía.

He intentado entrenar con valking forward a 1000 y a 20000 - todo falla.
 
¿Wo enseñar una clase comercio/no comercio?
¿O separar compra y venta?
 
elibrarius #:
Wo enseñar a una clase a comerciar/no comerciar?
¿O separar compra y venta?

Los resultados se muestran a partir de muestras sin transformación de destino, es decir, sí - comercio y no comercio.

Pero en realidad, hacer muestras separadas de compra y venta sería más fácil de entrenar.

elibrarius #:
trató de aprender por valing adelante en 1000 y en 20000 - todos los drenajes.

Hmm, extraño. ¿Qué método se utiliza para la formación - bosque aleatorio?

 
Aleksey Vyazmikin #:

Qué raro. ¿Qué método utilizas para el entrenamiento: bosque aleatorio?

Rediseñado a partir de Alglibow.
Estoy ejecutando más árboles ahora. Por la mañana, creo que va a calcular una nueva versión.

O tal vez hice algo mal, si el resultado es mucho peor que el tuyo.