Aprendizaje automático en el trading: teoría, práctica, operaciones y más

Aleksey Vyazmikin 2020.12.03 14:04 #22141

Volviendo a la cuestión de la visualización del modelo CatBoost, para analizar su perspectiva.

Este es el aspecto del modelo en la muestra de entrenamiento:

El eje x es el valor de la probabilidad de la función logística, y el eje y es el porcentaje sobre un intervalo de valores de 0,05:

- Razdel(azul) - todos los valores de la muestra.

- Objetivo=1(imán) - valores del objetivo 1

- Objetivo=0(aqua) - valores objetivo 0

- Balans+(azul claro) - el resultado financiero que dio lugar al beneficio comparado con todos los beneficios y pérdidas, este valor se escala para que quepa en el gráfico

- Saldo-(ladrillo) - resultado financiero que llevó a la pérdida con respecto a todas las ganancias y pérdidas, este valor se escala para encajar en el gráfico

- El círculo es un valor escalado de la balanza - nos centramos en un valor cero de la coordenada x - hecho para la ilustración

Línea de agua vertical - valor máximo Objetivo=0

Línea vertical del imán - valor máximo Target=1

Línea vertical en rojo - división condicional de 0,5 para la clasificación a 1 y 0 por defecto en CatBoost - para mayor claridad.

Supongo que cuanto más separadas estén las líneas de agua y de imán de la línea vertical roja, más seguro será el modelo a la hora de separar las clases. También vale la pena observar las líneas de balance, durante el entrenamiento también están espaciadas en ambos lados - es especialmente relevante para los modelos donde las ganancias y las pérdidas pueden tener diferentes valores, así que, por ejemplo, un modelo puede filtrar bien las pérdidas pequeñas pero perder en las grandes pérdidas, aunque según el valor de precisión de la clasificación será más de 0,5.

Además, observamos la muestra de prueba

Podemos ver que las líneas verticales -rojo y magnetita- se han acercado, pero su posición relativa no ha cambiado, lo que ya es bueno (sucede que la magnetita está en la zona de <0,5). Las líneas de equilibrio se han acercado, lo que es decepcionante. Hay un área de pérdida después de la probabilidad de 0,5, lo que sugiere que el modelo es de calidad insuficiente.

Además, podemos observar los resultados de la muestra de ensayo.

En el lado derecho (probabilidad superior a 0,5) la situación parece mejor que en la muestra de prueba, puede indicar que la muestra de prueba es una ocurrencia rara y que había pocos ejemplos similares a ella en el entrenamiento, o que el modelo no está completamente entrenado. A favor de esta última suposición está el hecho de que hay regiones en las que la línea de balanceBalans+, que indica resultados financieros positivos, se cruza con la líneaBalans-, lo que también puede verse al observar los círculos que indican el delta entre el beneficio y la pérdida en una determinada zona de probabilidad, en lazona de probabilidad inferior a 0,5.

Veamos el balance de la muestra del examen.

Se puede ver claramente que el carácter del mercado ha cambiado, lo que se puede ver en 2/3 del gráfico - debemos seguir estudiando el modelo.

Y aquí hay un ejemplo de un modelo claramente malo

Ya en la muestra de prueba se puede ver un fuerte desplazamiento del conjunto hacia la parte izquierda, es decir, el modelo sabe muy poco sobre la muestra - la completitud es baja, y el pico de acumulación del objetivo 1 está detrás de la parte izquierda de la probabilidad. Cabe destacar que sigue habiendo una ganancia en el aprendizaje.

Veamos la muestra de la prueba y el examen

Ya en la muestra de prueba podemos ver que todas las líneas fuera de la probabilidad 0,5 están muy cerca, y en la muestra de prueba podemos ver cómo las líneas de equilibrio han cambiado de lugar.

Línea vertical - Líneas Informe sobre la simulación Línea vertical - Líneas

Maxim Dmitrievsky 2020.12.03 14:07 #22142

mytarmailS:

Básicamente tengo una red vacía (sólo la entreno para que se pueda inicializar porque no está autoescrita, sino desde un paquete)

Puedo pensar en cualquier abstracción, cualquier objetivo y escribir una función de aptitud.

Entonces deja que la genética empiece a cambiar los pesos de la red para que en el tren y en la prueba yo (la red) reciba algo parecido a mi objetivo.

Y eso es mil veces" más profundo que crear las etiquetas y ajustar la regresión o la clasificación.

te remontaste 2 años atrás cuando condenábamos el entrenamiento de las neuronas con el optimizador mt5

Y yo escribía esos bots. Es una optimización común con un montón de parámetros.

compruébalo.

https://www.mql5.com/ru/articles/497

Нейронные сети - от теории к практике

www.mql5.com

В наше время, наверное, каждый трейдер слышал о нейронных сетях и знает, как это круто. В представлении большинства те, которые в них разбираются, это какие-то чуть ли не сверхчеловеки. В этой статье я постараюсь рассказать, как устроена нейросеть, что с ней можно делать и покажу практические примеры её использования. Понятие о нейронных сетях...

mytarmailS 2020.12.03 14:36 #22143

Maxim Dmitrievsky:

te remontaste a 2 años atrás cuando se condenó el entrenamiento de neuronas a través del optimizador de mt5

Y yo escribía esos bots. Se trata de una optimización común con muchos parámetros.

siga leyendo.

https://www.mql5.com/ru/articles/497

Lo he probado con max profit, puedo entrenarlo con otra cosa

Escucha, si no eres demasiado perezoso, trata de entrenar catbust en el beneficio máximo, no estoy seguro de cómo funciona allí

hay que alimentar los datos X y el objetivo Y al mismo tiempo

tal vez toda esta "personalización" es sólo una modificación cosmética de las funciones existentes

Línea vertical - Líneas Línea vertical - Líneas Linea vertical - Líneas

Forester 2020.12.03 14:53 #22144

Aleksey Vyazmikin:

Volviendo al tema de la visualización del modelo CatBoost, para analizar su perspectiva.

Creo que es mejor publicar estas grandes investigaciones en un blog y una copia aquí. Seis meses después no lo encontrarás aquí...

Aleksey Vyazmikin 2020.12.03 16:02 #22145

elibrarius:
Creo que los grandes estudios como éste deberían publicarse en el blog y copiarse aquí. No podrás encontrarlo aquí en seis meses...

Tal vez, es que no uso un blog, así que no se me ocurrió.

Estoy pensando que puedo poner todos estos puntos del gráfico (20 por curva) en una muestra y tratar de aprender - tal vez de esa manera podemos identificar con una mayor probabilidad los modelos con estabilidad potencial.

Arcos de Fibonacci - Arcos de Fibonacci - Linea vertical - Líneas

Forester 2020.12.03 16:22 #22146

Aleksey Vyazmikin:

Tal vez, es que no uso el blog, así que no se me ocurrió.

Estoy pensando que puedo poner todos estos puntos del gráfico (20 por curva) en una muestra y tratar de aprender - tal vez de esa manera seremos capaces de identificar con una mayor probabilidad los modelos con estabilidad potencial.

¿Cuál es el objetivo? ¿Cómo marcar cada ejemplo? ¿O mediante el autoaprendizaje?

Aleksey Vyazmikin 2020.12.03 16:44 #22147

elibrarius:
¿Cuál será el objetivo? ¿Cómo marcar cada uno de los ejemplos? ¿O mediante el autoaprendizaje?

El objetivo sería el resultado financiero del modelo en la muestra de examen.

Maxim Dmitrievsky 2020.12.03 17:44 #22148

mytarmailS:

Sólo estoy tratando de obtener el máximo beneficio, podría entrenar para otra cosa.

Escucha, si no eres demasiado perezoso, intenta entrenar a katbust en el beneficio máximo, no estoy seguro de que funcione allí

hay que alimentar los datos X y el objetivo Y al mismo tiempo

tal vez toda esta "personalización" es sólo un cambio cosmético a las funciones existentes

demasiado perezoso para escribir nuevas métricas... y definitivamente no será el beneficio máximo, sino algo más significativo

por ejemplo, la estabilidad de Lyapunov ))

Valeriy Yastremskiy 2020.12.03 18:02 #22149

Maxim Dmitrievsky:

demasiado perezoso para escribir nuevas métricas todavía... y definitivamente no será el beneficio máximo entonces, sino algo más significativo

como la estabilidad de Lyapunov )))

No se necesita un campo nivelado, ni densidad)). En nuestro negocio es raro.

Maxim Dmitrievsky 2020.12.03 18:05 #22150

Aleksey Vyazmikin:

Volviendo a la cuestión de la visualización del modelo CatBoost, para analizar su perspectiva.

Sí, las distribuciones suelen mostrarlo todo. Puedes hacer esto por señas -no hay aumentos- y ver inmediatamente

Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2215