Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 127

 
Alexey Burnakov:


¿Cómo lo ha determinado? ¿Ha seguido el rendimiento de sus predictores en un futuro entonces desconocido?

¿Por qué no un futuro desconocido? Todo se sabe sobre la historia. Lo aprendo en los azulejos de 1 a 10, y luego lo pruebo en ellos utilizando la validación cruzada. Luego obtengo las estadísticas de los segmentos 11, 12, etc. y las comparo con las que obtuve en los segmentos 1-10. Es decir, una completa analogía con el comercio real. Lo he descrito mucho en este hilo.
 
SanSanych Fomenko:
¿Por qué no un futuro conocido? Todo se sabe sobre la historia. Lo aprendo a trozos del 1 al 10, y luego lo compruebo en la validación cruzada. Y luego obtengo estadísticas sobre el 11, 12, etc. y las comparo con lo que obtuve en los trozos del 1 al 10. Es decir, una completa analogía con el comercio real. Lo he descrito mucho en este hilo.

Sí, bueno, eso es lo que me imaginaba.

¿Y cuántas variaciones diferentes del modelo se dan en este sentido? ¿Sucede que en los trozos 11, 12, etc. el modelo funciona peor que en el trozo de entrenamiento y se vuelve a empezar?

 
Alexey Burnakov:

Sí, bueno, eso es lo que me imaginaba.

¿Y cuántas variaciones diferentes del modelo se dan en este sentido? ¿Se da el caso de que en los trozos 11, 12, etc. el modelo funciona peor que en el trozo de entrenamiento y se vuelve a empezar?

La variación es de un 2-3%, con una media del 27-28%. Es la variación como desviación de la media.

Lo que escribe es que debería reducir el error de aprendizaje. No lo he hecho. Para mis predictores GBM es el mejor, luego ada. Yo uso rf. A continuación viene la SVM y, lo que es peor, la nnet. Como puedes ver, no estoy usando el mejor modelo.

 
SanSanych Fomenko:

La variación es de un 2-3%, con una media del 27-28%. Es la variación como desviación de la media.

Lo que escribe es que debería reducir el error de aprendizaje. No lo he hecho. Para mis predictores GBM es el mejor, luego ada. Yo uso rf. A continuación viene la SVM y, lo que es peor, la nnet. Como puedes ver, no estoy usando el mejor modelo.

Bueno, está bien. SanSanych.

Si todos tus modelos se validan más o menos por igual, no necesitas bailar.

Pongo la información para que pienses en ella. Lo uso, me pongo a prueba y me salvo de los errores.

No sé si te ayudará o no.

Creo que la información no es la más inútil.

 
Alexey Burnakov:

Bien, de acuerdo. SanSanych.

Si todos sus modelos validan por igual, no hace falta bailar la pandereta.

He dispuesto la información para que tenga sentido. Lo uso, me pongo a prueba y me salvo de los errores.

No sé si te ayudará o no.

Creo que la información no es la más inútil.

He seguido todos tus posts con gran interés.

Y buena suerte.

 
SanSanych Fomenko:

He seguido todos tus posts con gran interés.

Buena suerte.

Gracias.

Sin embargo, tengo la impresión de que está prediciendo algo poco relevante para el comercio. No puede ser que sus modelos consigan el 60-70% tan fácilmente y sigan dando señales precisas. Estamos luchando con el sobreentrenamiento aquí y usted acaba de mirar los datos y dijo, no, así que no hay señal. Su trabajo se parece a la predicción del Iris de Fisher. Se ha eliminado un poco de ruido y todo está parado. ¿No ha tratado de predecir procesos complejos, colega? Donde hay mucho ruido, se rechaza inmediatamente. Y cuál es el beneficio para ustedes, aparte del dinero de los clientes, no está nada claro.

Además, no sabe cómo funcionaron sus predicciones en el futuro, aunque habla de ello con confianza.
 
Alexey Burnakov:
Gracias.

Sin embargo, tengo la impresión de que está prediciendo algo poco relevante para el comercio. No puede ser que sus modelos consigan el 60-70% tan fácilmente y sigan dando señales precisas. Estamos luchando con el sobreentrenamiento aquí y usted acaba de mirar los datos y dijo, no, así que no hay señal. Su trabajo se parece a la predicción del Iris de Fisher. Se ha eliminado un poco de ruido y todo está parado. ¿No ha tratado de predecir procesos complejos, colega? Donde hay mucho ruido, se rechaza inmediatamente. Y cuál es el beneficio para ustedes, aparte del dinero de los clientes, no está nada claro.

Además, no sabe cómo funcionaron sus predicciones en el futuro, aunque lo diga con seguridad.

No entiendo qué son los "procesos complejos". Tengo un EA real conectado en el terminal a una cotización... Lo que me dan es lo que masticamos.

Ya escribí que uso la predicción en el TS en el TF más antiguo, que tiene tres ventanas. La TF superior marca la dirección. Pero aparte de eso, EA tiene un conjunto bastante grande de herramientas, cuyo propósito es la gestión de riesgos. Por eso no puedo decir con seguridad qué porcentaje de error de predicción de la siguiente vela perteneciente a la dirección de ZZ influye en el resultado total, pero no me interesa.

Repito mi post anterior. Las herramientas de R, en particular, el aprendizaje automático, trato de utilizarlas para resolver problemas específicos de un determinado Asesor Experto. No en general, sino uno específico. Es muy posible que en otros ST mis planteamientos no funcionen.

Sobre el futuro...

Funciona desde diciembre y tiene un vuelo normal. A diferencia del indicador que estaba en este lugar en el Asesor de Expertos, hay una herramienta que se vuelve a entrenar. El retraso se ha eliminado. ¿No es suficiente? Un paso adelante colosal. ¿Es la verdad en última instancia? No, claro que no.

 
Alexey Burnakov:

Sí.

Un ciclo de aprendizaje con validación cruzada M1 sobre 10 faltas, se entiende correctamente. Para cada combinación de parámetros de aprendizaje: en 9 faltas aprende, en un control retrasado. Así que 10 veces. Obtenemos el valor medio de la métrica de calidad en 10 pliegues. Llamémoslo m1.

Yo hago algo parecido, pero no muevo la ventana de prueba, sino una ventana de entrenamiento. En el centro siempre tendré una ventana de entrenamiento en movimiento, mientras que los datos de prueba la rodean por ambos lados. Creo que si las dependencias no son constantes, y algunos "periodos dominantes" están constantemente flotando de un lado a otro (según mytarmailS, yo mismo no soy bueno en frecuencias y Fourier) - entonces no tiene sentido entrenar en situaciones extremas (en el tiempo), y probar en algo en el medio, que podría ser aproximado por un modelo de opciones extremas. Para el entrenamiento tomo incluso mucho menos del 50% de los datos, eso también está bien (al menos no es peor).

Yo uso algo parecido al bucle exterior de esta foto, pero entrenando en azul y probando en gris. Estoy tratando de asegurar que cualquiera que sea el 30% de los datos secuenciales que tome para el entrenamiento, el modelo debe ser capaz de operar de manera rentable en el resto de los datos. Existe la teoría de que si puedo entrenar un modelo que opere bien en todo el periodo utilizando cualquier 10% de datos sucesivos para el entrenamiento, entonces también operará bien en los nuevos datos.

 
Andrey Dik:

El método es el siguiente (todo lo que sigue se aplica por igual a la ST clásica y a la ML) .............

Lo he leído tres veces, pero no lo entiendo ((

1) Parece que esto no es puramente el ML, es como una mejora de algún TS existente, que tiene señales para entrar, y solo sobre estas entradas entramos y estas entradas analizamos el ML ¿no?

2) Cuando haya beneficios, cerramos la operación. Cuando la operación tiene pérdidas, mantenemos la posición, ¿por qué deberíamos hacerlo?

3) ¿Cuándo comprar y cuándo vender?

Me puedo hacer el loco, me chifla), pero no entiendo lo que has escrito, tal vez puedas mostrarme una imagen o un esquema...

 

Me encontré con un blog y casi lloro, el hombre estaba haciendo casi la misma idea que alguna vez se me ocurrió y decidí poner en práctica, y fue esta idea la que me hizo empezar a aprender a programar hace aproximadamente un año

https://www.r-bloggers.com/time-series-matching-with-dynamic-time-warping/

Y yo que pensaba que mi idea era única))) la juventud, la ingenuidad... por supuesto que no utilicé DTW, porque no lo entendí en absoluto

Time Series Matching with Dynamic Time Warping
  • systematicinvestor
  • www.r-bloggers.com
THIS IS NOT INVESTMENT ADVICE. The information is provided for informational purposes only. In the Time Series Matching post, I used one to one mapping to the compute distance between the query(cur…