Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 186

 
Yury Reshetov:

Porque está congelado.

Lo siento, pero la pregunta es la misma que la respuesta.

No entiendo el humor, porque para tomar una decisión, el valor de la salida del clasificador debería compararse con algo, por ejemplo, con un valor umbral. Y como en tu formulación del problema los valores comparables por alguna razón son desconocidos, y sólo se conocen los que no son necesarios para la clasificación, sería conveniente hacer aclaraciones.

Bygones.
 

He completado mis cálculos de varios días (modelos sobre 6 predictores seleccionados (de 114) para forex).

Aquí está la imagen del título. Distribución de la precisión de la regresión (contada por la norma L1: suma de los valores de error absoluto ) en la validación para los modelos que fueron seleccionados como los mejores (por la misma medida) en las cajas de prueba.

Hay 99 valores en cada caja, cada uno de los cuales es la métrica 1 - suma(abs(X-Y))/suma(abs(X-media(X)) en una única muestra de validación. Análogo a R^2, ya veo, sí.

El total obtenido es de 8908 modelos... Para todos los instrumentos y objetivos en estudio.

Una reducción media del error del 0,2% (solamente). Pero es significativo... Se generó una única muestra de validación para cada modelo.

Todos los estudios que quiero publicar. Ahí va más allá la estimación del modelo MO y así hasta el final lógico. Si publico (no en MQL), daré un enlace a algunas personas con las que me comunico aquí o lo publicaré en mi perfil.

Y allí también. Una imagen mucho más interesante desde el punto de vista práctico. La relación entre la expectativa matemática del modelo en los bloques de prueba (dentro de la validación cruzada) y en la validación.

Aquí debemos comprobar de inmediato si la correlación positiva es significativa (ya que la correlación negativa no puede explicarse razonablemente en absoluto) y si hay valores positivos de MPO en la validación. Bueno, puedes verlo por ti mismo.

Los 99 puntos son modelos.

 
Dr.Trader:


Bueno, este es un buen ejemplo de por qué el 99% de los comerciantes ingenuos están perdiendo, si se mueve la ventana de este batiburrillo de puntos también se transforman al azar, que es sólo el ruido y MO no ayudará aquí
 
Va a ser genial, y si además le das un teletipo... onda cerebral)))
 
No lo estoy:
Bueno, este es un buen ejemplo de por qué el 99% de los comerciantes ingenuos están perdiendo...
Y este hilo es un buen y claro ejemplo de que el machine learning en el trading, es solo una teoría....
 
Incompleto:
Y esta rama es un buen y claro ejemplo de que el aprendizaje automático en el trading, es sólo una teoría...
Si se observa con atención el hilo, los habitantes se dividen en tres bandos:
  1. R (denominados aquí "parásitos"). Parecen una especie de secta destructiva. Todo el tiempo están hurgando en algunos paquetes, un día se dedican a la clasificación, mañana a la regresión, al día siguiente a alguna agrupación y así en círculo. La actividad parece impetuosa, pero es inútil, porque todo lo que emprenden lo hacen de forma incorrecta y torcida, por eso no tienen éxito. Esto se expresa en sus quejas, por ejemplo: sobre el destino, el "problema" del reciclaje, los predictores ruidosos y todo tipo de "radicales y malas personas" que no reconocen a R, como Reshetov.
  2. Los que no usan R. Estas personas, por regla general, han elegido una dirección concreta, en la que son buenos en algo. No se quejan del destino, no rebuscan en varios métodos, es decir, no tiran las cosas. En cambio, hacen lo que funciona y mejoran en lo que hacen.
  3. Los que pasaron por la puerta. A veces insertan su opinión, pero a menudo a destiempo.
 
Alexey Burnakov:

He completado muchos días de cálculos.

Sigo su investigación, muy informativa, gracias por publicar. Pero me parece que, aunque resuelvas con éxito problemas tan complicados, te faltan tareas de preparación y eso estropea el resultado. En concreto, ignoras la selección de los predictores.

Tomaste 114 predictores, luego seleccionaste de alguna manera 6, y después de entrenar los modelos puedes concluir qué objetivo es mejor. Pero este resultado obtenido es sólo un máximo local. No se puede decir globalmente que "el eurusd es mejor en la predicción de 16 barras por delante", sino sólo que "un conjunto de 114 predictores": (pre1, pre2, pre3,...) usando gbm predice mejor la dirección del precio a través de 16 barras".

Si tomas neuronas en lugar de gbm, obtienes un mejor objetivo diferente. Si se utilizan otros 114 predictores, el mejor objetivo volverá a ser diferente. Tus 114 predictores son una base tan importante que todo el curso posterior del experimento depende de ello, y los has cogido del techo sin ninguna preparación.

Hace aproximadamente medio año SanSanych ha publicado un archivo con sus pronósticos. La peculiaridad de ellos es que la mayoría de los modelos en rattle tienen un pequeño error en ellos y el error no crece en los nuevos datos. Puedes entrenar los modelos en cualquier segmento y ejecutar la prueba oos en los datos restantes y ver que no se degrada nada. Sus predictores y su objetivo están tan relacionados que los modelos encuentran la única relación posible entre ellos en cualquier barra.
Estoy tratando de replicar esto. Utilizo más de diez mil predictores iniciales (indicadores con diferentes parámetros y lags de mt5) y aprendo a seleccionarlos para que tengan la única conexión posible con la barra objetivo. Te recomiendo que hagas el mismo experimento, porque creo que la capacidad de determinar o encontrar tales predictores correlacionados y el objetivo es el verdadero indicador del grial.

En MQL5 recientemente está disponible el generador de Asesores Expertos, cuando se selecciona una lista de indicadores necesarios y un Asesor Experto listo con el código se crea inmediatamente, además es fácilmente optimizado por la genética. En tal Asesor Experto hay 20 indicadores, no hay modelos de aprendizaje automático en absoluto (todo lo que tenemos son coeficientes de importancia asignados a cada indicador).
Acabo de añadir mi código personalizado para la función de fitness de la genética e incluyó algunos criterios para hacer que el objetivo y los indicadores sean considerados como estrechamente relacionados en mi opinión. Resultó así:
(eurusd h1)

Los primeros 2/3 son backtest (muestra), el último tercio es fronttest (oos). Allí después de 2/3 del tiempo no un drenaje, pero el equilibrio se restablece a la inicial para la prueba de oos. Teniendo un conjunto de características tan pobre y añadiendo simplemente "criterios burdos e inacabados de dependencia del predictor y del objetivo", el resultado no es una pérdida, aunque sí malo. El 51% de las operaciones con éxito en Oos. ¿No es genial? Pero podríamos usar 20000 indicadores en lugar de 20, y añadir algún modelo de aprendizaje automático y eliminar el límite de 10000 iteraciones de la genética de mt5 y tendríamos incluso un Asesor Experto rentable.

 
...en el reverso de la moneda:
Y este hilo es un buen y claro ejemplo de que el machine learning en el trading, es solo teoría....

En el comercio la teoría no puede existir en principio, o más bien la teoría trata de la imposibilidad de ganar dinero, de un mercado eficiente, etc., todo está contemplado en el precio, el mecanismo de intercambio...Pero la estadística y el aprendizaje automático, que se hizo más accesible recientemente gracias a diferentes paquetes y bibliotecas matemáticas, permite ver realmente POR QUÉ es tan triste con TA estándar, no los científicos, pero los comerciantes simples, pasar una semana en R-studio o Matlab.

Si el modus operandi en el trading es "sólo teoría", lo cual es parcialmente cierto, entonces el AT ni siquiera es una teoría, sino una mierda, como la astrología o el vudú.

Pero muchos aquí saben que todavía es posible ganar dinero, un mercado eficiente no es sólo por la voluntad de Dios, sino porque algunos han conseguido obtener y procesar la información mejor que la mayoría. En mi opinión, el obstáculo más importante para los comerciantes es una ilusión de la simplicidad de este tipo de negocio, como si fueran a obtener dinero por su firma, aquí en este foro han escuchado repetidamente algo así como "no es necesario crear un colisionador de hadrones para el comercio" ...

Pero resulta que sí....

 
Dr.Trader:

Sigo tus investigaciones, son muy informativas, gracias por publicarlas. Pero me parece que, aunque resuelvas con éxito problemas tan complicados, te faltan tareas de preparación y eso estropea el resultado. En concreto, ignoras la selección de los predictores.

Tomaste 114 predictores, luego seleccionaste de alguna manera 6, y después de entrenar los modelos puedes concluir cuál es el mejor objetivo. Pero este resultado obtenido es sólo un máximo local. No se puede decir globalmente que "el eurusd es mejor en la predicción de 16 barras por delante", sino sólo que "un conjunto de 114 predictores": (pre1, pre2, pre3,...) usando gbm predice mejor la dirección del precio a través de 16 barras".

Si tomas neuronas en lugar de gbm, obtienes un mejor objetivo diferente. Si se utilizan otros 114 predictores, el mejor objetivo volverá a ser diferente. Tus 114 predictores son una base tan importante que todo el curso posterior del experimento depende de ello, y los has cogido del techo sin ninguna preparación.

Hace medio año SanSanych publicó un archivo con sus pronósticos. Su peculiaridad es que la mayoría de los modelos en traqueteo tienen un pequeño error en ellos, y al mismo tiempo el error no crece con los nuevos datos. Puedes entrenar los modelos en cualquier segmento y ejecutar la prueba oos en los datos restantes y ver que no se degrada nada. Sus predictores y su objetivo están tan relacionados que los modelos encuentran la única relación posible entre ellos en cualquier barra.
Estoy tratando de replicar esto. Utilizo más de diez mil predictores iniciales (indicadores con diferentes parámetros y lags de mt5) y aprendo a seleccionarlos para que tengan la única conexión posible con la barra objetivo. Te recomiendo que hagas el mismo experimento, porque creo que la capacidad de determinar o encontrar tales predictores correlacionados y el objetivo es el verdadero indicador del grial.

En MQL5 recientemente está disponible el generador de Asesores Expertos, cuando se selecciona una lista de indicadores necesarios y un Asesor Experto listo con el código se crea inmediatamente, además es fácilmente optimizado por la genética. En tal Asesor Experto hay 20 indicadores, no hay modelos de aprendizaje automático en absoluto (todo lo que tenemos son coeficientes de importancia asignados a cada indicador).
Acabo de añadir mi código personalizado para la función de fitness de la genética e incluyó algunos criterios para hacer que el objetivo y los indicadores sean considerados como estrechamente relacionados en mi opinión. Resultó así:
(eurusd h1)

Los primeros 2/3 son backtest (muestra), el último tercio es fronttest (oos). Después de 2/3 de tiempo no es un drenaje, pero la balanza se restablece a la inicial para la prueba de oos. Teniendo un conjunto de opciones tan pobre y añadiendo simplemente el "criterio burdo e inacabado de la dependencia del predictor y del objetivo", el resultado no es una pérdida, aunque sí malo. El 51% de las operaciones con éxito en Oos. ¿No es genial? Pero podríamos utilizar 20000 indicadores en lugar de 20, y añadir un modelo de aprendizaje automático y eliminar el límite de 10000 iteraciones de la genética de mt5 e incluso conseguiríamos un Asesor Experto rentable.

Sin duda, un resultado local. No hay oportunidad de diversificación. No hay tiempo. No hay recursos... Esto es exactamente lo que da GBM en mis pronósticos.

La cuestión es no utilizar la parte de la experiencia que está sobreentrenada para sacar conclusiones. Y si este resultado local se valida con éxito, estaré satisfecho.

Aquí se valida con éxito la calidad de la regresión. Los modelos entrenados dan una calidad de predicción significativa diferente de cero. Sin problemas de selección de modelos.

Y es más complicado con el modus operandi. No he mostrado todo... Hay submuestras (símbolo-objetivo) que dan una mediana de MO en la validación mayor que cero... Pero la tarea es tomar la cola de los patrones correlacionados con la validación para aumentar la MO. Pero esto también podría ser un caso...

Al final se reunirá un comité que será validado por otra muestra del futuro. A través de Montecarlo, por supuesto.

En cuanto a los predictores, también es complicado... Es largo de explicar... Pero la cuestión es que cada uno de los 99 modelos de la submuestra símbolo-objetivo utiliza su propio conjunto de 6 predictores. La combinación da como resultado una buena variedad de modelos (además de que aprenden de datos diferentes). y en general cada uno de los 114 está involucrado en alguna parte.

Y no te olvides de la selección optimista de modelos, por favor. Así que no entiendo cómo has elegido la foto. ¿Por el mejor resultado en IS o OS? Es una pregunta así. Pero los resultados de muchas "investigaciones" pecan de no tener respuesta a esa pregunta.
 

Consejos sobre dónde conseguir un EA (robot) que abra una operación a una hora determinada y luego la cierre a una hora determinada.


Por ejemplo, abra una operación a las 12:59 y ciérrela a las 13:59, independientemente del resultado: ganancia o pérdida de todos modos.