Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 789

 

¿Entiendo correctamente que AUTO ARIMA calcula todo por sí mismo, sólo tengo que cargar las cotizaciones.

He comprobado en varios sitios y el modelo ARIMA(0,1,0) aparece en todas partes.

 
Anatolii Zainchkovskii:

El hecho de que hayas visto esta caída tres barras antes, no significa que la tengas en cuenta ahora.


Bonita foto, la usaré como ejemplo...

Así que si no hay error en la previsión cómo podemos obtener menos si vemos que habrá caída. Cuando la barra cero se cierra con signo contrario, aún sabemos que habrá caída. Espero que no haya preguntas sobre esta imagen..... Hemos elegido la ventana al azar pero pronosticamos cada barra de esta ventana y en consecuencia cuando la tercera barra es cero y vemos gran diferencia en el pronóstico vendemos. Pero cuando hemos visto una ligera diferencia de módulo en la previsión de la primera barra, ya sabemos en qué barra habrá un aumento significativo. El problema son dos malentendidos. En primer lugar, me explico omitiendo algunos puntos que me parecen obvios. En segundo lugar, no lo entiendes por la falta de experiencia. Pero es normal hacer preguntas, así que continuemos...

 
Mihail Marchukajtes:

Bonita foto, la usaré como ejemplo...

Así que sin errores en la previsión cómo podemos obtener un menos si podemos ver que habrá una caída. Cuando la barra cero se cierra con signo contrario, aún sabemos que habrá caída. Espero que no haya preguntas sobre esta imagen..... Hemos elegido la ventana al azar pero pronosticamos cada barra de esta ventana y en consecuencia cuando la tercera barra es cero y vemos gran diferencia en el pronóstico vendemos. Pero cuando hemos visto una ligera diferencia de módulo en la previsión de la primera barra, ya sabemos en qué barra habrá un aumento significativo. El problema son dos malentendidos. En primer lugar, me explico omitiendo algunos puntos que me parecen obvios. En segundo lugar, no lo entiendes por la falta de experiencia. Pero está bien hacer preguntas, así que sigamos...

Si miro las estadísticas, no creo que se basen en previsiones y no creo que deban basarse en ellas, pero pueden basarse en previsiones. Pero todo está súper bien en la previsión del 100%, pero qué hacer cuando hay incluso un 90% de previsión, porque un 10% de previsiones erróneas puede inclinar la balanza demasiado.

 

Creo que hoy llegaré tarde a casa, pero llevo unos días queriendo escribir un post largo. Lo haré ahora y veré. Pero primero un pequeño inciso.

La parte escrita del artículo sí se publicará en el blog y se enlazará con él. Entonces, en lugar de este artículo, me puse a escribir otro que parece "Pautas metodológicas para trabajar en el aprendizaje automático". Un día iba caminando por la ciudad y pensé que estaría bien tener una metodología, como en las universidades, en la que se describieran, sin agua, las normas básicas de lo que se puede y no se puede hacer. Entonces, como se dice, hay que esperar y ver. Y ahora el tema del post largo. El objetivo de la página web .....

Durante este mes he hecho un gran avance y se ve claramente, alguien lo reconoce, y alguien refuta, pero nadie tiene una pregunta que el optimizador de Reshetova he tenido durante mucho tiempo, pero conseguir un buen modelo, empecé cuando el doc me llenan los comandos de la P con las explicaciones y al día siguiente recibí los resultados de las pruebas que nunca he visto en todos los 15 años. Sé que no se trata del carrete y que el optimizador está haciendo un buen trabajo, pero no se trata de él. Sólo estoy 100% seguro de que no es el único optimizador del mundo que hace el mejor trabajo. Por supuesto que no. La mayoría de los paquetes P funcionan tan bien como éste. Entonces, ¿cuál es el problema? Por qué los resultados son tan pobres y toda la columna vertebral de la rama del aprendizaje automático se sigue buscando y no se encuentra. La respuesta es sencilla. Usted comete errores en una u otra etapa de la preparación del modelo. Lógicamente, crees que haces lo correcto al elegir una determinada predicción o transformación, pero cometes algún pequeño error pensando que tienes razón, pero en realidad no la tienes.

Por eso he empezado a hablar de la regresión, para saber qué puedes y qué no puedes hacer. Me enfrenté a mi propia idea errónea de la siguiente manera. Lógicamente si lo piensas. Ese modelo con más entradas y un polinomio más largo es supuestamente más inteligente y paramétrico, pero la práctica mostró el resultado contrario cuando los modelos con un número mínimo de entradas en las retroalimentaciones ganaron más que los modelos con más entradas. Este es el ejemplo de cuando crees que tienes razón por lógica, pero en la práctica resulta que no la tienes.

Pero el problema del aprendizaje automático resulta no estar en el método de obtención de un modelo o en el uso de algunas transformaciones supersecretas. El principal talón de Aquiles es otra cosa y puedo explicarlo con un ejemplo, será comprensible y a la vez destrozaré las fotos de Maxim.

Supongamos que creamos un sistema para obtener un modelo de regresión o clasificación. Y creemos que no hemos cometido ningún error grave durante el diseño. Supongamos.

Tenemos un archivo de formación. Lo ejecutamos para la optimización 10 veces y obtenemos 10 modelos. Así que la pregunta más difícil para mí era. Cómo seleccionar el modelo que no se ha sobreentrenado y subentrenado pero que es adecuado para el mercado, etc. Esta cuestión es el talón de Aquiles. Puede que hayas hecho un sistema de IA y hayas cometido algunos errores en él, pero eso no significa que tu sistema NO PUEDA GENERAR un modelo generalizador.

La calidad de un sistema de IA se define precisamente por el número de modelos adecuados respecto al número total de optimizaciones. Digamos que un sistema de 100 optimizaciones da un solo modelo que se puede utilizar, y el segundo de las mismas cien optimizaciones da 20 modelos que son adecuados para su uso. Está claro que el segundo sistema es mejor que el primero ya que tiene más modelos correctos que el primero dada la misma cantidad de optimizaciones. Por ejemplo, el optimizador Reshetova de cuatro modelos (por regla general, no más de cuatro) da uno o dos modelos adecuados. A veces, cuatro no son suficientes. No hay problema, a la quinta, sexta o décima optimización dará un modelo adecuado al mercado. Y ahora lo más interesante es cómo identificar y encontrar este modelo. He encontrado una manera. Lo hago de la siguiente manera. Genero un archivo de entrenamiento y realizo cuatro entrenamientos. Luego evalúo estos modelos y elijo el que sea adecuado y para ello sólo necesito una sección de disparo en la que haya una validación o prueba en el proceso de disparo. Dejo una pequeña sección del OOS en forma de 3-4 señales para convencerme finalmente de que es esto y luego lo pongo en marcha. Por eso, la cuestión de la selección del modelo es una de las más importantes a la hora de preparar el ST. Continuaré.

 
forexman77:

¿Entiendo correctamente que AUTO ARIMA calcula todo por sí mismo, sólo tengo que cargar las cotizaciones.

Lo he comprobado en varios gráficos y muestra ARIMA(0,1,0) en todas partes.

auto.arima {forecast}
> y <- dd$OPEN
> auto.arima(y)
Series: y 
ARIMA(3,1,5) 

Coefficients:
         ar1     ar2      ar3      ma1      ma2     ma3      ma4      ma5
      0.3956  0.4421  -0.6151  -0.4159  -0.4165  0.6288  -0.0257  -0.0515
s.e.  0.0904  0.0701   0.0827   0.0905   0.0708  0.0797   0.0105   0.0115

sigma^2 estimated as 3.406 e-06:  log likelihood=66279.3
AIC=-132540.6   AICc=-132540.6   BIC=-132473
 

He escrito y el foro ha fallado, así que léelo así. No puedo reescribirlo...


 
Mihail Marchukajtes:

Creo que hoy llegaré tarde a casa, pero llevo unos días queriendo escribir un post largo. Lo haré ahora y veré. Pero primero un pequeño inciso.

La parte escrita del artículo sí se publicará en el blog y se enlazará con él. Entonces, en lugar de este artículo, me puse a escribir otro que parece "Pautas metodológicas para trabajar en el aprendizaje automático". Un día iba caminando por la ciudad y pensé que estaría bien tener una metodología, como en las universidades, en la que se describieran, sin agua, las normas básicas de lo que se puede y no se puede hacer. Entonces, como se dice, hay que esperar y ver. Y ahora el tema del post largo. El objetivo de la página web .....

Durante este mes he hecho un avance y se ve claramente, alguien lo reconoce, y alguien refuta, pero nadie tiene una pregunta que el optimizador de Reshetova he tenido durante mucho tiempo, pero conseguir un buen modelo, empecé cuando el doc me llenan los comandos de la P con explicaciones y al día siguiente me dan los resultados de las pruebas que nunca he visto en 15 años. Sé que no se trata del carrete y que el optimizador está haciendo un buen trabajo, pero no se trata de él. Sólo estoy 100% seguro de que no es el único optimizador del mundo que hace el mejor trabajo. Por supuesto que no. La mayoría de los paquetes P funcionan tan bien como éste. Entonces, ¿cuál es el problema? Por qué los resultados son tan pobres y toda la columna vertebral de la rama del aprendizaje automático se sigue buscando y no se encuentra. La respuesta es sencilla. Usted comete errores en una u otra etapa de la preparación del modelo. Lógicamente, crees que haces lo correcto al elegir una determinada predicción o transformación, pero cometes algún pequeño error pensando que tienes razón, pero en realidad no la tienes.

Por eso empecé la discusión sobre la regresión, para saber qué se puede y qué no se puede hacer. Me enfrenté a mi propia idea errónea de la siguiente manera. Lógicamente si lo piensas. Ese modelo con más entradas y un polinomio más largo es supuestamente más inteligente y paramétrico, pero la práctica mostró el resultado contrario cuando los modelos con un número mínimo de entradas en las retroalimentaciones ganaron más que los modelos con más entradas. Este es el ejemplo de cuando crees que tienes razón por lógica, pero en la práctica resulta que no la tienes.

Pero el problema del aprendizaje automático resulta no estar en el método de obtención de un modelo o en el uso de algunas transformaciones supersecretas. El principal talón de Aquiles es otra cosa y puedo explicarlo con un ejemplo, será comprensible y a la vez destrozaré las fotos de Maxim.

Supongamos que creamos un sistema para obtener un modelo de regresión o clasificación. Y creemos que no hemos cometido ningún error grave durante el diseño. Supongamos.

Tenemos un archivo de formación. Lo ejecutamos para la optimización 10 veces y obtenemos 10 modelos. Así que la pregunta más difícil para mí era. Cómo seleccionar el modelo que no ha sido sobre-entrenado y sub-entrenado, pero que es adecuado para el mercado, etc. Esta cuestión es el talón de Aquiles. Puede que hayas hecho un sistema de IA y hayas cometido algunos errores en él, pero eso no significa que tu sistema NO PUEDA GENERAR un modelo generalizador.

La calidad de un sistema de IA se define precisamente por el número de modelos adecuados respecto al número total de optimizaciones. Digamos que un sistema de 100 optimizaciones da un solo modelo que se puede utilizar, y el segundo de las mismas cien optimizaciones da 20 modelos que son adecuados para su uso. Está claro que el segundo sistema es mejor que el primero ya que tiene más modelos correctos que el primero dada la misma cantidad de optimizaciones. Por ejemplo, el optimizador Reshetova de cuatro modelos (por regla general, no más de cuatro) da uno o dos modelos adecuados. A veces, cuatro no son suficientes. No hay problema, a la quinta, sexta o décima optimización dará un modelo adecuado al mercado. Y ahora lo más interesante es cómo identificar y encontrar este modelo. He encontrado una manera. Lo hago de la siguiente manera. Genero un archivo de entrenamiento y realizo cuatro entrenamientos. Luego evalúo estos modelos y elijo el que sea adecuado y para ello sólo necesito una sección de disparo en la que haya una validación o prueba en el proceso de disparo. Dejo una pequeña parte de la retroalimentación en forma de 3-4 señales para convencerme finalmente de que es esto, y luego lo pongo en marcha. Por eso, la cuestión de la selección del modelo es una de las más importantes a la hora de preparar el ST. Continuaré.

No puedo seguir leyendo todas estas tonterías, me estáis matando.

el resto de vosotros, capitanes de la obviedad y gendarmes de la claridad

que se vaya a la mierda )

 
Maxim Dmitrievsky:

No puedo seguir leyendo todas estas locuras, me estáis matando.

El resto de ustedes, Capitanes de la Obviedad y Gendarmes de la Claridad

que se vaya a la mierda )

Escribió que estaba borracho y que estuvo despierto durante dos noches. Quería "hablar")).

Mihail Marchukajtes:
En general, Mikhail, deberías dormir por la noche.

 
Maxim Dmitrievsky:

No puedo seguir leyendo todas estas locuras, me estáis matando.

El resto de ustedes, Capitanes de la Obviedad y Gendarmes de la Claridad

Me voy de aquí).

Max encontró un grial con seguridad))

 
Maxim Dmitrievsky:

el tema ha sobrepasado el ámbito de lo razonable: hace tiempo que algunos se han vuelto rígidos y obsesionados con el sobreentrenamiento y los "paquetes"

Hay gente que sigue siendo igual que el tonto del culo en el Ministerio de Defensa.

No es que el tema se haya ido a alguna parte: es "difuso". No hay una moderación regular. Algunos se amontonan, incluso peor que mi hilo.

Pero, tenemos que esperar a que el hombre del Grial pase a primer plano.

Esperamos.