Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2066

 
Aleksey Vyazmikin:

No sé cómo explicarlo :)

Tomé esta función

Prueba XOR
 
Aleksey Nikolayev:

La búsqueda de patrones intradía se ve dificultada por las fluctuaciones de la volatilidad intradía. Tenemos que deshacernos de ellos de alguna manera. Posibles formas:

1) Reajustar los incrementos para tener en cuenta la volatilidad intradía.

2) Cambiar a un nuevo tiempo intradiario, en el que la varianza crece uniformemente.

3) Uso de un patrón en zigzag. Los valores de las rodillas no dependen de las fluctuaciones de la volatilidad. Los topes temporales dependen, por supuesto, de la volatilidad (son más frecuentes donde ésta es alta), pero al pasar a un tiempo uniforme estos racimos desaparecen.

¿Es suficiente el punto 1? ¿O el 2 también tiene que serlo? ¿Qué es? Explícate.
 
elibrarius:
¿Qué es un preanálisis? Se introducen los modelos y se comparan, con y sin esta función.

Análisis de datos mediante un matstat, y en un sentido más estricto, para encontrar diferencias útiles entre el precio y el SB. La principal diferencia con el MO es que los modelos se formulan explícitamente y con un pequeño conjunto de parámetros.

 
elibrarius:
Prueba XOR

Probaré otros, tal vez más tarde. En general, creo que deberíamos hacer una agrupación y tirar de grupos similares de una en una, ya que, de lo contrario, la calidad del aprendizaje disminuye de todos modos.

 
elibrarius:
¿Es suficiente el punto 1? ¿O el 2 también tiene que serlo? ¿Qué es? Explícate.

Quizá sea más fácil explicarlo con un ejemplo de aplicación.

El punto 1) es una prueba de la hipótesis de las fluctuaciones diurnas de persistencia-antipersistencia. Es una comprobación de la tendencia del precio a continuar o viceversa - a cambiar su dirección dependiendo de la hora del día. Para ello es necesario conocer la correlación.

Puntos 2) y 3) - probar la hipótesis de que las reversiones de precios "ocurren por horas" y es mejor hacerlo en el momento "adecuado".

Punto 3) - búsqueda de los momentos planos (de moda) de la hora del día mediante el estudio de la distribución empírica de las longitudes del zigzag.

 
Aleksey Nikolayev:

Puede ser más fácil de explicar a través de un ejemplo de aplicación.

punto 1) - comprobación de la hipótesis de las fluctuaciones diurnas de persistencia-antipersistencia. Es una comprobación de la propensión del precio a continuar o viceversa - a cambiar su dirección dependiendo de la hora del día. Para ello es necesario conocer la correlación.

Puntos 2) y 3) - probar la hipótesis de que las reversiones de precios "ocurren por horas" y es mejor hacerlo en el momento "adecuado".

Punto 3) - búsqueda de los momentos planos (de tendencia) de la hora del día mediante el estudio de la distribución empírica de las longitudes del zigzag.

En un par de meses hay una referencia sólo al día del mes o también al día de la semana. Por código sólo al tiempo dentro del período estudiado.

 
Aleksey Vyazmikin:

Probaré otros, tal vez más tarde. En general, creo que es necesario hacer un clustering y sacar una línea de cada uno de los clusters similares, de lo contrario la calidad del aprendizaje baja de todos modos.

Cada hoja del árbol es un racimo. Y no sólo en cuanto al número de características, sino también en cuanto a la mejor separación de clases
 
elibrarius:
Cada hoja del árbol es un racimo. Y no sólo en cuanto al número de características, sino también en cuanto a la mejor separación de clases

Esto es correcto, pero si se eliminan esas cadenas, que ya son muchas en las hojas, habrá un poco menos (clase "0"), y la calidad no debería caer, mientras que los indicadores relativos para "1" serán más, y por lo tanto el modelo será capaz de tener en cuenta esas opciones hojas en la búsqueda, que antes estadísticamente no se hizo correctamente.

Otra opción es eliminar las hojas únicas, que pueden interferir en el aprendizaje.

 
Valeriy Yastremskiy:

En un par de meses, la referencia es sólo al día del mes o al día de la semana, también. Por código, sólo el tiempo dentro del periodo estudiado.

Para periodos superiores a un día, existe el problema de separar la influencia del fondo de noticias de la periodicidad. No entiendo muy bien cómo se puede resolver.

 
Aleksey Nikolayev:

Para periodos superiores a un día, existe el problema de separar la influencia del fondo de noticias de la periodicidad. La verdad es que no veo cómo se puede solucionar.

Entiendo lo del día, estoy de acuerdo. La pregunta es sobre el día de la semana. El tiempo dentro del periodo de promediación, días, no está ligado al día de la semana inicialmente. Inicialmente, se puede hacer una vinculación con el día de la semana para detectar la repetibilidad intra-semanal, teniendo en cuenta la hora del día. Sólo tiene un vínculo con la hora del día del mes.