Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1290

 
Aleksey Vyazmikin:

Esto encaja fácilmente en mi teoría sobre el mercado. Simplemente, alguien con mucho dinero encendió su algoritmo para la selección de posiciones/operaciones, algún banco grande, tal vez el Banco Central, naturalmente esto no se hace rápidamente, pero como este participante era dominante y la situación del mercado contribuyó a esto, fue posible encontrar señales de su algoritmo. Por supuesto, cuando el participante dejó de influir en el mercado, las señales dejaron de funcionar. Hay muchos participantes de este tipo (tal vez 100), sus algoritmos pueden superponerse, pero hay una suposición de que son similares (recuerde el análisis técnico y los requisitos para que los bancos justifiquen sus operaciones de comercio sobre la base de ese análisis (al menos en Rusia), y por esta razón tiene sentido para analizar una gran muestra, donde uno y el mismo algoritmo se ejecuta varias veces, entonces hay una oportunidad de entender cómo funciona, describir sus signos indirectos, pero el modelo debe aprender a identificarlo y no trabajar en el ruido en este momento, a la espera de que el algoritmo se encienda, bajo el cual Creo que esto por supuesto funcionaría aún mejor en acciones y derivados, no hago MO en forex.

Pero la conclusión es que tenemos que encontrar modelos de 10 que describan el algoritmo para los individuos con mucho dinero, y aprender a determinar qué algoritmo es preferible. Dado que el ciclo del algoritmo puede ser de un par de días y que probablemente se repita en un periodo corto de tiempo, no pasa nada si entramos con un pequeño retraso, lo principal es elegir el modelo adecuado para este algoritmo.

No sé si se pueden encontrar 10 patrones. Pero el hecho de que la información que entra en el mercado esté estructurada en un ciclo que tiene un principio, una continuación y un final es cierto

El punto de bifurcación es exactamente el momento del impacto de una nueva porción explosiva de información, que luego se estructura en el tiempo. Una perturbación que se dispersa en círculos (ondas) durante algún tiempo.

Por eso, por ejemplo, los patrones dentro de los contratos de futuros son más fuertes que dentro de los diferentes contratos de futuros.

 
Maxim Dmitrievsky:

sobre la historia existe, no sé cómo algoritmizarla

Es posible que exista en la historia. ¿Es posible detectarlo en tiempo real y a tiempo? Si se desconoce, entonces no es seguro que la solución exista.

Suelo comprobar estas cosas con las estadísticas. En su mayor parte, los resultados no son nada). Se puede ver con los ojos, pero las estadísticas dicen que allí no hay nada: un reflejo aparente de la luna aparente).

 
Yuriy Asaulenko:

En la historia, bien puede existir. ¿Es posible detectar esto en tiempo real y a tiempo? Si se desconoce, no es en absoluto seguro que exista una solución.

Suelo comprobar estas cosas con las estadísticas. En su mayor parte, los resultados no son nada). Se puede ver con los ojos, pero las estadísticas dicen que no hay nada: un reflejo de la luna aparente).

Si miras el gráfico, puedes hacerlo con los ojos, yo no puedo hacerlo programáticamente.

 
Maxim Dmitrievsky:

No sé si se pueden encontrar 10 patrones. Pero el hecho de que la información que entra en el mercado está estructurada en un ciclo que tiene un principio, una continuación y un final es cierto.

Para ello hay que abandonar los algoritmos de volteo y enseñar al modelo a no estar siempre en el mercado. Mi estrategia permite hacer esto y ahora estoy experimentando en esta dirección con modelos de catbustos. Desgraciadamente, las hojas del árbol que he estado guardando durante medio año ya no se pueden aplicar, porque he hecho algunos cambios en los predictores (había errores en la lógica y retrasos nivelados en la apertura de las barras, es decir, el problema de cálculo estaba en los retrasos en tiempo real), pero el trabajo con ellas confirma que existe la posibilidad de detectar patrones que son más precisos individualmente que el poder predictivo del árbol/bosque, y por tanto su combinación da buenos resultados.

Maxim Dmitrievsky:

Y el punto de bifurcación es justo cuando se expone una nueva porción explosiva de información, que luego se estructura en el tiempo. Una perturbación que se dispersa en círculos (ondas) durante algún tiempo.

Por eso, por ejemplo, se ha observado que los patrones dentro de los contratos de futuros son más fuertes que en los diferentes contratos de futuros.

Por lo tanto, es necesario identificar estos puntos, tal vez deberían convertirse en objetivos. Y un modelo los identifica, y en función del objetivo se selecciona un modelo de negociación adecuado. Otra cosa es que debamos pensar de nuevo en los predictores y en la convolución de los datos, para expresar el periodo de inicio del ciclo en una línea, cuando el periodo en sí puede establecerse en (a lo largo de), digamos, 10 barras.

 
Maxim Dmitrievsky:

Si lo pones en el gráfico, puedes hacerlo con los ojos, no puedo hacerlo programáticamente.

Programáticamente, es una historia muy larga.

El sistema anterior tenía más de 30 condiciones (parámetros) para las entradas largas, lo mismo para las cortas, y un poco menos para las salidas. Hubo mucho trabajo, incluyendo la construcción de muchos conjuntos, y su separación, la eliminación de cualquier trato con condiciones adicionales incluidas en los conjuntos, etc.

 
Aleksey Vyazmikin:
Yuriy Asaulenko:

Programáticamente, es una historia muy larga.

El sistema anterior tenía más de 30 condiciones (parámetros) para las entradas largas, lo mismo para las cortas, y un poco menos para las salidas. Hubo mucho trabajo, incluyendo la construcción de muchos conjuntos, y su separación, la eliminación de los oficios que se caen de los conjuntos con condiciones adicionales, etc.

Así que tenemos que identificar estos puntos, tal vez haya que convertirlos en objetivos. Y un modelo identifica estos puntos y el otro selecciona el modelo de negociación correspondiente en función del objetivo. Otra cosa es que debamos pensar de nuevo en los predictores y en la convolución de los datos, para expresar el periodo de inicio del ciclo en una línea, cuando el periodo en sí puede establecerse en (a lo largo de), digamos, 10 barras.

Bueno, está claro que esto es un tostón, nadie lo discute ))

 
Sobre el catbucht, resultó que es posible ejecutar más de un procesamiento en la GPU a través de lotes, es decir, ejecutar dos lotes a la vez, llamando a la aplicación de consola. Y en este caso, al menos en mis modelos, la velocidad de la GPU para producir modelos no cambia, lo que significa que es posible paralelizar los cálculos. El límite y las limitaciones aún no se conocen del todo. Deja tu alglib, y vamos a torturar a catbust ;)
 
Aleksey Vyazmikin:
Sobre el catbucht, resultó que en la GPU es posible ejecutar más de un procesamiento por lotes, es decir, ejecutar dos lotes a la vez, llamando a la aplicación de consola. Y en este caso, al menos en mis modelos, la velocidad de la GPU para producir modelos no cambia, lo que significa que es posible paralelizar los cálculos. El límite y las limitaciones aún no se conocen del todo. Deja tu alglib, y vamos a torturar a catbust ;)

el software es sorprendentemente bueno (a diferencia de todo lo demás de Yandex), incluso utiliza el CERN para procesar los datos del colisionador

todavía no hay tiempo, entonces tal vez más tarde

 
Aleksey Vyazmikin:

También hay un software genial KNIME todo tipo de refuerzo, análisis de datos y visualización

es posible serrar xgboost sin programar, catboost parece ser también posible de añadir

KNIME - Open for Innovation
KNIME - Open for Innovation
  • 2019.01.28
  • www.knime.com
KNIME, the open platform for your data.
 
Maxim Dmitrievsky:

el software es sorprendentemente bueno (a diferencia de todo lo demás de Yandex), incluso utiliza el CERN para procesar los datos del colisionador

no hay tiempo todavía, más tarde tal vez.

Creo que hay una importante contribución del código abierto, que se corrige periódicamente y se añaden nuevas versiones. Eh, si pudiera leer ese código... me parece que hay un clandyke de ideas ahí que puedes tomar prestadas y desarrollar tú mismo, llegando a tu propio impulso.


MaximDmitrievsky:

También hay un software muy interesante de KNIME que potencia, analiza y visualiza los datos

¡se puede escribir xgboost sin programar, catboost parece ser capaz de añadirlo también!

Gracias. Por ahora me basta con el catboost porque he depurado todo el ciclo desde la creación de la muestra hasta la implementación en Expert Advisor. Y, a diferencia de lo que ocurre con los puentes a través de python, puedo utilizar la optimización para probar diferentes modelos, sus combinaciones y sólo las interpretaciones de las "probabilidades" que producen.

Aunque no puedo trabajar exactamente con signos categóricos (función CatBoost) - no tengo tal intérprete de modelos, pero mi investigación preliminar mostró que el uso de tales modelos da más estabilidad en los intervalos de tiempo, es decir, los modelos son mejores, aunque el entrenamiento es 5 veces más lento.