Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2017

 
mytarmailS:

¿Alguien ha probado a utilizar "niveles redondos" como señales?

¿O como una forma de procesar los precios?

Puede marcar los precios con valores circulares, por ejemplo...

Es posible eliminar los valores que son iguales en una fila...

Es una buena compresión de la información, además de un filtrado ... Tal vez sea más fácil buscar patrones en un gráfico de este tipo para un modelo ...

Planeo hacer predictores, la lógica aquí es que hay huelgas de opciones en los niveles, por lo que puede ser útil para Moex.

Los gráficos son interesantes, MQL quisiera obtener un algoritmo rápido...
 
Aleksey Vyazmikin:

En cuanto a los atascos, quizá haya que cambiar la forma de corregir el error.

Por qué caja negra, si sólo hay 2-3 capas, entonces es bastante realista para descifrar por coeficientes. Los coeficientes pequeños pueden ser eliminados, lo que reduce el número de entradas a la neurona.

¿Qué quieres decir con "quizás deberías cambiar"? Aprende las matemáticas y cómo funcionan las fuentes de activación. ¿O es que los desarrolladores de la red son tan tontos que no sabían

¿Por qué meterse en todo esto y reinventar la rueda sin un título o una formación matemática? Es una estúpida pérdida de tiempo. Hay tecnologías y está escrito cómo deben utilizarse.

 
Maxim Dmitrievsky:

¿Qué quieres decir con "puede que tenga que cambiar"? Aprende las matemáticas y cómo funcionan las funciones de activación. O los desarrolladores de la red son tan tontos que no se habrían dado cuenta

porque es una pérdida de tiempo, nada más que especulaciones y cero concreciones. Acabas de ajustar el autocodificador, has añadido teclas de acceso rápido a un grupo o NS y nos has mostrado los resultados. Eso es todo. No tienes que elaborar nada. Las arquitecturas profundas no se construyen para ser analizadas, sino para reducir la rutina analítica.

¿Por qué meterse en todo esto y reinventar la rueda sin un título o una formación matemática? Es una estúpida pérdida de tiempo. Hay tecnologías y está escrito cómo deben usarse, eso es todo. Mucha gente está trabajando en ello.

Si las soluciones listas para usar resolvieran las tareas que les he encomendado, no tendría que inventar nada.

Ahora estoy preparando una gran muestra y voy a entrenar muchos modelos en CatBoost, tengo algunas ideas sobre cómo estimar la calidad del modelo para su posterior aplicación con éxito en tiempo real - compartiré los resultados de mi investigación.

 
Aleksey Vyazmikin:

Si las soluciones listas para usar resolvieran las tareas que les planteo, no habría necesidad de inventar nada, pero, por desgracia.

Ahora preparo la muestra grande y entrenaré muchos modelos en CatBoost, hay ideas de cómo estimar la calidad del modelo con el propósito de su posterior aplicación exitosa en tiempo real - compartiré los resultados de la investigación.

No creo que catboost sea la mejor solución para la previsión de series temporales, no funciona con secuencias.

puedes jugar con la clasificación, pero será inútil
 
Maxim Dmitrievsky:

Catbust no es adecuado para la previsión de series temporales, no funciona con secuencias

puramente para jugar con la clasificación, pero es inútil

¿Y cómo se determina si funciona o no?

Tengo modelos que son rentables desde hace un año (formados hace aproximadamente un año) en el probador - ¿estás sugiriendo que son aleatorios?

Sí, CatBoost es inferior a un árbol genético con hojas de posprocesamiento, pero es muy rápido de entrenar.

Y lo que funciona - NS?

 
Aleksey Vyazmikin:

¿Cómo se puede saber si funciona o no?

Tengo modelos que han sido rentables durante un año (entrenados hace aproximadamente un año) en el probador - ¿estás sugiriendo que son una casualidad?

Sí, CatBoost es inferior a un árbol genético con hojas de posprocesamiento, pero es muy rápido de entrenar.

Y lo que funciona - NS?

No lo he definido, la arquitectura en sí es para otras tareas

Sí, todo es aleatorio.

todavía no funciona nada )

 
Aleksey Vyazmikin:

Los predictores no son precios al desnudo: muchos puntos relativos que pueden ser similares...

No estoy seguro de que el cribado por correlación sea eficaz...

¿Por qué no probarlo? Un resultado negativo también es un resultado (en el sentido de alimento para la reflexión).

Una vez incluso sugerí la fórmula del coeficiente de correlación: C = (n1 - n2)/n, donde n es el número de barras en las que al menos uno de los dos sistemas da la señal de la operación, n1 es el número de barras en las que las señales son dadas por ambos sistemas simultáneamente y en la misma dirección, y n2 es el número de barras en las que las señales son dadas por ambos sistemas simultáneamente y en direcciones opuestas.

Esta matriz puede utilizarse para la agrupación, el adelgazamiento y la formación de carteras.

 
Maxim Dmitrievsky:

No lo determiné, pero la arquitectura en sí es para otras tareas.

Sí, todo es aleatorio.

hasta ahora nada funciona )

Por supuesto, aquí no hay afinación de las series temporales, por lo que los predictores deben contener información de coordenadas X, no sólo de coordenadas Y.

Si uno aprende a identificar esos patrones aleatorios, será un profesional.

Tengo más del 60% de las hojas muestreadas en años anteriores funcionando, lo cual es muy, y en mi opinión, confirma la solidez de la idea de un enfoque de procesamiento de datos mal clasificados. Si hubiera más gente trabajando en la idea, el resultado sería mejor, pero todo el mundo tiene su chispa.

 
Aleksey Vyazmikin:

Por supuesto, aquí no hay afinación de las series temporales, por lo que los predictores deben contener información de las coordenadas X, no sólo de las coordenadas Y.

Si uno aprende a identificar esos patrones aleatorios, obtendrá beneficios.

Tengo más del 60% de las hojas muestreadas en años anteriores funcionando, lo cual es muy, y en mi opinión, confirma la solidez de la idea de un enfoque de procesamiento de datos mal clasificados. Si hubiera más gente trabajando en la idea, el resultado sería mejor, pero todo el mundo tiene su chispa.

Como, el artículo quería... Esboza la esencia del enfoque. Sigo sin entender lo que estás haciendo :D

Me quedo con la opinión de que las características deben ser extraídas automáticamente por el propio modelo a partir de las series temporales (si las hay). Y no es necesario hacer nada manualmente. Los incrementos son suficientes. La cuestión es la arquitectura. Por ejemplo, como en NLP (procesamiento neural del lenguaje), la propia red neural determina el contexto en las secuencias de palabras, es decir, la relación entre las muestras de las series temporales.

 
Aleksey Nikolayev:

¿Por qué no probarlo? Un resultado negativo también es un resultado (en el sentido de alimento para la reflexión).

Creo que una vez incluso sugerí la fórmula para el coeficiente de correlación: C = (n1 - n2)/n, donde n es el número de barras en las que al menos uno de los dos sistemas da una señal para operar, n1 es el número de barras en las que las señales son dadas por ambos sistemas simultáneamente y en la misma dirección y n2 es el número de barras en las que las señales son dadas por ambos sistemas simultáneamente y en direcciones opuestas.

La matriz de estos ratios puede utilizarse para la agrupación, el adelgazamiento y la formación de carteras.

¿Qué tiene esto que ver con los predictores?

Hago algo similar para la selección de hojas, pero hay una trampa en que el número de respuestas de las hojas es diferente en la muestra y debemos tener en cuenta que las hojas con respuestas similares pero de diferente longitud pueden pertenecer al mismo grupo.