Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2727

 
Aleksey Vyazmikin #:

¿No lo ha intentado experimentalmente? Al fin y al cabo, según tu planteamiento teórico en esta pregunta, tras un aumento crítico del tamaño de la muestra, los patrones de la muestra llegarán viejos, ya no funcionarán, y por tanto el aprendizaje debería deteriorarse en sentido cualitativo y sobre nuevos datos los resultados serán peores al aumentar la muestra.

Probablemente te des cuenta de que es una tarea computacional completamente inmensa entrenar sobre un gran número de variantes para la longitud de la historia para un gran número de puntos en el tiempo. Incluso si por algún milagro consigues recopilar todas estas estadísticas, entonces se planteará la cuestión de la sistematización significativa de este montón de información. Seguramente alguna longitud diferente de la historia resultará ser óptima para cada momento. ¿Y cómo interpretar esto y, lo que es más importante, cómo extrapolarlo al futuro?

Me gustaría ir en la dirección contraria: idear una heurística para reducir drásticamente el número de variantes para la longitud del historial de entrenamiento (literalmente, hasta unas pocas variantes).

 
Maxim Dmitrievsky #:

Empiezo sacando sólo trozos de trabajo de los datos nuevos y aplico el filtro como un segundo modelo para que funcione tanto con los datos antiguos como con los nuevos, luego lo compruebo con otros datos nuevos como en el artículo.

También es una especie de ajuste, pero sobre la base de los errores del modelo. Como si seleccionáramos al menos aquellas variantes que es capaz de clasificar bien, por lo que hay algo en ellas además de aleatoriedad (al menos en entrenamiento y validación y alguna otra validación).

Si a priori establecer algo, probablemente tiene sentido tomar cualquier seguimiento de larga duración, que dará al menos un poco de marcado adecuado. Recoger las señales.


Se me ocurrió un nuevo spammer de características y objetivos (parece ser informativo, y así es en comparación con el muestreo aleatorio habitual). Pero hay algunas variantes, no lo he probado todavía.

Tendré que reflexionar sobre ello. Realmente no entiendo cómo traducirlo a mis propias ideas y conceptos.

 
Aleksey Nikolayev #:

Tengo que pensar en ello. No entiendo muy bien cómo traducirlo al lenguaje de mis percepciones y conceptos.

Además, cambiar de ticks a barras reduce mucho el poder predictivo.

pero elimina posibles conflictos con los dts).

 
Maxim Dmitrievsky #:

Además, el cambio de ticks a barras reduce mucho la capacidad de predicción.

pero elimina posibles conflictos con dts :)

Por cierto, esta es también una cuestión práctica importante y teóricamente interesante. Se puede formular como una dependencia del diferencial real entre la oferta y la demanda con respecto al volumen (liquidez, volatilidad), calcular la regresión correspondiente, comparar el mercado de divisas con los instrumentos bursátiles, etc. Otra cosa es que sea interesante sólo para aquellos cuyas ST negocian grandes volúmenes)

 
Aleksey Nikolayev #:

Probablemente te des cuenta de que es una tarea computacional absolutamente inmensa entrenar un gran número de variantes para un gran número de momentos en el tiempo durante toda la historia. Incluso si por algún milagro se consigue recopilar todas estas estadísticas, habrá que plantearse la cuestión de la sistematización significativa de este montón de información. Seguramente, para cada momento resultará óptima una duración diferente de la historia. ¿Y cómo interpretarla y, lo que es más importante, cómo extrapolarla al futuro?

Me gustaría ir en la dirección contraria: idear alguna heurística para reducir drásticamente el número de variantes para la longitud del historial de entrenamiento (literalmente, a unas pocas variantes).

El problema del experimento tiene solución, ya he hecho algo parecido.

En ese momento se me ocurrió la idea de que debía indagar hacia métodos de estimación de la comparabilidad de la muestra. Pero no pude ponerlo en práctica - no entendía la fórmula.

 
Aleksey Vyazmikin #:

El problema del experimento tiene solución, yo he hecho algo parecido.

Técnicamente es bastante solucionable, probablemente. La cuestión es cómo interpretar los resultados de tal experimento.

Aleksey Vyazmikin #:

Entonces se me ocurrió la idea de que deberíamos investigar métodos para evaluar la comparabilidad de una muestra. Pero no pude realizarlo, no entendía la fórmula.

Matstat tiene un montón de pruebas para comprobar la homogeneidad de las muestras, por ejemplo. Si he entendido bien su terminología.

 
Aleksey Nikolayev #:

Por cierto, ésta es también una cuestión práctica importante y teóricamente interesante. Se puede formular como una dependencia del diferencial real entre precio de compra y de venta con respecto al volumen (liquidez, volatilidad), calcular la regresión correspondiente, comparar el mercado de divisas con los instrumentos bursátiles, etc. Otra cosa es que sólo sea interesante para aquellos cuya ST negocie grandes volúmenes).

Es tal el lío que no hay nada claro. De dónde sacan esas cotizaciones con volúmenes, qué proveedores hay, si existen y todo eso. Al final, aunque lo consigan, prohibirán un ts tan tóxico como todos los demás por principios similares. O correr a distintos sitios con un sombrero y recoger lo que caiga en él ante el péndel mágico

Bienvenido TS de una hora de duración de la transacción, es posible en varios instrumentos, parecen a nadie particularmente cepa en términos de toxicidad, pero es difícil hacer tan difícil, probablemente porque no se esfuerzan.
 
Maxim Dmitrievsky #:
Es un lío tan grande que resulta incomprensible. De dónde sacan esas cotizaciones con volúmenes, qué proveedores utilizan, si existen, y todo eso. Al final, aunque salga bien, prohibirán una TS tan tóxica como todas las demás por principios similares

Creo que fxsaber escribió que los problemas empiezan con algunas grandes rotaciones. Tal vez sus TS hayan sido víctimas de una popularidad demasiado alta entre los copistas)

 
Aleksey Nikolayev #:

Creo que fxsaber escribió que los problemas comienzan con algunas grandes rotaciones. Tal vez sus TCs han sido víctimas de una popularidad demasiado alta entre los redactores).

Cuando la cantidad se convierte en alrededor de 10k y aumenta constantemente, comienzan a prestar atención. Pero lo más habitual es que los límites sean mucho más modestos 😀 .

Hay una opción para hacerlo en cripto, pero no hay metatrader allí.

Sigue siendo un poco gracioso leer a los pringaos que piensan que si tienes una TS chula te puedes comprar un Boeing y una isla.

Aunque Saber definitivamente debería tener su propia isla, ¿quién sino él?
 

a la elección de los intervalos de entrenamiento (optimización)

podemos partir del modelo clásico Random-Walk, del que no nos hemos alejado mucho y en el que las desviaciones son ~2*sqrt(T). (dos son los restos de las tendencias)

Es notable en que
(a) es escalable (exactamente las mismas parábolas, las mismas líneas que en la captura de pantalla se mantendrá cuando se cambia a la menor TFs y ticks),
(b) vamos a comparar los resultados directa y directamente con él de todos modos
(c) tiene intervalos característicos. El mismo foco de la misma parábola.

estos son los intervalos en los que hay que orientarse.