Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3012

 
Aleksey Vyazmikin #:

No, es que cuando llegué al hilo y empecé a hablar de sacar reglas de los árboles y evaluarlas os reísteis de la idea.

Hice el siguiente paso ahora - la creación de condiciones para la creación de reglas potencialmente de alta calidad a través de la estimación de las secciones cuánticas de predictor, y de nuevo me enfrento a la incomprensión total.

¿Así que sacar reglas del árbol no te hace feliz? En teoría, ahí también es cuestión de suerte, pero a costa de su número (de reglas) uno podría encontrar algo.

Es más o menos lo mismo que buscar parámetros de estrategia en un optimizador, pero de una forma más elegante.
 
Maxim Dmitrievsky #:

¿Así que sacar las reglas del árbol no te hizo feliz?

El método resultó bastante bueno, salvo por el hecho de que no hay certeza sobre la vida ulterior de las reglas con su posterior reencarnación. En intervalos largos, más del 50% de las reglas seleccionadas mostraron resultados de rendimiento positivos.

Utilicé un árbol genético, que es muy lento si la muestra contiene muchos predictores.

Así que decidí buscar formas de reducir la cantidad de información que se suministraba al árbol para el entrenamiento. Empecé a buscar formas de resaltar los datos potencialmente útiles.

Otro problema es que las hojas/reglas son muy similares en términos de puntos de activación. Y a medida que la base de hojas crecía, la singularidad era difícil de encontrar.

Como resultado, el diseño es interesante, hay algo que mejorar, pero fue extremadamente lento en mi caso. En general, no es adecuado para los experimentos, pero interesante para la aplicación, si todo el concepto de dispositivo de construcción TC está listo.

Y por supuesto - no sé R, le pregunté a los gurús locales, y nadie me podía ayudar a resolver mis tareas.

Ahora añadiría muestreo y selección forzada del predictor raíz (por lista) y bloqueo del ya utilizado.

 
Aleksey Vyazmikin #:

El método resultó bastante bueno, salvo por el hecho de que no hay certeza sobre la vida ulterior de las reglas con su posterior reencarnación. En intervalos largos, más del 50% de las reglas seleccionadas mostraron resultados positivos.

Utilicé un árbol genético, que es muy lento si la muestra contiene muchos predictores.

Así que decidí buscar formas de reducir la cantidad de información que se suministra al árbol para el entrenamiento. Empecé a buscar formas de seleccionar datos potencialmente útiles.

Otro problema es que las hojas/reglas son muy similares en términos de puntos de activación. Y a medida que la base de hojas crecía, la unicidad era difícil de encontrar.

Como resultado, el diseño es interesante, hay algo que mejorar, pero fue extremadamente lento en mi caso. En general, no es adecuado para los experimentos, pero interesante para la aplicación, si todo el concepto del dispositivo de construcción TC está listo.

Y, por supuesto - no sé R, le pregunté a los gurús locales, y nadie me podía ayudar a resolver mis problemas.

Ahora añadiría muestreo y selección forzada del predictor raíz (por lista) y bloqueo del ya utilizado.

¿Qué tiene que ver catbust? ¿Para qué lo necesitas, sacas reglas de él también?

por qué no tomar un árbol simple e ir de la raíz a la cima por reglas, dando menos peso a las reglas complejas (penalización por complejidad de las reglas)

ejecutar cada regla en un comprobador con datos nuevos, desechando de antemano las que tengan un gran error.

ZY, todavía no me gusta este enfoque intuitivamente, no he descubierto por qué todavía
 
Aleksey Vyazmikin #:

Y por supuesto, no conozco a R,

He estado escuchando eso por más de un año.

Puedes aprender R en una semana.

 
Maxim Dmitrievsky #:

¿Qué tiene que ver el catbust con esto? ¿Para qué lo necesitas, también sacas las reglas?

CatBoost es una gran velocidad para comprobar si la dirección de las ideas es correcta en primer lugar.

Puedo sacar reglas del primer árbol, pero por supuesto resultan mucho más débiles de media (las hay buenas, pero muy raramente), así que dejé esta idea por ahora. Ahora hay una forma alternativa de construir árboles, tal vez las reglas son más fuertes allí, pero no hay posibilidad de trabajar en MQL5 con un modelo de este tipo sin python.

Y en general, tengo mis propias ideas de cómo construir un modelo que es lento para crear, pero con los mismos controles que se utilizaron para seleccionar las hojas. Tal vez algún día voy a llegar a su implementación en código.

 
Maxim Dmitrievsky #:

¿por qué no tomar un árbol simple e ir de la raíz a la cima por regla, dando menos peso a las reglas complejas (penalización por complejidad de la regla)?

ejecutar cada regla en un probador con datos nuevos, desechando de antemano las que tengan un gran error.

ZY, todavía no me gusta este enfoque intuitivamente, todavía no he descubierto por qué

La diferencia es esencialmente sólo en la cantidad de datos y la carga de la CPU al aplicar el modelo.

Bueno y además, las hojas son más fáciles de ensamblar agrupando y distribuyendo pesos (yo lo llamaba un herbario :) ).

Se utilizan muchos árboles para crear reglas, lo que significa que las señales se solapan, lo que no ocurre en un solo árbol.

 
mytarmailS #:

Llevo oyendo esto desde hace más de un año.

R se puede aprender en una semana

Por lo visto, no todo el mundo tiene tanto talento.

Y el código no es sencillo - intenté rehacerlo, pero no había suficiente información en Internet para resolver el problema.

Otra desventaja de R es que no existe una solución sencilla para paralelizar cálculos entre ordenadores.

 
Aleksey Vyazmikin #:

La diferencia estriba esencialmente en la cantidad de datos y la carga de la CPU al aplicar el modelo.

Bueno y además, las hojas son más fáciles de ensamblar, juntándolas en grupos y distribuyendo pesos (yo lo llamaba herbario :) ).

Se utilizan muchos árboles para crear reglas, lo que significa que las señales se solapan, lo que no ocurre en un solo árbol.

Me doy cuenta de por qué no me gusta esta idea, porque asociación (reglas, por ejemplo) != causalidad :)

 
Aleksey Vyazmikin #:

Otra desventaja de R es que no existe una solución sencilla para paralelizar cálculos entre ordenadores.

Sí, claro.

opinión profesional de un usuario profesional de R.

 
Maxim Dmitrievsky #:

Me doy cuenta de por qué odio esta idea, porque asociación (reglas, por ejemplo) ¡ = causalidad :)

no son reglas de asociación