Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1778

 
Dmitry:

¿Y la capacidad de predicción está determinada por cómo?

Bueno, no por correlación...

tal vez por correlación cruzada a través de la estimación del rezago...

Dimitri:

¿Metiendo todo en la maqueta a lo tonto?

¿Por qué no? En la formación, la validación cruzada eliminará lo que no es necesario, o algunas estadísticas...

¿Cómo saber "qué es qué"? ¿Cómo se sabe "qué es qué" hasta que se comprueba?

 
Aleksey Vyazmikin:

Todavía no has dicho cómo comerciar con ello, así que no sé qué tipo de TS inventar.

¿Cómo? Es obvio)) ZZ arriba significa comprar, abajo significa vender.

Predecirías la dirección de ZZ, ¿no?

 
mytarmailS:

no por correlación...

tal vez por correlación cruzada a través de la estimación del rezago...

¿Por qué no? La validación cruzada eliminará lo que no se necesita en la formación, o algunas estadísticas...

¿Cómo saber "qué es qué"? ¿hasta que lo pruebes?

Bueno, hablaría largo y tendido sobre el problema de la redundancia, especialmente relevante para NS, pero me da pereza.

Por cierto, este problema suele ser la causa de la escasa capacidad de predicción del modelo

 
mytarmailS:

¿Cómo? Es obvio)) ZZ arriba es una compra, abajo es una venta.

Estás prediciendo la dirección de ZZ, ¿verdad?

Eso resultaría ser un tic, probablemente.

¿Has probado a promediar/alisar el indicador de clasificación con la ventana para eliminar los valores atípicos?

 
Aleksey Vyazmikin:

Esto resultará ser un tic, probablemente.

¿Has probado a promediar/alisar el indicador de clasificación con la ventana para eliminar los valores atípicos?

En este caso, el promedio es igual al retraso. Hay que mejorar la calidad de la clasificación, el suavizado no es una opción.

Pruébalo tal cual.

Dmitriy:

Bueno, hablaría largo y tendido sobre el problema de la redundancia, especialmente relevante para NS, pero me da pereza.

Por cierto, este mismo problema suele ser la causa de la escasa capacidad de predicción del modelo

Por eso creo que en esta dirección, los signos pueden ser ya entrenados por AMO o reglas de trabajo, esos signos deben ser cualitativos, información comprimida y mi mini experimento en la página anterior lo demostró.

Sigo sin entender cómo predecir la correlación (no lo sé).

 
mytarmailS:


Y lo de predecir por correlación aún no lo entiendo(

Previsión de nuevo....

El coeficiente de correlación ayuda a identificar de antemano los predictores más significativos: cuanto mayor sea la correlación entre la variable dependiente y el predictor, más significativa será esa variable para el modelo.

Así que, en tu ejemplo, hay dos maneras de hacerlo. La primera, la suya, consiste en sustituir un predictor cada vez en el modelo y ver cuánto mejora la precisión de la predicción. Eso es mucho tiempo.

La segunda, utilizar el coeficiente de correlación para descartar de antemano los predictores sin importancia que ensucian el modelo.


El problema de la redundancia es que se pueden añadir 100+1 nuevos predictores al modelo, pero 100 predictores añadirán un 0,01% a la calidad del pronóstico, mientras que 1 añadirá un 10%. Y no tiene sentido sobrecargar el modelo con esos 100 nuevos predictores - overfitting

 
mytarmailS:


Y por cierto, en un gran número de predictores el árbol es una mierda, el bosque aleatorio manda

 
Dmitry:

Previsión de nuevo....

El coeficiente de correlación ayuda a identificar de antemano los predictores más significativos: cuanto mayor sea la correlación entre la variable dependiente y el predictor, más significativa será esa variable para el modelo.

Así que, en tu ejemplo, hay dos maneras de hacerlo. La primera, la suya, consiste en sustituir un predictor cada vez en el modelo y ver cuánto mejora la precisión de la predicción. Eso es mucho tiempo.

En segundo lugar, utilice el coeficiente de correlación para descartar de antemano los predictores sin importancia que ensucian el modelo.

Bueno, la correlación es sólo una de las opciones de cribado y definitivamente no es la mejor... También se puede utilizar la cointegración, la correlación cruzada, la correlación no lineal, etc., y será aún mejor, pero todos ellos están jerárquicamente por debajo del simple error de clasificación, por eso elegí el criterio del error de predicción de un rasgo

Dimitri:

Y por cierto, en un gran número de predictores el árbol es una mierda, el bosque aleatorio manda

Estoy parcialmente de acuerdo, pero en términos generales el bosque es la misma regla, la única diferencia es la complejidad.

Existe un paquete en R que puede comprimir un bosque de 200 árboles en una o tres reglas eliminando todo lo innecesario y superfluo, la pérdida de calidad de la clasificación es del 0,5-2%, esto es una compresión de información a la que debemos aspirar + interpretabilidad

 
mytarmailS:

En este caso, promediar equivale a retrasar. Hay que mejorar la calidad de la clasificación, el suavizado no es una opción.

Pruébalo tal cual.

No es una opción. Hay demasiado atasco en el piso.

Por supuesto, puede desplazar el umbral de activación 0,65 - compra, 0,35 - venta.


 
Aleksey Vyazmikin:

Eso no es una opción. Hay demasiado acaparamiento en el piso.

Por supuesto, podría cambiar el umbral de activación a 0,65 - compra, y 0,35 - venta.

Muéstrame un gráfico con operaciones