Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3091

 
mytarmailS #:

según tengo entendido hay 4 parámetros a optimizar

  • p_bo ( probabilidad de sobreentrenamiento en el backtest) debe ser cercana a 0, lo que indica un bajo riesgo de sobreentrenamiento.
  • slope ( coeficiente de pendiente de la regresión lineal) debe ser cercano a 1, lo que indica una fuerte relación lineal entre los valores de la métrica de rendimiento para los subconjuntos de entrenamiento y prueba.
  • ar^2 ( coeficiente de determinación ajustado) debe ser cercano a 1, lo que indica una buena precisión de la regresión lineal.
  • p_loss (la proporción de valores de la métrica de rendimiento para el subconjunto de prueba que están por debajo de un umbral determinado) debe estar cerca de 0, lo que indica que la mayoría de los valores de la métrica de rendimiento para el subconjunto de prueba están por encima de un umbral determinado.

Sin embargo, hay que tener en cuenta que estos valores pueden depender de la métrica de rendimiento elegida y del valor del umbral

Demasiado corto para entender qué son estos parámetros. aquí hay más del artículo página 13 (si el paquete reproduce completamente los métodos del artículo, pero quizás algo más añadido/sustraído)

Overfit statistics
El marco introducido en la Sección 2 nos permite caracterizar la fiabilidad-
bilidad delbacktest de una estrategia en términos de cuatro análisis complementarios:
1. Probability of Backtest Overfitting (PBO): La probabilidad de que laconfiguración del modelo
seleccionada como óptima IS tenga un rendimiento inferior al me-
diano de las N configuraciones del modelo OOS.
2. Degradación del rendimiento: Determina hasta qué punto un mayor per-
formance IS conduce a un menor rendimiento OOS, un hecho asociado
a los efectos de memoria analizados en Bailey et al. [1].
3. Probabilidad de pérdida: La probabilidad de que el modelo seleccionado como óptimo
IS produzca una pérdida OOS.
4. Dominancia estocástica: Este análisis determina si el pro-
cesoutilizado para seleccionar una estrategia IS es preferible a elegir al azar
una configuración de modelo entre las N alternativas.

A continuación se analiza cada punto con más detalle.

 
Forester #:

Es demasiado corto para entender lo que estos parámetros son. aquí hay más de la página 13 del artículo (si el paquete reproduce completamente los métodos en el artículo, pero tal vez algo más fue añadido / restado).

el paquete es simplemente horrible, nunca he visto tal partak en años

el código es terrible

la documentación es prácticamente inútil

no entiendo como llegó a CRAN.


Todavía no puedo entender, ¿hay un sistema de comercio se investiga dividido en lotes o se trata de varios TS (en esta biblioteca)?

 
mytarmailS #:

Todavía no puedo entender, hay un sistema de comercio se estudia dividido en lotes o se trata de varios TS (en esta biblioteca).

Selección del mejor modelo entre un conjunto de modelos obtenidos con diferentes parámetros/hiperparámetros. La entrada es una matriz, donde cada columna es una previsión de uno de los modelos.

O tal vez no. Yo tampoco lo he averiguado todavía
 
Forester #:

Selección del mejor modelo entre el conjunto de modelos obtenidos con diferentes parámetros/hiperparámetros. La entrada es una matriz en la que cada columna es una predicción de uno de los modelos.

Esto ya lo he resuelto.

No entiendo cómo trabajar con el resultado

Doy una columna (una TS)

resultado

summary(my_pbo)
Performance function Omega with threshold 1

  p_bo  slope   ar^2 p_loss 
0.0000 2.2673 0.9700 0.3710 

doy 5 columnas (cinco CT)

También obtengo una fila.

summary(my_pbo)
Performance function Omega with threshold 1

     p_bo     slope      ar^2    p_loss 
0.3428571 1.9081000 0.0440000 0.2860000 

Debería haber 5 filas, o si es el resultado de la mejor TS, debería haber un mndex de la mejor....


Mataría a este autor

 
Forester #:

Selección del mejor modelo entre el conjunto de modelos obtenidos con diferentes parámetros/hiperparámetros. La entrada es una matriz en la que cada columna es una predicción de uno de los modelos.

O tal vez no. Yo tampoco lo he averiguado todavía

Se puede interpretar como tomar los retornos de beneficios TS de diferentes secciones de mercado (parámetros /hiperparámetros) ????



diferentes secciones de mercado == parámetros/hiperparámetros?

 
mytarmailS #:

Puede interpretarse como la obtención de beneficios de TC de diferentes partes del mercado (parámetros/hiperparámetros ) ????

Exactamente profit retournals.

mytarmailS #:

diferentes partes del mercado == parámetros/hiperparámetros?

Como entendí exactamente ajustes: diferentes períodos de MA, SL, etc..

 
mytarmailS #:

También recibo una línea

Debería haber 5 líneas, o si es el mejor TC, debería haber un mndex de los mejores...

Como resultado, se obtiene la evaluación global del modelo (y probablemente de los datos predictores y objetivo)
Un mal modelo da tales resultados (sólo el 17% de los resultados OOS por encima de 0).

Un buen modelo - 95% de resultados OOS por encima de 0

 
Forester #:

Son los retornados los que han llegado.

Ya sabes, ganancias y pérdidas, ¿verdad?

Así que tomamos los retornados de los estados cuando la posición está abierta.

Forester #:

Como yo lo entiendo, es la configuración: diferentes períodos de MA, SL, etc.

En lugar de diferentes ajustes de la TS, sólo voy a tomar el comercio en diferentes áreas, creo que se puede equiparar.

 
mytarmailS #:

ya sabes, pérdidas y ganancias, ¿verdad?

Así que tomamos retournals de esos estados cuando la posición está abierta.

Si.

mytarmailS #:

en lugar de diferentes configuraciones de TS solo tomare operaciones en diferentes secciones, creo que se puede equiparar.

No estoy seguro.

Y en general. leer el artículo para entender lo que está haciendo, hay limitaciones. Por ejemplo, es necesario dar obviamente ajustes exitosos, no -1000000 a +1000000. Si usted da todo en una fila, el promedio de OOS estará en la parte inferior y no tiene sentido comparar con él. Un rango muy estrecho de 0,95...,0,98 también es malo desde el punto de vista de la RD: los resultados serán muy parecidos.

 
Forester #:

no estoy seguro.

Y en general. leer el artículo para entender lo que está haciendo, hay limitaciones. Por ejemplo, es necesario dar obviamente ajustes exitosos, no -1000000 a +1000000. Si usted da todo en una fila, el promedio de OOS estará en la parte inferior y no tiene sentido comparar con él. Un rango muy estrecho de 0,95...,0,98 también es malo - los resultados serán muy parecidos.

Entiendo que usted debe presentar un TS rentable y no cualquier cosa....


Ya he esbozado el algoritmo para probar esto, pero sólo hay un matiz con las métricas


¿Debo optimizar las 4 + 1 métricas?

 p_bo      slope       ar^2     p_loss 
 0.1666667  2.1796000 -0.2100000  0.1670000 
+

прибыль


O sólo

 p_bp  + прибыль