Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 92

 
Vizard_:
OK)))) pero lee las condiciones cuidadosamente -
" resultados posteriores en % (casos predichos con éxito) para ambas muestras (tren = xx%, prueba = xx%). No es necesario especificar métodos y modelos, sólo números".
Estamos esperando más resultados. Me pregunto qué conclusiones sacará Mihail Marchukajtes.

mi resultado (si lo deseas, te doy también el método):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

El 56% en formación:

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

52% en la prueba:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
De todos modos, el nivel máximo de generalización es de alrededor del 53%, así que..... De vez en cuando aparece Garbage in Garbage Out, es decir, basura.... No puedo comprobarlo en el examen porque Excel no admite fórmulas largas. No quiero escribir por ello en MKUL, si el modelo fuera de calidad normal lo intentaría, pero con tal porcentaje de generalización, creo que el resultado no será muy bueno en el examen...
 
mytarmailS:
No entiendo cómo se calcula esta "previsibilidad" y si tiene algún sentido si no se tiene en cuenta el objetivo

Existen fórmulas para estimar el nivel de ruido de la señal, o viceversa. Cómo y qué calculan estas fórmulas, sólo el autor lo sabe, sólo podemos confiar en que sabe lo que hace.
La conclusión es bastante sencilla: si los predictores en sí no son "ruido", es más fácil predecir algo con ellos. Y si los procesas de alguna manera, puedes obtener una señal aún más estable. Una señal estable es una buena base para una previsión.

Incluso puede estimar rápidamente los predictores usted mismo utilizando la función Omega() de este paquete y aplicarle los valores de algún predictor en particular (una columna de la tabla de entrenamiento). El resultado es 0% - ruido y el predictor es inútil. 100% - todo está bien, el predictor puede ser utilizado.
Supongo que no debemos introducir los valores puros del indicador en la función, sino su incremento, por ejemplo, para una media móvil - c(MA[0]-MA[1], MA[1]-MA[2], MA[2]-MA[3], etc.).

En cuanto a los valores objetivo, sí, no se utilizan en el paquete. Este paquete no puede predecir nada. Sólo determina de alguna manera en qué predictores se puede confiar y en cuáles no, y crea otros nuevos basados en ellos. La selección de la variable objetivo y el entrenamiento del modelo predictivo deben tratarse de forma diferente. Es lógico que algunas variables objetivo puedan predecirse mejor y otras peor.
La variable de destino es un problema para cualquier paquete. Ni siquiera es seguro que la variable objetivo utilizada pueda predecirse con los predictores disponibles. Por ejemplo, puedo utilizar "subida/bajada del precio en la siguiente barra" o "subida/bajada en zigzag" para la variable objetivo. Me gustaría aprender a crear nuevas variables objetivo para que se ajusten mejor a los predictores disponibles. Quién sabe, tal vez podría predecir perfectamente un pinchazo con mis predictores, pero nunca lo sabré porque no lo he probado.

 
Como tengo entendido que nadie lee las condiciones (se permite cualquier manipulación de datos), no voy a torturar. De hecho, todo es sencillo.
Sólo tengo que tomar los lags de A6, aplicar una fórmula simple siete menos que quinto y obtener el 100% en ambas muestras. Gracias a todos. Buena suerte...
 
Vizard_:
Como tengo entendido que nadie lee las condiciones (se permite cualquier manipulación de datos), no voy a torturar. De hecho, todo es sencillo.
Sólo hay que tomar los rezagos de A6, aplicar una fórmula simple séptima menos quinta y obtener el 100% en ambas muestras. Gracias a todos. Buena suerte...
¿Y cuál es la trampa? Yo también puedo codificar una variable de salida en un montón de basura de entrada como esa. Nunca lo adivinarías. Todavía no sé qué sentido tiene esto.
 
Mihail Marchukajtes:
¿Qué gracia tiene eso? También puedo codificar una variable de salida en un montón de basura de entrada. No podrás adivinarlo. Todavía no sé qué sentido tenía eso.
Llamó la atención sobre el hecho de que la cantidad de datos utilizados no siempre es suficiente para la predicción. Por ejemplo, si nos limitamos a 9 compases, podríamos perder información importante de compases más lejanos. Y también que no podemos evaluar un predictor sin tener en cuenta sus interacciones con otros predictores.
 
Mihail Marchukajtes:
¿Qué gracia tiene eso? También puedo codificar una variable de salida en un montón de basura de entrada. No podrás adivinarlo. Sigo sin entender el sentido de esto.
Que no se puede ver el topo, pero sí).
Venga, vamos a probarlo. Una simple.
 
Vizard_:
En eso no se ve el topo, pero está ahí)))
Venga, vamos a intentarlo. Una simple.
Vamos, voy a pensar en algo....
 
Por ejemplo, este archivo. El tren Chitso no necesita hacer ninguna prueba. El optimizador de Reshetov muestra la basura o el 56%, pero el topo también está ahí. ¿Quién puede encontrar....? Realmente no veo el punto de estos juegos cuando la salida se hace de la transformación de la entrada, aquí y la red no será necesario.... así que eso es todo....
 
Mihail Marchukajtes:
Bueno, por ejemplo, este archivo. El tren Chitso no necesita hacer ninguna prueba. El optimizador de Reshetov muestra la basura o el 56%, pero el topo también está ahí. ¿Quién puede encontrar....? Realmente no veo el punto de estos juegos cuando la salida se hace de la transformación de la entrada, no habrá necesidad de la red ya sea.... así....
Me jode que en este foro no se pueda adjuntar un simple archivo rar.... Es patético en una palabra....
Archivos adjuntos: