Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 99

 
DAFomenko:

La clasificación no es una panacea ni una herramienta para hacer el grial.

Lo primero que hace la aplicación de la clasificación es aplicar las herramientas a los problemas a los que son aplicables. Por ejemplo, se ha discutido muchas veces la idea de aplicar el análisis espectral a los mercados financieros, que parece una gran herramienta, pero para otros objetos, ah, no, se ofrece de nuevo.

Segundo. La clasificación es bastante aplicable a los mercados financieros, pero hay muchos problemas, como se ha escrito anteriormente. Pero en la clasificación podemos poner el problema principal: el problema del reentrenamiento (overfitting) del ST. ¿Qué puede ser más importante? No es agradable, por supuesto, verse privado de la ilusión de tener un grial favorito, pero ahí está la elección: la felicidad es buena, pero la verdad es mejor...

Tercero. La clasificación plantea la pregunta de forma muy concreta: ¿qué estamos prediciendo? Comparémoslo con el AT. Tomamos indicadores. Siempre es una barra [1]. La barra actual no se utiliza. ¿Qué significa para el H1? Utilizamos la información de frescura por hora para predecir la entrada en el mercado. Esto es en el mejor de los casos.

Esto es completamente diferente en la clasificación. Se toma el valor actual de la variable objetivo y se compara con los datos brutos de ayer, desplazando el objetivo en una o varias barras. Utilizando un modelo ajustado a esos datos, siempre se puede predecir de forma realista el futuro cuando llegue la siguiente barra.

PS.

Si vas a utilizarlo para predecir movimientos bruscos del mercado (noticias), tendrás éxito si consigues generar una variable objetivo, y eso es un gran problema en casos mucho más sencillos.

Suscribo todo esto.

No sé sobre el espectro, nunca lo he usado.

Segundo. La clasificación es bastante aplicable a los mercados financieros, pero hay muchos entresijos, como se ha escrito anteriormente. Pero a la hora de clasificar se puede poner el problema principal: el problema del reentrenamiento (overfitting) del ST. ¿Qué puede ser más importante? No es agradable, por supuesto, que te priven de la ilusión de tener tu grial favorito, pero ahí está la elección: la felicidad es buena, pero la verdad es mejor...

¡Ahí, ahí! Sólo tenemos un problema: la sobreeducación. Y eso pesa sobre todos. La otra cara de la moneda es la infraeducación (y los malos resultados en todas partes).

Te he puesto unos gráficos preciosos aquí, incluido el de Montecarlo. Básicamente, he llegado a la conclusión de que he ajustado los datos a un segmento fuera de la muestra sin entrenar el modelo(s) en él. Parece que los modelos pasan bien fuera de la muestra. Pero el problema es que hasta que no pueda ver el fuera de muestra, NO puedo seleccionar un modelo de trabajo. Es una pena.

 
Alexey Burnakov:


¡Ahí, ahí! Sólo tenemos un problema: el reciclaje.

En cuanto a mí, el problema es justo lo otro, ya sabes.......
 
mytarmailS:
Creo que el problema es algo totalmente distinto, ya sabes.......
Es que hay mucho en juego. Y cuando los datos, los predictores y los modelos están listos, se alinea el diseño del experimento. Queda por comprobar si el modelo se reentrena o no, y sí tiende a reentrenarse. (Es mi experiencia).
 
Yuri Evseenkov:

L ¿Qué soy, un médico? Aquí está escribiendo Sanych:

"Aquí estamos hablando de predicciones basadas en la clasificación, que no tienen en cuenta el estado anterior a la hora de predecir el siguiente compás. Las predicciones (pronósticos) basadas en la clasificación son predicciones basadas en patrones. Y si hubo noticias en el pasado que provocaron un cambio que NO se desprende de los valores anteriores (no extrapolados), entonces la clasificación captará ese cambio como tal y si hay un cambio similar en el futuro (no exactamente igual, pero sí similar) se reconocerá y se hará una predicción correcta. "

Así que creo que vale la pena indagar en esa dirección :"la clasificación captará tal cambio como tal" .

Tiene toda la razón al principio. Por fin aparecieron personas sensatas en la sucursal. Sí, la clasificación estima una pauta relativa a la veracidad o a la falsedad, o dice no sé, como sugirió Reshetov. Y la pauta en sí tiene un componente predictivo; lo importante no es la pauta en sí, sino la reacción del mercado ante ella. Y si esta reacción es idéntica a la del entrenamiento, la red sacará la conclusión correcta. Así que es como esto....
 
Mihail Marchukajtes:
Por fin hay gente sensata en el hilo.
¿Lo has pensado bien?
 
mytarmailS:
¿has pensado bien esto?
Siempre lo hago. Pensar mal no funciona :-)
 
Mihail Marchukajtes:
Siempre lo hago. Pensar mal no funciona :-)

de ninguna manera

 
Alexey Burnakov:

Te he colgado unos bonitos gráficos aquí, incluido el de Montecarlo. Básicamente, he llegado a la conclusión de que he ajustado los datos a un segmento fuera de la muestra sin entrenar el modelo(s) en él. Parece que los modelos pasan bien fuera de la muestra. Pero el problema es que hasta que no pueda ver el fuera de muestra, NO puedo elegir un modelo que funcione. Es una pena.

¿Has probado el comité? Si gbm se entrena varias veces con los mismos parámetros en los mismos datos, el resultado en los nuevos datos será ligeramente diferente cada vez. Si eliges un modelo al azar, tal vez tengas suerte y la operación salga bien, o tal vez no, no puedes adivinarlo. En este caso, deberá entrenar docenas (¿cientos?) de modelos y el resultado final será el predicho por la mayoría de los modelos.

Por ejemplo: En la parte izquierda está la simulación de los resultados comerciales de 100 modelos. Se puede ver que tomando sólo un modelo se tiene casi un 50% de posibilidades de perder.
En el lado derecho se negocia por la decisión del comité de estos modelos, sin aleatoriedad, todo es claro y casi estable hacia arriba.

 
mytarmailS:

el experimento es el criterio de la verdad - no pienses, haz

Personalmente, creo que el análisis espectral es más prometedor, pero eso es sólo cosa mía...

¿Por qué no lo piensas primero? Incluso un lobo piensa si perseguir una liebre flaca o no. A veces se desperdicia más energía de la que se gana con la presa.
 
DAFomenko:

Lo primero que hace la aplicación de la clasificación es aplicar las herramientas a los problemas a los que son aplicables. Por ejemplo, la idea de aplicar el análisis espectral a los mercados financieros se ha discutido muchas veces, todas ellas aparentemente grandes herramientas, pero para otros objetos, ah, no, de nuevo se propone.

Segundo. La clasificación es bastante aplicable a los mercados financieros, pero hay muchos problemas, como se ha escrito anteriormente. Pero en la clasificación podemos poner el problema principal: el problema del reentrenamiento (overfitting) del ST. ¿Qué puede ser más importante? No es agradable, por supuesto, verse privado de la ilusión de tener un grial amado, pero ahí está la elección: la felicidad es buena, pero la verdad es mejor...

Tercero. La clasificación plantea la pregunta de forma muy concreta: ¿qué estamos prediciendo? Comparémoslo con el AT. Tomamos indicadores. Siempre es una barra [1]. La barra actual no se utiliza. ¿Qué significa para el H1? Utilizamos la información de frescura por hora para predecir la entrada en el mercado. Esto es en el mejor de los casos.

Esto es completamente diferente en la clasificación. Se toma el valor actual de la variable objetivo y se compara con los datos brutos de ayer: se desplaza el objetivo una o varias barras. Cuando se utiliza un modelo ajustado a estos datos, siempre se predice de forma realista el futuro cuando llega la siguiente barra.

Si va a utilizarlo para predecir movimientos bruscos del mercado (noticias), entonces tendrá éxito si puede generar una variable objetivo, lo cual es un gran problema en casos mucho más simples.

¿Es usted pariente de Sanych?

Sí, lo soy. El clasificador bayesiano ingenuo, como filtra el spam, ¿funcionará aquí o no?

En cuanto a las noticias, ¡ni hablar! Algunas noticias estarán tan recalificadas en todas las grietas que será un verdadero desastre. He dado ejemplos.