Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1917

 
mytarmailS:

Sí, se supone que es lo mismo que todo el mundo) La idea es modificar las características, entrenar el modelo y ver qué pasa con los nuevos datos.


¿Cómo trabajamos con los modelos ordinarios? Simplemente alimentamos x1,x2,x3,....x20 y se acabó.


Lo que hice en el último script es que - 0.82

Tomé los 31 indicadores como predictores.

luego tomé sus predicciones como predictores de segundo orden, luego tomé las predicciones de las predicciones y así 11 veces hasta que el error fue disminuyendo, obtuve 0,82 en lugar de 0,7


No sé en qué me he equivocado ((

La idea es absolutamente correcta permitiendo generar esencialmente predictores, pero hay dos sutilezas:

1. Reproducibilidad de los resultados - será necesario hacer algún tipo de conversión adicional - ¿qué obtenemos después del procesamiento - una nueva tabla?

2. Es necesario comprobar las regularidades en el período de muestreo - que la clasificación correcta sería en diferentes sitios y no se realiza en cualquier modelo de formación conocido por mí que es muy malo.

Dado que la mayor parte de mis predictores son categóricos en esencia cuantiles, quiero intentar generar predictores combinando a través de && rangos de pre-unión de predictores estadísticamente significativos.

Sobre el error, ¿cae en una muestra previamente desconocida, o en una muestra de prueba? ¿Tal vez el script tuvo en cuenta las lecturas de la muestra de prueba al generar nuevas reglas?

Ha pasado un tiempo, ¿cuál es la conclusión: el método funciona o no?

 
mytarmailS:

decidió ver cómo serían los datos típicos para el entrenamiento de NS en 3d ))

datos es de 31 indicadores, el objetivo es un zigzag

disminuí la dimensionalidad a tres dimensiones con tres algoritmos - pca, t-sne , umap (los dos últimos se consideran los más avanzados)


¿qué es? -https://en.wikipedia.org/wiki/Dimensionality_reduction

how it can help -https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%BA%D0%BB%D1%8F%D1%82%D0%B8%D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8


Así que los datos 31 indicador objetivo zigzag , primero tenemos PCA

¿Puedes publicar el guión para que los tontos como yo también puedan ver esas bonitas imágenes en sus muestras?

 
mytarmailS:

Tuve la idea de crear un hilo para discutir las funciones de destino, ni siquiera una discusión, sino más bien crear una base de datos de diferentes tipos de funciones de destino y las estadísticas sobre ellos, lo que funciona y lo que no funciona en absoluto.

¿Crees que alguien lo necesita?

La idea es buena, pero además de las ideas, sería útil tener un código abierto en MQL - el resultado sería una biblioteca.

Si ni siquiera un código, al menos un algoritmo de palabras para la reproducción.


1. predecir el precio máximo del día utilizando los datos intradía (regresión)

Por los datos internos de los días anteriores o durante el día - si es esto último, entonces al final del día el error simplemente disminuirá.

Si en un momento determinado, la muestra será pequeña.


2. en qué nivel de desglose habrá sobrevolatilidad (regresión + clasificación)

Ni siquiera sé lo que es la súper volatilidad, pero creo que sólo se trata de la tendencia o no?

Si hay muchos niveles, habrá muchas clases, lo que significa un error mucho mayor que con la clasificación binaria.

La única manera de hacerlo es utilizar un modelo diferente para cada nivel...


2. Predicción de la hora de la inversión diariautilizando datos intradiarios(clasificación).

Es esencialmente lo mismo que la previsión del precio máximo: los mismos problemas.


3. Si la primera vela era negra, ¿la tercera será blanca? (clasificación)

Debería ser muy sencillo, podríamos intentarlo.


4. marcar los niveles de soporte y resistencia y predecir el nivel a partir del cual se producirá un salto/ruptura (clasificación).

Los mismos problemas que en la segunda frase.


5. Predecir el periodo óptimo del indicador en un momento determinado (regresión).

Esto es interesante, por supuesto, dando la vuelta al propósito de utilizar el indicador.

 
Aleksey Vyazmikin:

Ha pasado mucho tiempo, ¿cuál es el resultado? ¿Funciona el método o no?

Sí, yo mismo no lo entendí, creo que sí, intente chapucear algo parecido


Hay signos x1,x2,x3 y el objetivo "Y"

hacer una predicción sobre los atributos

"Y_x1[i+1]" ~ x1+x2+x3

"U_x2[i+1]" ~ x1+x2+x3

"Y_x3[i+1]" ~ x1+x2+x3

y añadir al modelo

x1,x2,x3"U_x1" + "U_x2"+ "U_x2" y el objetivo "U"

ahora hay 6 signos.


Aleksey Vyazmikin:

¿Puedes publicar el guión para que los tontos como yo puedan ver esas fotos tan bonitas en sus muestras?

Ya lo he borrado, es divertido visualizarlo, darse el gusto... pero no sé si lo necesitas del todo... Si lo necesitas, puedo volver a escribirlo, ¿no?


Aleksey Vyazmikin:

La idea es buena, pero además de las ideas, sería útil tener un código abierto en MQL - el resultado sería una biblioteca.

Si ni siquiera un código, al menos un algoritmo de palabras para la reproducción.

Si quería demostrar que hay millones de formas de hacer predicciones, me aburro con una: el binario (arriba/abajo) o los incrementos, ¡y ya está! Ambos no funcionan, ¡pero todos se hartan!)

 
mytarmailS:

Yo tampoco lo entendí, creo que sí, prueba a hacer algo parecido en tu casa.


hay signos x1,x2,x3 y el objetivo "Y"

hacer una predicción sobre los signos

"Y_x1[i+1]" ~ x1+x2+x3

"U_x2[i+1]" ~ x1+x2+x3

"U_x3[i+1]" ~ x1+x2+x3

y añadir al modelo

x1,x2,x3"U_x1" + "U_x2"+ "U_x2" y el objetivo "U"

Ahora hay seis signos.

Sí, voy a probar mi metodología, pero todavía parece que todo va a ser muy lento de hacer - un montón de combinaciones.

¿Cuánto de esto se hace en R, con cuánto muestreo?

mytarmailS:

Ya lo he borrado, es divertido visualizarlo, sólo por diversión... pero no sé si lo necesito del todo... Si realmente lo necesitas, puedo volver a escribirlo, ¿no?

Sería interesante ver - sólo escribir más qué y cómo poner la biblioteca, por favor. Y más comentarios en el guión. Delimitador personalizable y selección de columna con destino, también columnas de exclusión :)

Por cierto, se puede hacer un despliegue de diferentes grupos de columnas en el ciclo y ver, cómo estos modelos visuales cambiarán, entonces el ahorro de imágenes debe ser realizado ...

mytarmailS:

Sí, escribí todas estas opciones sólo para mostrar que hay millones de maneras de predecir, y luego todos pegados a uno o binario (arriba / abajo) o incrementos, y eso es !!! Estoy harto de ella ... Ninguno de los dos funciona, pero todo el mundo se está hartando de ellos )

Millones de ellos...

Pruebe mi método - 1 o -1 - vector opuesto ZZ canal Doncian ha cruzado el punto de cambio de vector. Entrar en el cambio de vector, arrastrar en el canal opuesto y 0 - no entrar en el mercado - plano. Con un 40% de precisión en la clasificación de 1 y -1 habrá un beneficio.

De simple quiero implementar un objetivo primitivo con entrada correcta con 1k3 de riesgo en pips o cualquiera - el conjunto con diferente riesgo puede dar buenos resultados en conjunto, pero es teórico.

Así que, por supuesto, hay que pensar en diferentes objetivos.

 
Aleksey Vyazmikin:

Sí, voy a probar mi metodología, pero todavía parece que todo sería muy lento de hacer - un montón de combinaciones.

¿Cuánto de esto se hace en R, con cuánto muestreo?

Es muy rápido con la vectorización, pero cuando escribí un corrector para que contara por una barra, es más lento, pero sigue siendo muy aceptable.

Aleksey Vyazmikin:

Sería interesante ver - sólo escribir qué y cómo utilizar las bibliotecas, por favor. Y más comentarios en el guión. Delimitador personalizable y selección de columna con destino, también columnas de exclusión :)

Ok. Envíame un archivo con tus atributos y el objetivo, en el formato en el que lanzarás el archivo p, intentaré que funcione de forma inmediata

No es un archivo grande por favor 1000 líneas para los ojos

Sólo ten en cuenta que esto es sólo un juguete, sólo para la visualización, si quieres comprobar el modelo/signos es 10000% mejor ver el error en la prueba)
 
mytarmailS:

Es muy rápido con la vectorización, pero cuando escribí un comprobador para que contara un compás a la vez, es más lento, pero sigue siendo muy aceptable.

Hm, interesante - si crees que puedes, deja el script, puede ser realmente útil. Ahora estoy haciendo un grupo muy grande de nuevos predictores, y necesito buscar de alguna manera una conexión entre ellos - sinergia, tal vez la mayoría de ellos tendrá que ser desechada...

mytarmailS:

Ok. Envíame el archivo con tus rasgos y el objetivo, en el formato en el que lanzarás el archivo p, intentaré que funcione fuera de la caja

Pero no un archivo grande, por favor. 1.000 líneas son suficientes.

La cosa es que los formatos pueden cambiar - así que no seas tacaño con los comentarios :)

Una variante de la más utilizada.

Archivos adjuntos:
 
mytarmailS:

tiempo o ignorarlo?

Ignóralo, así como las últimas columnas con el resultado financiero. El momento está en los predictores.

 
Aleksey Vyazmikin:

Ignorar, así como las últimas columnas con el resultado financiero. El momento está en los predictores.

Sí, sí, ya lo he visto)

 

En cuanto al objetivo, creo que debería cambiarse cuando no hay forma de cambiar los datos de entrada, como dije en el vídeo. Cuando los datos se recogen y no hay manera de cambiarlos. De lo contrario, si tiene una variedad de variables de entrada, debe tomar el objetivo por defecto y profundizar en los datos de entrada.

No hay que olvidar que si el objetivo contiene deliberadamente errores y mejora la curva de aprendizaje, el modelo también cometerá errores de acuerdo con el objetivo. IMHO