Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 453

 

El tema ha descendido a las adivinanzas de los posos del café, al menos han traído una ciencia llamada astrología.


¿Por qué molestarse con tonterías y culpar de todo a la entrada del modelo? Se ha discutido durante casi cien páginas que sólo hay que tomar aquellos predictores que afectan a la variable objetivo. Siempre realizo datamining y nunca tengo modelos con más del 40% de error. Es cierto que los modelos con menos del 30% de error son difíciles de encontrar. Pero nunca he tenido una indignación tan grande como el 50%.

 
SanSanych Fomenko:

El tema ha descendido a las adivinanzas de los posos del café, al menos han traído una ciencia llamada astrología.


¿Por qué molestarse con tonterías y culpar de todo a la entrada del modelo? Se ha discutido durante casi cien páginas que sólo hay que tomar aquellos predictores que afectan a la variable objetivo. Siempre realizo datamining y nunca tengo modelos con más del 40% de error. Es cierto que los modelos con menos del 30% de error son difíciles de encontrar. Pero nunca he tenido una indignación tan grande como el 50%.

Porque usted tiene "caballos mezclados personas, características, la orientación, ZZ ...", mientras que la predicción de color de la vela o el retorno, a tales frecuencias (>5min), tendría sobre el mismo.

 
Dr. Trader:

Experimento. Que tal si se toman diferentes gbpusd, usdchf, usdrub, y otros símbolos populares y se usan para predecir el eurusd.

Aquí hay dos tablas en atache, train.csv y test.csv, en ellos el objetivo es el crecimiento de eurusd m5 para la siguiente barra, y los predictores son audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], etc. Hay 12 símbolos en total, los incrementos de las 3 barras anteriores de la historia se toman de cada uno de ellos. En general, todo está claro por el nombre de las columnas.
La tabla de entrenamiento tiene 10000 filas, es decir, unas 7 semanas.

Intenté entrenar un modelo y obtuve r^2 = 0,0006164161 en los datos de entrenamiento, y si redondeamos el objetivo y los resultados a las clases -1 y 1, la precisión es de 0,5052. Esto es muy malo. Pero es poco realista tomar docenas de barras para cada ejemplo de entrenamiento y docenas de personajes en sí, mi modelo en estos cientos de columnas tomará semanas para entrenar.
En el banco de pruebas, los resultados de validación del modelo son bajos, r^2 = -0,003390913 y precisión 0,4907. El azar fue, el azar es.

Pero todo es aburrido e inconcluso.
Fue interesante cuando miré los pesos que el modelo daba a cada predictor (cuanto más alto sea el peso, mejor):


Conclusión: intentar predecir la dirección del eurusd en la siguiente barra m5 es mejor utilizando en primer lugar audusd, usdrub, usdsgd

Sí, el resultado no es bueno, pero es justo y el probador tendrá la equidad pertinente, no el mismo error en el delantero 30% y Sharp Ratio +-0,5 que debe ser 10))))

Tus fichas no son nada buenas, al menos para cada instrumento unos retornos pasados con ventana exponencialmente creciente (1,2,5,10,30,60...) y mejor que cojas los minutos.

 

Para ser sincero, hace tiempo que empecé a pensar lo mismo sobre Yura Reshetov. Una vez dijo: "Me voy a ir de aquí". Me sorprendió mucho, al principio pensé que se habría unido a una organización secreta, nunca se sabe... luego el sitio web dejó de funcionar y así sucesivamente. Lástima que sea así, que descanse en paz ......

De hecho, la seriedad de su trabajo es innegable..... Pero me parece que no lo ha terminado sólo un poco..... Creo que voy a desmontar su método y atornillarlo... Bueno, veamos.....

 
tóxicos:

Porque tienes "caballos mezclados gente, fichas, targeting, ZZ...", y si estuvieras prediciendo el color de la vela o el retorno, a esas frecuencias(>5min), tendrías más o menos lo mismo.


Aquí no tengo exactamente nada mezclado: el principal problema en el datamining, la principal cantidad de trabajo.... Y lo que tienes aquí es diversión intelectual.

 
SanSanych Fomenko:

Aquí no tengo exactamente nada mezclado: el principal problema en el datamining, la principal cantidad de trabajo.... Y tú tienes algo de diversión intelectual aquí.

Sólo estoy con los predicados HFT todo en todo noble, yo estaba poniendo el conjunto de datos, y 10 min y por encima no hay nada en absoluto, en los precios en sí, necesita otros datos, macro, noticias, etc en el precio en sí cero, la eficiencia proverbial.

 
La otra es esta:

Mis prefijos HFT son todos muy respetables, he expuesto el conjunto de datos, y de 10 min en adelante no hay nada en absoluto, en los precios en sí, necesita otros datos, macro, noticias, etc. en el precio en sí cero, eficiencia notoria.

Estoy más bien de acuerdo con usted. Pero, ¿qué pasa con las personas que abren por señas, como TA, y me aseguran que ganan regularmente y con gusto?

Hay dos posibilidades: 1. que sean ilusiones y todo sea una broma, y 2. que haya algo de valor predictivo más allá de los 10 minutos.

 
No estoy seguro:

Mis predicados HFT están todos bien y dignos, he puesto un conjunto de datos, y a partir de 10 min no hay nada en absoluto, en los propios precios, necesita otros datos, macro, noticias, etc. en el propio precio cero, eficiencia notoria.

¿Tienes HFT para operar? Si no es un secreto por supuesto y "honestamente" ...

 
Vizard_:

No te asustes, hace tiempo que me río de él y de Vova, aunque Mishka los supera a todos)))
No brillar la luz y no discutir, dejar que ellos mismos)))


Así que... más..... No puedes hacer que nadie hable, no puedes hacer que nadie diga nada bueno.... Te veo riendo a la vuelta de la esquina.... ¿De qué sirve?

Probablemente lo mismo que yo. No.... Pero al menos soy divertido).

 
Vizard_:

Lo siento, Profesor))))))


Muy bien... No estoy enfadado contigo..... Sólo tengo curiosidad, ya sabes, puramente teórica..... Sólo para experimentar. Voy a enviar mi conjunto de datos de nuevo, se trata de 3 futuros, es decir, casi 9 meses de datos, usted va a construir un modelo y dar algún veredicto. Lo ideal sería ejecutar su modelo en mi ordenador, pero no insisto en ello..... Sólo por curiosidad....

Así que, eh... ¿Lo publico?