Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 257

 

Estoy un poco confundido.

Hay un precio. Tomo las últimas 200 barras, intento entrenar un modelo en ellas para dos clases (compra/venta). Puedo entrenar cualquier cosa, incluso un bosque, incluso una neurona, pero será inútil, porque si imaginamos todos los ejemplos de entrenamiento como puntos en un espacio de 200 dimensiones, entonces ambas clases están mezcladas de manera uniforme allí y los intentos de separarlas con hiperplanos no son lo suficientemente precisos.

Ahora una opción mejor - todo tipo de fondos de cobertura crean nuevos predictores (indicadores, clusters, algunas fórmulas, y lo que sea) basados en el precio. Y sobre estos nuevos predictores se entrena el mismo modelo que en el primer punto, pero en este caso se corta el colín.

Por lo tanto, en el segundo caso no se forma ni se añade ninguna información nueva, sino que se trata de los mismos puntos en el espacio de 200 dimensiones, que se han desplazado en un espacio menor. Es decir, una reducción dimensional tan peculiar, acercando puntos de la misma clase en el espacio. Pero los modelos de aprendizaje automático también lo hacen, también utilizan sus algoritmos para reducir la dimensionalidad y acercar las clases. ¿Cuál es la diferencia entre estos dos métodos?

Por qué si se aproximan puntos en el espacio de forma semiautomática, con diferentes trucos, y luego se entrena el modelo, entonces funciona. Pero si se confía en que el propio modelo funcione con el espacio original, entonces falla... Se trata de operaciones similares en ambos casos.

 
Dr.Trader:

Ahora una mejor opción - todo tipo de fondos de cobertura crean nuevos predictores (indicadores, clusters, algunas fórmulas, y cualquier otra cosa) basados en el precio. Y sobre estos nuevos predictores se entrena el mismo modelo que en el primer punto, pero en este caso se pica el colín.

...

Por qué, si se aproximan los puntos en el espacio de forma semiautomática, con varios trucos, seguido de la enseñanza del modelo, entonces funciona. ¿Y si confías en que el modelo funcione con el propio espacio original, falla? Son operaciones similares en ambos casos, ¿no?

¿No tienes en cuenta que los grandes participantes del mercado mueven el precio?
 
Dr.Trader:

Estoy un poco confundido.

Hay un precio. Tomo las últimas 200 barras, intento entrenar un modelo en ellas para dos clases (compra/venta). Puedo entrenar cualquier cosa, incluso un bosque, incluso una neurona, pero será inútil, porque si imaginamos todos los ejemplos de entrenamiento como puntos en un espacio de 200 dimensiones, entonces ambas clases están mezcladas de manera uniforme allí y los intentos de separarlas con hiperplanos no son lo suficientemente precisos.

Ahora una opción mejor - todo tipo de fondos de cobertura crean nuevos predictores (indicadores, clusters, algunas fórmulas, y lo que sea) basados en el precio. Y sobre estos nuevos predictores se entrena el mismo modelo que en el primer punto, pero en este caso se corta el colín.

Por lo tanto, en el segundo caso no se forma ni se añade ninguna información nueva, sino que se trata de los mismos puntos en el espacio de 200 dimensiones, que se han desplazado en un espacio menor. Es decir, una reducción dimensional tan peculiar, acercando puntos de la misma clase en el espacio. Pero los modelos de aprendizaje automático también lo hacen, también utilizan sus algoritmos para reducir la dimensionalidad y acercar las clases. ¿Cuál es la diferencia entre estos dos métodos?

Por qué si se aproximan puntos en el espacio de forma semiautomática, con diferentes trucos, y luego se entrena el modelo, entonces funciona. Pero si se confía en que el propio modelo funcione con el espacio original, entonces falla... Al fin y al cabo, se trata de operaciones similares en ambos casos.

¿Por qué necesitamos el modelo en principio?

¿Por qué necesitamos filtros diferentes en la ingeniería de radio, y también en la econometría? Suavizar y así sucesivamente ....

La estadística es una ciencia muy astuta: se puede caer fácilmente en un juego de números. A cualquier paso.

Si ha definido una variable objetivo, entonces debe hacer coincidir los predictores con esa variable objetivo, no cualquier predictor, sino sólo aquellos que son DEFINITIVAMENTE relevantes para esa variable objetivo. Observe siempre el predictor e intente responder a la pregunta: "¿qué propiedad o rasgo refleja este predictor mío en mi variable objetivo? Y de todos modos: ¿qué tiene que ver el predictor con los mercados financieros?

Por ejemplo, el RSI: parece reflejar los mercados de sobrecompra/sobreventa. Se relaciona claramente con las reversiones. Y así sucesivamente.

O recordemos a Burnakoff (según tengo entendido, el hombre ha sido expulsado del lugar por las inundaciones): los incrementos con rezagos bastante grandes son un indicador de la periodicidad.

Y hablando en general, es necesario formular un modelo general y verbal del mercado financiero.

Hindiman (paquete de previsiones), por ejemplo. En su opinión, el mercado consiste en:

  • tres variedades de tendencia
  • tres tipos de ruido
  • La ciclicidad, que tiene un período constante, que es coherente con los datos de producción, como la producción agrícola.
Probablemente no sea el único enfoque. Pero es la certeza, no el ruido

Con este enfoque, marcarás los posos del café, los anillos de Saturno (ver lista de astrólogos)...

Y tampoco hay que olvidar el azote de los datos financieros, llamado "no estacionariedad".

Y tampoco hay que olvidar que los modelos para los mercados financieros casi siempre resultan estar sobreentrenados.

¿Hemos ganado todos? Vamos a fumar bambú...

 
Dr.Trader:

Estoy algo confundido.

1) ¿quizás porque las fundaciones no lo hacen?

2) tienes que entender lo que es el mercado, aunque a tu manera...

3) hay que saber claramente de quién y por qué hay que coger dinero, hay que tener una idea propia y específica

4) todo el MO y demás... esto es sólo un conjunto de herramientas para describir su idea específica, pero no la idea en sí, y así es como la mayoría de la gente en esta rama piensa que el MO llegará por sí mismo

No importa lo pomposo que suene, pero he conseguido hacer previsiones de mercado más o menos adecuadas y tengo un algoritmo bastante complicado, tarda unos 6 minutos en calcular una vela, pero algunos elementos básicos serán reescritos en C++

Y el resultado calculado por este complejo algoritmo tiene que ser analizado con mis ojos - no es automático sino semiautomático, pero en un futuro próximo intentaré reemplazar mi análisis visual con algún MO para el reconocimiento de patrones, por cierto, reconoce muy bien el MO a diferencia de la previsión.Usé mis ojos para mirar a través de cada salida y decir: "Esto lo considero una señal de compra y esto no lo considero una señal", creé el objetivo de acuerdo a mi visión, fue un experimento, porque no hice muchos datos con el objetivo todavía... Tenía 100 objetivos y 50 controles y entrené a un Forest normal y ¿qué te parece? Forest reconoció el 90% de la nueva muestra

 

Buenas tardes, Tarea:

- Hay una matriz de valores X,Y,Z;

- Tomemos una porción - por X de 1 a 1000 en n-ésimo Y:

-Hay algunos puntos de mínimos y máximos. Si cortamos por X, cualquier valor >1 es importante.

Qué manera de mirar para recrear el cálculo del tipo de pesos con respecto a los ejes.

Es decir, empezar a medir el objeto.

Si se recibió una señal en la celda x-55 y-163, la tarea consiste en determinar el valor (peso) del punto en relación con los ejes X e Y (posiblemente a lo largo de la diagonal), para sentir la posición del punto en el objeto.

Creo que hay que mirar hacia las principales características estadísticas, la dispersión, las medianas, la moda, la asimetría.

En general es necesario comenzar a medir el objeto de alguna manera, cada unidad en relación con los demás, también que en los valores de un punto en el objeto se tenga en cuenta la presencia de otros objetos.

Archivos adjuntos:
eiova.jpg  382 kb
1.jpg  320 kb
 
Top2n:

Buen tiempo, Tarea:

¿Puedes mantenerlo simple? No sé lo que estás tratando de hacer.
 
SanSanych Fomenko:


Gracias, entiendo algo.

Los modelos se limitan esencialmente a dividir de forma óptima el espacio de los predictores en dos subespacios: clase-compra y clase-venta.
Si empezamos a crear nuevos predictores de forma aleatoria y durante mucho tiempo, podemos ayudar un poco al modelo, hacer nosotros mismos parte de su trabajo. Pero no tiene por qué dar mayor estabilidad y previsibilidad, sólo puede ayudar a que el modelo haga su trabajo en menos iteraciones, y realmente no hay tanta utilidad en esa operación como nos gustaría.

Pero esas operaciones que mencionas -limpieza de ruido, suavizado, tendencia, etc.- no se limitan a crear predictores que se ajusten al modelo. Se trata de la creación de predictores que describen de alguna manera los procesos internos del mercado.
He mirado diferentes estrategias de trabajo antiguas, siempre tienen algunas constantes - si MA, entonces 21, si RSI, entonces 14. Todas estas constantes e indicadores construidos con ellas no sólo ayudan al modelo a clasificar los datos más fácilmente, sino que también tienen algunas propiedades que describen los procesos internos del mercado. Además, las diferentes constantes en las fórmulas de los predictores son algunos datos nuevos, por lo que añadimos nueva información a los datos originales.

Resulta que si se empieza a generar nuevos predictores de forma irreflexiva, sólo ayudarán al modelo a obtener una mayor precisión en el entrenamiento, pero no ayudarán a describir los procesos dentro del mercado, y por tanto las predicciones con ellos son poco fiables. Así que hay que generarlos pensando mucho, estoy de acuerdo :)

Además, hay una nueva e interesante propiedad de los predictores para mí: la descripción de los procesos internos de los datos originales.
En otras palabras, si tengo, por ejemplo, una docena de predictores que pueden reconstruir fácilmente cientos de barras de precios, es obvio que contienen las propiedades necesarias del mercado y el modelo construido sobre ellos debería ser mejor.

 
Top2n:


Probablemente no entendí bien lo que necesitas, pero yo tomaría algún radio, digamos 4, y para cada punto encontraría el valor promedio en ese radio.
Es decir, si X=BC, Y=158, Z=1, se puede hallar el valor medio de todos los puntos de este radio R=4. Este sería el peso medio del punto (BC,158,1) y sus alrededores. Haga esto para todos los puntos de la matriz, y obtendrá una nueva matriz, en la que cuanto más alto sea el número, más señales habrá en las proximidades de la matriz original.
Entonces podemos proyectarlo a algún eje (descartar la coordenada Z, sumar todas las celdas X e Y relevantes, que tienen diferente coordenada Z). Entonces también descarta Y por sí mismo y suma todas las celdas por X.

Archivos adjuntos:
w5rtduyghjbn.png  388 kb
 
Dr.Trader:


Resulta que si se empieza a generar nuevos predictores de forma irreflexiva, sólo ayudarán al modelo a obtener una mayor precisión en el entrenamiento, pero no ayudarán a describir los procesos dentro del mercado, y por tanto las predicciones con ellos son poco fiables. Así que hay que generarlos pensando mucho, estoy de acuerdo :)


Aun así, el horno desde el que bailar es alguna descripción verbal e intuitiva del mercado.

He estado dándole vueltas a la idea de que en los mercados financieros esta descripción intuitiva viene dada por ZZ. Si lo miras:

  • se pueden ver las tendencias
  • el ruido se ve como una desviación de las líneas rectas
  • se puede ver la periodicidad

Me parece que todos nuestros problemas están en esta periodicidad, que varía caóticamente en ambos ejes. Eso es lo que nos está pasando. Si aprendemos al menos a lidiar con esta no estacionalidad, el resto es más fácil.

 
SanSanych Fomenko:

De todos modos, el horno del que hay que bailar es alguna descripción verbal e intuitiva del mercado.

Llevo mucho tiempo con la idea de que en los mercados financieros esta descripción intuitiva viene dada por ZZ. Si lo miras:

  • se pueden ver las tendencias
  • el ruido se ve como una desviación de las líneas rectas
  • se puede ver la periodicidad

Me parece que todos nuestros problemas están en esta periodicidad, que varía caóticamente en ambos ejes. Eso es lo que nos está pasando. Si aprendemos a lidiar al menos de alguna manera con esta no estacionariedad, el resto es más fácil.

No juzgues estrictamente y no preguntes a qué me refiero, pero tal vez un generador de White_Noise pueda ayudar. Por cierto, si alguien puede, por favor comparta su experiencia con las transformadas Fourier_Laplace_Z.