Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2526

 
Aleksey Nikolayev #:

Por ejemplo, si 1<=t1<=t2<n, entonces ACF(t1,t2)=sqrt(t1/t2).

Tengo otra pregunta. Aquí consideramos la ACF de los valores adyacentes en una muestra de tamaño infinito. Por ejemplo, t1=1, t2=2. Obtenemos ACF =sqrt(0,5) ~ 0,707. Ahora tomamos otros valores vecinos, por ejemplo,t1=10000, t2=10001. Obtenemos ACF = 1 (casi). Resulta que los valores vecinos están correlacionados de forma diferente entre sí. ¿Es normal?

 
LenaTrap #:

Para ser honesto, no puedo entender nada en absoluto.

p.d. ¿quizás algún matemático súper inteligente se apiade de mí y me explique qué está pasando aquí?

no se necesita un "matemático súper inteligente" en el comercio .....

DL tiene 3 capas - internas (ocultas) maneja el momento t respectivamente externo t-1 y t+1... - de ahí que la autocorrelación sea posible... imho... Yo lo veo así

aunque me parece por alguna razón que si tomamos no el cambio delta de una característica en el tiempo, sino algún índice - entonces, tal vez, el efecto de la autocorrelación de estos valores de intersección en el espacio de tiempo puede ser de alguna manera nivelado... es discutible... porque close(t)/close(t-1) también tienen intersección y por tanto autocorrelación... aunque a TF>15min la autocorrelación parece desaparecer (no se observa) - no lo he comprobado personalmente... y este no es todavía el índice que necesito...

Es inútil rezar por la autocorrelación en la modelización de los movimientos de los precios con TF's adecuados... Y no tiene sentido utilizar un modelo después de cada tick (como en la derivación de regularidades, además de las de largo plazo)... imho (pero más probablemente justo)...

PERO las redes neuronales recurrentes sólo pasan la información hacia delante (con la llegada de las máquinas de Boltzmann se empezaron a utilizar en el aprendizaje probabilístico multicapa)... aunque ya ha sonado

Las redes recurrentes y los métodos bayesianos, por sí mismos, no han demostrado la capacidad de sacar "memoria" de las series temporales financieras ni de obtener conclusiones sobre el modelo más robusto con nuevos datos.

por eso en los problemas reales se utilizan redes recursivas con retropropagación del error y su minimización dy/dx (ya que permiten realizar la integración sólo por esa razón de sus capacidades de minimización dy/dx)

p.d.

en general, como para mí - es el mismo método de Monte Carlo - sólo por la máquina ... Todavía no veo nada nuevo en la búsqueda de avances utilizando la retropropagación... puramente terminológica...

p.p.s

excepto que con Theano se puede probar algo sin usar mucho los recursos del PC (aunque se ha promocionado TensorFlow)...

y lo que Y y lo que X es a discreción del desarrollador (ya sea a priori o como resultado de un análisis estadístico)... Si eres bueno con python -- en sklearn, incluso las características 2-en-1 ya están implementadas en algunos métodos... ¡ejemplos! -- y la importancia de la característica se hace sola y ML se hace sola -- un par de líneas también (como encontraste corrcoef en un par de líneas)

 
LenaTrap #:

¿En el mercado real? Personalmente, tengo una especie de filosofía así:

*pero no quiero discutirlo, porque sin pruebas es inútil discutir suposiciones

! en el comercio real - no tergiverse el significado...

sí, la filosofía es efectivamente diferente para cada uno... el objetivo de la estadística es explicar la varianza

y formalizar las dependencias de las pruebas independientes

 
Doctor #:

Tengo otra pregunta. Considere la ACF de los valores vecinos en una muestra de tamaño infinito. Por ejemplo, t1=1, t2=2. Obtenemos ACF =sqrt(0,5) ~ 0,707. Ahora tomamos otros valores vecinos, por ejemplo,t1=10000, t2=10001. Obtenemos ACF = 1 (casi). Resulta que los valores vecinos están correlacionados de forma diferente entre sí. ¿Es normal?

Así es, lo es. Esta es la segunda razón para hablar de la no estacionariedad de la SB (la primera es el crecimiento de la varianza con el tiempo). Sólo en los procesos estacionarios (por su propia definición) la FCA depende únicamente de la diferencia temporal ACF(t1,t2)=ACF(t1-t2). Por eso, para las series estacionarias, la FCA suele escribirse como una función de un argumento t1-t2.

 
Doc #:

La pregunta debe dirigirse, por supuesto, a Alexei. Pero yo respondería "lo que sea". La cuestión, supongo, es que SB recorre una trayectoria proporcional a sqrt(t).

Lo que se quería decir era el famoso problema de la "ruina del jugador". Podría utilizarse, por ejemplo, para comprobar la significación estadística del efecto de que los precios "aspiren" a ciertos niveles.

 
Aleksey Nikolayev #:

El famoso problema de "reventar a los jugadores" fue significado. Podría utilizarse, por ejemplo, para comprobar la significación estadística del efecto de que los precios "aspiren" a determinados niveles.

Eso es mucho más interesante.

Tal vez debamos abandonar el punto de vista de que el mercado es una serie temporal, y por fin hacer un avance en el análisis del mercado.

 
Aleksey Nikolayev #:

Así es, lo es. Esta es la segunda razón para hablar de la no estacionariedad de la SB (la primera es el crecimiento de la dispersión con el tiempo). Sólo en el caso de los procesos estacionarios (por su propia definición) la FCA depende únicamente de la diferencia temporal ACF(t1,t2)=ACF(t1-t2). Por eso, para las series estacionarias, la ACF suele escribirse como una función de un argumento t1-t2.

BIEN. Permítanme plantear la pregunta de otra manera. ¿Son diferentes las dos situaciones descritas a continuación?

1) Tenemos una muestra de tamaño infinito. Consideremos dos momentos de tiempo n y (n-t). Considera que 1 <= (n-t) <= n. CalculaACF((n-t),n)=sqrt((n-t)/n).

2) Tenemos una muestra de longitud n. Calcule la ACF de la muestra con el retraso t:ACF(t) =sqrt((n-t)/n).

 
JeeyCi #:

aunque me parece, por alguna razón, que si no se toma el cambio delta de la característica a lo largo del tiempo, sino que se contrata algún índice - entonces tal vez el efecto de la autocorrelación de estos valores superpuestos en el espacio temporal puede ser de alguna manera igualado... es discutible... porque close(t)/close(t-1) también tienen intersección y por tanto autocorrelación... aunque a TF>15min la autocorrelación parece desaparecer (no se observa) - no lo he comprobado personalmente... y no es el índice que necesito todavía...


Probablemente no lo necesite, pero con cualquier tendencia los datos de las series temporales empiezan a mostrar autocorrelación, a veces muy alta, lo que teóricamente debería interferir con muchos modelos de análisis/redes neuronales.

Este efecto es realmente difícil de utilizar para los pronósticos, porque nada es duradero, la tendencia cambia con el rango, el caos con el orden, las series de tiempo que vagan al azar de repente pueden no vagar en absoluto, y viceversa, y por tal estimación no se puede entender la estructura del proceso, es demasiado simple, sería como el comercio por encima de 200SMA.

Pero quizá merezca la pena comprobar cómo reacciona su red neuronal a las autocorrelaciones, e intentar eliminarlas si existen e interfieren. Los elementos vecinos no deberían tener ningún tipo de solapamiento (si es que eso es lo que creo), si se utilizan datos así, sería un gran milagro que el modelo funcionara.

 
LenaTrap #:

Probablemente no lo necesites, pero con cualquier tendencia, los datos de la serie temporal

no lo tergiverses: tratando de discutir conmigo, sigues hablando de tu... sólo sobre las series temporales... (y nadie ha anulado los métodos de muestreo)...

el precio a largo plazo no está en función del tiempo, ya lo he dicho muchas veces (y no lo voy a repetir)... Te mostré dónde puedes obtener la autocorrelación en DL... y qué usar para X e Y y para modelar qué dependencias - también lo he escrito por décima vez - es a discreción del desarrollador...

No soy el desarrollador de su modelo, no necesito probar el comportamiento del precio en el tiempo... (tal vez no debería haber garabateado en el DL - aquí todo el mundo está pensando en algo y refutándolo o probando algo a alguien - sacando una palabra de cada disciplina)... Los ingenieros que hacen MO (que no están aquí) seguirán entendiendo la estrechez del debate de la autocorrelación (por aquello de la charla friki) ya sea en tendencia o en tick, si el modelo se construye en un aspecto mucho más amplio y en un horizonte del conjunto de aprendizaje más amplio que el horizonte donde pueden salir sus pulgas (autocorrelación)... para eso está el Deep Learning (para dar cuenta de todo)

... para mí el tema del comercio no es un problema:

Aleksey Nikolayev #:

El famoso problema de la "ruina del jugador".

... ... por eso hace tiempo que evito estas tonterías ... se ha revelado que aquí nadie tiene ni idea de modelismo, y los que la tienen, no pierden el tiempo en este hilo ... ok, hay muchas más cosas útiles de DL en la red que toda la jerga descarada que has soltado aquí sin ninguna razón...

Para las estadísticas es mejor que hables con matemáticos académicos, no soy yo quien debe responder... - No me interesa tu creencia de que la autocorrelación gobierna la DL... - por quinta vez escribí "es un mal modelo" (no quiero escribir la décima)... deja que tus académicos te respondan (si mi respuesta te ha hecho querer probar algo)

 
Doctor #:

Bueno, está bien. Permítanme plantear la pregunta de otra manera. ¿Son diferentes las dos situaciones descritas a continuación?

1) Tenemos una muestra de tamaño infinito. Consideremos dos momentos de tiempo n y (n-t). Considera que 1 <= (n-t) <= n. CalculaACF((n-t),n)=sqrt((n-t)/n).

2) Tenemos una muestra de longitud n. Calculamos el ACF de la muestra con el retraso t:ACF(t) =sqrt((n-t)/n).

La diferencia es que en el primer caso la ACF se considera para todos los pares posibles de momentos temporales, mientras que en el segundo caso, uno de los momentos temporales es fijo t2=n y muchos pares de momentos temporales( por ejemplo, el par t1=1, t2=2) se dejan de considerar. En general, el ACF es una función de dos argumentos. Sólo para los procesos estacionarios se puede considerar el ACF como una función de un argumento t=t1-t2 (lag).

La muestra ACF siempre se calcula a partir de una muestra numérica específica (realización) de un proceso y siempre resulta ser una función de un argumento (valor de retardo). Esta es la razón principal por la que la muestra ACF en una implementación de SB no es una estimación para su ACF)