Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2786

 
JeeyCi #:

describe variables aleatorias - dónde tiene conexiones (lógicamente, no hay ninguna)... pero como hay una matriz - significa que es posible encontrar/describir/perderse/formar conexiones en ella... imho sobre describir el estado bajo la influencia de eventos... toda la misma estadistica, pero tambien un paso adelante dependiendo del estado (y justo este paso establece la dinamica de la serie estadistica de cada momento)... solo que también me confunde la "aleatoriedad" en la formulación de todo el markoviano (pero para eso están la estadística y la dim_reduction).

Di mi entendimiento de la física de los procesos aleatorios, para mi son 2 variantes, en el mercado la primera es cuando el número de factores da un resultado probabilístico, y la segunda es el resultado de un proceso de baja frecuencia en relación a uno de alta frecuencia, en eso los procesos no están interconectados.

Y filosóficamente entiendo que si no hay conexión con valores pasados de una función o un proceso, el proceso será aleatorio. Pero en el mundo real esto no suele ser así.

En el mercado, si suponemos que los estados estacionarios prolongados son el efecto de algunas fuerzas inerciales de factores fuertes, o de factores fuertes prolongados, entonces es posible distinguirlos en el ruido, y no se trata de un estado de Markov. El enfoque de distinguir el modelo del modelo SB es bastante lógico. Pero qué hacer con él, lógicamente, si hay un estado no Markov, entonces es posible investigar, y si no hay diferencias, entonces no tiene sentido investigar.))))))

 
Maxim Dmitrievsky #:

Cómo que no, donde estás en la matriz de transición, ahí es donde vas.

Está claro, pero es un proceso aleatorio, porque no hay conexión entre el valor actual y el anterior.)))))) Y así, sí, en la matriz hay valores)))))

que minimizan esta relación hasta casi cero).

 

Los métodos de normalización de Vladimir Perervenko son simplemente extraños - log2(x + 1) sigue siendo comprensible,

pero la aparición de tal bestia - deshacerse de la asimetría a través de sin(2*pi*x)- no está muy claro lo que hace - lógicamente añade algún componente cíclico, y la pregunta es, ¿por qué tal componente? o lo elimina? (quitamos ciclos, nos quedamos con ruido)...

y tanh(x) en general parece una imitación del procesamiento de una red neuronal para comprimir una serie... ¿o sólo otro simple warping de la fila? - Es poco probable que elimine la ciclicidad, y no está claro cuál....

De todas formas, por supuesto, está claro que timeseries= tendencia+ciclo+ruido...

... pero puede que esté tratando de deshacerse de la ciclicidad con tales transformaciones (y no se sabe cómo sin(2*pi*x) es una forma universal ??) ... De alguna manera pensé al principio que esto es una especie de intento de poner un elemento d/df en la serie--para eliminar la ciclicidad (mediante la incorporación de esta longitud en los propios signos-factores? longitud de onda en los signos-factores de sí mismos), para lograr la distribución normal, es decir, la velocidad y la aceleración de poner en la composición de los signos ... ?? pero aún manipulación con pecado parece ser una distorsión injustificada de la serie bajo la amplitud escalada de acuerdo con el valor de signo - No he encontrado tal cosa en el procesamiento estadístico .... ¿por qué no cos? ¿por qué no tanh? -- sólo diferentes formas de curva? ¿Por qué?

?? tal vez el autor pueda explicar la esencia de esta trigonometría en particular (el propósito de eliminar la distribución sesgada mediante log ya está claro) - pero ¿cuáles son las justificaciones/suposiciones para usar sin?? ¿por qué no cos? y por qué esta curvatura en absoluto?(¿acelerará el cambio de signo?-en lugar de simplemente suavizarlo a veces)


Renat Akhtyamov #:

te dieron vectores, escribiste un articulo, y te trataron como una baratija....

¿alguien podría escribir la seriedad con la que se deben/pueden tomar dichas transformaciones y por qué? (aparte del deseo de deshacerse de la asimetría con log, creo que ln es la más común).

 
JeeyCi #:

Vladimir Perervenko tiene sólo algunas formas extrañas de convertir a la normalidad - log2(x + 1) todavía se puede tratar de entender,

pero la aparición de tal bestia - deshacerse de la asimetría a través de sin(2*pi*x)- no está muy claro lo que hace - lógicamente añade algún componente cíclico, y la pregunta es, ¿por qué tal componente? o lo elimina? (eliminamos los ciclos, nos quedamos con el ruido)....

y tanh(x) en general parece una imitación de procesamiento de redes neuronales para comprimir una serie.... ¿o simplemente otra simple deformación de la fila? - es poco probable que elimine los ciclos, y no está claro cuál....

De todas formas, por supuesto, está claro que timeseries= tendencia+ciclo+ruido...

... pero puede que esté tratando de deshacerse de la ciclicidad con tales transformaciones (y no se sabe cómo sin(2*pi*x) es una forma universal ??) ... De alguna manera pensé al principio que esto es una especie de intento de poner un elemento d/df en la serie--para eliminar la ciclicidad (mediante la incorporación de esta longitud en los propios signos-factores? longitud de onda en los signos-factores de sí mismos), para lograr la distribución normal, es decir, la velocidad y la aceleración de poner en la composición de los signos ... ?? pero aún manipulación con pecado parece ser una distorsión injustificada de la serie bajo la amplitud escalada de acuerdo con el valor de signo - No he encontrado tal cosa en el procesamiento estadístico .... ¿por qué no cos? ¿por qué no tanh? -- sólo diferentes formas de deformación? ¿Para qué?

?? tal vez el autor pueda explicar la esencia de esta trigonometría en particular (el propósito de eliminar la distribución sesgada a través de log ya está claro) - pero ¿cuáles son las justificaciones / supuestos para el uso de sin?? ¿por qué no cos? y por qué esta curvatura en absoluto?(¿acelerará el cambio de signo?-en lugar de simplemente suavizarlo a veces)


¿alguien podría escribir la seriedad con la que uno debe/puede tomarse estas transformaciones y por qué? (aparte de intentar deshacerse de la asimetría con log, creo que ln es la más común).

Yo tampoco he entendido nunca tales transformaciones, pero lo más probable es que se trate simplemente de una elección de la mejor transformación entre el resto. Y no hay lógica en la elección, normalmente se basa en pruebas.

Las formas de los filtros y antenas en UHF no se calculaban originalmente. Sí, y el cálculo a continuación, en la vida real se finalizó con un archivo)))))

 
Valeriy Yastremskiy #:

Yo tampoco he entendido nunca este tipo de conversiones, pero lo más probable es que se trate simplemente de una elección según la opinión del selector de la mejor conversión entre el resto. Y no hay ninguna lógica en la elección por lo general, por lo general sobre la base de pruebas.

Las formas de los filtros y antenas en UHF no se calculaban originalmente. Sí, y el cálculo a continuación, en la vida real se finalizó con un archivo)))))

Puedes simplemente comparar los histogramas de la muestra antes y después de la conversión. Si el final está más cerca de la forma de destino (distribución normal o uniforme, por ejemplo), entonces la transformación es bastante adecuado). En lugar de dibujar histogramas, puede considerar pruebas de conformidad con el objetivo (de normalidad o uniformidad, respectivamente).

¿No tienen los platos forma parabólica? Bastante según la fórmula)

 
JeeyCi #:

Vladimir Perervenko tiene sólo algunas formas extrañas de convertir a la normalidad - log2(x + 1) todavía se puede tratar de entender,

pero la aparición de tal bestia - deshacerse de la asimetría a través de sin(2*pi*x)- no está muy claro lo que hace - lógicamente añade algún componente cíclico, y la pregunta es, ¿por qué tal componente? o lo elimina? (eliminamos los ciclos, nos quedamos con el ruido)....

y tanh(x) en general parece una imitación de procesamiento de redes neuronales para comprimir una serie.... ¿o simplemente otra simple deformación de la fila? - es poco probable que elimine los ciclos, y no está claro cuál....

De todas formas, por supuesto, está claro que timeseries= tendencia+ciclo+ruido...

... pero puede que esté tratando de deshacerse de la ciclicidad con tales transformaciones (y no se sabe cómo sin(2*pi*x) es una forma universal ??) ... De alguna manera pensé al principio que esto es una especie de intento de poner un elemento d/df en la serie--para eliminar la ciclicidad (mediante la incorporación de esta longitud en los propios signos-factores? longitud de onda en los signos-factores de sí mismos), para lograr la distribución normal, es decir, la velocidad y la aceleración de poner en la composición de los signos ... ?? pero aún manipulación con pecado parece ser una distorsión injustificada de la serie bajo la amplitud escalada de acuerdo con el valor de signo - No he encontrado tal cosa en el procesamiento estadístico .... ¿por qué no cos? ¿por qué no tanh? -- sólo diferentes formas de deformación? ¿Para qué?

?? tal vez el autor pueda explicar la esencia de esta trigonometría en particular (el propósito de eliminar la distribución sesgada a través de log ya está claro) - pero ¿cuáles son las justificaciones / supuestos para el uso de sin?? ¿por qué no cos? y por qué esta curvatura en absoluto?(¿acelerará el cambio de signo?-en lugar de simplemente suavizarlo a veces)


¿alguien podría escribir la seriedad con la que uno debe/puede tomarse estas transformaciones y por qué? (aparte de intentar deshacerse de la asimetría con log, creo que ln es la más común).

Mientras estemos en el nivel de razonamiento de funciones trigonometricas o cualquier otra cosa en este nivel, no hay justificacion por una razon - es imposible hacer una justificacion, porque el proposito de tales justificaciones NO esta declarado y el criterio para alcanzar el proposito es desconocido.


Y el objetivo en MO es el único - reducir el error de ajuste, o más bien reducir el error de predicción del modelo de aprendizaje automático. Y bajo la restricción de que el error de predicción NO debe cambiar mucho en el futuro.


El principal obstáculo para lograr este objetivo es la no estacionariedad de las series financieras.

La fórmula dada timeseries= trend+cycle+noise no es del todo exacta. Es más exacta y está muy bien elaborada en los modelos de tipo GARCH, de los que existen más de cien, pero ninguno de ellos resuelve el problema en su forma final, es decir, cómo modelizar la no estacionariedad con la mayor precisión posible.

Si especificamos un objetivo y un criterio para alcanzarlo, entonces los métodos para tratar la no estacionariedad no son importantes en absoluto: lo que importa es el resultado. En cualquier caso, está claro que cuanto más cerca de la estacionariedad pueda transformarse la serie inicial no estacionaria, menor será el error de predicción del modelo MO y, lo que es más importante, menores serán las fluctuaciones de este error.

Vladimir Perervenko lo entiende perfectamente, pero sus artículos son más didácticos que prácticos: se limita a mostrar problemas y a proporcionar herramientas para su solución, y de forma muy completa y sistemática, sin lagunas visibles. La selección de problemas y herramientas para su solución está subordinada al objetivo de reducir el error de predicción.

Vladimir Perervenko
Vladimir Perervenko
  • www.mql5.com
Профиль трейдера
 

allí Aleksey Vyazmikin le hizo al autor tal pregunta en los comentarios - consiguió un enlace al hilo de discusión - ¡el enlace está DESTRUIDO! ¿se ha escondido el autor Vladimir Perervenko ? )

 

Se me ocurrió la idea de un árbol de decisión local. Es algo así como un análogo de KNN o de regresión local (también potencialmente adecuado para la no estacionariedad). La idea es que dividimos en cajas sólo la caja que contiene el punto de interés (hasta al menos un número determinado de K puntos en ella), y no nos preocupamos por el resto de las cajas. Puede ser mejor que KNN o la regresión local si los límites entre las clases son nítidos y el punto está cerca de tal límite.

Me pregunto si este enfoque tiene algún sentido.

 
СанСаныч Фоменко #:

Mientras estemos en el nivel de razonamiento de las funciones trigonométricas o cualquier otra cosa a este nivel, no hay justificación por una razón - es imposible hacer una justificación, porque el objetivo de tales justificaciones NO está declarado y el criterio para alcanzar el objetivo es desconocido.

Y el objetivo en MO es el único - reducir el error de ajuste, o más bien reducir el error de predicción del modelo de aprendizaje automático. Y con la restricción: el error de predicción NO debe cambiar mucho en el futuro.

y el objetivo es siempre el mismo - la lógica y la adecuación en lugar de una búsqueda estúpida por un algoritmo codicioso de toda la basura y aullando acerca de la falta de poder para que....

sí, las estimaciones deben ser (consistente) estable - lo llamas "el error no debe cambiar", la predicción en sí va a cambiar en series de tiempo (en la dinámica) ...

no puedes ir más allá de tus comentarios publicitarios sobre herramientas -- sin saber cómo funcionan estas herramientas ... te han dado un mazo en las manos - loestas agitando(eres Chapayev???? ) con referencia a tu umbral de IV=0.02 - ESO ES UNA conexión BAJA(!) - entonces por que estas agitando tus slogans aqui... y llamando a las propuestas de analisis adecuadas como mashkas (donde nunca existieron en el pasado)... abre tu propio hilo publicitario.

y MO si - funciona de la misma manera en todas partes y para el MISMO PROPOSITO - y en Py y otras bibliotecas no es IV en absoluto - pero la esencia no cambia, - tu, aparentemente, no entendiendo la esencia del analisis de datos - solo puedes gritar eslóganes sobre candidatos y herramientas y estúpidamente cargar basura en tu "caja negra" - e incluso para usar tus predicciones para el proposito previsto no molestaste....

bueno, abre una rama para tus propias promociones, y grita allí -- si no puedes hacer nada más que análisis de chorradas (ni siquiera conclusiones normales) -- pareces un puto coleccionista intentando conseguir ideas de otros para tu chatarra (excepto por la palabra "herramienta" - ni siquiera has entendido cómo funciona) -- ¿qué no hizo LogisticRegression?

=== ¡no tienes que responder! (tu Valor Informativo personal = 0 para mi)... tus interpretaciones del álgebra lineal son aún más bajas en IV

 
Aleksey Nikolayev #:

Basta con comparar los histogramas de la muestra antes y después de la transformación. Si el final se acerca más a la forma objetivo (distribución normal o uniforme, por ejemplo), entonces la transformación está bien). En lugar de dibujar histogramas, podemos considerar pruebas de conformidad con el objetivo (de normalidad o uniformidad, respectivamente).

¿No tienen los platos forma parabólica? Bastante según la fórmula)

Sí, mira y selecciona visualmente lo que está más cerca del objetivo) Pero no hay ninguna lógica en lo que hace esta transformación y por qué es mejor que las otras.

Tardé mucho en llegar a estas parábolas)))))) Y los filtros son realmente crackers))))