Ecuación de regresión

 

¡Miembros del foro!

¿Puede aconsejarnos alguien que haya trabajado con ecuaciones de regresión para cotizaciones de divisas? ¿Existenindicadores, MTS, bibliotecas MQLbasados en ellos?

Para los que están al tanto, ¿podrían responder a un par de preguntas?

Me interesan las ecuaciones de regresión. Pero me encuentro con el problema de su adecuada descripción. Qué datos tenemos: hora (digamos M15), ALTO, BAJO, ABIERTO, CERRADO, VOLUMEN. Para nosotros es un conjunto de observaciones. Tenemos un indicador para el que necesitamos establecer una relación funcional con los parámetros del objeto (en nuestro caso, la variación del tipo de cambio): los factores. Obligatorio: establecer una relación cuantitativa entre el indicador y los factores. En este caso, la tarea del análisis de regresión se entiende como la tarea de identificar la dependencia funcional y* = f(x 1, x 2, ..., x t) que mejor describe los datos que tenemos.

La función f(x 1, x 2, ..., x t) que describe la dependencia del indicador de los parámetros se denomina ecuación (función) de regresión.

Así que. Pregunta 1: De los datos que tenemos, ¿cuál debemos elegir como Indicador y cuál como Factor? Lógicamente el Indicador es el tiempo, los factores son H, L, O, C, V

En nuestro caso se trata de una serie temporal.

La siguiente tarea es elegir la dependencia funcional. Una ecuación que describe la relación entre la variación del indicador y la variación de los factores. A menudo se trata de funciones polinómicas. Un caso particular es el polinomio de grado 1: la ecuación de regresión lineal.

Pregunta 2: Cuál es el mejor polinomio a elegir, y cómo describirlo adecuadamente en términos de series temporales, qué parámetros aplicar, cuál es el grado del polinomio. ¿Alguien ha utilizado el polinomio de Chebyshev? Si es así, ¿cuál es el orden?

Nuestra siguiente tarea es calcular los coeficientes de la ecuación de regresión. Lo habitual es utilizar el CNA.

Pregunta 3: ¿Cuál es el mejor método para calcular los coeficientes en nuestro caso?

Pregunta 4. ¿Es necesario normalizar los datos?

Y la pregunta más interesante. ¿Cómo hacer previsiones de, por ejemplo, el próximo tick a partir de los datos obtenidos y la ecuación de regresión?

Agradecería que alguien compartiera su experiencia, sus ideas.

 
Y realmente quieres comer o una receta (lo siento, acaba de salir). Este método describe la parte seleccionada de la historia ni mejor ni peor que otros, en la parte delantera se comporta igual que la gran mayoría de los sistemas.
 

Gracias por los consejos. Estoy leyendo los hilos del foro correspondientes en este momento.

Por cierto - la conveniencia de introducir un par de divisas adicional para el análisis de bermellón, por ejemplo, EURUSD es bastante cuestionable.

 
ivandurak:
¿Quieres comer realmente o una receta (lo siento, se me escapó). En mi opinión, este método describe la parte seleccionada de la historia ni mejor ni peor que otros, en adelante se comportan de la misma manera que la gran mayoría de los sistemas pierden.

Más concretamente, estoy especialmente interesado en la regresión multivariante. También es interesante estudiar las opciones para resolver la regresión no lineal. No he encontrado ningún algoritmo para resolver la regresión multivariante en MQL. Si me proporcionas los enlaces y los indicadores (si no te da pereza, claro), ¡será genial! No voy a encontrar un santo grial, pero entender los métodos de regresión multivariante desde la perspectiva de las series temporales de los pares de divisas, es extremadamente importante para mí.

Le agradeceré sus comentarios.

 
Échale un vistazo al ISC, puede serte útil.
 

En cuanto al punto 3, la LOC es ineficiente para las cotizaciones (si se va a utilizar la regresión como predictor). Es mejor utilizar la LAD o la regresión cuantílica. Es más complicado (hay que hacer mucha más codificación y ciencia), pero funciona, a diferencia de los mínimos cuadrados.

 
la razón de la ineficacia del ISC, por cierto, son las proverbiales colas gordas. Los cuantiles no tienen esta desventaja.
 
alsu:
La causa de la ineficacia de la LOM, por cierto, son las famosas colas gordas. Los cuantiles no tienen este defecto.

¿Puede ser más específico?

El MNC se posiciona, entre otras cosas, como un método para estimar los mejores parámetros de una función elegida a priori por el investigador.

Se derivaron fórmulas para calcular estos parámetros minimizando el cuadrado de la desviación de los datos reales con respecto a la función de aproximación para un conjunto de funciones.

¿Dónde aparecen las colas gordas?

Por favor, ilumíname...

 
FreeLance: se derivan fórmulas para calcular estos parámetros minimizando el cuadrado de la desviación de los datos reales respecto a la función proxy para un conjunto de funciones.

¿De dónde surgen las colas gruesas?

Esta función objetivo -la suma de los cuadrados de los errores- sólo es óptima cuando la propia distribución de errores es normal.
 
Mathemat:
Esta función objetivo -la suma de los cuadrados de los errores- sólo es óptima cuando la propia distribución de errores es normal.

¿Dónde he hablado de las distribuciones?

¿O el topicstarter?

Estamos hablando de una aproximación a un polinomio. No más que eso.

Pero no menos.

¿Y dónde está la ineficacia de las empresas multinacionales?

;)

--

pero los estudios de error para la normalidad, un elemento importante de la estimación de la plausibilidad del modelo a priori...

No hay discusión.