El modelo de regresión de Sultonov (SRM): pretende ser un modelo matemático del mercado. - página 46

 
VladislavVG:


No importa. El método de resolución de la ecuación no afecta a la solución, si existe y es singular, pero si hay muchas soluciones aceptables y Yusuf tiene un mínimo local, entonces la genética o las abejas son mejores. Para una solución manual frontal, basta con utilizar un probador: el algoritmo genético le ayudará.

Existe el peligro de caer en el encaje, ya que con tantos parámetros a variar hay que tomar más ejemplos para optimizar.

Y una observación más: no se sabe el período de la muestra en el que se buscaron los coeficientes. Si este periodo coincidió con el periodo de crecimiento del equilibrio en el gráfico, entonces, por desgracia, no todo es tan color de rosa.

En mi caso, hay una única solución, si es que la hay, y esta solución da siempre suma cero de residuos (MO=0), es decir, es la solución analíticamente exacta de la ecuación en cuestión y las soluciones aproximadas están fuera de lugar, aunque tienes razón y tienen derecho a existir. Pero ahora, con la llegada del método de solución exacta, no tendrá sentido tratar con soluciones aproximadas. El caso de degeneración de los datos de entrada, cuando es imposible resolver la ecuación, no se ha observado aún en los datos de Forex OHLC. El algoritmo no ha tropezado con ellos, así que son correctos.
 

Ahora tratemos de expresar la dependencia del precio medio de formación de la siguiente barra como una función lineal del tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Para un historial seleccionado de 15 barras diarias D1 se obtienen los siguientes valores de coeficientes:

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894








Hemos obtenido información muy importante sobre la naturaleza del cambio de precios:
1. Los precios de cierre de la barra C actual son los más significativos para la formación del precio de la barra futura;
2. El segundo más significativo son los precios L, que indican una fuerza significativa de los osos en relación con los toros;
3. Entonces los precios de apertura de O son significativos;
4. La insignificancia de los precios H indica que es poco probable que se produzca un movimiento significativo de los precios al alza.
Conclusión: Es preferible vender a corto plazo.




 
yosuf:

Ahora vamos a intentar expresar la dependencia del precio medio de formación de la siguiente barra como una función lineal del tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Para un historial seleccionado de 15 barras diarias D1 se obtienen los siguientes valores de coeficientes:

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894














No entiendo en absoluto cómo se estiman los coeficientes de regresión.

Aquí está el método de mínimos cuadrados (OLS) para EURUSD_H1 longitud de la muestra = 50 barras.

Variable dependiente: F

Método: Mínimos cuadrados del panel

Fecha: 12/02/12 Hora: 10:26

Muestra: 1 50

Períodos incluidos: 23

Secciones transversales incluidas: 3

Total de observaciones del panel (no equilibrado): 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coeficiente Std. Error t-Statistic Prob.

C(1) 0,114716 0,046286 2,478392 0,0173

C(2) -0,051038 0,156544 -0,326030 0,7460

C(3) -0,343986 0,179835 -1,912786 0,0626

C(4) 0,139395 0,190961 0,729968 0,4695

C(5) 1.163942 0.207562 5.607671 0.0000

R-cuadrado 0,947458 Var. media dependiente 1,247037

R-cuadrado ajustado 0.942454 S.D. var dependiente 0.002839

S.E. de regresión 0.000681 Criterio de información de Akaike -11.64578

Suma del residuo al cuadrado 1,95E-05 Criterio de Schwarz -11,44895

Log likelihood 278.6757 Criterio de Hannan-Quinn. -11.57171

Estadística F 189,3409 Estadística Durbin-Watson 1,935322

Prob(F-statistic) 0.000000

Este es el gráfico

Aquí estáel método de mínimos cuadrados (LOS) para EURUSD_H1 con una longitud de muestra = 2000 barras.

Variable dependiente: F

Método: Mínimos cuadrados del panel

Fecha: 12/02/12 Hora: 10:29

Muestra: 1.000

Períodos incluidos: 23

Secciones transversales incluidas: 85

Total de observaciones del panel (no equilibrado): 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coeficiente Std. Error t-Statistic Prob.

C(1) 0,000190 0,000729 0,260526 0,7945

C(2) 0,026179 0,029181 0,897122 0,3698

C(3) -0,020055 0,028992 -0,691745 0,4892

C(4) -0,106262 0,032127 -3,307569 0,0010

C(5) 1,099945 0,031672 34,72901 0,0000

R-cuadrado 0.999362 Var. media dependiente 1.259869

R-cuadrado ajustado 0.999361 S.D. var dependiente 0.031014

S.E. de regresión 0.000784 Criterio de información de Akaike -11.46178

Suma cuadrada del residuo 0,001174 Criterio de Schwarz -11,44727

Log likelihood 10979.66 Criterio de Hannan-Quinn. -11.45644

Estadística F 748391,1 Estadística Durbin-Watson 2,058272

Prob(F-statistic) 0.000000

Con cualquier longitud de muestra es obligatorio calcular el error de los coeficientes estimados. Podemos ver que en la última estimación con el valor del coeficiente =0,000190 el skop =0,000729. ¡No sólo el valor del coeficiente es ridículo, sino que la primicia es 7 veces el valor nominal!

Lo siento, Yusuf, pero esa es otra bicicleta. Cualquier libro de texto sobre análisis de regresión comienza con una ecuación como la suya. Pero, a diferencia de usted, los estudiantes saben cómo evaluar el resultado del ajuste: cualquiera de ellos le dirá que dicha regresión no puede utilizarse.

 
faa1947:


No entiendo en absoluto cómo se estiman los coeficientes de regresión.

Aquí está el método de mínimos cuadrados (OLS) para EURUSD_H1 longitud de la muestra = 50 barras.


En cualquier longitud de muestra es obligatorio calcular el error de los coeficientes estimados. Y vemos que en la última estimación con el coeficiente =0,000190 sko =0,000729. ¡No sólo el valor del coeficiente es ridículo, sino que el sco es 7 veces el valor nominal!

Por favor, indíqueme el tipo de ecuación de regresión que está investigando.
 
yosuf:
Indique el tipo de ecuación de regresión que está investigando.


Está en la lista del puesto. Aquí tienes una copia:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Para 50 bares, este es el coeficiente.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Pero se trata de estimar estos coeficientes. No se quiere entender que lejos de siempre, sino más bien siempre, no se puede confiar en la estimación de los coeficientes (su valor). Este es el corazón del análisis de regresión.

Hay que responder a la pregunta: ¿en qué nos basamos para creer que los coeficientes que calculamos tienen exactamente el valor que vemos?

 
faa1947:


Así lo indica el puesto. Aquí tienes una copia:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Para 50 bares, este es el coeficiente.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Pero se trata de estimar estos coeficientes. No se quiere entender que lejos de siempre, sino más bien siempre, no se puede confiar en la estimación de los coeficientes (su valor). Este es el corazón del análisis de regresión.

Tenemos que responder a la pregunta: ¿en qué nos basamos para creer que los coeficientes que calculamos tienen exactamente el valor que vemos?

Por definición, la MNC da la mejor estimación de los coeficientes de la ecuación en cuestión y si no te gustan por la razón que sea, busca otra forma de estimarlos o cambia la forma de la ecuación. Este es el enfoque estándar cuando se investigan fenómenos y procesos. Si la ecuación de regresión con el CNA encontrado proporciona un error relativo inferior al 1% (0,29% en este caso), ¿qué más quiero de estos coeficientes? Te encuentras con el problema de la fiabilidad de los coeficientes, todavía no se ha ideado ninguna forma más fiable de determinarlos que el CNA. No obstante, debemos ser conscientes de que cualquier razonamiento y conclusión que hagamos sólo es cierto dentro de la muestra en cuestión y no hay garantía de que fuera de ella, incluido el futuro, siga siendo cierto. Pero nos vemos obligados, con cierta probabilidad, a asumir su aplicabilidad en un futuro próximo. Nada ni nadie puede predecir el futuro con absoluta certeza.
 
yosuf:
Por definición, la MNC da la mejor estimación de los coeficientes de la ecuación en cuestión y si no te gustan por la razón que sea, busca otra forma de estimarlos o cambia la forma de la ecuación. Este es el enfoque estándar cuando se investigan fenómenos y procesos. Si la ecuación de regresión con el CNA encontrado proporciona un error relativo inferior al 1% (0,29% en este caso), ¿qué más quiero de estos coeficientes? Te encuentras con el problema de la fiabilidad de los coeficientes, todavía no se ha ideado ninguna forma más fiable de determinarlos que el CNA. No obstante, debemos ser conscientes de que cualquier razonamiento y conclusión que hagamos sólo es cierto dentro de la muestra en cuestión y no hay garantía de que fuera de ella, incluido el futuro, siga siendo cierto. Pero nos vemos obligados, con cierta probabilidad, a asumir su aplicabilidad en un futuro próximo. Nada ni nadie puede predecir el futuro con absoluta certeza.


Por alguna razón no entraste en el informe de ajuste de la regresión. En este último, los distintos coeficientes tienen una precisión de cálculo diferente. Lo mejor es el 3%. Pero también hay múltiplos de par.

No me obsesiono con nada. Sólo hago la estimación de regresión estándar. De todos modos, no doy los valores de los coeficientes sin estimarlos.

Sobre el ISC. Quiero decepcionarte. El MNC no es el único método, además es un método con un gran número de limitaciones. Hay otros métodos que no tienen esas limitaciones.

 
yosuf:

Ahora vamos a intentar expresar la dependencia del precio medio de formación de la siguiente barra como una función lineal del tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Para un historial seleccionado de 15 barras diarias D1, se obtienen los siguientes valores de coeficientes:






Estas 15 barras diarias, ¿en qué fechas se tomaron?
 
Demi:
Esas barras de 15 días, ¿en qué fechas se tomaron?

Datos utilizados en D1 del 16. 09. 12 al 05. 10. 12
 
yosuf:
Datos utilizados en D1 del 16. 09. 12 al 05. 10. 12




))))I lo pensó:

1. Sus datos no son homogéneos. El modelo incluye datos que describen la dinámica de los precios en 24 horas y datos que describen la dinámica de los precios en 4 horas. Los datos del domingo deben ser eliminados. Todo el mundo comete este error.

2. Debe tener un número óptimo de observaciones. No hay una fórmula precisa, pero está entre 5 y 10 observaciones por variable. Tiene cuatro variables y quince observaciones. El modelo es inadecuado. Y no hagas como un gran experto de este foro: ¡toma un modelo con cuatro variables y 5.000 observaciones! ))))

3. Una vez construido el modelo, determine los coeficientes de correlación parcial para cada variable. Y encuentras que sólo C es estadísticamente significativo. Construye un modelo incluyendo sólo C y el coeficiente antes de C será positivo.

De esto se extrae una conclusión común a TODOS los modelos de autoregresión: SI EL PRECIO ESTÁ SUBIENDO, entonces hay una mayor probabilidad de que siga subiendo en el futuro y viceversa. Entonces se tira el modelo.