O Modelo de Regressão Sultonov (SRM) - alegando ser um modelo matemático do mercado. - página 46

 
VladislavVG:


Isso não importa. O método de resolver a equação não tem efeito na solução, se ela existe e é a única, mas se há muitas soluções aceitáveis e Yusuf tem um mínimo local, então a genética ou as abelhas são melhores. Para uma solução manual, basta usar um testador: o algoritmo genético o ajudará.

Há o perigo de escorregar para o ajuste - com tantos parâmetros para variar é preciso tomar mais exemplos para otimizar.

E mais uma observação - você não sabe o período de amostragem no qual os coeficientes foram pesquisados. Se este período coincidiu com o período de crescimento do equilíbrio no gráfico, então, infelizmente, nem tudo é tão cor-de-rosa.

No meu caso, há uma única solução, se houver alguma, e esta solução sempre dá soma zero de resíduos (MO=0), ou seja, é uma solução analiticamente exata para a equação em questão e as soluções aproximadas estão fora de questão, embora você esteja certo e elas tenham o direito de existir. Mas agora, com o advento do método de solução exata, será um absurdo lidar com soluções aproximadas. O caso de degeneração dos dados de entrada, quando é impossível resolver a equação, ainda não foi observado nos dados da OHLC. O algoritmo não tropeçou neles, portanto eles estão corretos.
 

Agora vamos tentar expressar a dependência do preço médio de formação da próxima barra como uma função linear do tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Para um histórico selecionado de 15 barras diárias D1, são obtidos os seguintes valores de coeficientes:

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894








Obtivemos informações muito importantes sobre a natureza da mudança de preço:
1. Os preços de fechamento da barra C atual são os mais significativos para a formação do preço da barra futura;
2. Os segundos mais significativos são os preços L, o que indica uma força significativa de ursos em relação aos touros;
3. Então, os preços de O-abertura são significativos;
4. A insignificância dos preços H indica que é improvável um movimento significativo dos preços para cima.
Conclusão: A venda é preferível para o curto prazo.




 
yosuf:

Agora vamos tentar expressar a dependência do preço médio de formação da próxima barra como uma função linear do tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Para um histórico selecionado de 15 barras diárias D1, são obtidos os seguintes valores de coeficientes:

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894














Não entendo de forma alguma como os coeficientes de regressão são estimados.

Aqui está o método dos mínimos quadrados (OLS) para EURUSD_H1 comprimento da amostra = 50 barras.

Variável Dependente: F

Método: Painel de mínimos quadrados

Data: 12/02/12 Hora: 10:26

Amostra: 1 50

Períodos incluídos: 23

Cortes transversais incluídos: 3

Total de observações do painel (desequilibrado): 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coeficiente Std. Erro t-Statistic Prob.

C(1) 0,114716 0,046286 2,478392 0,0173

C(2) -0.051038 0.156544 -0.326030 0.7460

C(3) -0,343986 0,179835 -1,912786 0,0626

C(4) 0,139395 0,190961 0,729968 0,4695

C(5) 1.163942 0.207562 5.607671 0.0000

R-quadrado 0,947458 dependente médio var 1,247037

R-quadrado ajustado 0.942454 S.D. dependente var 0.002839

S.E. de regressão 0.000681 Akaike info criterion -11.64578

Soma ao quadrado residente 1.95E-05 Critério Schwarz -11.44895

Probabilidade de registro 278.6757 Critério Hannan-Quinn. -11.57171

F-statistic 189.3409 Durbin-Watson stat 1.935322

Prob(F-statistic) 0,000000

Aqui está o gráfico

Aqui estáo método dos mínimos quadrados (LOS) para EURUSD_H1 com comprimento da amostra = 2000 barras.

Variável Dependente: F

Método: Painel de mínimos quadrados

Data: 12/02/12 Hora: 10:29

Amostra: 1.000

Períodos incluídos: 23

Cortes transversais incluídos: 85

Total de observações do painel (desequilibrado): 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coeficiente Std. Erro t-Statistic Prob.

C(1) 0,000190 0,000729 0,260526 0,7945

C(2) 0,026179 0,029181 0,897122 0,3698

C(3) -0.020055 0.028992 -0.691745 0.4892

C(4) -0.106262 0.032127 -3.307569 0.0010

C(5) 1.099945 0.031672 34.72901 0.0000

R-quadrado 0,999362 dependente médio var 1,259869

R-quadrado corrigido 0.999361 S.D. dependente var 0.031014

S.E. de regressão 0.000784 Akaike info criterion -11.46178

Soma ao quadrado residente 0.001174 Critério Schwarz -11.44727

Probabilidade de registro 10979.66 Critério Hannan-Quinn. -11.45644

F-statistic 748391.1 Durbin-Watson stat 2.058272

Prob(F-statistic) 0,000000

Com qualquer comprimento de amostra é obrigatório calcular o erro dos coeficientes estimados. Podemos ver que na última estimativa com o valor do coeficiente =0,000190 o skop =0,000729. Não só o valor do coeficiente é ridículo, mas o sco é 7 vezes o valor facial!

Desculpe, Yusuf, mas isso é apenas mais uma bicicleta. Qualquer livro sobre análise de regressão começa com uma equação como a sua. Mas ao contrário de você, os estudantes sabem como avaliar o resultado do ajuste - qualquer um deles lhe dirá que a referida regressão não pode ser usada.

 
faa1947:


Não entendo de forma alguma como os coeficientes de regressão são estimados.

Aqui está o método dos mínimos quadrados (OLS) para EURUSD_H1 comprimento da amostra = 50 barras.


Em qualquer comprimento de amostra é obrigatório calcular o erro dos coeficientes estimados. E vemos que na última estimativa com o coeficiente =0,000190 sko =0,000729. Não só o valor do coeficiente é ridículo, mas o sco é 7 vezes o valor nominal!

Por favor, me dê o tipo de equação de regressão que você está investigando.
 
yosuf:
Favor fornecer o tipo de equação de regressão que você está investigando.


Está listado no correio. Aqui está uma cópia:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Para 50 barras, aqui está o coeficiente.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Mas trata-se de estimar estes coeficientes. Você não quer entender que longe de sempre, mas sim sempre, a estimativa dos coeficientes (seu valor) não pode ser confiável. Este é o coração da análise de regressão.

Você tem que responder à pergunta: em que base acreditamos que os coeficientes que calculamos têm exatamente o valor que vemos?

 
faa1947:


É declarado no correio. Aqui está uma cópia:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Para 50 barras, aqui está o coeficiente.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Mas trata-se de estimar estes coeficientes. Você não quer entender que longe de sempre, mas sim sempre, a estimativa dos coeficientes (seu valor) não pode ser confiável. Este é o coração da análise de regressão.

Precisamos responder à pergunta: em que base acreditamos que os coeficientes que calculamos têm exatamente o valor que vemos?

Por definição, MNC dá a melhor estimativa dos coeficientes da equação em questão e se você não gosta deles por qualquer razão, procure outra forma de estimá-los ou mudar a forma da equação. Esta é a abordagem padrão na investigação de fenômenos e processos. Se a equação de regressão com o ANC encontrado fornecer um erro relativo inferior a 1% (0,29% neste caso), então o que mais eu quero desses coeficientes? Você está preso ao problema da confiabilidade dos coeficientes, não há maneira mais confiável de determiná-los do que o ANC ainda não foi concebido. Entretanto, devemos estar cientes de que qualquer raciocínio e conclusões que fazemos só são verdadeiras dentro da amostra em questão e não há garantia de que fora dela, incluindo o futuro, elas permanecerão verdadeiras. Mas, somos forçados, com um grau de probabilidade, a assumir sua aplicabilidade em um futuro próximo. Nada e ninguém pode prever o futuro com absoluta certeza.
 
yosuf:
Por definição, MNC dá a melhor estimativa dos coeficientes da equação em questão e se você não gosta deles por qualquer razão, procure outra forma de estimá-los ou mudar a forma da equação. Esta é a abordagem padrão na investigação de fenômenos e processos. Se a equação de regressão com o ANC encontrado fornece um erro relativo inferior a 1% (0,29% neste caso), então o que mais eu quero desses coeficientes? Você está preso ao problema da confiabilidade dos coeficientes, não há maneira mais confiável de determiná-los do que o ANC ainda não foi concebido. Entretanto, devemos estar cientes de que qualquer raciocínio e conclusões que fazemos só são verdadeiras dentro da amostra em questão e não há garantia de que fora dela, incluindo o futuro, elas permanecerão verdadeiras. Mas, somos forçados, com um grau de probabilidade, a assumir sua aplicabilidade em um futuro próximo. Nada e ninguém pode prever o futuro com absoluta certeza.


De alguma forma, você não entrou no relatório de ajuste de regressão. Neste último, coeficientes diferentes têm uma precisão de cálculo diferente. O melhor é 3%. Mas também há múltiplos de par.

Eu não fico pendurado em nada. Eu apenas faço a estimativa de regressão padrão. De qualquer forma, não dou valores de coeficiente sem estimá-los.

Sobre o ISC. Quero decepcioná-los. O MNC não é o único método, além disso, é um método com um grande número de restrições. Existem outros métodos que não têm tais limitações.

 
yosuf:

Agora vamos tentar expressar a dependência do preço médio de formação da próxima barra como uma função linear do tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Para um histórico selecionado de 15 barras diárias D1, são obtidos os seguintes valores de coeficientes:






Estas 15 barras diárias - quais datas foram tomadas?
 
Demi:
Essas barras de 15 dias - que datas foram tomadas?

Dados utilizados em D1 de 16. 09. 12 a 05. 10. 12
 
yosuf:
Dados utilizados em D1 de 16. 09. 12 a 05. 10. 12




))))Pensei que sim:

1. seus dados não são homogêneos. O modelo inclui dados que descrevem a dinâmica de preços de 24 horas e dados que descrevem a dinâmica de preços de 4 horas. Os dados para o domingo devem ser removidos. Todos cometem este erro.

2. você deve ter um número ótimo de observações. Não há uma fórmula precisa, mas está em algum lugar entre 5 e 10 observações por variável. Você tem quatro variáveis e quinze observações. O modelo é inadequado. E não faça como um grande especialista neste fórum - pegue um modelo com quatro variáveis e 5.000 observações! ))))

3. uma vez construído o modelo, determine os coeficientes de correlação parciais para cada variável. E você acha que apenas C é estatisticamente significativo. Construa um modelo que inclua apenas C e o coeficiente antes de C será positivo.

A partir disto, você tira uma conclusão comum a TODOS os modelos autoregressivos - SE O PREÇO ESTIVER, então há uma maior probabilidade de que ele continuará a aumentar no futuro e vice-versa. Em seguida, você joga fora o modelo.