Econometria: um passo à frente na previsão - página 73

 
faa1947:

Sim, 40 é um pouco baixo. Fez o teste e escreveu acima. Após 70 novos aumentos da amostra, o resultado não é afetado. Aqui está o resultado sobre o comprimento da amostra. É digno de nota. Os coeficientes do modelo são estimados:

EURUSD = C(1)*HP1(-1) + C(2)*HP1(-2) + C(3)*HP1_D(-1) + C(4)*EQ1_HP2(-1) + C(5)*EQ1_HP2(-2) + C(6)*EQ1_HP2(-3) + C(7)*EQ1_HP2_D(-1) + C(8)*EQ1_HP2_D(-2) + C(9)*EQ1_HP2_D(-3) + C(10)*EQ1_HP2_D(-4)

São 10 no total. Todos os coeficientes são variáveis aleatórias. Pergunta: em que comprimento de amostra eles se tornarão aproximadamente uma constante. Mostrarei todos os coeficientes em um figo:

Aqui amostra = 80 observações. Vemos que depois da metade da amostra tudo está resolvido e especialmente o erro da avaliação do coeficiente. Para o primeiro coeficiente darei um maior:

Esta é uma estimativa do próprio coeficiente - vemos que seu valor não é uma constante.

E agora o erro de estimativa do coeficiente:

Portanto, concluo que a amostra deve estar em algum lugar com mais de 60 observações.

Precisamos de coeficientes estáveis com um pequeno erro - esta é uma medida do comprimento da amostra!




A convergência dos coeficientes dos modelos ou de seus erros para algum número não determina o número de observações necessárias. Pegue um LR comum e quanto menores os dados, mais rápido ele mudará seus coeficientes, e mais lento ele aumentará. Mas esta é uma propriedade da regressão em si, não sua precisão na previsão de séries. E não determina o tamanho da janela de cálculo da regressão.

Se você aplicar um critério, que dá resultados numéricos, você deve saber não apenas um número, mas até que ponto você pode confiar nele neste caso. Por exemplo, para este fim, as estatísticas matemáticas utilizam o DI.

 
Avals:

E, a propósito, sobre a análise de resíduos para distribuição normal: apenas 116 observações são muito poucas para que os resultados sejam confiáveis. Isto é, é claro, o teste pode ser aplicado e atribuirá a distribuição ao normal com alguma probabilidade, mas qual é o intervalo de confiança desta previsão? Ou seja, 25% é novamente um valor muito aproximado e pode ser a faixa de 0...50 com 95% de confiança, por exemplo, ou 22...28. Depende tanto do número de observações quanto da variância. Parece-me que com 116 observações, a CI seria enorme.

Eu não analiso para normalidade. Por quê?

Antes de mais nada, precisamos extrair do quociente o que podemos usar: correlação de observações. Se obtivermos um resíduo sem correlações, então temos que descobrir se existe alguma outra informação que possa ser utilizada - ARCH. Se houver, então modelar (escrever fórmula analítica) esta informação também. O resíduo ideal é aquele do qual não podemos (não sabemos, não sabemos) extrair nenhuma informação para modelagem.

 
paukas:
Decida-se de alguma forma.....
É um hábito muito bom ler uma frase até o fim, ou melhor ainda, um parágrafo até o fim, ou melhor ainda, tudo o que o autor escreve.
 
Avals:


A convergência dos coeficientes do modelo ou de seus erros para algum número não determina o número de observações necessárias. Pegue um LR comum e quanto menores os dados, mais rápido ele mudará seus coeficientes, e mais lento ele aumentará. Mas esta é uma propriedade da regressão em si, não sua precisão na previsão de séries. E não determina o tamanho da janela de cálculo da regressão.

Se você aplicar algum critério que dê resultados numéricos, você precisa saber não apenas o número, mas o quanto você pode confiar nele em um determinado caso. Por exemplo, as estatísticas matemáticas utilizam um DI para este fim.

O raciocínio não é muito claro: por que aumentar a janela se o coeficiente é constante e o coeficiente de oscilação é constante? Podemos ver isso nos números.

 
faa1947:
É um hábito muito útil ler uma frase até o fim, ou melhor ainda, um parágrafo até o fim, ou ainda melhor, tudo o que o autor escreve.
Um hábito ainda mais útil é escrever de uma forma que faça sentido não só para o autor, mas também para o agricultor coletivo médio.
 
Reshetov:

Finalmente o adepto do culto, revelou o segredo principal do truque religioso!

Elementar, Watson! Porque são não-estacionários. A estacionaridade é quando a dispersão e a expectativa são constantes e não dependem da amostra, da qual são medidas. Isto é, em qualquer outra amostra independente, devemos obter aproximadamente as mesmas constantes. Se não as obtivemos, então a hipótese de estacionaridade é desmentida.

A hipótese de estacionaridade pode ser testada de outra forma, aumentando a dimensão da amostra. No caso de estacionaridade, tanto a variação quanto a expectativa devem também permanecer constantes.


Ah, vamos lá! O principal problema com o modelo não está na não-estacionariedade do mercado, mas no modelo em si, ele simplesmente não pode funcionar, como evidenciado pelo testador de estratégia, que o iniciante do tópico não quer admitir, e ao mesmo tempo ele se pergunta por que seu modelo não funciona. Não há necessidade de fazer tal confusão com R^2, etc. quando testes simples são uma maneira muito mais objetiva de mostrar o que é o quê.

Se você quiser tal estacionaridade, por favor, use gráficos equivocados. A volatilidade é uma constante, a dispersão e o m.o.s. deve ser finito, mas será de pouca utilidade, já que o modelo não funcionou em gráficos comuns e também não funcionará em gráficos equivocados.

 
faa1947:

Eu não analiso para normalidade. Por quê?

Em primeiro lugar, o que pode ser usado para extrair do quociente é a correlação entre as observações. Se obtivermos um resíduo sem correlações, então temos que descobrir se existe alguma outra informação que possa ser utilizada - ARCH. Se houver, então modelar (escrever fórmula analítica) esta informação também. O resíduo ideal é aquele do qual não podemos (não sabemos, não sabemos) extrair nenhuma informação para modelagem.


Como você não o analisa? Você o tem escrito em seu artigo 1.3. Estimativa de resíduos a partir de uma equação de regressão

Você recebe números específicos -

"A probabilidade de que o resíduo seja normalmente distribuído é de 25,57%".

ACF, etc., etc.

Mas estes números não têm valor sem uma indicação do quanto eles podem ser acreditados.

O fator de lucro de 400 negócios pode ser confiável, assim como 40? Assim como todos os outros valores estatísticos e critérios numéricos - estimativas precisas são necessárias. O intervalo de confiança é uma maneira de fazer isso. 116 observações não é suficiente para acreditar nos resultados da atribuição ou não atribuição de uma distribuição ao normal, qualquer que seja o critério aplicado.

 
faa1947:

A surdez é espantosa.

Há anos que me dedico a isto - o kotir é não-estacionário e não pode ser previsto.

Tenho dito ao longo de toda esta linha - o quociente é não-estacionário, mas pode ser previsto se o resíduo do modelo for estacionário. O residual é de interesse porque então você pode adicionar o modelo (analítico) com um residual estacionário. Esta soma é igual ao quociente, não se perde uma tubulação. Já escrevi cem vezes acima. Não é a mesma coisa, adeptos dos chukchi que são escritores, mas não leitores.

Continue falando. O resíduo não é estacionário, pois se o modelo adaptado a uma única amostra for testado em qualquer outra amostra independente, o resíduo não é mais uma constante. É possível fazer ajustes para outras amostras, mas depois desses ajustes, obtemos um modelo diferente para cada amostra individual.

Mais uma vez, repito para os especialmente dotados: a estacionaridade só pode ser revelada por coincidência de dados estatísticos sobre amostras diferentes e independentes. E não existe tal coincidência.

O truque com as manipulações econométricas é que eles encontraram um método para ajustar um modelo a uma amostra de tal forma que todos os resíduos dessa amostra são aproximadamente iguais. Mas como tal truque só ocorre para uma única amostra e em outras amostras o modelo dá resultados diferentes, os resíduos não são estacionários, mas apenas ajustados a uma única amostra. Os modelos economométricos não podem extrapolar o futuro porque ainda não possuem dados históricos (que só aparecerão no futuro) que possam ser ajustados ao modelo.

É o mesmo que um indicador redesenhado - ajustando suas leituras a dados específicos, modificando-os retroativamente.

 
faa1947:

O raciocínio não é muito claro: por que aumentar a janela se o coeficiente é constante e o coeficiente de osh. é constante? Podemos ver isso nos números.



Não estou sugerindo que a janela para o cálculo dos coeficientes de regressão deva ser ampliada. A janela para isso não é definida por sua convergência a um número. Estou falando sobre o número de observações e como isso afeta a precisão de seu critério e estimativas estatísticas
 
A regra básica das estatísticas é que deve haver pelo menos 300 pontos, que é o limite inferior.