Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 73

 
alexeymosc:

Bem dito! Nós, Alexei, somos a favor das ineficiências de mercado. E já temos resultados práticos mostrando isso, mas não visíveis através do prisma da abordagem estatística-econométrica clássica.

Com relação ao seu resultado, você ignorou meu posto.

Que assim seja. Mas.

A clássica ACF sabe onde ficar e não só eu, mas milhões. Depois de deter a ACF raramente produz dependências superiores a 10 e, se assim for, é mais provável que não seja uma tendência qualitativa. Entretanto, se as dependências permanecerem e o número de defasagens exceder 40 (135 em sua foto), então isso implica modelos com integração fracionária (FARIMA). E o que se segue de sua abordagem não clássica? Que modelos seguem quando são detectadas dependências de informação?

 
faa1947:

Pode ser.

Qualquer intervalo de confiança soa assim: ao nível de 5% (por exemplo) a hipótese nula é (não é) confirmada.

Como soa sua hipótese nula? Onde está o intervalo de confiança? etc. Se a ACF é uma coisa compreensível para mim, seu gráfico não é compreensível. Se o máximo for 2,098 bits, então 0,05/2,098 não deve ser discutido. E as questões no início da linha não são removidas.

A propósito, em que você calculou a ACF?

Sobre o que eu contei a ACF - eu escrevi. Nos dados do arquivo anexo, apenas eu pego a linha inteira dos dados, não 100 pontos como você. A propósito, não entendo porque você tem que tomar 100 pontos de dados. Não é o suficiente, IMHO.

Sobre o intervalo de confiança. Meu resultado soa assim: no nível 0,01, a hipótese nula de que as estatísticas de informação mútua entre a barra nula e os lags não são diferentes na série aleatória e a fonte não é confirmada.

Desculpe por não responder de imediato. Apenas me esqueci, e estava um pouco ocupado.

 
Entendo corretamente que a acf é considerada aqui para uma seqüência linear de séries? E é possível passar à noção de correlação de parcelas de distribuição com o aumento do comprimento das séries?
 
alexeymosc:

O que eu usava para calcular a ACF - eu a escrevi. Nos dados do arquivo anexo, apenas eu pego a linha inteira dos dados, não 100 pontos como você. A propósito, não entendo porque você tem que tomar 100 pontos de dados. Não é o suficiente, IMHO.

Sobre o intervalo de confiança. Meu resultado soa assim: no nível 0,01, a hipótese nula de que a estatística de informação mútua entre a barra nula e os lags não é diferente na série aleatória e a fonte não é confirmada.

Obrigado, você me proporcionou total clareza.
 
faa1947:
Obrigado, você me deu total clareza.
Seja bem-vindo. Essa foi a mensagem principal do meu artigo. Conduzi especificamente um teste no final: teste Kolmogorov-Smirnov e Mann-Whitney U-test - para amostras sem especificar o tipo de distribuição. Ambos os testes mostraram que a hipótese nula não está confirmada. Como interpretar este é um tema muito mais amplo.
 
alexeymosc:
Por favor. Essa foi a mensagem principal do meu artigo. Eu fiz especificamente um teste Kolmogorov-Smirnov e Mann-Whitney U no final para amostras sem nenhuma indicação do tipo de distribuição. Ambos os testes mostraram que a hipótese nula não está confirmada. Como interpretar este é um tópico muito mais amplo.
Então, de onde vieram os testes e a ACF, afinal?
 
faa1947:
Então, de onde vieram os testes e a ACF, afinal?
Ah, agora eu entendo a pergunta. Statistica.
 
alexeymosc:
Ah, agora eu entendo a pergunta. Statistica.
O próximo penúltimo passo é EViews e depois o último passo é R.
 
faa1947:
O próximo penúltimo passo é EViews, e depois o último é R.

Já ouvi falar muito sobre EViwes de você, vou tentar. R - também já ouviram e até viram. Também vou tentar quando tiver tempo. Li em um fórum médico que às vezes os resultados dos cálculos dos testes diferem entre os diferentes programas, infelizmente.

E o Excel em geral - mesmo a qualidade do PRNG, ao contrário do Statistica. Eu mesmo observei diferenças na suavidade do sino de distribuição normal.

 

Quando eu tiver tempo, gostaria de fazer isso neste tópico. Por analogia com a autocorrelação privada (onde a influência dos desfasamentos intermediários é cortada), fazer o corte da influência dos desfasamentos intermediários ao calcular informações mútuas.

Aqui está um exemplo. Esta é a autocorrelação da volatilidade (modulo) do EURUSD H1 na profundidade de até 480 lags:

E é assim que se parece um gráfico de autocorrelações parciais - ou seja, a influência de desfasamentos intermediários (falsas correlações) foi removida:

Você pode ver que muitas correlações são cortadas de uma só vez.

Aqui eu quero fazer uma coisa semelhante, apenas para uma série de retornos com sinais. Pelo menos será visível até que barra há realmente uma memória.