A correlação de amostra zero não significa necessariamente que não exista uma relação linear - página 8

 
hrenfx:

Em todos os lugares que leio, eles dizem que uma correlação de amostra zero significa que não existe uma relação linear (geralmente esquecemos a palavra linear) naquela amostra.

Apenas em termos simplificados, sim, é verdade. E isto é, em geral, correto. E as sutilezas não têm nenhuma utilidade para o público em geral.

hrenfx:

Exemplo de dois gráficos com MO zero, variância um e correlação zero. Ou seja, a correlação neste caso é a soma dos produtos dos termos da BP dividida pelo comprimento da BP.

Aqui estão meus gráficos. Estes são os dados.


E aqui está Pearson, calculado trivialmente em Excel. Com uma advertência, os cálculos foram feitos em uma janela deslizante.


Como você pode ver, na aproximação mais crua, o coeficiente varia ao longo do tempo. Parece-me que foi você, que eu já havia apontado antes, que existem problemas de estacionariedade nas séries temporais de preços. E sobre a necessidade de ter cuidado ao utilizar métodos estatísticos não projetados para dados não estacionários. (Embora, o problema aqui seja um pouco mais complexo do que a não-estacionariedade).

hrenfx:

Na verdade, há sempre uma relação linear entre quaisquer duas variáveis aleatórias em uma amostra finita.

Tenha cuidado ao interpretar correlações próximas a zero.

Na verdade, existe uma relação linear entre duas variáveis aleatórias nessas duas séries. Pode não estar presente nos outros. Esta é uma delas. Segundo, o coeficiente, como qualquer estimativa decente de uma variável aleatória, tem uma área de confiança. De qualquer forma, seus sentimentos não importam.


Em geral, tenha cuidado com o que você diz sobre coisas que não entende completamente.

 
HideYourRichess:

Como pode ser visto, na aproximação mais crua, o coeficiente varia ao longo do tempo.

Isto é óbvio. Assim como o fato de que a dinâmica do coeficiente dependerá do tamanho da janela deslizante.

Creio que foi a vocês que já apontei os problemas de estacionaridade nos preços das séries temporais. E sobre a necessidade de ter cuidado ao utilizar métodos estatísticos não projetados para dados não estacionários.

Nenhum método estatístico é utilizado. A não-estacionariedade não tem nada a ver com isso.

Na verdade, existe uma relação linear entre as duas variáveis aleatórias nessas duas séries. Pode não existir nos outros. Esta é uma delas. Segundo, o coeficiente, como qualquer estimativa decente de uma variável aleatória, tem uma área de confiança. De qualquer forma, suas frases não fazem nenhum sentido.

Como você entende a correlação linear? Já escrevi que em um sentido acadêmico é uma medida do ângulo entre os vetores. E isso é uma má definição quando se trata de interconexão.

Não há relação linear somente quando a variação de um dos vetores é zero. Em todos os outros casos existe uma relação.

E mais uma vez, estamos falando de estimativas sobre amostras, não de BPs teóricas infinitas.

 
hrenfx:

Isto é óbvio. Assim como o fato de que a dinâmica do coeficiente dependerá do tamanho da janela deslizante.

Pelo que você escreveu e desenhou aqui, eu não vi que este é o caso. É uma questão de obviedade. Bem, compreender o significado de estacionaridade não é tão simples como se tenta fazer com que seja, através do tamanho da janela.

hrenfx:

Nenhum método estatístico é utilizado. A não-estacionariedade não tem nada a ver com isso.

Na verdade, o coeficiente de correlação pertence a uma seção de estatísticas matemáticas chamada análise de correlação. E foi inventado por estaticistas matemáticos. Assim, assim que você tenta calcular um coeficiente de correlação, você está automaticamente usando métodos estatísticos. E você tem que considerar todas as limitações desses métodos.

hrenfx:

Como você entende sequer a relação linear? Já escrevi que em um sentido acadêmico é uma medida do ângulo entre os vetores. E é uma definição ruim quando se trata de interacoplamento.

Não há relação linear somente quando a variação de um dos vetores é zero. Em todos os outros casos há um relacionamento.

E mais uma vez, estamos falando de estimativas sobre amostras, não de BPs teóricas infinitas.

Não exatamente dessa forma. E foi explicado acima porque não. Em estatística, sob certas condições, coeficiente =0 e coeficiente =0,7 pode significar a mesma coisa - nenhuma ou fraca conexão.

 
HideYourRichess:

Pelo que você escreveu e desenhou aqui, eu não vi que este é o caso. É uma questão de obviedade. Bem, compreender o significado de estacionaridade não é tão simples como se tenta fazer com que seja, através do tamanho da janela.

Você está, por alguma razão, me compensando. Não vou usar um termo que não entendo. E uma definição da qual eu não sei.

Na verdade, o coeficiente de correlação pertence a uma seção de estatísticas matemáticas chamada análise de correlação. E foi inventado por estaticistas matemáticos. Assim, assim que você tenta calcular o coeficiente de correlação, você utiliza automaticamente métodos estatísticos. E você tem que considerar todas as limitações desses métodos.

Também familiarizado com a análise de correlação e regressão. Eu não utilizo nenhum método estatístico. Eu penso no coeficiente de correlação como a coisa mais simples que vem à mente quando se precisa estimar um relacionamento. Este é o nível escolar. E sem conhecimento de Pearson, cheguei a isso quase tão logo pensei em correlações.

Na verdade, não. E foi explicado acima porque não. Em estatística, sob certas condições, coeficiente =0 e coeficiente =0,7 pode significar a mesma coisa - a ausência ou fraqueza de uma relação.

Eu não entendo.
 
É simples. Você acusa o coeficiente Pearson de ser insustentável, e eu digo que seus métodos de utilização são insustentáveis, mas o parâmetro em si é bom. E, como foi corretamente dito, você não deve ler livros sobre estatísticas matemáticas, mas estudá-los. Para utilizá-lo de forma competente.
 
hrenfx:
Minha conclusão é que a correlação (coeficiente de Pearson) é um indicador de merda de uma relação linear em uma amostra. Não só não mostra uma correlação direta, como também mente
.

Você chama isso de uma crítica ao coeficiente Pearson? Estou criticando as pessoas inteligentes que a interpretam mal ao falar sobre a presença/ausência de uma relação, e nem mesmo ao entender o que é uma relação linear.

Falando da inconsistência dos meus métodos, você deve pelo menos mencionar um. Os métodos Pearson não foram discutidos neste tópico.

Além disso, não li nenhum livro de estatísticas matemáticas. A análise de correlação e regressão foi estudada, quando todo este simples kit de ferramentas escrito por matemáticos em uma linguagem complicada já estava funcional em meu MQL4. E não é preciso ser um "jack-of-all-trades" para entender 90% do que está escrito nos livros sobre correlação e regressão. Refiro-me à parte prática, não à parte teórica que ocupa a maior parte dos livros.

 
hrenfx:

Você chama isso de uma crítica ao coeficiente Pearson? Estou criticando as pessoas inteligentes que a interpretam mal ao falar sobre a presença/ausência de uma relação, e nem mesmo ao entender o que é uma relação linear.

Sim. E mais, você está criticando C. Pearson de forma descarada. Escreva mais claramente para que fique inequivocamente claro para todos o que exatamente é que você está desafiando.

hrenfx:

Falando da inconsistência dos meus métodos, você mencionaria pelo menos um. Os métodos Pearson não foram discutidos neste tópico.

O coeficiente de correlação linear em pares é o que você estava falando.

E quanto aos métodos, você tem resultados surpreendentes no início de seu tópico. E ao apontar seu dedo para eles, você tira conclusões surpreendentes. Como isso pode ser considerado, exceto como falha de seus métodos - recuso-me a entender.

hrenfx:

Além disso, não li um livro sobre estatísticas matemáticas.

Dê meus cumprimentos à Mitrofanushka.

hrenfx:

Aprendi a correlação e análise de regressão quando todas aquelas ferramentas simples, escritas por matemáticos em uma linguagem complicada, já estavam funcionais em meu MQL4. E não é preciso ser um "jack-of-all-trades" para entender 90% do que está escrito nos livros sobre correlação e regressão. Refiro-me à parte prática, não à parte teórica que ocupa a maior parte dos livros.

O que você mostrou aqui - mostra claramente que você não estudou nada adequadamente. As fórmulas na seção de correlação Pearson realmente não são difíceis, mas o fato de que você é capaz de adicionar números sobre as fórmulas, não significa de modo algum que você seja capaz de usar corretamente o aparelho de matemática dado. E seu raciocínio mostra que há algo de errado com seu entendimento.

 
hrenfx:

Você chama isso de uma crítica ao coeficiente Pearson? Estou criticando as pessoas inteligentes que a interpretam mal ao falar sobre a presença/ausência de uma relação, e nem mesmo ao entender o que é uma relação linear.

...


Você não acha honestamente que nenhum dos presentes aqui em um fórum por cerca de 5-8 anos, nunca adivinhou construir CC, que ninguém ouviu falar de Pearson e mesmo se ouvido, não pode programá-lo (calcular), etc.

Ouça bem (leia-se), aqui neste tópico já foram verificados muitos. E eles lhe falam sobre a mesma coisa, em palavras diferentes, mas estão tentando explicar algo. Sim, eu também discuti freqüentemente recentemente com o HideYourRichess, mas posso assegurar que ele é muito competente e especialista em seu trabalho. Como quase todos que aqui marcaram a filial. Sim, podemos não concordar em pontos de vista, mas uma conversa respeitosa ajuda a ganhar conhecimento, às vezes se os adversários estiverem atentos uns aos outros, em uma discussão nasce a verdade ...

Parece-me que você quer explorar (construir) algo, mas não pode explicá-lo de forma alguma. Muitas pessoas não entendem você, você usa termos comumente conhecidos para explicar, mas você os usa da maneira errada. Tente explicar isso com fórmulas. Basta escrevê-lo de uma forma compreensível. E explique o que e como você quer calcular ou já calculou.

Não irrite Deus (embora eu não acredite nele), mas acusar a todos indiscriminadamente de usar Pearson incorretamente, calculá-lo, não entendê-lo, é muito presunçoso...

 

hrenfx, não consigo entender, você já leu muitos livros?

Que diabos é logaritmo, que baldes e quilos????? Que outra "interpretação" do coeficiente de correlação além da conhecida que existe há cem anos? Meu conselho a você - durma um pouco primeiro, e depois comece a aprender a matemática do zero. Privalov escreveu um roteiro, os resultados são consistentes com os de Matkad. Escrevi o roteiro sem olhar para os outros, comparei os resultados e eles são os mesmos que os de Beer e Matkad. Cento e cinqüenta pessoas já escreveram este CQ cento e cinqüenta vezes - e todos os resultados são os mesmos. Então, por que todos se apressariam a reescrever seus programas, descobrindo de repente que alguém tem sua própria interpretação do CQ da Pearson?

 
hrenfx:

.........

Se a amostra parece pequena, vamos tirar algo maior da tabela de correlação:

Corr = 0,0000, #NGX0 - EURGBP, barras = 24943 (2010.05.28 21:25 - 2010.09.28 18:40), Novembro 2010 Futuro do Gás Natural - Euro vs Libra Est
erlina

Corr = -0,0015, USDNOK - USDSGD, barras = 54961 (2010.01.01 00:00 - 2010.09.28 17:20), dólar americano vs coroa norueguesa - dólar americano vs coroa de Cingapura

Uau, quase não há correlação linear entre a coroa norueguesa e o dólar Signpura - bobagem!
Corr = -0,0008, GOLD - USDCAD, barras = 54898 (2010.01.01 00:00 - 2010.09.28 16:45), SPOT Gold Once vs US Dollar - US Dollar vs Canadian
Ainda mais engraçado, não há quase nenhuma correlação linear entre o ouro e o dólar canadense - piça!

.........

Sem tocar nos aspectos matemáticos do problema levantado, quero perguntar ao iniciador do tema: e por que, na sua opinião, deveria haver uma correlação pronunciada entre os três pares de ativos apresentados? Por exemplo: por que uma mudança no valor do dólar canadense é certo que haverá. afetam as mudanças no valor do ouro? E em que direção?