Une corrélation nulle entre les échantillons ne signifie pas nécessairement qu'il n'y a pas de relation linéaire. - page 40

 

Coefficient de corrélation = 0,766654

Tout a été calculé dans Excel. La seule chose - j'ai pris des citations en or de MT (j'étais trop paresseux pour convertir manuellement les chiffres à virgule en points dans le vôtre)

 

J'ai revérifié les données : je me suis un peu trompé. Premièrement, les ratios ne sont pas calculés sur l'intérêt en cours mais sur l'intérêt en cours des opérateurs de couverture de l'or, et deuxièmement, j'ai 3 valeurs nulles pour OM à la fin des données - cela aussi pourrait avoir un fort impact. Bref, les ratios mis à jour :

Pearson : 0,1968

Spearman : 0.2135

Kendall : 0,1430.

Comme vous pouvez le voir, ça s'est amélioré.

 
Demi:

Coefficient de corrélation = 0,766654

Tout a été calculé dans Excel. La seule chose - j'ai pris des citations dorées de MT (j'étais trop paresseux pour convertir manuellement les chiffres à virgule en points dans le vôtre).

On ne peut pas compter sur les rangs, seulement sur les premières différences.
 
Pourquoi pas ?
 
Demi: pourquoi pas ?

Environ la moitié des messages de ce fil sont consacrés à une discussion sur cette question (commencée ici).

Mon avis : L'estimation de la corrélation par le coefficient de corrélation de Pearson, par analogie avec l'estimation de l'espérance par la moyenne arithmétique et l'estimation de la variance par le RMS, n'est acceptable que pour les éléments d'ensembles de l'espace linéaire. Sinon, il est nécessaire soit d'effectuer une transformation sur les données originales (par exemple, dans le cas de séries chronologiques de prix, de convertir les mesures de l'échelle relative absolue à l'échelle d'intervalle), soit d'ajuster les formules d'estimation.

 
GaryKa:

Environ la moitié des messages de ce fil sont consacrés à la discussion de cette question (commencée ici).

Mon avis : L'estimation de la corrélation par le coefficient de corrélation de Pearson, par analogie avec l'estimation de l'espérance par la moyenne arithmétique et la variance par la RMS, n'est acceptable que pour les éléments des ensembles de l'espace linéaire. Sinon, il est nécessaire soit d'effectuer une transformation sur les données originales (par exemple, dans le cas de séries chronologiques de prix, de convertir les mesures de l'échelle absolue à l'échelle d'intervalle), soit d'ajuster les formules d'estimation.

En fait, ici.

Il y a beaucoup de texte - la corrélation peut être comptée à la fois entre les séries et entre les premières différences. Hafftar a posté deux graphiques et a montré des coefficients de corrélation de dimension 0.00... Cela m'a frappé et j'ai recalculé. Mais l'afftar s'est corrigé.

P.S. Plus simple, plus simple nous devrions être....

 

C-4:

Évidemment, les premières différences de la forme I(0) sont nécessaires pour le calcul, car dans le cas de I(1), nous sommes dans un guet-apens, car les séries auxquelles nous avons affaire sont toujours positives (le prix est toujours supérieur à zéro), mais de cela aussi plus tard.


Heh, pas évident. Pour le CQ de Pearson, il importe peu que les séries soient positives ou négatives, ce qui compte c'est qu'il y ait covariance, c'est-à-dire la similarité de la dynamique. Des différences premières non corrélées n'impliquent pas du tout que les séries originales sont non corrélées. De plus, en prenant cette différence même, les éléments de corrélation linéaire, que Pearson montre, sont juste éliminés. Il n'y a donc rien d'inhabituel dans le résultat obtenu, et la conclusion est la suivante

1. Comme vous pouvez le constater, la série I(1) ne peut pas du tout être utilisée. Pour les séries dont la corrélation n'est pas évidente et n'est pas rigidement fonctionnelle, les coefficients de corrélation sont absolument inutiles.

Le fait que le CQ soit prétendument surestimé est absolument faux : le processus est centré dans le calcul (la moyenne de l'échantillon est soustraite), le CQ peut donc être positif ou négatif. C'est-à-dire que 15% dans votre cas est un coefficient parfaitement réaliste, qui est à peu près ce que je donnerais en regardant le graphique visuellement.

 
alsu:

C'est-à-dire que 15% dans votre cas est un coefficient parfaitement réaliste, qui est à peu près ce que je donnerais en regardant le graphique visuellement.

Je suis d'accord avec cela.

alsu:

Heh, pas évident. Pour le CQ de Pearson, peu importe que la série soit positive ou négative, ce qui compte c'est qu'il y ait covariance, c'est-à-dire la similarité de la dynamique. Des différences premières non corrélées n'impliquent pas du tout que les séries originales sont non corrélées. De plus, en prenant cette différence même, on détruit les éléments de corrélation linéaire que Pearson montre. Il n'y a donc rien d'anormal dans le résultat obtenu...

Ok, alors pourquoi si nous générons 100 BP(1) indépendants avec un biais positif insignifiant (c'est-à-dire que la plupart des BP sont dans la zone > 0), puis construisons leur matrice de corrélation et obtenons ensuite un histogramme de leurs distributions, nous ne verrons rien de commun avec la distribution normale sur cet histogramme, mais nous verrons ceci :

Nous pouvons voir que sur 10 000 combinaisons de BP (100*100), il y a autant de combinaisons avec une corrélation de 0,5 et -0,5. C'est-à-dire que la probabilité que deux marches aléatoires positives et indépendantes soient corrélées entre elles avec un KK de 0,0 est la même que si leur KK était égal à tout autre nombre compris entre -1,0 et +1,0. Ce qui signifie que I(1) ne peut pas être utilisé. D'une manière ou d'une autre.

 

Le problème de la corrélation se situe sur un tout autre plan.

Lorsque le CQ est compté, nous obtenons toujours un chiffre. L'algorithme ne fournit pas de valeur QC= NA, c'est-à-dire "aucune valeur". Pas zéro, mais "aucune valeur". C'est pourquoi il est possible d'obtenir une corrélation de kothir avec les anneaux de Saturne, et par là même, avec les problèmes nasaux.

Le CQ ne doit être compté que pour les paires dont vous savez, d'après leur contenu, qu'elles sont potentiellement corrélées. Au minimum. Et en général, l'existence d'une telle connexion doit être justifiée de manière significative. Dans ce cas, le chiffre obtenu sera interprété comme une mesure quantitative de ce contenu.

Je passe sous silence le reste des subtilités du calcul.

 
faa1947:

Le problème de la corrélation se situe sur un tout autre plan.

Lorsque le CQ est compté, nous obtenons toujours un chiffre. L'algorithme ne fournit pas de valeur QC= NA, c'est-à-dire "aucune valeur". Pas zéro, mais "aucune valeur". C'est pourquoi il est possible d'obtenir une corrélation de kothir avec les anneaux de Saturne, et en même temps avec les problèmes de nez.

Le CQ ne doit être compté que pour les paires dont vous savez, d'après leur contenu, qu'elles sont potentiellement corrélées. Au minimum. Et en général, l'existence d'une telle connexion doit être justifiée de manière significative. Dans ce cas, le chiffre obtenu sera interprété comme une mesure quantitative de ce contenu.

Je suis silencieux sur toutes les autres subtilités du calcul.

Tout cela est absurde. "Potentiellement connecté" tout dans ce monde. Et la température de l'océan au large des côtes du Mexique a un effet fonctionnel sur les rendements du blé en France.

Un coefficient de corrélation peut également être calculé entre des phénomènes qui ne sont pas en relation de cause à effet. La question est l'interprétation de ce coefficient