Une corrélation nulle entre les échantillons ne signifie pas nécessairement qu'il n'y a pas de relation linéaire. - page 8

 
hrenfx:

Partout où je lis, on dit qu'une corrélation d'échantillon nulle signifie qu'il n'y a pas de relation linéaire (on oublie généralement le mot linéaire) dans cet échantillon.

Si ce n'est que sous une forme simplifiée, alors oui, c'est ce qu'il dit. Et c'est, en général, correct. Et les subtilités ne sont d'aucune utilité pour le grand public.

hrenfx:

Exemple de deux graphiques avec un MO de zéro, une variance de un et une corrélation de zéro. C'est-à-dire que la corrélation dans ce cas est la somme des produits des termes de la BP divisée par la longueur de la BP.

Voici mes graphiques. Voici les données.


Et voici Pearson, calculé trivialement dans Excel. Avec une réserve, les calculs ont été effectués dans une fenêtre coulissante.


Comme vous pouvez le voir, dans l'approximation la plus grossière, le coefficient varie dans le temps. Il me semble que c'est vous, que j'ai déjà signalé, qu'il y a des problèmes de stationnarité dans les séries chronologiques de prix. Et sur la nécessité d'être prudent lors de l'utilisation de méthodes statistiques non conçues pour les données non stationnaires. (Bien que le problème ici soit un peu plus complexe que la non-stationnarité).

hrenfx:

En fait, il existe toujours une relation linéaire entre deux variables aléatoires quelconques sur un échantillon fini.

Faites attention à l'interprétation des corrélations proches de zéro.

En fait, il existe une relation linéaire entre deux variables aléatoires sur ces deux séries. Elle peut ne pas être présente sur les autres. C'en est une. Deuxièmement, le coefficient, comme toute estimation décente d'une variable aléatoire, possède une zone de confiance. De toute façon, vos sentiments n'ont pas d'importance.


En général, faites attention à ce que vous dites sur les choses que vous ne comprenez pas complètement.

 
HideYourRichess:

Comme on peut le voir, dans l'approximation la plus grossière, le coefficient varie dans le temps.

C'est évident. Ainsi que le fait que la dynamique du coefficient dépendra de la taille de la fenêtre glissante.

Je crois que c'est à vous que j'ai déjà signalé les problèmes de stationnarité dans les séries chronologiques de prix. Et sur la nécessité d'être prudent lors de l'utilisation de méthodes statistiques non conçues pour les données non stationnaires.

Aucune méthode statistique n'est utilisée. La non-stationnarité n'a rien à voir avec cela.

En fait, il existe une relation linéaire entre les deux variables aléatoires de ces deux séries. Elle peut ne pas exister sur les autres. C'en est une. Deuxièmement, le coefficient, comme toute estimation décente d'une variable aléatoire, possède une zone de confiance. De toute façon, vos phrases n'ont aucun sens.

Comment comprenez-vous la corrélation linéaire ? J'ai déjà écrit que dans un sens académique, c'est une mesure de l'angle entre les vecteurs. Et c'est une mauvaise définition lorsqu'il s'agit d'interconnexion.

Il n'y a de relation linéaire que lorsque la variance de l'un des vecteurs est nulle. Dans tous les autres cas, il existe une relation.

Et encore une fois, nous parlons d'estimations sur des échantillons, pas de BP théoriques infinis.

 
hrenfx:

C'est évident. Il en est de même du fait que la dynamique du coefficient dépendra de la taille de la fenêtre glissante.

D'après ce que vous avez écrit et dessiné ici, je n'ai pas vu que c'était le cas. C'est une question d'évidence. Eh bien, comprendre la signification de la stationnarité n'est pas aussi simple que vous essayez de le faire croire, par la taille de la fenêtre.

hrenfx:

Aucune méthode statistique n'est utilisée. La non-stationnarité n'a rien à voir avec cela.

En fait, le coefficient de corrélation appartient à une section de la statistique mathématique appelée analyse de corrélation. Et il a été inventé par des statisticiens mathématiciens. Ainsi, dès que vous essayez de calculer un coefficient de corrélation, vous utilisez automatiquement des méthodes statistiques. Et vous devez tenir compte de toutes les limites de ces méthodes.

hrenfx:

Comment comprenez-vous la relation linéaire ? J'ai déjà écrit que dans un sens académique, c'est une mesure de l'angle entre les vecteurs. Et c'est une mauvaise définition lorsqu'il s'agit d'intercouplage.

Il n'y a de relation linéaire que lorsque la variance de l'un des vecteurs est nulle. Dans tous les autres cas, il existe une relation.

Et encore une fois, nous parlons d'estimations sur des échantillons, pas de BP théoriques infinis.

Pas exactement comme ça. Et il a été expliqué ci-dessus pourquoi pas. En statistique, dans certaines conditions, le coefficient =0 et le coefficient =0,7 peuvent signifier la même chose - une connexion nulle ou faible.

 
HideYourRichess:

D'après ce que vous avez écrit et dessiné ici, je n'ai pas vu que c'était le cas. C'est une question d'évidence. Eh bien, comprendre la signification de la stationnarité n'est pas aussi simple que vous essayez de le faire croire, par la taille de la fenêtre.

Vous êtes, pour une raison quelconque, en train de vous rattraper. Je n'utiliserai pas un terme que je ne comprends pas. Et une définition que je ne connais pas.

En fait, le coefficient de corrélation appartient à une section de la statistique mathématique appelée analyse de corrélation. Et il a été inventé par des statisticiens mathématiciens. Ainsi, dès que vous essayez de calculer le coefficient de corrélation, vous utilisez automatiquement des méthodes statistiques. Et vous devez tenir compte de toutes les limites de ces méthodes.

Connaissance également de l'analyse de corrélation et de régression. Je n'utilise pas de méthodes statistiques. Je considère le coefficient de corrélation comme la chose la plus simple qui vient à l'esprit lorsqu'il s'agit d'estimer une relation. C'est le niveau de l'école. Et sans connaître Pearson, j'y suis arrivé presque dès que j'ai pensé aux corrélations.

Pas vraiment. Et il a été expliqué ci-dessus pourquoi pas. En statistique, dans certaines conditions, le coefficient =0 et le coefficient =0,7 peuvent signifier la même chose - l'absence ou la faiblesse d'une relation.

Je ne comprends pas.
 
C'est simple. Vous accusez le coefficient de Pearson d'être indéfendable, et je dis que vos méthodes d'utilisation sont indéfendables, mais que le paramètre lui-même est bon. Et, comme on l'a dit à juste titre, il ne faut pas lire les livres de statistiques mathématiques, mais les étudier. Pour l'utiliser avec compétence.
 
hrenfx:
Ma conclusion est que la corrélation (coefficient de Pearson) est un indicateur merdique d'une relation linéaire dans un échantillon. Non seulement la corrélation ne montre pas une relation directe, mais elle ment.

Est-ce que vous appelez cela une critique du coefficient de Pearson ? Je critique les personnes intelligentes qui l'interprètent mal en parlant de la présence/absence d'une relation, sans même comprendre ce qu'est une relation linéaire.

En parlant de l'incohérence de mes méthodes, vous devriez au moins en mentionner une. Les méthodes de Pearson n'ont pas été discutées dans ce fil.

De plus, je n'ai pas lu de livres de statistiques mathématiques. L'analyse de corrélation et de régression a été étudiée, alors que toute cette simple boîte à outils écrite par des mathématiciens dans un langage compliqué était déjà fonctionnelle dans mon MQL4. Et il n'est pas nécessaire d'être un touche-à-tout pour comprendre 90 % de ce qui est écrit dans les livres sur la corrélation et la régression. Je veux dire la partie pratique, pas la partie théorique qui occupe la plupart des livres.

 
hrenfx:

Est-ce que vous appelez cela une critique du coefficient de Pearson ? Je critique les personnes intelligentes qui l'interprètent mal en parlant de la présence/absence d'une relation, sans même comprendre ce qu'est une relation linéaire.

Oui. De plus, vous critiquez C. Pearson de façon éhontée. Écrivez plus clairement afin que chacun comprenne sans ambiguïté ce que vous contestez exactement.

hrenfx:

En parlant de l'incohérence de mes méthodes, vous devriez au moins en mentionner une. Les méthodes de Pearson n'ont pas été discutées dans ce fil.

Le coefficient de corrélation linéaire par paire est ce dont vous parliez.

Et pour ce qui est des méthodes, vous avez des résultats étonnants dans votre topicstart. Et en les montrant du doigt, vous tirez des conclusions surprenantes. Je refuse de comprendre comment cela peut être considéré, sauf comme un échec de vos méthodes.

hrenfx:

De plus, je n'ai pas lu de livre sur les statistiques mathématiques.

Transmettez mes salutations à Mitrofanushka.

hrenfx:

J'ai appris la corrélation et l'analyse de régression alors que tous ces outils simples, écrits par des mathématiciens dans un langage compliqué, étaient déjà fonctionnels dans mon MQL4. Et il n'est pas nécessaire d'être un touche-à-tout pour comprendre 90 % de ce qui est écrit dans les livres sur la corrélation et la régression. Je veux dire la partie pratique, pas la partie théorique qui occupe la plupart des livres.

Ce que vous avez montré ici - montre clairement que vous n'avez rien étudié correctement. Les formules de la section corrélation Pearson ne sont vraiment pas difficiles, mais le fait que vous soyez capable d'ajouter des chiffres sur des formules, cela ne signifie pas du tout que vous êtes capable d'utiliser correctement l'appareil mathématique donné. Et votre raisonnement montre qu'il y a quelque chose qui cloche dans votre compréhension.

 
hrenfx:

Est-ce que vous appelez cela une critique du coefficient de Pearson ? Je critique les personnes intelligentes qui l'interprètent mal en parlant de la présence/absence d'une relation, sans même comprendre ce qu'est une relation linéaire.

...


Ne pensez-vous pas honnêtement qu'aucun des présents ici sur un forum depuis environ 5-8 ans, n'a jamais deviné de construire CC, que personne n'a entendu parler de Pearson et que même s'ils en ont entendu parler, ils ne peuvent pas le programmer (calculer), etc.

Eh bien, écoutez (lisez), ici dans ce fil a déjà vérifié beaucoup. Ils vous parlent de la même chose, avec des mots différents, mais ils essaient d'expliquer quelque chose. Oui, moi aussi j'ai récemment et fréquemment discuté avec HideYourRichess, mais je peux vous assurer qu'il est très compétent et expert dans son travail. Comme presque tout le monde qui ici a marqué la branche. Oui, nous pouvons ne pas être d'accord sur les points de vue, mais une conversation respectueuse aide à acquérir des connaissances, parfois si les adversaires sont attentifs l'un à l'autre, dans un argument la vérité naît ...

Il me semble que vous voulez explorer (construire) quelque chose, mais que vous ne pouvez l'expliquer d'aucune manière. Beaucoup de gens ne vous comprennent pas, vous utilisez des termes connus pour expliquer, mais vous les utilisez de la mauvaise façon. Essayez de l'expliquer avec des formules. Il suffit de l'écrire de manière compréhensible. Et expliquez ce que vous voulez calculer ou faire calculer et comment.

Ne pas fâcher Dieu (même si je ne crois pas en lui) mais accuser tout le monde indistinctement qu'il utilise Pearson de manière incorrecte, le calcule, ne le comprend pas, est trop présomptueux...

 

hrenfx, je ne comprends pas, avez-vous lu trop de livres ?

Que diable est le logarithme, que sont les seaux et les kilogrammes ????? Quelle autre "interprétation" du coefficient de corrélation que celle, bien connue, qui existe depuis cent ans ? Mon conseil : dormez un peu d'abord, puis commencez à apprendre les maths à partir de zéro. Privalov a écrit un script, les résultats sont cohérents avec ceux de Matkad. J'ai écrit le script sans regarder les autres, et j'ai comparé les résultats - ils sont les mêmes que ceux de Beer et Matkad. Cent cinquante personnes ont déjà écrit ce QC cent cinquante fois - et tous les résultats sont les mêmes. Alors pourquoi tout le monde se précipiterait-il soudainement pour réécrire ses programmes en découvrant que quelqu'un a sa propre interprétation du CQ de Pearson ?

 
hrenfx:

.........

Si l'échantillon semble petit, prenons quelque chose de plus grand dans le tableau de corrélation :

Corr = 0.0000, #NGX0 - EURGBP, barres = 24943 (2010.05.28 21:25 - 2010.09.28 18:40), novembre 2010 Natural Gas Future - Euro vs British Pound

Corr = -0.0015, USDNOK - USDSGD, barres = 54961 (2010.01.01 00:00 - 2010.09.28 17:20), Dollar US vs Couronne norvégienne - Dollar US vs Dollar de Singapour

Wow, il n'y a presque pas de corrélation linéaire entre la couronne norvégienne et le dollar signpura - un non-sens !
Corr = -0.0008, GOLD - USDCAD, bars = 54898 (2010.01.01 00:00 - 2010.09.28 16:45), SPOT Gold Once vs US Dollar - US Dollar vs Canadian
Plus drôle encore, il n'y a pratiquement aucune corrélation linéaire entre l'or et le dollar canadien - couillon !

.........

Sans toucher aux aspects mathématiques du problème soulevé, je souhaite poser la question suivante au topicstarter : et pourquoi, selon vous, devrait-il y avoir une corrélation prononcée entre les trois paires d'actifs présentées ? Par exemple : pourquoi un changement de la valeur du dollar canadien il y en a forcément. affectent les changements de la valeur de l'or ? Et dans quelle direction ?