Une corrélation nulle entre les échantillons ne signifie pas nécessairement qu'il n'y a pas de relation linéaire. - page 39

 


Voici les commentaires sur le lien de hrenfx 22.03.2011 00:43 aimé :

il y a une corrélation ! :)
cela ne signifie pas que l'un soit une conséquence de l'autre.
mais les phénomènes sont liés.
(et on peut alors commencer à inventer des explications).
mais ce n'est pas la question.
Le fait est que, dans une certaine mesure, il est possible de prévoir la relation de l'un à l'autre. jusqu'à un certain point. )
Bien entendu, une bonne compréhension du mécanisme de la connexion permettra de prévoir le moment où la connexion prendra fin.
mais...
mais aussi simplement en analysant constamment la corrélation - il est possible de prédire quand elle prendra fin. )

 
Comme Grove : il y a une corrélation - ça ne peut pas ne pas être))))))))))
 
Neutron:

Je suis en partie d'accord, mais en aucun cas avec tout. Si vous souhaitez avoir une discussion de fond sur le sujet que vous avez soulevé, vous devrez d'abord lire quelques-uns de mes messages révélant mon point de vue sur le sujet. J'ai dû me répéter souvent, alors je ne le ferai plus. Je viens de vous envoyer deux liens vers mes posts par MP.

 
hrenfx

Bonjour, j'ai suivi vos fils de discussion et je suis intéressé par votre logique,

J'ai une question - avez-vous essayé de réécrire l'indicateur de corrélation de recycle2 à mt5

 

Dans ma recherche, j'avais besoin d'évaluer qualitativement la relation entre les séries, j'ai donc décidé d'utiliser le coefficient de corrélation. Les conclusions sont décevantes : les méthodes que les statistiques classiques suggèrent d'utiliser sont pratiquement inutiles pour trouver des relations non évidentes entre les séries. Par exemple, prenons un graphique hebdomadaire de contrats à terme sur l'or et son intérêt ouvert :

Il y a manifestement une corrélation directe. Oui, ce n'est pas très fort et évident, mais lorsque le prix de l'or augmente, la valeur de l'intérêt ouvert des contrats à terme sur l'or est plus élevée, lorsqu'il baisse - plus faible.

Plus tard, nous trouverons les coefficients de corrélation entre le prix de l'or et son OI. Mais d'abord, considérons la formule de corrélation de Pearson la plus courante :

Si vous regardez de près, il apparaît clairement que la formule déstend les données (x - x médiane), aligne les volatilités par écart type sur l'ensemble de l'échantillon, puis compte combien de temps les deux séries ont été dans la même direction. Évidemment, le calcul nécessite les différences premières de la forme I(0), car dans le cas de I(1), nous sommes dans un guet-apens, car les séries auxquelles nous avons affaire sont toujours positives (le prix est toujours supérieur à zéro), mais nous y reviendrons plus tard.

Corrélation de Pearson : 0,02234314

Corrélation de Kendel : 0.002866038

Corrélation de Spearman : 0.002046104

C'est-à-dire qu'en fait, aucune corrélation n'a été trouvée dans tous les cas. Mais qu'en est-il de nos yeux perçants ? Est-ce que nous imaginons tout ça ? Et la corrélation entre l'or et l'Open Interest est-elle la même que la corrélation entre les importations de bananes du Maroc et le taux de natalité du pays ?

La raison en est peut-être le retard d'un indicateur par rapport à l'autre. Les décalages ne correspondent pas. Et si l'OI augmente d'abord et seulement ensuite l'or le fait ? - Oh, alors il pourrait y avoir de l'argent à gagner là-dessus :) Testons l'idée avec une fonction de corrélation croisée :

Un peu moins convaincant. Deux valeurs se détachent de l'échantillon, mais dans l'ensemble et ici, on a l'impression qu'il n'y a pas de relation et que le décalage ne joue donc aucun rôle.

OK. Essayons ensuite de calculer la corrélation sur la série I(1). Qui dit que cela ne devrait pas être fait dans tous les cas ? Qu'il y ait une surestimation du résultat - mais mieux vaut une surestimation que pas de résultat. A cette fin, une expérience a été menée, générons 100 BPs et calculons la matrice de corrélation pour eux. La valeur moyenne montrera de combien l'estimation sera surestimée, et simplement en travaillant sur des séries I(1), nous en tiendrons compte, ou pas ?

Voici un script sur R qui fait tout cela :

#
# corexp - эксперимент выявляющий особенности корреляционных функций при работе с I(1) рядами
# exp - количество экспериментов
# lenght - длинна каждой серии
# cortype - тип корреляции (pearson - КК Пирсона, kendall - КК Кендалла, spearman - КК Спирмана)
# retrange - Истина, если требуется сгенерировать I(1) ряды
#
corexp <- function(exp = 10, lenght = 1000, cortype = 'pearson', retrange = TRUE)
{
   bp <- matrix(ncol = exp, nrow = lenght)
   for(i in 1:exp)
   {
      bp[,i] <- rnorm(lenght, mean = 0.000117, sd = 0.0048)
      if(retrange == FALSE)
            bp[,i] <- cumsum(bp[,i])
   }
   #Рассчитываем матрицу корреляций
   mcor <- matrix(ncol=exp, nrow=exp)
   for(k in 1:exp)
   {
      for(i in 1:exp)
      {
         mcor[k,i] <- cor(bp[,k], bp[,i], method = cortype)
      }
   }
   return(mcor)
}

# Статистика корреляций
# При желании считаем здесь все что угодно
corstat <- function(m)
{
   m[m == 1] <- NaN
   mean(m, na.rm = TRUE)
}

Regardons en fait cette "moyenne" : 0,153359. Il semble bien - il n'est surestimé que de 15 %. Mais il y a un autre piège. Nous examinons la distribution de la matrice de corrélation :

Dans ce cas, la valeur moyenne n'est pas du tout définie, ou plutôt toute valeur de corrélation est aussi fréquente que toute autre valeur. Il s'agit du biais positif de notre BP, qui est défini par le paramètre mis en évidence en gras. Après tout, tous les prix auxquels nous avons affaire ont des valeurs positives, c'est-à-dire qu'ils se situent dans la zone positive.

1. Comme vous pouvez le constater, la série I(1) ne peut pas du tout être utilisée. Pour les séries dont la relation n'est pas évidente et n'est pas rigidement fonctionnelle, les coefficients de corrélation sont absolument inutiles.

2. Le choix d'une implémentation particulière d'un coefficient de corrélation n'affecte pas fondamentalement quoi que ce soit. Aucun des trois coefficients communs n'a jamais pu révéler la relation entre l'or et son intérêt ouvert, même s'il est évident qu'une telle relation existe.

 
C-4:

Corrélation de Pearson : 0,02234314

Corrélation de Kendel : 0.002866038

Corrélation de Spearman : 0.002046104

Peut-on jeter un coup d'œil à la série originale ? Sont-ils disponibles dans Excel, par exemple ?
 
Les lignes d'origine ne sont pas sauvegardées. Voici l'une des générations au format CSV.
Dossiers :
bp.txt  2010 kb
 
C-4:
Les lignes d'origine ne sont pas sauvegardées. Voici l'une des générations au format CSV.
Quelle est votre source de données sur les intérêts ouverts ?
 
Voici les données OI alignées sur le prix de l'or.
Dossiers :
gold_oi_2.txt  19 kb
 
Coefficient de corrélation = 0,766654