Eine Stichprobenkorrelation von Null bedeutet nicht zwangsläufig, dass es keine lineare Beziehung gibt. - Seite 39

 


Hier aus den Kommentaren zum Link von hrenfx 22.03.2011 00:43 gefällt es:

es besteht ein Zusammenhang! :)
bedeutet dies nicht, dass das eine eine Folge des anderen ist.
aber die Phänomene sind miteinander verbunden.
(und dann kann man anfangen, Erklärungen zu erfinden).
aber das ist nicht der Punkt.
Der Punkt ist, dass es in gewisser Hinsicht möglich ist, das Verhältnis des einen zum anderen vorherzusagen. bis zu einem gewissen Punkt. )
Wenn man den Mechanismus der Verbindung versteht, kann man natürlich vorhersagen, wann die Verbindung enden wird.
aber...
aber auch nur durch ständige Analyse der Korrelation - kann man vorhersagen, wann sie enden wird. )

 
Wie Grove: es gibt eine Korrelation - es kann nicht anders sein))))))))))
 
Neutron:

Ich stimme teilweise zu, aber bei weitem nicht mit allem. Wenn Sie eine sachliche Diskussion über das von Ihnen angesprochene Thema führen wollen, müssen Sie zunächst einige meiner Beiträge lesen, in denen ich meine Meinung zu diesem Thema darlege. Ich musste mich schon oft wiederholen, also werde ich das nicht mehr tun. Ich habe Ihnen gerade zwei Links zu meinen Beiträgen per PM geschickt.

 
hrenfx

Guten Tag, ich habe Ihre Beiträge verfolgt und interessiere mich für Ihre Logik,

Ich habe eine Frage - haben Sie versucht , den Korrelationsindikator von recycle2 auf mt5 umzuschreiben

 

In meiner Untersuchung musste ich die Beziehung zwischen den Reihen qualitativ bewerten, daher habe ich mich für den Korrelationskoeffizienten entschieden. Die Schlussfolgerungen sind enttäuschend: Die Methoden, die die klassische Statistik vorschlägt, sind praktisch unbrauchbar, um nicht offensichtliche Beziehungen zwischen Reihen zu finden. Nehmen wir zum Beispiel ein Wochenchart für Gold-Futures und dessen Open Interest:

Offensichtlich gibt es einen direkten Zusammenhang. Ja, es ist nicht sehr stark und offensichtlich, aber wenn der Goldpreis steigt, ist der Open-Interest-Wert der Gold-Futures höher, wenn er fällt - niedriger.

Später werden wir die Korrelationskoeffizienten zwischen dem Goldpreis und seinem OI ermitteln. Doch betrachten wir zunächst die gängigste Pearson-Korrelationsformel:

Wenn man genau hinsieht, wird deutlich, dass die Formel die Daten detrendiert (x - x Median), die Volatilitäten an der Standardabweichung über die gesamte Stichprobe ausrichtet und dann zählt, wie lange sich beide Reihen in dieselbe Richtung bewegt haben. Für die Berechnung sind natürlich die ersten Differenzen der Form I(0) erforderlich, denn im Fall von I(1) haben wir es mit einem Hinterhalt zu tun, da die Reihen, mit denen wir es zu tun haben, immer positiv sind (der Preis ist immer größer als Null), aber dazu später mehr.

Pearson-Korrelation: 0,02234314

Kendel-Korrelation: 0,002866038

Spearman-Korrelation: 0,002046104

Das heißt, es wurde in allen Fällen keine Korrelation festgestellt. Aber was ist mit unseren scharfen Augen? Bilden wir uns das alles nur ein? Und ist die Korrelation zwischen Gold und Open Interest die gleiche wie die Korrelation zwischen Bananenimporten aus Marokko und der Geburtenrate des Landes?

Vielleicht liegt es daran, dass der eine Indikator gegenüber dem anderen zurückbleibt. Die Verzögerungen stimmen einfach nicht überein. Was ist, wenn der OI zuerst ansteigt und erst dann der Goldpreis steigt? - Oh, dann könnte man damit Geld verdienen :) Testen wir die Idee mit einer Kreuzkorrelationsfunktion:

Wenig überzeugend. Es gibt zwei Werte, die aus der Stichprobe herausstechen, insgesamt ergibt sich hier das Bild, als gäbe es keinen Zusammenhang, und daher spielt die Verzögerung keine Rolle.

GUT. Versuchen wir nun, die Korrelation für die I(1)-Reihe zu berechnen. Wer sagt, dass dies nicht in jedem Fall geschehen sollte? Es kann sein, dass das Ergebnis überschätzt wird - aber besser eine Überschätzung als gar kein Ergebnis. Zu diesem Zweck wurde ein Experiment durchgeführt, bei dem wir 100 BPs erzeugen und die Korrelationsmatrix für sie berechnen. Der Durchschnittswert zeigt, wie stark die Schätzung überschätzt wird, und bei der Arbeit mit I(1)-Reihen wird dies einfach berücksichtigt oder nicht?

Hier ist ein Skript für R, das all dies ermöglicht:

#
# corexp - эксперимент выявляющий особенности корреляционных функций при работе с I(1) рядами
# exp - количество экспериментов
# lenght - длинна каждой серии
# cortype - тип корреляции (pearson - КК Пирсона, kendall - КК Кендалла, spearman - КК Спирмана)
# retrange - Истина, если требуется сгенерировать I(1) ряды
#
corexp <- function(exp = 10, lenght = 1000, cortype = 'pearson', retrange = TRUE)
{
   bp <- matrix(ncol = exp, nrow = lenght)
   for(i in 1:exp)
   {
      bp[,i] <- rnorm(lenght, mean = 0.000117, sd = 0.0048)
      if(retrange == FALSE)
            bp[,i] <- cumsum(bp[,i])
   }
   #Рассчитываем матрицу корреляций
   mcor <- matrix(ncol=exp, nrow=exp)
   for(k in 1:exp)
   {
      for(i in 1:exp)
      {
         mcor[k,i] <- cor(bp[,k], bp[,i], method = cortype)
      }
   }
   return(mcor)
}

# Статистика корреляций
# При желании считаем здесь все что угодно
corstat <- function(m)
{
   m[m == 1] <- NaN
   mean(m, na.rm = TRUE)
}

Schauen wir uns diesen "Mittelwert" einmal genauer an: 0,153359. Sie scheint in Ordnung zu sein - sie wird um nur 15 % überschätzt. Aber es gibt noch eine andere Falle. Wir schauen uns die Verteilung der Korrelationsmatrix an:

Der Mittelwert ist in diesem Fall überhaupt nicht definiert, bzw. jeder Korrelationswert ist genauso häufig wie jeder andere Wert. Es geht um die positive Verzerrung unseres Blutdrucks, die durch den fett gedruckten Parameter festgelegt wird. Schließlich haben alle Preise, mit denen wir zu tun haben, positive Werte, d.h. sie liegen im positiven Bereich.

1. Wie Sie sehen können, kann die Reihe I(1) überhaupt nicht verwendet werden. Für Reihen, deren Beziehung nicht offensichtlich und nicht streng funktional ist, sind Korrelationskoeffizienten absolut nutzlos.

2. Die Wahl einer bestimmten Implementierung eines Korrelationskoeffizienten hat keine grundsätzlichen Auswirkungen. Keiner der drei gängigen Koeffizienten war jemals in der Lage, die Beziehung zwischen Gold und seinem offenen Interesse aufzuzeigen, obwohl es offensichtlich ist, dass eine solche Beziehung besteht.

 
C-4:

Pearson-Korrelation: 0,02234314

Kendel-Korrelation: 0,002866038

Spearman-Korrelation: 0,002046104

Können wir einen Blick auf die Originalserie werfen? Sind sie zum Beispiel in Excel verfügbar?
 
Die ursprünglichen Zeilen werden nicht gespeichert. Hier ist eine der Generationen im CSV-Format.
Dateien:
bp.txt  2010 kb
 
C-4:
Die ursprünglichen Zeilen werden nicht gespeichert. Hier ist eine der Generationen im CSV-Format.
Aus welcher Quelle beziehen Sie die Daten zu den offenen Zinsen?
 
Hier sind die OI-Daten auf den Goldpreis abgestimmt.
Dateien:
gold_oi_2.txt  19 kb
 
Korrelationskoeffizient = 0,766654