Eine Stichprobenkorrelation von Null bedeutet nicht zwangsläufig, dass es keine lineare Beziehung gibt. - Seite 40

 

Korrelationskoeffizient = 0,766654

Es wurde alles in Excel berechnet. Das Einzige ist, dass ich die goldenen Anführungszeichen von MT übernommen habe (ich war zu faul, die Kommaziffern bei Ihnen manuell in Punkte umzuwandeln)

 

Ich habe die Daten noch einmal überprüft: Ich habe mich ein wenig vertan. Erstens werden die Quoten dort nicht auf der Grundlage des offenen Interesses, sondern auf der Grundlage des offenen Interesses der Gold-Hedger berechnet, und zweitens habe ich 3 Nullwerte für OM am Ende der Daten - auch dies könnte einen starken Einfluss haben. Wie auch immer, aktualisierte Verhältnisse:

Pearson: 0,1968

Spearman: 0,2135

Kendall: 0,1430.

Wie Sie sehen können, ist es besser geworden.

 
Demi:

Korrelationskoeffizient = 0,766654

Alles wurde in Excel berechnet. Das Einzige - ich habe die goldenen Anführungszeichen von MT übernommen (ich war zu faul, die Kommaziffern bei Ihnen manuell in Punkte umzuwandeln)

Sie können nicht mit Zeilen rechnen, sondern nur mit den ersten Differenzen.
 
Warum nicht?
 
Demi: warum nicht?

Etwa die Hälfte der Beiträge in diesem Thread sind einer Diskussion über dieses Thema gewidmet (die hier begonnen wurde)

Meine Meinung: Die Schätzung der Korrelation durch den Pearson-Korrelationskoeffizienten ist in Analogie zur Schätzung der Erwartung durch das arithmetische Mittel und der Varianz durch den RMS nur für Elemente von Mengen aus dem linearen Raum akzeptabel. Andernfalls müssen entweder die ursprünglichen Daten transformiert werden (z. B. bei Preiszeitreihen die Umwandlung der Messungen von einer absoluten relativen Skala in eine Intervallskala) oder die Formeln für die Schätzung müssen angepasst werden.

 
GaryKa:

Etwa die Hälfte der Beiträge in diesem Thread sind der Diskussion dieses Themas gewidmet (begonnen hier)

Meine Meinung: Die Schätzung der Korrelation durch den Pearson-Korrelationskoeffizienten ist in Analogie zur Schätzung der Erwartung durch das arithmetische Mittel und der Varianz durch den RMS nur für Elemente von Mengen aus dem linearen Raum akzeptabel. Andernfalls müssen entweder die ursprünglichen Daten transformiert werden (z. B. bei Preiszeitreihen die Umwandlung der Messungen von der absoluten in die Intervallskala) oder die Formeln für die Schätzung angepasst werden.

Eigentlich hier.

Es gibt eine Menge Text - die Korrelation kann sowohl zwischen den Reihen als auch zwischen den ersten Differenzen gezählt werden. Hafftar hat zwei Diagramme veröffentlicht und Korrelationskoeffizienten der Dimension 0,00 gezeigt... Das fiel mir auf und ich rechnete nach. Doch der Afftar korrigierte sich.

P.S. Einfacher, einfacher sollten wir sein....

 

C-4:

Offensichtlich werden für die Berechnung die ersten Differenzen der Form I(0) benötigt, denn im Falle von I(1) befinden wir uns in einem Hinterhalt, da die Reihen, mit denen wir es zu tun haben, immer positiv sind (der Preis ist immer größer als Null), aber dazu später mehr.


Ha, nicht offensichtlich. Für die Pearson QC spielt es keine Rolle, ob die Reihen positiv oder negativ sind, entscheidend ist, ob es eine Kovarianz gibt, d. h. die Ähnlichkeit der Dynamik. Unkorrelierte erste Differenzen bedeuten keineswegs, dass die ursprünglichen Reihen unkorreliert sind. Außerdem werden durch diese Differenz die linearen Korrelationselemente, die Pearson aufzeigt, einfach eliminiert. Das Ergebnis ist also nicht ungewöhnlich, und die Schlussfolgerung lautet

1. Wie Sie sehen können, kann die Reihe I(1) überhaupt nicht verwendet werden. Für Reihen, deren Korrelation nicht offensichtlich und nicht streng funktional ist, sind Korrelationskoeffizienten absolut nutzlos.

Die Tatsache, dass die QC angeblich überschätzt wird, ist absolut falsch: Der Prozess wird bei der Berechnung zentriert (der Stichprobendurchschnitt wird abgezogen), so dass die QC positiv oder negativ sein kann. D.h. 15% ist in Ihrem Fall ein durchaus realistischer Koeffizient, den ich bei einer visuellen Betrachtung des Diagramms in etwa angeben würde.

 
alsu:

D.h. 15 % ist in Ihrem Fall ein durchaus realistischer Koeffizient, was ungefähr dem entspricht, was ich bei visueller Betrachtung des Diagramms angeben würde.

Ich stimme dem zu.

alsu:

Ha, nicht offensichtlich. Für die QC nach Pearson spielt es keine Rolle, ob die Reihe positiv oder negativ ist, entscheidend ist, ob es eine Kovarianz gibt, d. h. die Ähnlichkeit der Dynamik. Unkorrelierte erste Differenzen bedeuten keineswegs, dass die ursprünglichen Reihen unkorreliert sind. Außerdem werden durch diese Differenz die linearen Korrelationselemente, die Pearson aufzeigt, einfach eliminiert. Das erzielte Ergebnis ist also nicht ungewöhnlich...

Wenn wir nun 100 unabhängige BP(1) mit unbedeutender positiver Verzerrung erzeugen (d. h. die meisten BPs liegen im Bereich > 0), dann ihre Korrelationsmatrix erstellen und dann ein Histogramm ihrer Verteilungen erhalten, werden wir in diesem Histogramm nichts sehen, was mit der Normalverteilung übereinstimmt, aber wir werden dies sehen:

Wir sehen, dass es von 10 000 BP-Kombinationen (100*100) ebenso viele Kombinationen mit 0,5 und -0,5 Korrelation gibt. D.h. die Wahrscheinlichkeit, dass zwei unabhängige, positive Random Walks mit KK 0,0 miteinander korreliert sind, ist die gleiche, wie wenn ihr KK gleich einer beliebigen anderen Zahl zwischen -1,0 und +1,0 wäre. Das bedeutet, dass I(1) nicht verwendet werden kann. Irgendwie.

 

Das Problem der Korrelation liegt auf einer ganz anderen Ebene.

Wenn QC gezählt wird, erhalten wir immer eine Zahl. Der Algorithmus liefert keinen QC= NA-Wert, d. h. "kein Wert". Nicht Null, sondern "kein Wert". Aus diesem Grund ist es möglich, eine Korrelation zwischen Kothir und den Saturnringen und gleichzeitig mit Nasenproblemen herzustellen.

QC sollte nur für die Paare gezählt werden, von denen man aufgrund ihres Inhalts weiß, dass sie potenziell korreliert sind. Zumindest. Und im Allgemeinen muss es eine sinnvolle Rechtfertigung für das Bestehen einer solchen Verbindung geben. In diesem Fall wird die erhaltene Zahl als quantitatives Maß für diesen Inhalt interpretiert.

Über die übrigen Feinheiten der Berechnung schweige ich mich aus.

 
faa1947:

Das Problem der Korrelation liegt auf einer ganz anderen Ebene.

Wenn QC gezählt wird, erhalten wir immer eine Zahl. Der Algorithmus liefert keinen QC= NA-Wert, d. h. "kein Wert". Nicht Null, sondern "kein Wert". Aus diesem Grund ist es möglich, eine Korrelation zwischen Kothir und den Saturnringen und gleichzeitig mit Nasenproblemen herzustellen.

QC sollte nur für die Paare gezählt werden, von denen man aufgrund ihres Inhalts weiß, dass sie potenziell korreliert sind. Zumindest. Und im Allgemeinen muss es eine sinnvolle Rechtfertigung für das Bestehen einer solchen Verbindung geben. In diesem Fall wird die erhaltene Zahl als quantitatives Maß für diesen Inhalt interpretiert.

Über alle anderen Feinheiten der Berechnung schweige ich.

Das ist alles Blödsinn. Alles auf dieser Welt ist "potenziell verbunden". Und die Meerestemperatur vor der Küste Mexikos hat einen funktionalen Einfluss auf die Weizenerträge in Frankreich.

Ein Korrelationskoeffizient kann auch zwischen Phänomenen berechnet werden, die nicht kausal miteinander verbunden sind. Die Frage ist, wie dieser Koeffizient zu interpretieren ist