Eine Stichprobenkorrelation von Null bedeutet nicht zwangsläufig, dass es keine lineare Beziehung gibt. - Seite 8

 
hrenfx:

Überall, wo ich lese, heißt es, dass eine Null-Stichproben-Korrelation bedeutet, dass es in dieser Stichprobe keine lineare Beziehung gibt (normalerweise wird das Wort linear vergessen).

Wenn auch nur in vereinfachter Form, dann ja, das steht da. Und das ist im Allgemeinen auch richtig. Und die Feinheiten sind für die breite Öffentlichkeit nicht von Nutzen.

hrenfx:

Beispiel für zwei Graphen mit null MO, Varianz eins und Korrelation null. Das heißt, die Korrelation ist in diesem Fall die Summe der Produkte der GP-Terme geteilt durch die Länge des GP.

Hier sind meine Diagramme. Dies sind die Daten.


Und hier ist Pearson, trivialerweise in Excel berechnet. Mit einem Vorbehalt: Die Berechnungen wurden in einem gleitenden Fenster durchgeführt.


Wie Sie sehen können, variiert der Koeffizient in grober Näherung mit der Zeit. Es scheint mir, dass Sie es waren, die ich zuvor darauf hingewiesen habe, dass es Probleme mit der Stationarität der Zeitreihen der Preise gibt. Und darüber, dass bei der Verwendung statistischer Methoden, die nicht für nicht-stationäre Daten ausgelegt sind, Vorsicht geboten ist. (Allerdings ist das Problem hier etwas komplexer als die Nicht-Stationarität).

hrenfx:

In der Tat besteht immer eine lineare Beziehung zwischen zwei beliebigen Zufallsvariablen in einer endlichen Stichprobe.

Seien Sie vorsichtig bei der Interpretation von Korrelationen, die nahe bei Null liegen.

Es besteht nämlich eine lineare Beziehung zwischen zwei Zufallsvariablen dieser beiden Reihen. Bei den anderen ist das vielleicht nicht der Fall. Das ist die eine. Zweitens hat der Koeffizient, wie jede anständige Schätzung einer Zufallsvariablen, einen Vertrauensbereich. Wie dem auch sei, Ihre Gefühle spielen keine Rolle.


Seien Sie generell vorsichtig, was Sie über Dinge sagen, die Sie nicht vollständig verstehen.

 
HideYourRichess:

Wie man sieht, variiert der Koeffizient in grober Näherung mit der Zeit.

Das ist offensichtlich. Außerdem hängt die Dynamik des Koeffizienten von der Größe des Schiebefensters ab.

Ich glaube, ich habe Sie bereits auf die Probleme der Stationarität von Zeitreihenpreisen hingewiesen. Und darüber, dass man vorsichtig sein muss, wenn man statistische Methoden verwendet, die nicht für nicht-stationäre Daten ausgelegt sind.

Es werden überhaupt keine statistischen Methoden verwendet. Die Nicht-Stationarität hat damit nichts zu tun.

Tatsächlich besteht eine lineare Beziehung zwischen den beiden Zufallsvariablen in diesen beiden Reihen. Bei den anderen gibt es sie vielleicht nicht. Das ist die eine. Zweitens hat der Koeffizient, wie jede anständige Schätzung einer Zufallsvariablen, einen Vertrauensbereich. Jedenfalls ergeben Ihre Sätze keinen Sinn.

Wie können Sie überhaupt eine lineare Korrelation verstehen? Ich habe bereits geschrieben, dass es im akademischen Sinne ein Maß für den Winkel zwischen Vektoren ist. Und das ist eine schlechte Definition, wenn es um die Zusammenschaltung geht.

Nur wenn die Varianz eines der Vektoren gleich Null ist, besteht kein linearer Zusammenhang. In allen anderen Fällen besteht ein Zusammenhang.

Und noch einmal: Wir sprechen von Schätzungen auf der Grundlage von Stichproben, nicht von theoretisch unendlichen BPs.

 
hrenfx:

Das ist offensichtlich. Das gilt auch für die Tatsache, dass die Dynamik des Koeffizienten von der Größe des Schiebefensters abhängt.

Aus dem, was Sie hier geschrieben und gezeichnet haben, kann ich nicht erkennen, dass dies der Fall ist. Es geht um Offensichtlichkeit. Nun, die Bedeutung der Stationarität zu verstehen, ist nicht so einfach, wie Sie versuchen, es durch die Größe des Fensters darzustellen.

hrenfx:

Es werden überhaupt keine statistischen Methoden verwendet. Die Nicht-Stationarität hat damit nichts zu tun.

Der Korrelationskoeffizient gehört zu einem Teilbereich der mathematischen Statistik, der Korrelationsanalyse. Und sie wurde von mathematischen Statistikern erfunden. Sobald Sie also versuchen, einen Korrelationskoeffizienten zu berechnen, wenden Sie automatisch statistische Methoden an. Und Sie müssen alle Einschränkungen dieser Methoden berücksichtigen.

hrenfx:

Wie können Sie die lineare Beziehung überhaupt verstehen? Ich habe bereits geschrieben, dass es im akademischen Sinne ein Maß für den Winkel zwischen Vektoren ist. Und es ist eine schlechte Definition, wenn es um die Kopplung geht.

Nur wenn die Varianz eines der Vektoren gleich Null ist, besteht kein linearer Zusammenhang. In allen anderen Fällen besteht ein Zusammenhang.

Und noch einmal: Wir sprechen von Schätzungen auf der Grundlage von Stichproben, nicht von theoretisch unendlichen BPs.

Das ist nicht ganz so. Und es wurde oben erklärt, warum nicht. In der Statistik können Koeffizient =0 und Koeffizient =0,7 unter bestimmten Bedingungen das Gleiche bedeuten - kein oder ein schwacher Zusammenhang.

 
HideYourRichess:

Aus dem, was Sie hier geschrieben und gezeichnet haben, kann ich nicht erkennen, dass dies der Fall ist. Es geht um Offensichtlichkeit. Nun, die Bedeutung der Stationarität zu verstehen, ist nicht so einfach, wie Sie versuchen, es durch die Größe des Fensters darzustellen.

Aus irgendeinem Grund denkst du dir das aus. Ich werde keinen Begriff verwenden, den ich nicht verstehe. Und eine Definition, die ich nicht kenne.

Eigentlich gehört der Korrelationskoeffizient zu einem Teilbereich der mathematischen Statistik, der Korrelationsanalyse. Und sie wurde von mathematischen Statistikern erfunden. Sobald Sie also versuchen, einen Korrelationskoeffizienten zu berechnen, verwenden Sie automatisch statistische Methoden. Und Sie müssen alle Einschränkungen dieser Methoden berücksichtigen.

Auch mit Korrelations- und Regressionsanalysen vertraut. Ich verwende keine statistischen Methoden. Ich halte den Korrelationskoeffizienten für das Einfachste, was einem in den Sinn kommt, wenn man eine Beziehung schätzen muss. Dies ist die Schulebene. Und ohne Pearson-Kenntnisse kam ich fast sofort darauf, als ich über Korrelationen nachdachte.

Nicht wirklich. Und es wurde oben erklärt, warum nicht. In der Statistik können Koeffizient =0 und Koeffizient =0,7 unter bestimmten Bedingungen dasselbe bedeuten: das Fehlen oder die Schwäche einer Beziehung.

Das verstehe ich nicht.
 
Das ist ganz einfach. Sie werfen dem Pearson-Koeffizienten vor, unhaltbar zu sein, und ich sage, dass Ihre Methoden, ihn zu verwenden, unhaltbar sind, aber der Parameter selbst ist gut. Und wie schon richtig gesagt wurde, braucht man keine Bücher über mathematische Statistik zu lesen, sondern man muss sie studieren. Sie kompetent zu nutzen.
 
hrenfx:
Meine Schlussfolgerung ist, dass die Korrelation (Pearson-Koeffizient) ein beschissener Indikator für einen linearen Zusammenhang in einer Stichprobe ist. Sie zeigt nicht nur keine direkte Korrelation, sondern lügt auch.

Nennen Sie dies eine Kritik am Pearson-Koeffizienten? Ich kritisiere kluge Leute, die sie falsch interpretieren, indem sie über das Vorhandensein oder Nichtvorhandensein einer Beziehung sprechen und nicht einmal verstehen, was eine lineare Beziehung ist.

Wenn Sie schon von der Widersprüchlichkeit meiner Methoden sprechen, sollten Sie wenigstens eine erwähnen. Die Pearson-Methoden wurden in diesem Thread nicht diskutiert.

Außerdem habe ich keine Bücher über mathematische Statistik gelesen. Die Korrelations- und Regressionsanalyse wurde untersucht, als das ganze einfache Toolkit, das von Mathematikern in einer komplizierten Sprache geschrieben wurde, bereits in meinem MQL4 funktionierte. Und man muss kein Tausendsassa sein, um 90 % dessen zu verstehen, was in Büchern über Korrelation und Regression steht. Ich meine den praktischen Teil, nicht den theoretischen, der den größten Teil der Bücher einnimmt.

 
hrenfx:

Nennen Sie dies eine Kritik am Pearson-Koeffizienten? Ich kritisiere kluge Leute, die sie falsch interpretieren, indem sie über das Vorhandensein oder Nichtvorhandensein einer Beziehung sprechen und nicht einmal verstehen, was eine lineare Beziehung ist.

Ja, und außerdem kritisieren Sie C. Pearson auf unverfrorene Weise. Schreiben Sie klarer, so dass für jeden eindeutig ersichtlich ist, was genau Sie fordern.

hrenfx:

Wenn Sie schon von der Widersprüchlichkeit meiner Methoden sprechen, sollten Sie wenigstens eine erwähnen. Die Pearson-Methoden wurden in diesem Thread nicht diskutiert.

Der paarweise lineare Korrelationskoeffizient ist das, wovon Sie sprachen.

Und was die Methoden angeht, so haben Sie bei Ihrem Themenstart erstaunliche Ergebnisse erzielt. Und indem man mit dem Finger auf sie zeigt, zieht man überraschende Schlüsse. Wie man das betrachten kann, außer als Versagen Ihrer Methoden - ich weigere mich zu verstehen.

hrenfx:

Außerdem habe ich kein Buch über mathematische Statistik gelesen.

Grüßen Sie Mitrofanushka von mir.

hrenfx:

Ich habe Korrelations- und Regressionsanalyse gelernt, als all diese einfachen Werkzeuge, die von Mathematikern in einer komplizierten Sprache geschrieben wurden, bereits in meinem MQL4 funktionierten. Und man muss kein Tausendsassa sein, um 90 % dessen zu verstehen, was in Büchern über Korrelation und Regression geschrieben wird. Ich meine den praktischen Teil, nicht den theoretischen, der den größten Teil der Bücher einnimmt.

Was Sie hier gezeigt haben, zeigt deutlich, dass Sie nichts richtig studiert haben. Formeln im Abschnitt Korrelation Pearson wirklich nicht schwierig, aber die Tatsache, dass Sie in der Lage sind, Zahlen auf Formeln zu addieren, es überhaupt nicht bedeutet, dass Sie in der Lage sind, die gegebene mat.apparatus richtig zu verwenden. Und Ihre Argumentation zeigt, dass mit Ihrem Verständnis etwas nicht stimmt.

 
hrenfx:

Nennen Sie dies eine Kritik am Pearson-Koeffizienten? Ich kritisiere schlaue Leute, die das falsch interpretieren, indem sie über das Vorhandensein oder Nichtvorhandensein einer Beziehung sprechen und nicht einmal verstehen, was eine lineare Beziehung ist.

...


Glauben Sie nicht ehrlich, dass keiner von , der hier auf dem Forum seit 5-8 Jahren anwesend ist, nie erraten hat, CC zu bauen, dass niemand von Pearson gehört hat und selbst wenn gehört, kann es nicht programmieren (berechnen), usw.

Nun hören (lesen), hier in diesem Thread hat schon viele überprüft. Sie erzählen dasselbe, nur mit anderen Worten, aber sie versuchen, etwas zu erklären. Ja, auch ich habe mich in letzter Zeit häufig mit HideYourRichess gestritten, aber ich kann Ihnen versichern, dass er sehr kompetent und fachkundig in seiner Arbeit ist. Wie fast jeder, der hier markiert einen Zweig. Ja, wir mögen in unseren Ansichten nicht übereinstimmen, aber ein respektvolles Gespräch hilft, Wissen zu erlangen, und manchmal, wenn die Kontrahenten einander aufmerksam zuhören, wird in einem Streit die Wahrheit geboren ...

Ich habe den Eindruck, dass Sie etwas erforschen (aufbauen) wollen, es aber in keiner Weise erklären können. Viele Menschen verstehen Sie nicht, weil Sie allgemein bekannte Begriffe verwenden, um sie zu erklären, aber Sie verwenden sie auf die falsche Weise. Versuchen Sie, es mit Formeln zu erklären. Schreiben Sie es einfach in einer verständlichen Form. Und erklären Sie, was und wie Sie berechnen oder berechnen lassen wollen.

Ich will Gott nicht verärgern (auch wenn ich nicht an ihn glaube), aber alle pauschal zu beschuldigen, dass sie Pearson falsch verwenden, berechnen, nicht verstehen, ist zu anmaßend...

 

hrenfx, das kann ich nicht verstehen, hast du zu viele Bücher gelesen?

Was zum Teufel ist ein Logarithmus, was Eimer und Kilogramm????? Welche andere "Interpretation" des Korrelationskoeffizienten als die wohlbekannte, die es seit hundert Jahren gibt? Mein Rat an Sie: Schlafen Sie sich erst einmal aus und beginnen Sie dann, die Mathematik von Grund auf zu lernen. Privalov schrieb ein Skript, die Ergebnisse stimmen mit denen von Matkad überein. Ich habe das Skript geschrieben, ohne mir die anderen anzuschauen, ich habe die Ergebnisse verglichen und sie sind die gleichen wie die von Beer und Matkad. Hundertfünfzig Leute haben diesen QC bereits hundertfünfzig Mal geschrieben - und alle Ergebnisse sind gleich. Warum sollten also plötzlich alle ihre Programme überstürzt umschreiben, wenn sie plötzlich herausfinden, dass jemand seine eigene Interpretation von Pearsons QC hat?

 
hrenfx:

.........

Wenn die Stichprobe klein erscheint, nehmen wir etwas Größeres aus der Korrelationstabelle:

Korr = 0.0000, #NGX0 - EURGBP, Balken = 24943 (28.05.2010 21:25 - 28.09.2010 18:40), November 2010 Erdgas-Future - Euro gegen Britisches Pfund

Korr = -0,0015, USDNOK - USDSGD, Balken = 54961 (2010.01.01 00:00 - 2010.09.28 17:20), US-Dollar gegen Norwegische Krone - US-Dollar gegen Singapur-Dollar

Wow, es gibt fast keine lineare Korrelation zwischen der norwegischen Krone und dem Signpura-Dollar - Unsinn!
Corr = -0.0008, GOLD - USDCAD, bars = 54898 (2010.01.01 00:00 - 2010.09.28 16:45), SPOT Gold Once vs US Dollar - US Dollar vs Canadian
Noch lustiger ist, dass es fast keine lineare Korrelation zwischen Gold und dem kanadischen Dollar gibt - Schwanz!

.........

Ohne auf die mathematischen Aspekte des aufgeworfenen Problems einzugehen, möchte ich den Themenstarter fragen: Und warum sollte es Ihrer Meinung nach eine ausgeprägte Korrelation zwischen den drei vorgestellten Vermögenspaaren geben? Zum Beispiel: Warum sollte eine Änderung des Wertes des kanadischen Dollars muss es das geben. Veränderungen im Wert des Goldes beeinflussen? Und in welche Richtung?