Correlazione zero del campione non significa necessariamente che non ci sia una relazione lineare - pagina 40

 

Coefficiente di correlazione = 0,766654

Era tutto calcolato in Excel. L'unica cosa - ho preso le citazioni in oro da MT (ero troppo pigro per convertire manualmente le cifre con la virgola in punti nel tuo)

 

Ho ricontrollato i dati: ho sbagliato un po'. In primo luogo, i rapporti non sono calcolati sull'interesse aperto ma sull'interesse aperto degli hedger dell'oro, e in secondo luogo, ho 3 valori zero per OM alla fine dei dati - anche questo potrebbe avere un forte impatto. Comunque, rapporti aggiornati:

Pearson: 0,1968

Spearman: 0,2135

Kendall: 0,1430.

Come potete vedere, è migliorato.

 
Demi:

Coefficiente di correlazione = 0,766654

Tutto è stato calcolato in Excel. L'unica cosa - ho preso le virgolette d'oro da MT (ero troppo pigro per convertire le cifre della virgola in punti manualmente nel tuo)

Non si può contare sulle righe, ma solo sulle prime differenze.
 
Perché no?
 
Demi: perché no?

Circa la metà dei post in questo thread sono dedicati alla discussione di questo problema (iniziato qui)

La mia opinione: la stima della correlazione tramite il coefficiente di correlazione di Pearson, per analogia con la stima delle aspettative tramite la media aritmetica e la stima della varianza tramite RMS, è accettabile solo per elementi di insiemi dello spazio lineare. Altrimenti, è necessario effettuare una trasformazione sui dati originali (per esempio, nel caso delle serie temporali dei prezzi, per convertire le misurazioni da una scala relativa assoluta a una scala a intervalli) o per aggiustare le formule di stima.

 
GaryKa:

Circa la metà dei post in questo thread sono dedicati alla discussione di questo problema (iniziato qui)

La mia opinione: la stima della correlazione tramite il coefficiente di correlazione di Pearson, per analogia con la stima delle aspettative tramite la media aritmetica e la varianza tramite RMS, è accettabile solo per elementi di insiemi dello spazio lineare. Altrimenti, è necessario effettuare una trasformazione sui dati originali (per esempio, nel caso di serie temporali di prezzi, convertire le misure da scala assoluta a scala di intervallo) o aggiustare le formule di stima.

In realtà qui.

C'è molto testo - la correlazione può essere contata sia tra le serie che tra le prime differenze. Hafftar ha postato due grafici e ha mostrato coefficienti di correlazione di dimensione 0,00... Questo mi ha colpito e ho ricalcolato. Ma l'afftar si è corretto.

P.S. Più semplice, più semplice dovremmo essere....

 

C-4:

Ovviamente, le prime differenze della forma I(0) sono necessarie per il calcolo, perché nel caso di I(1) siamo in un'imboscata, perché le serie con cui abbiamo a che fare sono sempre positive (il prezzo è sempre maggiore di zero), ma anche su questo più tardi.


Heh, non è ovvio. Per il Pearson QC non importa se le serie sono positive o negative, ciò che conta è se c'è covarianza, cioè la somiglianza delle dinamiche. Le prime differenze non correlate non implicano affatto che le serie originali non siano correlate. Inoltre, prendendo proprio questa differenza, gli elementi di correlazione lineare, che Pearson mostra, sono appena eliminati. Non c'è quindi nulla di insolito nel risultato ottenuto, e la conclusione è

1. Come potete vedere la serie I(1) non può essere usata affatto. Per le serie la cui correlazione non è evidente e non è rigidamente funzionale, i coefficienti di correlazione sono assolutamente inutili.

Il fatto che il QC sia presumibilmente sovrastimato è assolutamente sbagliato: il processo è centrato nel calcolo (la media del campione è sottratta), quindi il QC può essere positivo o negativo. Cioè il 15% nel tuo caso è un coefficiente perfettamente realistico, che è circa quello che darei guardando il grafico visivamente.

 
alsu:

Cioè il 15% nel tuo caso è un coefficiente perfettamente realistico, che è circa quello che darei guardando il grafico visivamente.

Sono d'accordo con questo.

alsu:

Heh, non è ovvio. Per il CQ di Pearson non importa se la serie è positiva o negativa, ciò che conta è se c'è covarianza, cioè la somiglianza delle dinamiche. Le prime differenze non correlate non implicano affatto che le serie originali non siano correlate. Inoltre, prendere proprio questa differenza distrugge gli elementi di correlazione lineare che Pearson mostra. Non c'è quindi nulla di insolito nel risultato ottenuto...

Ok, allora perché se generiamo 100 BP(1) indipendenti con bias positivi insignificanti (cioè la maggior parte dei BP sono nella zona > 0), poi costruiamo la loro matrice di correlazione e poi otteniamo un istogramma delle loro distribuzioni, non vedremo nulla di comune con la distribuzione normale su questo istogramma, ma vedremo questo:

Possiamo vedere che su 10 000 combinazioni di BP (100*100), ci sono altrettante combinazioni con correlazione 0,5 e -0,5. Cioè la probabilità che due passeggiate casuali indipendenti e positive siano correlate tra loro con KK 0,0 è la stessa che se il loro KK fosse uguale a qualsiasi altro numero da -1,0 a +1,0. Il che significa che I(1) non può essere usato. In qualche modo.

 

Il problema della correlazione è su un piano completamente diverso.

Quando si conta il QC, si ottiene sempre un numero. L'algoritmo non fornisce un valore QC= NA, cioè "nessun valore". Non zero, ma 'nessun valore'. È per questo che è possibile ottenere una correlazione del kothir con gli anelli di Saturno, e per lo stesso motivo, con i problemi nasali.

Il QC deve essere contato solo per quelle coppie di cui si sa dal loro contenuto che sono potenzialmente correlate. Come minimo. E in generale ci deve essere una giustificazione significativa per l'esistenza di una tale connessione. In questo caso la cifra ottenuta sarà interpretata come una misura quantitativa di questo contenuto.

Taccio sul resto delle sottigliezze del calcolo.

 
faa1947:

Il problema della correlazione è su un piano completamente diverso.

Quando si conta il QC, si ottiene sempre un numero. L'algoritmo non fornisce un valore QC= NA, cioè "nessun valore". Non zero, ma "nessun valore". È per questo che è possibile ottenere una correlazione del kothir con gli anelli di Saturno, e allo stesso tempo con i problemi del naso.

Il QC dovrebbe essere contato solo per quelle coppie di cui si sa dal loro contenuto che sono potenzialmente correlate. Come minimo. E in generale ci deve essere una giustificazione significativa per l'esistenza di una tale connessione. In questo caso la cifra ottenuta sarà interpretata come una misura quantitativa di questo contenuto.

Taccio su tutte le altre sottigliezze di calcolo.

Sono tutte sciocchezze. "Potenzialmente connesso" tutto in questo mondo. E la temperatura dell'oceano al largo della costa del Messico ha un effetto funzionale sulla resa del grano in Francia.

Un coefficiente di correlazione può anche essere calcolato tra fenomeni che non sono causalmente correlati. La questione è l'interpretazione di questo coefficiente