Correlazione zero del campione non significa necessariamente che non ci sia una relazione lineare - pagina 42

 

Sì... La parola magica "correlazione" inganna molte persone.

Correlazione == dipendenza probabilistica. Cioè l'auto-illusione. Cerca una relazione lineare.

 
C-4: Cosa faranno i logaritmi per voi? I logaritmi possono essere usati solo quando i punti di inizio e fine di una serie sono troppo diversi nella loro volatilità e livello. Cioè, se state analizzando il DowJons dal 1900 al 2013, non potete farne a meno, ma in altri casi non può essere utilizzato.

Di nuovo, questo thread sembra averne già parlato.

Pensate alla definizione di correlazione - in parole semplici è la relazione di due insiemi. Per gli insiemi dello spazio lineare questa correlazione può essere stimata tramite il prodotto scalare dei vettori (equivalente al QC di Pearson), e ad esempio è logico che per i vettori ortogonali tale correlazione sia zero. Per gli insiemi che non appartengono allo spazio lineare, questa relazione deve essere stimata in modo diverso. Come? Dipende già dalle caratteristiche dello spazio. Come esempi potremmo considerare altri coefficienti di correlazione.

Se le letture sono su una scala relativa, che è il caso delle quotazioni (che mostrano quante volte una valuta ha "più valore" di un'altra), allora non è corretto applicare metodi lineari (prodotto scalare) "a fondo" ai dati grezzi. Il logaritmo trasferisce le letture da una scala relativa a una scala a intervalli, dove la stessa correlazione può già essere stimata usando il CQ di Pearson.

 
GaryKa:

Di nuovo, questo thread sembra averne già parlato.

Pensate alla definizione di correlazione - in parole semplici è una relazione tra due insiemi. Per gli insiemi dello spazio lineare questa correlazione può essere stimata tramite il prodotto scalare dei vettori (equivalente al QC di Pearson), e per esempio è logico che per i vettori ortogonali tale correlazione sia zero. Per gli insiemi che non appartengono allo spazio lineare, questa relazione deve essere stimata in modo diverso. Come? Dipende già dalle caratteristiche dello spazio. Come esempi potremmo considerare altri coefficienti di correlazione.

Se le letture sono su una scala relativa, che è il caso delle quotazioni (che mostrano quante volte una valuta ha "più valore" di un'altra), allora non è corretto applicare metodi lineari (prodotto scalare) "a fondo" ai dati grezzi. Il logaritmo trasferisce le letture da una scala relativa a una scala a intervalli, dove la stessa correlazione può già essere stimata usando il CQ di Pearson.


Puoi fornire un esempio specifico in cui prendere i logaritmi cambia la lettura del QC in modo chiave? Per favore, datemi un esempio in cui la serie originale dà un QC vicino a zero, mentre i suoi logaritmi mettono miracolosamente il QC a una stima significativa.

Finora, facciamo un esempio:

Correlazione di Pearson tra prezzi dell'oro e Open Interest calcolata sulle prime differenze senza logaritmo: 0,1968

Correlazione di Pearson tra prezzi dell'oro e Open Interest calcolata per ln(Pi/Pi-1): 0,2067

Ora, a causa della differenza dell'1% si può gridare di gioia e dire in ogni angolo che non c'è modo senza logaritmo.

 
alsu:

Il tipo di distribuzione della matrice di correlazione dipende dalle proprietà di entrambe le serie e dalla relazione tra loro, cioè non deve essere la stessa per tutte le serie possibili... Per SB è uno, per alcuni brillamenti solari un altro...
che è una misura dell'errore. Se la distribuzione è come ha mostrato C-4, l'errore è enorme e la probabilità di ottenere una deviazione maggiore dal valore reale è quasi inesistente. Che senso ha un tale indicatore se con l'indipendenza reale si può ottenere una correlazione da -0,6 a +0,6 con uguale probabilità?
 
C-4: Puoi fornire un esempio specifico in cui prendere i logaritmi cambia la lettura del QC in modo chiave? Per favore, datemi un esempio in cui la serie originale dà un QC vicino a zero, mentre i suoi logaritmi mettono miracolosamente il QC a una stima significativa.

Cercherò di farlo.

C-4: Mentre si prende un esempio:
  • Correlazione di Pearson tra prezzi dell'oro e Open Interest calcolata sulle prime differenze senza logaritmo: 0,1968
  • Correlazione di Pearson tra prezzo dell'oro e Open Interest calcolata per ln(Pi/Pi-1): 0,2067

Ora, a causa della differenza dell'1% si può gridare di gioia e dire in ogni angolo che senza logaritmo non si può andare da nessuna parte.

Non conto le prime differenze ... decimi o )

Sui dati del tuo esempio:

  • La correlazione di Pearson sui dati grezzi è 0,767687.
  • La correlazione di Pearson sui logaritmi dei dati grezzi è 0,819971.

Sembra essere in buon accordo con l'osservazione visiva. La differenza è più del 5%.

File:
 
GaryKa:

Cercherò di farne uno.

Non conto le prime differenze ... anche i decimi...)

...

Scopriamo prima se è corretto usare il QC sulle serie di prezzi regolari. Finora ho fornito dati che dicono che il QC su I(1) non deve essere contato.
 
C-4:
Scopriamo prima se è corretto usare QR su una serie di prezzi regolari. Finora ho fornito dati che dicono che sembra che il QC su I(1) non possa essere calcolato.

Dove avete mai visto un requisito di normalità per il calcolo del CQ? Ancora una volta, è un requisito per utilizzare l'analisi di correlazione.

Che assurdità - il QC è solo per valori normalmente distribuiti.......... Si scopre che non si può calcolare il QC tra, per esempio, le quotazioni dell'oro e dell'argento.........

 
Demi:

Dove avete mai visto un requisito di normalità per il calcolo del CQ? Ancora una volta, è un requisito per l'uso dell'analisi di correlazione.

Che assurdità - QC è solo per valori normalmente distribuiti..........

Cosa c'entra la normalità? Di nuovo, I(1) è la somma consecutiva di una serie della forma I(0). I(0) è il normale incremento, o ritorno. Il tipo di ritorno non è importante. La cosa importante è che il QC può essere calcolato solo sui ritorni, ma non sul prezzo stesso.
 
C-4:
La cosa importante è che il QC può essere contato solo sui rendimenti, non sul prezzo stesso.

Di nuovo, perché?
 
Demi:
Di nuovo, perché?


Perché: 1. vedere l'immagine qui sopra.

2. 2. Leggete quello che scrive Avals:

Avals:
questa è una misura dell'errore. Se la distribuzione è come mostrato da C-4, l'errore è enorme e la probabilità di ottenere una deviazione maggiore dal valore reale difficilmente diminuisce. Che senso ha un tale indicatore se si può ottenere una correlazione da -0,6 a +0,6 con indipendenza reale?