Correlazione zero del campione non significa necessariamente che non ci sia una relazione lineare - pagina 41

 
alsu:

Heh, non è ovvio. Per il QC di Pearson non importa se le righe sono positive o negative...


O.K. Supponiamo che non abbia importanza. Allora l'aspetto della distribuzione della matrice di correlazione I(0) sarà approssimativamente lo stesso che con I(1). Controllare. Prendiamo 100 I(0). Costruiamo una matrice di correlazione di queste I tra loro. Poi costruisci un istogramma delle frequenze dei valori più frequenti:

Vediamo una classica distribuzione normale centrata intorno allo zero - tutto bene, perché 100 righe sono completamente indipendenti l'una dall'altra. Raramente la correlazione tra le file raggiunge il +/- 10%.

Ora prendete 100 serie e integratele. L'output sarà una classica passeggiata casuale della forma I(1). Costruiamo una matrice di correlazione per queste serie e poi lo stesso istogramma di distribuzione:

La distribuzione è crollata. I valori di -0,5 e +0,5 si ripetono con la stessa frequenza dei valori di 0,0. Il CC diventa un indicatore privo di significato, poiché qualsiasi altro numero può uscire con la stessa probabilità, anche se non c'è dipendenza tra le righe in modo affidabile.

Ora prendete 100 BP di tipo I(1), ma aggiungete il valore 100 a ciascuno di essi. A causa della piccola varianza, questo è un numero significativo per queste serie. Così tutti i 100 BP saranno nella zona positiva > 0. Guardiamo l'istogramma:

Infatti, nulla è cambiato rispetto al grafico precedente. Ma questo non cambia l'essenza e l'ipotesi rimane valida: la serie I(1) non può essere usata per calcolare il QC.

 

Non è questo il modo di farlo! Devi calcolare il logaritmo del prezzo, poi le prime differenze, poi prenderne il logaritmo e poi calcolare la correlazione.

Ha-ha-ha!


 
faa1947:

...

Non zero, ma "nessun valore". Ecco perché si può ottenere una correlazione di kotir con gli anelli di Saturno, e per lo stesso motivo, i problemi del naso.

...

Questo è il bello e il punto della correlazione - in quanto può essere contato tra serie di dimensioni diverse.
 
Integer:

Non è questo il modo di farlo! Devi calcolare il logaritmo del prezzo, poi le prime differenze, poi prenderne il logaritmo e poi calcolare la correlazione.

Ha-ha-ha!

Prima del secondo logaritmo, moltiplicare per 100 e aggiungere 5.
 
Integer:

Non è questo il modo di farlo! Devi calcolare il logaritmo del prezzo, poi le prime differenze, poi prenderne il logaritmo e poi calcolare la correlazione.

Ha-ha-ha!

Cosa vi darà il logaritmo? I logaritmi sono utili solo quando i punti di partenza e di arrivo di una serie sono troppo diversi nella loro volatilità e livello. Cioè, se state analizzando il DowJons dal 1900 al 2013, non potete farne a meno, ma in altri casi non può essere utilizzato.
 
Era uno scherzo.
 

Limiti dell'analisi di correlazione:

I valori totali di tutte le variabili fattore e risultato devono seguire una distribuzione normale multivariata.

Wiki

Credo di aver capito che QC funziona solo per NR di SV? Nelle serie del mondo reale, anche la prima differenza non è un NR.

 
Avals:

Limiti dell'analisi di correlazione:

I valori totali di tutte le variabili fattore e risultato devono seguire una distribuzione normale multivariata.

Wiki

Credo di aver capito che QC funziona solo per NR di SV? Nelle serie del mondo reale, anche la prima differenza non è un NR.

Non c'è nessun requisito di normalità per il calcolo del QC. La normalità è richiesta per l'analisi di correlazione - è usata per determinare se i fattori devono essere inclusi in una regressione multipla e per valutare l'equazione di regressione risultante per coerenza con le relazioni identificate.
 
Avals:

...

wiki

...

Ibidem:

Spesso l'allettante semplicità degli studi di correlazione incoraggia il ricercatore a trarre false conclusioni intuitive sull'esistenza di una relazione causale tra coppie di attributi, mentre i coefficienti di correlazione stabiliscono solo relazioni statistiche. Osservando gli incendi in una data città, per esempio, si potrebbe trovare una correlazione molto alta tra i danni da incendio e il numero di vigili del fuoco coinvolti nella soppressione di un incendio, e la correlazione sarebbe positiva. Non ne consegue, tuttavia, che "più vigili del fuoco portano a più danni", e ha ancora meno senso cercare di minimizzare i danni da incendio eliminando i vigili del fuoco.[5] Allo stesso tempo, la mancanza di correlazione tra le due quantità non significa che non ci sia una relazione tra loro.

 
C-4:


O.k. Supponiamo che non abbia importanza. Poi il tipo di distribuzione della matrice di correlazione ...


Il tipo di distribuzione della matrice di correlazione dipende dalle proprietà di entrambe le serie e dalla relazione tra loro, cioè non deve essere la stessa per tutte le serie possibili... Per SB è uno, per alcuni brillamenti solari un altro...