Correlazione zero del campione non significa necessariamente che non ci sia una relazione lineare - pagina 8

 
hrenfx:

Ovunque leggo, si dice che una correlazione zero del campione significa che non c'è una relazione lineare (di solito si dimentica la parola lineare) in quel campione.

Se solo in forma semplificata, allora sì, è quello che dice. E questo è, in generale, corretto. E le sottigliezze non servono al grande pubblico.

hrenfx:

Esempio di due grafici con MO zero, varianza uno e correlazione zero. Cioè, la correlazione in questo caso è la somma dei prodotti dei termini BP divisa per la lunghezza del BP.

Ecco i miei grafici. Questi sono i dati.


Ed ecco Pearson, banalmente calcolato in Excel. Con un avvertimento, i calcoli sono stati fatti in una finestra scorrevole.


Come potete vedere, nella più cruda approssimazione, il coefficiente varia nel tempo. Mi sembra che sia stato lei, che ho fatto notare prima, che ci sono problemi di stazionarietà nelle serie temporali dei prezzi. E sulla necessità di fare attenzione quando si usano metodi statistici non progettati per dati non stazionari. (Anche se qui il problema è un po' più complesso della non stazionarietà).

hrenfx:

Infatti, c'è sempre una relazione lineare tra due variabili casuali qualsiasi su un campione finito.

Fate attenzione a interpretare le correlazioni vicine allo zero.

Infatti, c'è una relazione lineare tra due variabili casuali su queste due serie. Potrebbe non esserci sugli altri. Questo è uno. Due, il coefficiente, come ogni stima decente di una variabile casuale, ha un'area di confidenza. Comunque, i tuoi sentimenti non hanno importanza.


In generale, fate attenzione a quello che dite su cose che non capite del tutto.

 
HideYourRichess:

Come si può vedere, nella più cruda approssimazione, il coefficiente varia nel tempo.

Questo è ovvio. Così come il fatto che la dinamica del coefficiente dipenderà dalla dimensione della finestra scorrevole.

Credo che sia stato a lei che ho già fatto notare i problemi di stazionarietà nelle serie temporali dei prezzi. E sulla necessità di fare attenzione quando si usano metodi statistici non progettati per dati non stazionari.

Non viene utilizzato alcun metodo statistico. La non stazionarietà non c'entra niente.

Infatti, c'è una relazione lineare tra le due variabili casuali su queste due serie. Può non esistere sugli altri. Questo è uno. Due, il coefficiente, come ogni stima decente di una variabile casuale, ha un'area di confidenza. Comunque, le tue frasi non hanno senso.

Come fai a capire la correlazione lineare? Ho già scritto che in senso accademico è una misura dell'angolo tra i vettori. E questa è una cattiva definizione quando si parla di interconnessione.

Non c'è relazione lineare solo quando la varianza di uno dei vettori è zero. In tutti gli altri casi c'è una relazione.

E ancora una volta, stiamo parlando di stime su campioni, non di BP teoriche infinite.

 
hrenfx:

Questo è ovvio. Così è il fatto che la dinamica del coefficiente dipenderà dalla dimensione della finestra scorrevole.

Da quello che hai scritto e disegnato qui, non ho visto che questo è il caso. Si tratta di ovvietà. Beh, capire il significato di stazionarietà non è così semplice come si sta cercando di far credere, attraverso la dimensione della finestra.

hrenfx:

Non viene utilizzato alcun metodo statistico. La non stazionarietà non c'entra niente.

In realtà, il coefficiente di correlazione appartiene a una sezione della statistica matematica chiamata analisi di correlazione. Ed è stato inventato da statistici matematici. Quindi, non appena si cerca di calcolare un coefficiente di correlazione, si utilizzano automaticamente metodi statistici. E bisogna considerare tutte le limitazioni di questi metodi.

hrenfx:

Come si fa a capire la relazione lineare? Ho già scritto che in senso accademico è una misura dell'angolo tra i vettori. Ed è una definizione povera quando si parla di intercoupling.

Non c'è relazione lineare solo quando la varianza di uno dei vettori è zero. In tutti gli altri casi c'è una relazione.

E ancora una volta, stiamo parlando di stime su campioni, non di BP teoriche infinite.

Non esattamente così. Ed è stato spiegato sopra perché no. In statistica, in certe condizioni, coefficiente =0 e coefficiente =0,7 possono significare la stessa cosa - nessuna o debole connessione.

 
HideYourRichess:

Da quello che hai scritto e disegnato qui, non ho visto che questo è il caso. Si tratta di ovvietà. Beh, capire il significato di stazionarietà non è così semplice come si sta cercando di far credere, attraverso la dimensione della finestra.

Lei, per qualche motivo, si sta inventando tutto. Non userò un termine che non capisco. E una definizione che non conosco.

In realtà, il coefficiente di correlazione appartiene a una sezione della statistica matematica chiamata analisi di correlazione. Ed è stato inventato da statistici matematici. Quindi, non appena si cerca di calcolare il coefficiente di correlazione, si usano automaticamente metodi statistici. E bisogna considerare tutte le limitazioni di questi metodi.

Conosce anche l'analisi di correlazione e regressione. Non uso alcun metodo statistico. Penso al coefficiente di correlazione come la cosa più semplice che viene in mente quando si deve stimare una relazione. Questo è il livello della scuola. E senza la conoscenza di Pearson, ci sono arrivato quasi appena ho pensato alle correlazioni.

Non proprio. Ed è stato spiegato sopra perché no. In statistica, in certe condizioni, coefficiente =0 e coefficiente =0,7 possono significare la stessa cosa - l'assenza o la debolezza di una relazione.

Non capisco.
 
È semplice. Lei accusa il coefficiente di Pearson di essere insostenibile, e io dico che i suoi metodi di utilizzo sono insostenibili, ma il parametro in sé è buono. E, come è stato giustamente detto, non bisogna leggere libri di statistica matematica, ma studiarli. Per usarlo con competenza.
 
hrenfx:
La mia conclusione è che la correlazione (coefficiente di Pearson) è un indicatore di merda di una relazione lineare in un campione. Non solo la correlazione non mostra una relazione diretta, ma mente anche.

La chiama una critica al coefficiente di Pearson? Sto criticando le persone intelligenti che lo interpretano male parlando della presenza/assenza di una relazione, e non capendo nemmeno cosa sia una relazione lineare.

A proposito dell'incoerenza dei miei metodi, ne menzioni almeno uno. I metodi Pearson non sono stati discussi in questo thread.

Inoltre, non ho letto nessun libro di statistica matematica. L'analisi di correlazione e regressione è stata studiata, quando tutto questo semplice toolkit scritto da matematici in un linguaggio complicato era già funzionale nel mio MQL4. E non c'è bisogno di essere un esperto per capire il 90% di ciò che è scritto nei libri sulla correlazione e la regressione. Intendo la parte pratica, non quella teorica che occupa la maggior parte dei libri.

 
hrenfx:

La chiama una critica al coefficiente di Pearson? Sto criticando le persone intelligenti che lo interpretano male parlando della presenza/assenza di una relazione, e non capendo nemmeno cosa sia una relazione lineare.

Sì. Per di più, lei sta criticando C. Pearson in modo sfacciato. Scrivete più chiaramente in modo che sia chiaro a tutti in modo inequivocabile cos'è esattamente che state contestando.

hrenfx:

A proposito dell'incoerenza dei miei metodi, ne menzioni almeno uno. I metodi Pearson non sono stati discussi in questo thread.

Il coefficiente di correlazione lineare a coppie è quello di cui stavi parlando.

E per quanto riguarda i metodi, hai risultati sorprendenti nel tuo topicstart. E puntando il dito contro di loro si traggono conclusioni sorprendenti. Come possa essere considerato, se non come un fallimento dei vostri metodi, mi rifiuto di capire.

hrenfx:

Inoltre, non ho letto un libro di statistica matematica.

Porta i miei saluti a Mitrofanushka.

hrenfx:

Ho imparato l'analisi di correlazione e regressione quando tutti quei semplici strumenti, scritti da matematici in un linguaggio complicato, erano già funzionali nel mio MQL4. E non c'è bisogno di essere un esperto per capire il 90% di ciò che è scritto nei libri sulla correlazione e la regressione. Intendo la parte pratica, non quella teorica che occupa la maggior parte dei libri.

Quello che avete mostrato qui - mostra chiaramente che non avete studiato nulla in modo adeguato. Le formule nella sezione correlazione Pearson non sono davvero difficili, ma il fatto che siate in grado di aggiungere cifre sulle formule, non significa affatto che siate in grado di utilizzare correttamente l'apparato matematico dato. E il suo ragionamento dimostra che c'è qualcosa di sbagliato nella sua comprensione.

 
hrenfx:

La chiama una critica al coefficiente di Pearson? Sto criticando le persone intelligenti che lo interpretano male parlando della presenza/assenza di una relazione, e non capendo nemmeno cosa sia una relazione lineare.

...


Non pensate onestamente che nessuno di presente qui su un forum da circa 5-8 anni, non ha mai indovinato di costruire CC, che nessuno ha sentito parlare di Pearson e anche se l'ha sentito, non può programmarlo (calcolarlo), ecc.

Bene ascoltare (leggere), qui in questo thread ha già controllato molti. E ti parlano della stessa cosa, con parole diverse, ma stanno cercando di spiegare qualcosa. Sì, anch'io ultimamente ho discusso spesso con HideYourRichess, ma posso assicurarvi che è molto competente ed esperto nel suo lavoro. Come quasi tutti quelli che qui hanno segnato il ramo. Sì, possiamo non essere d'accordo nei punti di vista, ma una conversazione rispettosa aiuta ad acquisire conoscenze, a volte se gli avversari sono attenti a vicenda, in una discussione la verità è nata ...

Mi sembra che tu voglia esplorare (costruire) qualcosa, ma non puoi spiegarlo in alcun modo. Molte persone non ti capiscono, tu usi termini comunemente conosciuti per spiegare, ma li usi nel modo sbagliato. Prova a spiegarlo con delle formule. Basta scriverlo in modo comprensibile. E spiegate cosa e come volete calcolare o far calcolare.

Non far arrabbiare Dio (anche se non credo in lui) ma accusare tutti indistintamente che usano male il Pearson, lo calcolano, non lo capiscono, è troppo presuntuoso...

 

hrenfx, non riesco a capire, hai letto troppi libri?

Che diavolo è il logaritmo, che secchi e chilogrammi????? Quale altra "interpretazione" del coefficiente di correlazione se non quella ben nota che esiste da cento anni? Il mio consiglio è di dormire un po' prima, e poi iniziare a imparare la matematica da zero. Privalov ha scritto uno script, i risultati sono coerenti con quelli di Matkad. Ho scritto lo script senza guardare gli altri, e ho confrontato i risultati - sono gli stessi di Beer e Matkad. Centocinquanta persone hanno già scritto questo QC centocinquanta volte - e tutti i risultati sono gli stessi. Allora perché tutti dovrebbero improvvisamente correre a riscrivere i loro programmi, scoprendo improvvisamente che qualcuno ha una propria interpretazione del QC di Pearson?

 
hrenfx:

.........

Se il campione sembra piccolo, prendiamo qualcosa di più grande dalla tabella di correlazione:

Corr = 0.0000, #NGX0 - EURGBP, barre = 24943 (2010.05.28 21:25 - 2010.09.28 18:40), Novembre 2010 Natural Gas Future - Euro vs British Pound

Corr = -0,0015, USDNOK - USDSGD, barre = 54961 (2010.01.01 00:00 - 2010.09.28 17:20), Dollaro USA contro Corona Norvegese - Dollaro USA contro Dollaro Singapore

Wow, non c'è quasi nessuna correlazione lineare tra la corona norvegese e il dollaro Signpura - nonsense!
Corr = -0.0008, GOLD - USDCAD, bars = 54898 (2010.01.01 00:00 - 2010.09.28 16:45), SPOT Gold Once vs US Dollar - US Dollar vs Canadian
Ancora più divertente, non c'è quasi nessuna correlazione lineare tra l'oro e il dollaro canadese - cazzo!

.........

Senza toccare gli aspetti matematici del problema sollevato, voglio chiedere al topicstarter: e perché, secondo voi, ci dovrebbe essere una correlazione pronunciata tra le tre coppie di asset presentate? Per esempio: perché un cambiamento nel valore del dollaro canadese ci sarà sicuramente. influenzano i cambiamenti nel valore dell'oro? E in quale direzione?