Correlazione zero del campione non significa necessariamente che non ci sia una relazione lineare - pagina 49

 
C-4:


In generale, sì, è così. Ma con l'unica eccezione che ho bisogno di metodi che permettano di determinare la relazione, non usando l'assunzione che ci sia una tale relazione a priori. Per esempio, ho letto un articolo sull'analisi di regressione su wikipedia:

OK, quindi prima di poter utilizzare la stessa analisi di regressione, dobbiamo identificare la relazione. Ma come lo rileviamo? L'analisi di regressione è impossibile poiché è una conseguenza della relazione, la correlazione è anche impossibile poiché QC stesso non parla di relazioni causa-effetto, la correlazione incrociata? - sembra migliore, ma qui finisce la mia conoscenza...

Niente di che. I moderni "correlation traders" - ci sono anche dei post come questo, così si chiamano - partono dall'ipotesi "nulla" che TUTTO È COLLEGATO, e poi per enumerazione calcolano la forza di quella connessione - di tutto - a tutto.

Qui, trovato negli archivi, guardian.co.uk ha un blog sui finanzieri. E ci sono alcuni grandi articoli sul vero lavoro di un trader in una grande banca o in un hedge fund. Possono andare a caccia di correlazioni fino a DUE SETTIMANE, poi il trader controlla tutto in qualche laboratorio di matematica, fa una presentazione ai suoi capi, e poi la banca apre una posizione coperta per qualcosa come 100 milioni.

http://www.guardian.co.uk/commentisfree/joris-luyendijk-banking-blog/2012/apr/02/quantatitive-prop-trader-voices-of-finance

C'è un sacco di roba interessante per i trader professionisti sul blog.

 
anonymous:

L'approccio più noto è il test di causalità di Granger. Puoi anche guardare l'entropia di trasferimento

Dove posso trovare la documentazione su di essi e in quali pacchetti R si possono consultare questi test?
 
C-4:
E dove posso trovare la documentazione su di loro e in quali pacchetti R posso trovare questi test?


libreria(MSBVAR); ?granger.test

Non ci sono pacchetti per l'entropia di trasferimento, ma non è difficile interrogarli da soli.

 
Non c'è nessuno disposto a scrivere questo Granger sull'emcool?
 
GaryKa: Cari visitatori, quali dati per le serie temporali dei prezzi (FX) usate quando traete conclusioni su stazionarietà, distribuzioni, ergodicità, correlazione e altre cose statistiche? La domanda è senza cavilli. Basta prendere spesso una delle migliori letture della fascia quantificata dal tempo astronomico? Ma questo è ... come posso dire... inaccettabile. Ha senso analizzare la sequenza delle letture dei prezzi di scambi "reali", tenendo conto dei volumi reali. Forse è questo il punto: preparare i dati per l'analisi.

Leggete le definizioni in qualsiasi libro di testo e avrete il succo. Non fa alcuna differenza se si usa bid/ask/midprice. Le caratteristiche numeriche possono essere leggermente diverse, ma le conclusioni sulla stazionarietà saranno le stesse.

La domanda è un po' più ampia e comporta diverse sotto-domande:


  • (1) Qual è la lettura del prezzo sugli scambi attuali?

bid e ask sono solo le migliori offerte e, . e così via. Possono cambiare quando non c'è uno scambio effettivo? Sì, possono. Possono rimanere invariati in presenza di uno scambio? Sì, assolutamente (parzialmente eseguito). A metà prezzo! Che dire delle volte in cui lo spread aumenta più volte, che dire del midprice o della fascia migliore?

  • (2) Quali sono le letture del volume sulle transazioni reali?
Ecco un esempio, di nuovo inventato (l'immagine è presa dal primo post del ramo)


La correlazione è zero in tutto l'intervallo, anche se l'intero commercio è concentrato in aree in cui la correlazione è significativa.
È ovvio che le transazioni di un lotto non sono equivalenti a quelle di 100 lotti. E nel frattempo, i dati sui prezzi di queste micro transazioni danno un contributo significativo nei calcoli delle caratteristiche selettive. Conoscendo i volumi reali, potremmo eseguire delle "medie ponderate" che sarebbero più adeguate.
  • (3) Come quantizzare i dati
Prendete la prima differenza tra le candele, non è HP BP. E perché dovrebbe essere normalmente distribuito se una candela ha X scambi e l'altra 100X scambi e tutti con volumi diversi. Scavare nella storia delle zecche, storia di secondo livello? Più si va in profondità, più differenze ci sono tra i broker.
 
C-4: I(0) è semplicemente le prime differenze di I(1).

È logico, non c'è dubbio. Ma la verità è in realtà diversa: I(1) è l'"integrale" di I(0) - del processo che è definito dall'inizio. Non è I(0) che si definisce attraverso I(1), ma viceversa.

Le proprietà I(1) potrebbero essere qualsiasi cosa, potrebbe essere SB, potrebbe essere un mercato reale con una distribuzione non normale, dinamiche di temperatura a Lisbona, qualsiasi cosa.

Scusa, ma non è proprio così. Bisogna partire da I(0), che dovrebbe essere sempre fermo e nessun altro. Successive "integrazioni" del processo I(0) portano a diversi I(n).

I(1) non può in alcun modo essere quotazioni reali, perché il processo di differenze di queste quotazioni non è stazionario, cioè non può essere I(0). Quindi, in origine (le citazioni) non era I(1).

 

Orrore.

Con tutto il rispetto, non riesco a capire perché la statistica debba essere applicata a processi la cui essenza è spiegabile e descrivibile.

Qui ho sviluppato qualcosa. Nessuno sa se è buono o cattivo. Accendi la statistica - sarà lei a decidere. Quando nessuno lo sa!

 
hMathemat:

È logico, non c'è dubbio. Ma la verità è in realtà diversa: I(1) è l'"integrale" di I(0) - del processo che è definito dall'inizio. Non è I(0) che si definisce attraverso I(1), ma viceversa.

Scusa, ma non è proprio così. Bisogna partire da I(0), che deve essere sempre fermo e nessun altro. Successive "integrazioni" del processo I(0) danno come risultato diversi I(n).

I(1) non può in alcun modo essere quotazioni reali, perché il processo di differenze di queste quotazioni non è stazionario, cioè non può essere I(0). Quindi, in origine (le citazioni) non era I(1).

Supponiamo che MQ abbia deciso di rilasciare MetaTrader 6 dove invece dei classici grafici sotto forma di barre e candele ci vengono dati solo incrementi di prezzo. Il mercato non è ancora normale, ma ora usiamo e facciamo affidamento su I(0).

Entrambi i processi nell'immagine sopra sono dell'ordine I(0), ma il primo è una distribuzione normale classica e il secondo è un mercato RTS reale e non stazionario. Se l'immagine in basso non è un processo di ordine I(0), allora che ordine è e come dovremmo chiamarlo?

 
Integer:
Non c'è nessuno disposto a emulare questo Granger sull'emculus?

Sarebbe bello sapere come funziona, per cominciare.

Qualcuno ha il libro di Granger del 1969"Investigating Causal Relations by Econometric Models and Cross-Spectral Methods"?)

E inoltre, per essere onesti, non ho ancora capito chi è più colpevole del conflitto israelo-polestinese? Gli ebrei? Gli arabi?

C'è solo un set di dati speciale chiamato IsraelPalestineConflicte che va con il test, che assomiglia a questo:

Si può vedere che i dati sono strettamente correlati, ma non si può vedere di chi sia la colpa, e quello che Granger sta dicendo non è chiaro.

 
C-4: Se l'immagine in basso non è un processo di ordine I(0), allora che ordine è e come lo chiamate?
Non lo so, dobbiamo controllare. Qui lasciamo che la Faa controlli le radici unidirezionali.