Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 16

 
E ho concettualizzato un ulteriore percorso di ricerca (scrivendo per chi è interessato, non per chi impreca nel linguaggio delle formule). Se abbiamo dipendenza dalla volatilità (dipendenza da entrambi i lag più vicini e ciclici - 24 ore per H1), allora perché non calcolare la stessa informazione reciproca per i ritorni presi modulo (che sarà volatilità pura), e poi sottrarre la quantità di informazione ottenuta dal simile (dove i ritorni erano con segno +-). Se tutto è calcolato correttamente, allora avremo una dipendenza del segno negli arretrati. Questo caso può già essere paragonato a una serie temporale di rumore.
 
alexeymosc:
E ho concettualizzato un'ulteriore ricerca (scrivendo per gli interessati, non bestemmiando in un linguaggio formulaico). Se abbiamo dipendenza dalla volatilità (dipendenza da entrambi i lag più vicini e ciclici - 24 ore per H1), allora perché non calcolare la stessa informazione reciproca per i ritorni presi modulo (che sarà volatilità pura), e poi sottrarre la quantità di informazione ottenuta dal simile (dove i ritorni erano con segno +-). Se tutto è calcolato correttamente, allora avremo una dipendenza del segno negli arretrati. Questo caso può essere confrontato con serie temporali di rumore.

Anche se si trova qualcosa di non banale, ci sarà sempre una questione di applicazione corretta delle formule e soprattutto di come applicarle nella pratica. cioè l'interesse è puramente accademico)))
 
avatara:

Ma tu, Alexey, potresti formulare più chiaramente (usando la tua tabella) quale ipotesi sulla distribuzione dei rendimenti corrisponde alla stima del chi-quadro?

Quello prima facie "marrone" o qualcosa di più fresco?

Nessuna. Quando si stima la relazione chi-quadrato, non si inventa nessuna ipotesi sulle distribuzioni. Risulta essere un criterio non parametrico.

 
Mathemat:

Nessuna. Nessuna ipotesi sulle distribuzioni viene inventata quando si stima la relazione chi-quadrato. Quindi è un criterio non parametrico.

Cosa vuol dire "nessuno"?

Puoi scrivere la dipendenza da stimare?

Forse dopo le formule mi verrà l'idea. O speri in una distribuzione uniforme...

;)

 
Avals:

Anche se si trova qualcosa di non banale, rimarrà sempre la questione della corretta applicazione delle formule e soprattutto di come applicarle nella pratica. Cioè l'interesse è puramente accademico)))
Penso che i risultati degli esperimenti di previsione siano il criterio principale. Se è ovvio che le statistiche TI aiutano, allora tutto va bene. E per applicare correttamente le formule, naturalmente, ora sto leggendo degli articoli su di esso.
 
avatara: In che senso, nessuno?

Posso scrivere la dipendenza stimata?

Forse dopo le formule mi farò un'idea. O speri in una distribuzione uniforme...

No, per niente, vi dico la verità. Ipotesi non fingo.

Avete mai provato ad applicare il criterio del chi-quadro dell'indipendenza dei valori? Non sapevo come farlo io stesso qualche mese fa, ma l'ho appena fatto. Provate, non c'è niente di difficile. Trovate un manuale di matstat per qualche istituzione fuori dallo stato e leggetelo. Più semplice e chiaro sarà il metodo descritto, più velocemente lo capirete.

In realtà, ci sono diversi criteri del chi-quadro. Ma sto parlando di quello che valuta l'indipendenza dei valori. Questo criterio non lo valuta in base a distribuzioni date a priori. Testa solo l'ipotesi di indipendenza di due variabili a un dato livello di significatività (di solito 0,95 o 0,99). Più il livello di significatività è vicino a 1, più la conclusione è affidabile.

La base ideologica del criterio è la solita formula per la probabilità congiunta di due quantità. Sulle dita: se P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) per qualsiasi x1,y1 ammissibile, allora X e Y sono indipendenti. E viceversa. E il chi-quadro calcola, approssimativamente, una somma ponderata di deviazioni da questa uguaglianza per tutti i casi possibili e la confronta con qualche valore limite. Se la somma ottenuta è maggiore di questo valore limite, allora l'ipotesi di indipendenza delle variabili (Null) non è accettata. Se è inferiore, allora l'ipotesi nulla non è respinta.

 
Mathemat:

Niente di niente, ti dico la verità. Ipotesi non fingo.

Avete mai provato ad applicare il criterio del chi-quadro dell'indipendenza dei valori? Non sapevo come farlo io stesso qualche mese fa, ma l'ho appena fatto. Provate, non c'è niente di difficile. Trovate un manuale matstat di qualche istituzione fuori dallo stato e leggetelo. Più semplice e chiaro sarà il metodo descritto, più velocemente lo capirete.

In effetti, ci sono diversi criteri del chi-quadro. Ma sto parlando di quello che valuta l'indipendenza dei valori. Non valuta l'indipendenza sulla base di distribuzioni a priori. Testa solo l'ipotesi di indipendenza di due variabili a un dato livello di significatività (di solito 0,95 o 0,99). Più il livello di significatività è vicino a 1, più la conclusione è affidabile.

La base ideologica del criterio è la solita formula per la probabilità congiunta di due quantità. Sulle dita: se P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) per qualsiasi x1,y1 ammissibile, allora X e Y sono indipendenti. E viceversa. E il chi-quadro calcola, approssimativamente, una somma ponderata di deviazioni da questa uguaglianza per tutti i casi possibili e la confronta con qualche valore limite. Se la somma ottenuta è maggiore di questo valore limite, allora si accetta l'ipotesi di dipendenza dei valori. Se meno, l'ipotesi di indipendenza non è respinta.

Non essere ridicolo...

Vi è stata chiesta l'ipotesi della distribuzione, e state per imparare questo metodo solo ieri.

Mi ostino a voler sapere - qual è l'ipotesi nulla? Che sono indipendenti?

 

Zero - "i rendimenti sono indipendenti". Non è divertente, davvero!

Nessuna ipotesi sulle distribuzioni che ho testato! Questo è un altro chi-quadro. E ho testato solo la dipendenza!

Se volete controllare la distribuzione, fate pure. È Laplaciano con una precisione decente.

 
Mathemat:

Zero - "i rendimenti sono indipendenti". Niente di divertente, davvero!

Nessuna ipotesi sulle distribuzioni che ho testato! Questo è un altro chi-quadro. E ho testato solo la dipendenza!

Se vuoi testare la distribuzione, fai pure. È Laplaciano con una precisione decente.

Ok.

Diamo un'occhiata.

---

L'ipotesi di indipendenza è la stessa dell'ipotesi di una distribuzione uniforme o di una distribuzione normale?

Questo è quello che voglio scoprire.

Poi con "Laplace-like" tutto ha un senso.

 
alexeymosc:
E ho concettualizzato un ulteriore percorso di ricerca (scrivendo per chi è interessato, non imprecando in un linguaggio formulaico). Se abbiamo delle dipendenze dalla volatilità (dipendenza dai lag più vicini così come dal ciclico - 24 ore per H1), allora perché non calcolare la stessa informazione reciproca per i ritorni presi modulo (che sarebbe volatilità pura), e poi sottrarre la quantità di informazione ottenuta dal simile (dove i ritorni erano con segno +-). Se tutto è calcolato correttamente, allora avremo una dipendenza del segno negli arretrati. Questo caso può già essere paragonato a una serie temporale di rumore.

Posso metterlo a modo mio?

Quindi, l'approccio scelto mostra che ci sono delle dipendenze. La più ovvia, ragionevole e visibile a occhio nudo è la periodicità giornaliera della volatilità.

Pertanto, il prossimo passo logico nella mia ricerca sarebbe quello di cercare di escludere questa dipendenza ovvia e molto forte dai dati e vedere se il nostro (vostro) metodo mostra la presenza di altre dipendenze.

Come metodo di eliminazione propongo di mettere semplicemente in relazione gli incrementi con il profilo di volatilità giornaliero.