Perché la distribuzione normale non è normale? - pagina 15

 
TVA_11 >> :

Se la tua figura è da credere, più grande è l'orizzonte temporale più alta è la correlazione.

Ci sono anche correlazioni positive su grandi...?

Guarda di nuovo la Fig. che mostra in rosso i coefficienti di correlazione (CC) tra campioni vicini per la prima serie di differenze EURCHF in funzione del Timeframe selezionato. Ricordate, il coefficiente di correlazione è considerato grande, e la relazione tra i campioni è "forte", se il coefficiente di correlazione è vicino a 1. Al contrario, se KK tende a zero, allora non c'è (o è debole) connessione tra i campioni, o è non lineare (per Price VR come questo, possiamo dimenticarcene - se c'è qualche connessione, è lineare e semplice). QC positivo significa che ci sono effetti di gruppo nella serie originale dei prezzi, cioè "se il trend è iniziato, è più probabile che continui", "il trend è frend", ecc. Il QC negativo caratterizza il mercato come un "rollback", questo è quando il trend è probabile che giri alla prossima lettura (barra) piuttosto che continuare il suo movimento nella direzione scelta.

Si può vedere dalla figura che CK per il prezzo RPR è notevolmente diverso da zero in tutti i TF e diminuisce (si avvicina a zero in valore assoluto) con la crescita del TF, il che suggerisce un allentamento delle relazioni e, di conseguenza, una diminuzione dell'affidabilità della previsione per TF grandi. Questo fatto è in contraddizione con il tuo "...Se credi alla tua figura, più grande è il lasso di tempo più alta è la correlazione".

Per darvi un esempio, ho valori di QC colorati in blu per il rumore bianco creato da un generatore di numeri casuali (RNG). Come ci si potrebbe aspettare, i suoi RNG QR si aggirano intorno allo zero, segnalandoci che non c'è alcuna relazione significativa tra i campioni. Il fatto che l'SCR non sia esattamente zero, ma prenda valori piccoli, ma diversi, è di natura statistica ed è legato alla lunghezza finita della BP iniziale e non ha nulla a che fare con la "non-idealità" dell'RNG utilizzato. È ben visibile come con la crescita di TF, l'ampiezza di uno "zero" di rumore cresce a causa della riduzione del numero di campioni di VP ricevuti da una stessa serie di minuti iniziale. Così la BP con TF500 m è 500 volte più corta della BP con TF1m.

Ora sulla significatività statistica del risultato ottenuto. Confrontando correlogrammi di serie di prezzi reali e sintetici della stessa lunghezza, si vede chiaramente l'intervallo di errore legato alla lunghezza limitata dei dati di input. Poiché non ci sono altre fonti di errore che possono influenzare il risultato, possiamo dire con sicurezza che all'interno del corridoio di "rumore" chiaramente visibile sul grafico, i valori AC sono statisticamente significativi.

Grasn ha scritto >> Beh sì, questa è una dichiarazione un po' audace di Sergei sul valore statistico significativo per gli incrementi. È oggettivamente sotto lo zoccolo lì.

Così, Sergei, non è la "vicinanza" o la "distanza" del CQ da zero che determina la validità statistica, ma la diffusione statistica del risultato.

Questo sono io che faccio l'artista cercando di spiegare ciò che è statisticamente corretto guardando l'immagine. Per essere precisi, non abbiamo bisogno di confrontare il comportamento di due QC(TF) per valutare la validità statistica. Dobbiamo tagliare la BP originale in 100 pezzi identici e costruire un QC(TF) per ognuno di essi. Otterremo 100 valori QC non corrispondenti per ogni TF. Troviamo il valore medio di ciascuno e tracciamo questo punto sul grafico. Poi abbiamo bisogno di tracciare l'intervallo di confidenza all'interno del quale si trovano i nostri valori (per un certo TF). A questo scopo, conoscendo il MI troviamo la deviazione standard (SD) e tracciamo i baffi verticali per ogni punto del grafico. Questi baffi corrispondono all'intervallo di confidenza del livello 1/e, la probabilità di essere in questo intervallo per CB è del 68%. Questo è tutto. Se i valori di QC ottenuti non toccano lo zero con i loro baffi, allora possiamo dire che c'è una relazione statisticamente significativa tra campioni adiacenti nel RRR della serie dei prezzi. Vedere la figura qui sotto:


Il QC(TF) per il LFG entro i limiti statistici è "zero", il che è prevedibile. Il KK(TF) per la serie dei prezzi è statisticamente diverso da zero, indicando la presenza di dipendenze evidenti tra le barre per diversi TF. Per i grandi TF, la lunghezza della serie utilizzata è chiaramente insufficiente.

Questo materiale è la prova della mia affermazione di cui sopra. C'è una domanda separata sul significato delle dipendenze trovate. Purtroppo, per noi trader, queste relazioni hanno un valore pratico solo se il prodotto della volatilità di uno strumento su IR per il TF selezionato supera i suoi costi di transazione (spread di una società di brokeraggio). Questo non viene osservato e per trovare un algoritmo per un trading redditizio è necessario utilizzare metodi aggiuntivi di analisi BP, in particolare per trovare "finestre" temporali con alti valori del prodotto della volatilità su KK e valutare la loro ergodicità (stabilità).

 
getch >> :

>> Com'è?

Ugh.

"Pensiero lungo, leggi il pager" (i tuoi ultimi messaggi sul forum mql).

Riassumendo più o meno così: la tua domanda è troppo pratica per un ramo così accademico... :)

// In generale - mi sembra che entrare in una relazione così intima con il mercato di fronte al pubblico sia in qualche modo sconveniente.

// La gente non ci capirà e avrà ragione. E se lo fanno... - ci sbaglieremo ancora. ;)

Fate pure la cacca in privato. Riferirò stasera quando torno a casa dal lavoro.

 
Neutron писал(а) >>

Come artista, ho cercato di spiegare cos'è la validità statistica guardando un'immagine. Per essere precisi, non abbiamo bisogno di confrontare il comportamento di due FC per valutare la plausibilità. Dobbiamo tagliare la BP originale in 100 pezzi identici e costruire un QC(TF) per ognuno di essi. Otterremo 100 valori QC non corrispondenti per ogni TF. Troviamo il valore medio di ciascuno e tracciamo questo punto sul grafico. Poi abbiamo bisogno di tracciare l'intervallo di confidenza all'interno del quale si trovano i nostri valori (per un certo TF). A questo scopo, conoscendo il MI troviamo la deviazione standard (SD) e tracciamo i baffi verticali per ogni punto sul grafico. Questi baffi corrispondono all'intervallo di confidenza, la probabilità di essere in questo intervallo per CB è del 68%. Questo è tutto. Se i valori di QC ottenuti non raggiungono lo zero con i loro baffi, possiamo parlare di relazioni statisticamente probabili tra letture adiacenti nel BPR della serie dei prezzi.

Potrebbe esserci un altro tipo di inaffidabilità nel verbale EURCHF. Lo strumento è poco liquido, e di notte viene disegnato dalla corrente continua secondo una sua logica non sempre chiara. Ovviamente filtra una parte delle possibili combinazioni delle sue major EURUSD e USDCHF nello stesso minuto. Questo può essere possibile da usare (tutti gli stessi pipser notturni), ma non permetteranno di guadagnare denaro normale. Aumenteranno lo spread, cambieranno i filtri, ecc. Questo perché si tratta di una perdita diretta per le società di intermediazione e non c'è sovrapposizione in questi momenti.

Quindi più fiducia in minuti di major liquide in momenti liquidi della giornata. Questo eliminerà le dipendenze dei filtri di citazione che non vi permetteranno di usarli comunque.

 

Un sacco di bukaf.

 
Neutron >> :

Il materiale dato è una prova della mia affermazione di cui sopra. Una domanda a parte riguarda il significato delle dipendenze trovate. Purtroppo, per noi trader, queste relazioni hanno un valore pratico solo se il prodotto della volatilità di uno strumento su KK per il TF selezionato supera i suoi costi di transazione (spread di una società di brokeraggio). Questo non viene osservato e per trovare l'algoritmo di trading redditizio è necessario utilizzare ulteriori metodi di analisi BP legati alla ricerca di "finestre" temporali con alti valori del prodotto della volatilità su KK e alla valutazione della loro ergodicità (stabilità).


Stai scrivendo tutto questo apposta per poter concludere dicendo: purtroppo è tutta spazzatura)? Non è il primo tuo post che ho notato. Ma con piacere ho letto dall'inizio. Ora, ovviamente, non tutti, ma comunque interessanti.

IMHO, qualsiasi dipendenza può essere usata in TS, dato che il mercato non può essere descritto da una sola formula.

 
Neutron >>:
Таким образом, Сергей, статдостоверность определяется вовсе не "близостью" или "дальностью" КК от нуля, а статистическим разбросом полученного результата.


E dove ho scritto che la validità delle statistiche è definita dal "range"? Determinato dalla valutazione dell'errore (e non proprio uno spread, se rileggi attentamente il mio post) Il che significa che 0,4 - nessun valore significativo semplicemente per definizione, e un errore nel suo calcolo mangerà un altro 20%-30% del suo "corpo". Sergey, non c'è nessuna correlazione, semplicemente non c'è. Accettatelo come un fatto e prendetevela comoda. Esattamente per questi motivi (o meglio, anche per questi motivi) è inutile predire per pochi conti, è inutile farlo in qualsiasi modo, compreso NS, bisogna predire in modo fondamentalmente diverso.

Come artista, ho cercato di spiegare cos'è il significato statistico guardando un'immagine.

Sergey, non sono un matematico professionista (immagino che neanche tu lo sia :o), ma è ovvio che una parte delle tue conclusioni scientifiche sulla correlazione e soprattutto sulla significatività statistica sono discutibili, per usare un eufemismo. Ma questo non ci impedisce di mantenere le nostre opinioni. :о)

 
Avals >> :

I minuti EURCHF possono avere un diverso tipo di inaffidabilità. Lo strumento è poco liquido, e di notte viene disegnato dalla DC secondo una sua logica non sempre chiara. Ovviamente filtra una parte delle possibili combinazioni delle sue major EURUSD e USDCHF nello stesso minuto. Questo può essere possibile da usare (tutti gli stessi pipser notturni), ma non permetteranno di guadagnare denaro normale. Aumenteranno lo spread, cambieranno i filtri, ecc. Questo perché si tratta di una perdita diretta per le società di intermediazione e non c'è sovrapposizione in questi momenti.

Quindi più fiducia in minuti di major liquide in momenti liquidi della giornata. Questo eliminerà le dipendenze dei filtri di citazione, che non permetteremo di usare comunque.

Non commerciate a Washington e non ci saranno questi problemi. Penso che abbia senso parlare di prezzi reali e non di DC.

 
grasn >> :

Sergei, non c'è dipendenza, semplicemente non c'è. Accettatelo come un fatto e prendetevela comoda.

Beh, è simile alla religione... No, non è il nostro modo!

Ma questo non le impedisce di rimanere fedele alle sue opinioni. :о)

Ecco di cosa si tratta. Se cambiassimo le nostre opinioni ogni volta senza una VERA ragione, la storia dell'umanità sarebbe molto diversa :-)
 
getch писал(а) >>

Scambiate con un non-DC e non avrete questi problemi. Penso che abbia senso parlare di prezzi reali e non di DC.

Stiamo parlando dell'adeguatezza dello studio. Sui dati non-DC il quadro può essere diverso, e i problemi sono diversi. Sul mercato "reale" (ECN per esempio) potrebbe non esserci nessuna operazione in questo momento per questo strumento e lo spread sarà folle.

 
Neutron >> :

Beh, è simile alla religione... No, non è il nostro modo!

Ecco di cosa si tratta. Se cambiassimo le nostre opinioni ogni volta senza una VERA ragione, la storia dell'umanità sarebbe molto diversa :-)

Beh come posso dire, finora hai dimostrato (ma l'hai fatto brillantemente :o) che la correlazione dei primi incrementi di lag è diversa da zero. In questo caso (da fuori), la religione è la santa convinzione che 0,4, è da qualche parte - 0,6, e 0,6 è già, sai, non più di 0,99, nel senso che è circa 0,97, ma non meno di 0,9 di sicuro :o) :о) Ecco come è andata a finire finora :o)

Sergei, da artista a artista, prendi due serie con correlazione 0,4 e guardale, anche a occhio nudo.