Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 25

 
Candid:

Ricordo bene che i dati di input qui sono il modulo percentuale incrementale?

Ma se è così, si tratta essenzialmente della stessa volatilità (cioè la sua funzione monotona e non ambigua), ci si aspetterebbe che tutti gli effetti legati alla volatilità appaiano anche qui, sebbene in una forma un po' filtrata. E poiché gli effetti della volatilità sembrano superare di gran lunga tutti gli altri fenomeni di mercato, la prospettiva di vedere "qualcos'altro" sul loro sfondo sembra piuttosto problematica. Ripeto, penso che sia più promettente cercare di escludere coerentemente effetti noti ma "inutili" dai dati grezzi.

A proposito, Alexei(Mathemat), hai anche i dati di origine nei moduli?

Buona giornata!

Per tutti i grafici Forex calcolo in pip (in contrasto con il mercato azionario).

Secondo - salvo i segni, cioè non prendo modulo. Tutto ciò che avete visto per D1, M5, H1 - è calcolato sulla base dei rendimenti in pip, discretizzati a 5 simboli dell'alfabeto, il segno del cambiamento di prezzo è conservato.

Ultimo grafico per H1 - ho squadrato i rendimenti per eliminare il segno.

 
HideYourRichess:

In realtà, sia il grande Bohr che il grande Shannon, nella soluzione dei loro problemi passarono dall'essenza, la "fisica", alle figure, a differenza di quello che succede qui.

Il secondo problema, non è possibile spiegare alle persone che vogliono credere - che la loro credenza è falsa. Come è possibile spiegare alla gente che il metodo non è applicabile, poiché è progettato per la stazionarietà e l'indipendenza. Che anche l'indipendenza sotto forma di catene di Markov, in ogni caso esclude l'applicabilità del metodo a dati con presenza di "memoria" più lunga di quella considerata. La non stazionarietà e la dipendenza (voglio sottolineare ancora una volta, questa dipendenza è anche non stazionaria, quindi né CM, né entropie condizionali funzionano) derivano direttamente dalla comprensione dei processi di mercato che generano un flusso di quote.

No, non venivano dal punto, venivano dai fatti :)) È uno scherzo :).

Sta pretendendo una rigorosa stazionarietà dai processi reali? Spero di no. Andiamo avanti. Abbiamo bisogno di regolarità, cioè di un effetto che esiste per un tempo abbastanza lungo. Cioè siamo interessati a processi stazionari (almeno approssimativamente e almeno per il tempo limitato dal nostro campione) nel mercato. In altre parole, l'apparato è abbastanza adeguato allo scopo.

 
alexeymosc:

Buon pomeriggio!

Per tutti i grafici Forex conto in pip (al contrario del mercato azionario).

Secondo - salvo i segni, cioè non li prendo modulo. Tutto quello che avete visto per D1, M5, H1 - è calcolato sulla base dei rendimenti in pip, discretizzati a 5 simboli dell'alfabeto, il segno del cambiamento di prezzo è conservato.

Ultimo grafico per H1 - ho squadrato i rendimenti per eliminare il segno.

La presenza di un cartello fa una grande differenza, naturalmente. È solo che nel vostro articolo, le funzioni di densità di probabilità sono date solo per valori positivi.
 
Candid:
La presenza del cartello fa una grande differenza, naturalmente. È solo che nel vostro articolo le funzioni di densità di probabilità sono date solo per valori positivi.

Queste funzioni non sono per i rendimenti, ma per il valore dell'informazione reciproca calcolata, e questo valore non può essere negativo.

Nell'articolo Habra per i ritorni è stato mantenuto anche il segno, ma lì ho preso incrementi percentuali. Ma non fa molta differenza.

Qui - confronta gli ultimi due grafici per EURUSD H1. Nel primo il segno per gli incrementi è conservato, nel secondo è omesso. L'informatività del secondo sistema è naturalmente superiore. Ma l'informatività non è bassa anche con il segno della direzione del movimento. È già interessante.

 
alexeymosc:
Queste funzioni non si basano sui rendimenti, ma sui valori dell'informazione reciproca calcolata, e questo valore non può essere negativo.

Sì, ho già notato che ho sbagliato.

In ogni caso, se la metodologia percepisce gli effetti della volatilità anche su dati significativi parla piuttosto a suo favore, imho.

 
Candid:

Sì, ho già notato che ho sbagliato.

In ogni caso, se la metodologia percepisce gli effetti della volatilità anche sui dati di riferimento parla piuttosto a suo favore, imho.

Ho dato qui la vera tabella di calcolo qui sotto - questa è la vera quotazione EURUSD M5: https://www.mql5.com/ru/forum/135430/page22

Lo stato 1 è il quantile inferiore (forte movimento verso il basso), lo stato 5 è un forte movimento verso l'alto. La variabile indipendente viene restituita un passo indietro, cioè il lag più vicino. Si può vedere che se il valore della fonte = 1, il ricevitore ha più probabilità di prendere il valore 1 o 5, ma con un bias di 5.

Se la fonte ha preso un valore di 5, il ricevitore è o 1 o 5 più probabile che sia sbilanciato verso 1. Queste cose riducono l'incertezza dello stato del ricevitore. Sia la volatilità che l'asimmetria a valori specifici giocano un ruolo qui. Isolando la volatilità separatamente, la componente informativa per valori specifici (piuttosto che coppie di valori polari di 1-5) rimane.

Ho volutamente postato questo screenshot per rendere più chiara l'essenza della ricerca. Tutto si basa sulla probabilità e sulla funzione di densità.

 
joo:
come viene fatta la ricerca, non con la forza bruta?

L'overkill è un'opzione. Si potrebbe provare un algoritmo di ricerca genetica con informazioni reciproche come funzione di fitness.

Immaginate di avere un insieme di 100 variabili, che sono ugualmente campionate. Potrebbe accadere che se la variabile 5 assume il valore 3 e la variabile 76 assume il valore 1, allora la probabilità che la variabile dipendente assuma il valore 4 è del 75%. Ma per campionare questa coppia di variabili indipendenti, dobbiamo misurare l'informazione reciproca tra le due variabili indipendenti e la variabile dipendente 100 * 100 - 100 volte. E se vogliamo guardare le combinazioni di tre variabili indipendenti...

 
Avals:
non generano SB basati su GARCH. Devi prendere una serie reale e generare una SB basata sulla volatilità reale. Ho postato uno script qui https://forum.mql4.com/ru/41986/page10 che sostituisce la storia offline di uno strumento reale con un SB utilizzando tick volumetrici. Un tale SB replicherà quasi al 100% il vol reale. GARCH, ecc. non tengono conto di molte sfumature come i diversi cicli d'onda e molti altri. Se c'è una differenza tra questa riga di SB e la riga da cui è generata, è più interessante :)

Ecco un grafico generato di SB con volatilità identica a EURUSD. Alexey, per favore esegui l'analisi per questo. Vediamo se ci sono differenze.
File:
eurusd_r.zip  499 kb
 
Candid:

No, non venivano dal punto, venivano dai fatti :)) È uno scherzo :).

Sta pretendendo una rigorosa stazionarietà dai processi reali? Spero di no. Andiamo avanti. Abbiamo bisogno di regolarità, cioè di un effetto che esiste per un tempo abbastanza lungo. Cioè siamo interessati a processi stazionari (almeno approssimativamente e almeno per il tempo limitato dal nostro campione) nel mercato. Cioè l'apparato è abbastanza adeguato allo scopo.

Esattamente, si spera. Secondo i miei calcoli, i processi che avvengono in momenti diversi del mercato differiscono, diciamo, molte volte. Non le percentuali che sperate. Si sta cercando di confrontare processi che si verificano in un momento con un processo di un altro tempo - da dove vengono la stazionarietà e l'adeguatezza dei metodi. Riflessi di questa non stazionarietà possono essere visti nei cambiamenti di volatilità (sia ciclici che sporadici), ma anche questo non è completo.

Qui, sembra che molte persone abbiano letto la conferenza di Shiryaev sull'opera di Pastukhov e sembra che quando il metro dice che "la volatilità stessa è volatile" dovrebbe essere chiaro che tutto non è semplice e dobbiamo guardare attentamente ciò che facciamo. Ma no, ancora una volta vediamo un altro tentativo di tirare alcune formule sul mercato.

In breve, fate quello che volete, è il vostro tempo e le vostre perdite. Naturalmente, se ti piace il processo di studio dei numeri - questo è un altro discorso, c'è solo il divertimento dell'hobby.

 
HideYourRichess:

Esattamente, si spera. Secondo i miei calcoli, i processi che avvengono in momenti diversi del mercato differiscono, diciamo, molte volte. Non nelle percentuali che sperate.

In primo luogo, lo capiamo. La non stazionarietà è un dato di fatto che devi sopportare, nel peggiore dei casi separando il tuo denaro sporco di sangue.

In secondo luogo, con la discretizzazione per 5 quantili, si coartano le serie di dati e il rumore viene assorbito, almeno parzialmente, all'interno degli intervalli di quantili. La funzione di densità diventa uniforme.