Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 72

 
Mathemat:

Esattamente, è proprio così. L'ACF è inutile.

L'informazione reciproca, tuttavia, dovrebbe essere, come non c'è odore di zero anche ad una distanza di centinaia di barre.



mandami i tuoi risultati - come li hai calcolati, quali dati hai usato, ecc.
 
Avals:

Ho bisogno che mi mandi i risultati - come li hai calcolati, quali dati hai usato, ecc.

Non ho contato i take-away. Ho altre cose - le statistiche. Il criterio del chi-quadro della relazione tra serie di dati. Lo posterò più tardi. Dovrò chiarirlo per renderlo più chiaro.

In effetti, questo è molto vicino a ciò che fa l'omonimo. Anche le formule sono molto simili lì.

 
alexeymosc:

Il massimo può essere 2,098 bit. Questa è l'informazione media di questa particolare serie di dati. Se, per esempio, una barra sul ritardo 1 determina completamente una barra zero, allora la loro informazione reciproca diventerà 2,098 bit.

Qual è questo numero? È una misura dell'informazione) Bisogna leggere gli articoli su TI. In breve, i bit riflettono una misura della casualità dei valori della fonte dei dati secondo la formula dell'autoinformazione di un valore particolare

I(X) = - log(P(x))*P(x).

Un altro esempio. Lanciamo una moneta, contiamo l'informazione reciproca tra due eventi consecutivi. Con le formule che ho tradotto nel mio articolo si ottiene che la mutua informazione I(X;Y) = 0. E se un lancio di croce indica precisamente un successivo lancio di croce (o testa), allora I(X;Y) sarebbe uguale a 1 - questa è l'informazione media della fonte di dati "moneta giusta".

Alexey! Anch'io uso l'informazione reciproca per selezionare input significativi per una rete neurale. Di solito ottengo modelli con una prevedibilità del 52 - 54%. Mi sembra che si ottengano risultati validi quando l'informazione reciproca è > 0,1 bit. Per la volatilità è possibile trovare tali input significativi.

 
VNG: Chi si prende il cinque non lo so. Tuttavia, vedo che si è imbattuto in un risultato molto interessante durante la ricerca e non l'ha visto.

Mi rendo conto che i miei post in questo thread sono al limite del fallo, quasi off-topic.

Al cinque, hrenfx.

I post vanno bene, abbastanza in tema. Anche solo sull'applicabilità di TI al soggetto, qui alcuni hanno dei dubbi.

- Che ci sia un 'invarianza nel cambiamento di scala, scusate, non lo capisco. Intendo l'invarianza come la presenza di un fattore di scala (nel caso generale può essere qualsiasi numero o funzione), quando moltiplicato per il quale si ottiene un nuovo modello di scala diversa. Cioè, la trasformazione affine, che è la manifestazione della strutturalità in un flusso caotico di dati. Il problema si riduce allora a trovare un tale coefficiente. Quando si trova un modello viene semplicemente moltiplicato per questo coefficiente. E tale trasformazione funziona sia "verso l'alto" che "verso il basso". E questo è tutto.

Ok, che sia così, ho esagerato con la frattalità. C'è, ma non è perfetto. Più precisamente, l'invarianza frattale non è perfetta.

- se si studia la relazione tra le due quantità.

- perché è così, cosa causa questa affermazione

Quale dichiarazione - non capisco.

- Perché due e non tre-cinque-trenta

- Quali due valori?

Qui è più chiaro.

1. Due perché prendiamo una fonte condizionata e un ricevitore condizionato e cerchiamo di scoprire se c'è qualche dipendenza tra loro.

Componiamo un alfabeto (io divido la distribuzione dei rendimenti in quantili, è più comodo per me; l'omonimo lo fa un po' diversamente, ma non influisce molto sul risultato), applichiamo TI. Ci sono alcuni dubbi sul canale di comunicazione. Forse il tempo è il canale di comunicazione.

Se fissiamo la differenza tra le barre (i numeri sono calcolati in MT4) uguale a, diciamo, 238, allora la fonte è la serie

return(Bars-1), return(Bars-2), ... return(238) (circa 80 000 valori a 12 anni di orologio)

Il ricevitore è una serie di

return(Bars-1 - 238), return(Bars-2 - 238), ... ritorno(0).

In breve, solo una serie di rendimenti e lo stesso, spostati rispetto a se stessi di 238.

Potete calcolare l'ACF. Sarà quasi certamente uguale a zero o ne differirà in modo statisticamente insignificante. Ebbene sì, non ci sono relazioni lineari significative tra queste serie, tutte banali, niente pesci.

Ma noi alexiani non contiamo gli ACF, contiamo le dipendenze non lineari - qualsiasi dipendenza. Ecco a cosa serve la distribuzione congiunta di queste due quantità. Ce l'abbiamo. (A proposito, è anche necessario per calcolare l'ACF, cosa che la gente di solito trascura).

L'omonimo prese subito il toro per le corna e contò l'informazione reciproca di queste due serie.

Ho valutato il test del chi-quadro della relazione tra le due variabili casuali.

I risultati sono molto simili.

- La distribuzione congiunta delle due quantità rappresenta una superficie. Ci trasferiamo in un'altra rayelnost?

Siamo lì da un po' di tempo, è solo che non tutti se ne rendono conto.

Per ora è solo un progetto di canna da pesca, non è affatto un pesce.

 
IgorM:

L'unico modo per verificare l'efficienza del mercato è verificarla da soli, altrimenti rimarrà nel piano del "crederci o no". Non posso dirlo meglio di come l'ho già detto:

Spero di sbagliarmi, ma le tue "macchie magiche" sono più nella mia testa, il TS per canali è molto simile al TS per intuizione, ecco una previsione non realizzata

Io "stravolgo" i livelli con diverse build, li vedo lavorare 50/50 nel TS proposto con risultati molto simili, ho il sospetto che anche se prendo un decennio di movimento dei prezzi, essi coincideranno sulla storia o nel prossimo futuro


Igor, non tendo a idealizzare nessuno e niente. Ma ho già detto

- Questi non sono TS, sono modelli di movimenti di mercato. Devi costruire tu stesso un TS basato su di loro.

- L'autore è sempre stato contrario alle previsioni. L'essenza del suo lavoro è espressa in una frase - rimbalzo, vai al precedente, sfondamento - vai al successivo.

- Per quanto posso vedere non è una previsione, ma un possibile obiettivo, che personalmente non ho messo a fuoco.

- State cercando dei difetti senza cercare di andare al fondo di ciò che viene proposto. Capisco il tuo scetticismo, ma sei partito con il piede sbagliato. Cerca di entrare prima nelle regole e nell'essenza delle costruzioni. Per renderti più facile - il canale di Vadim è la stessa candela, ma senza relazione con il TF.

Il TAdv postula lo sviluppo del movimento secondo sei punti di controllo. Il canale è i punti 1 e 2 del Tadp. Lo swing è punti 1,2,3 di Tadv. Notate che né Jan, che è uno degli autori di TAdv, né Vadim, l'autore di V-Channels e V-Swings, dimostrano e convincono qualcuno di qualcosa, appaiono qui solo in casi strettamente definiti e non chiedono niente a nessuno, non pubblicizzano niente. Non si fanno beffe e si comportano correttamente. Non è un indicatore di convinzione e forza interiore? Aiutano disinteressatamente e condividono i loro sviluppi. TAdv è stato presentato più di 10 anni fa, VKanals e Vsvings, ho paura di mentire, qualcosa come 7, sono stati testati dal tempo e hanno un sacco di seguaci. L'unico modo per verificarne l'efficacia è quello di addentrarsi da soli e testarlo per vedere se funziona. Altrimenti rimarrà sul piano del "crederci o no".

Buona fortuna.

 
VNG: Igor, non tendo a idealizzare nessuno o niente. Ma ho già detto
hmm, l'esperienza è stata un successo, il mio post è stato sul thread per circa 5 minuti, ma anche riuscito a ottenere un aggancio, e non i regolari locali
 
renegate:

Alexey! Anch'io uso l'informazione reciproca per selezionare input significativi per una rete neurale. Di solito ottengo modelli con una prevedibilità dei rendimenti del 52 - 54%. Mi sembra che si ottengano buoni risultati quando l'informazione reciproca è > 0,1 bit. Per la volatilità è possibile trovare tali input significativi.

Oh, è bello vedere qualcuno che ha anche imparato ad applicare TI al problema della selezione delle variabili significative.

Solo il tuo consiglio è un po' incompleto o qualcosa del genere. Il semplice fatto è che le informazioni medie di una fonte di dati possono essere diverse. La soglia significativa di mutua informazione dipenderà anche da questo. Qual è il vostro flusso medio di informazioni H(X)?

 
Mathemat:

Su un cinque - hrenfx.

I post vanno bene, abbastanza in linea. Oltre alla semplice applicabilità di TI all'argomento, alcuni hanno dei dubbi qui.

Va bene, che sia così, con la frattalità ho esagerato. C'è, ma non è l'ideale. Più precisamente, l'invarianza frattale non è ideale.

Quale dichiarazione - non capisco.

Qui è più chiaro.

1. Due perché prendiamo una fonte condizionata e un ricevitore condizionato e cerchiamo di scoprire se c'è qualche dipendenza tra loro.

Creiamo un alfabeto (io divido la distribuzione dei rendimenti in quantili, è più comodo per me; il mio omonimo lo fa un po' diversamente, ma non influisce molto sul risultato), applichiamo TI. Ci sono alcuni dubbi sul canale di comunicazione. Forse il tempo è il canale di comunicazione.

Se fissiamo la differenza tra le barre (i numeri sono calcolati in MT4) per essere, diciamo, 238, - allora la fonte è la serie

return(Bars-1), return(Bars-2), ... return(238) (circa 80 000 valori in 12 anni)

Il ricevitore è una serie

return(Bars-1 - 238), return(Bars-2 - 238), ... ritorno(0).

In breve, solo una serie di rendimenti e lo stesso, spostati rispetto a se stessi di 238.

È possibile calcolare l'ACF. Sarà quasi certamente uguale a zero o ne differirà in modo statisticamente insignificante. Ebbene sì, non ci sono relazioni lineari significative tra queste serie, tutte banali, niente pesci.

Ma noi alexiani non contiamo gli ACF, contiamo le dipendenze non lineari - qualsiasi dipendenza. Ecco a cosa serve la distribuzione congiunta di queste due quantità. Ce l'abbiamo. (A proposito, è anche necessario per calcolare l'ACF, solo che non tutti lo capiscono!)

Tezka ha subito preso il toro per le corna e calcola l'informazione reciproca di queste due serie.

Ho valutato un test chi-quadrato della relazione tra due variabili casuali.

I risultati sono molto simili.

Sì, siamo lì da molto tempo, solo che non tutti lo capiscono.

Tutto questo e c'è finora solo una canna da pesca, non è affatto un pesce.


Grazie Alexey, ora è tutto chiaro.

Nel contesto di questo problema, le caratteristiche del canale di comunicazione sono assolutamente irrilevanti, saranno contabilizzate automaticamente tramite l'entropia dell'informazione.

 
IgorM:
Hmmm, l'esperienza è stata un successo, il mio post è stato sul thread per circa 5 minuti, ma è stato addirittura bloccato, e non dai regolari locali

Qual è stata l'esperienza?
 
Mathemat:


Ma noi, Alexei, non stiamo contando gli ACF, ma le dipendenze non lineari - qualsiasi dipendenza. A questo serve la distribuzione congiunta delle due quantità. Ce l'abbiamo. (A proposito, è anche necessario per calcolare l'ACF.

Ben detto! Noi, Alexei, siamo a favore dell'inefficienza del mercato. E abbiamo già risultati pratici che lo dimostrano, ma non visibili attraverso il prisma dell'approccio statistico-econometrico classico.