Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 30

 
faa1947:

analisi dei residui per l'autocorrelazione e il tipo di funzione di densità di probabilità. Anche, ovviamente, R^2. Queste sono, in linea di principio, tecniche comuni di previsione delle serie temporali.

Questo è solo un inizio, e nel senso di essere generalmente accettato, non è completo. Completo è mostrato qui, anche se questo è solo un esempio di utilizzo. Tre gruppi di analisi: coefficienti, residui e stabilità. Se riesci a conciliare le contraddizioni, potresti ottenere una stima, che è sempre un errore di previsione, poiché l'obiettivo è la previsione e tutto il resto sono i risultati intermedi.

Sì, non credo di aver mai fatto uno studio accademico COMPLETO. Di solito c'è una carenza di tempo e di sforzi nel lavoro, quindi vado per la via più breve: costruire diversi (2 o più) modelli predittivi e fare un'analisi dei residui, poi scegliere un modello basato su una valutazione equilibrata della precisione e della qualità della serie dei residui. Sono d'accordo che, dato il tempo, si può approfondire le stime di affidabilità dei predittori.

A proposito, un test buono e relativamente a basso costo dell'accuratezza e della stabilità del predittore è la convalida incrociata, dove i periodi di addestramento e di convalida sono scelti molte volte in modo che alla fine l'intera serie originale sia spezzata in piccoli segmenti e ogni segmento sia incluso nel campione di convalida.

 
alexeymosc:

Sì, non credo di aver mai fatto uno studio accademico completo. Di solito c'è una carenza di tempo e di sforzi nel mio lavoro, quindi prendo una strada più breve: costruire diversi (2 o più) modelli predittivi e fare un'analisi dei residui, poi scegliere un modello basato su una valutazione equilibrata della precisione e della qualità delle serie dei residui. Sono d'accordo che, dato il tempo, si può approfondire le stime di affidabilità dei predittori.

A proposito, un test buono e relativamente a basso costo per l'accuratezza e la stabilità del predittore è la convalida incrociata, dove i periodi di addestramento e di convalida sono scelti molte volte, in modo che alla fine l'intera serie originale sia spezzata in piccoli segmenti e ogni segmento sia incluso nel campione di convalida.

Per molto tempo, ho dato il seguente consiglio, che è duramente conquistato dalla mia esperienza personale. Da circa trent'anni, e soprattutto al giorno d'oggi, il modo più produttivo per padroneggiare un'area tematica è quello di prendere un pacchetto già pronto focalizzato su quell'area. Ho menzionato EViews, ma non è l'unico pacchetto. È solo che questo pacchetto è usato nell'insegnamento nelle nostre università. Utilizzando il pacchetto si otterrà:

Un gran numero di programmi specializzati che sono stati eseguiti e verificati da milioni di utenti.

schema di analisi

completezza dell'analisi

riferimenti da cui sono stati presi gli algoritmi utilizzati.

Avendo acquisito esperienza e una prospettiva, si può poi passare a qualche miglioramento. Ma questi miglioramenti saranno basati sulla conoscenza sistematica della materia e non vi verrà in mente di portare Peters o qualcun altro come Tolomeo, come alcuni sopra.

 
faa1947:

Per molto tempo, ho dato il seguente consiglio, duramente conquistato dalla mia esperienza personale. Da circa trent'anni, e soprattutto al giorno d'oggi, il modo più produttivo per imparare un'area tematica è quello di prendere un pacchetto già pronto focalizzato su quell'area. Ho menzionato EViews, ma non è l'unico pacchetto. È solo che questo pacchetto è usato nell'insegnamento nelle nostre università. Usando il pacchetto si ottiene:

un gran numero di programmi specializzati funzionali e testati per milioni di utenti

Un quadro di analisi

Completezza dell'analisi

Elenchi di riferimenti da cui sono stati presi gli algoritmi utilizzati.

Avendo acquisito esperienza e prospettive, si può poi passare a eventuali miglioramenti. Ma questi miglioramenti saranno basati su una conoscenza sistematica della materia e non vi verrà in mente di portare Peters o qualcun altro come Tolomeo, come alcuni sopra.


Scusa, ma la cosa principale è la corretta dichiarazione del problema e le conclusioni. Per esempio, ciò che è scritto nell'articolo relativo alla "Diagnostica degli indicatori" e le conclusioni sulla base dei residui che l'indicatore è utile o no ecc. - non è corretto (imha). Così come non è vero che l'indicatore deve prevedere o essere utile su tutta la serie. Non è necessario prevedere i prezzi tutto il tempo per ottenere un profitto, solo in momenti relativamente rari. Previsione in un certo senso perché non è un singolo cambiamento di prezzo, ma la robustezza del sistema e la ripetizione di statistiche passate. E non sono gli indicatori a fare previsioni, ma solo il sistema nel suo insieme.

P.S. L'articolo è ancora utile, grazie :)

 
Avals:


Per esempio, quello che avete scritto nell'articolo in relazione alla "diagnostica dell'indicatore" e le conclusioni basate sui residui che l'indicatore è utile o no, ecc. - non è corretto (imha). Non è nemmeno vero che l'indicatore debba prevedere o essere utile su tutto il range.

Sono d'accordo, l'articolo è scritto con qualche esitazione, perché il suo scopo era quello di dimostrare l'approccio in generale, la metodologia nella sua interezza, per così dire.

Non c'è bisogno di fare previsioni di prezzo tutto il tempo per fare profitto, solo in momenti relativamente rari

Non sono affatto d'accordo. Qualsiasi ST prevede sempre, che lo ammetta o no. Con la periodicità si fa un'analisi per prendere decisioni per il futuro: prendere una posizione, uscire, stare fuori dal mercato o rimanere nel mercato. Queste decisioni si basano su previsioni del futuro comportamento del mercato.

Non è un singolo cambiamento di prezzo che è previsto, ma la robustezza del sistema.

La robustezza non è prevista, è costruita, mentre il risultato della costruzione è valutato dall'errore di previsione - se la varianza dell'errore è vicina a una costante, il sistema sarà stabile.

E non sono gli indicatori a prevedere, ma solo il sistema nel suo insieme.

Naturalmente. L'articolo presuppone che il sistema sia costituito da un unico indicatore. Anche con questa semplificazione, l'articolo è diventato troppo complicato.

Se vuoi discutere l'articolo nei dettagli, ti suggerisco di spostarti nel topic appropriato, forse altri si uniranno. Questo thread ha un argomento diverso, dopo tutto.

 
faa1947:

Non c'è bisogno di prevedere costantemente i prezzi per fare profitti, solo in occasioni relativamente rare

Completamente in disaccordo. Qualsiasi ST prevede sempre, che lo ammetta o no. Con la periodicità del TS si fa un'analisi per prendere decisioni per il futuro: prendere una posizione, uscire, stare fuori dal mercato o nel mercato. Queste decisioni si basano su previsioni del futuro comportamento del mercato.


non c'è bisogno di prevedere, ma non c'è bisogno di prevedere continuamente :) Solo in momenti discreti, e controllando i residui dell'indicatore su tutta la serie si verifica effettivamente la sua capacità di prevedere la serie in modo continuo
faa1947:

Non è un singolo cambiamento di prezzo che è previsto, ma la robustezza del sistema

La robustezza non è prevista, ma costruita, e il risultato della costruzione è valutato dall'errore di previsione - se la varianza dell'errore è vicina a una costante, allora il sistema sarà stabile.

I risultati di un singolo trade non sono importanti, sono importanti le statistiche su molti trade. Deve corrispondere almeno in parte alle statistiche favorevoli dei test retrospettivi. Quindi, quando si danno soldi alla gestione del sistema, la scommessa è esattamente su questo - che le nostre statistiche favorevoli rimarranno (con un approccio sistematico). E questa è la robustezza
 
alexeymosc:

È possibile che questo sia il caso. Ma quando costruiamo una serie di ritorni della forma seguente: X[t]-X[t-1], quasi non lo mostra. Uso le parole rendimenti, incrementi, ritorni, sono tutte serie di prezzi differenziati.

Questo è facilmente verificabile, non c'è bisogno di argomenti filologici :). A proposito, puoi cercare di scoprirlo su questo forum.

L'asimmetria delle probabilità nella direzione del cambiamento di segno è minima e insignificante. Ma se si calcola l'entropia condizionale tra la variabile dipendente e i rendimenti su due o più ritardi, allora tutte le disuguaglianze vengono contabilizzate nella figura risultante e l'entropia si riduce.

Ancora una volta: la forza dell'effetto dipende dal TF, ma l'H1 generato su tick casuali sarà simile all'H1 generato su tick con ritorno reale?

Ho provato ad addestrare NS su dati orari e ho preso solo i lag più informativi (42 variabili, sui lag 1, 2, 23, 23, 25,... 479, 480, 481). Sfortunatamente, il risultato non ha funzionato molto bene. Accuratezza della previsione del numero quantile - nella regione del 30-40%. Anche se le irregolarità che la rete neurale è stata in grado di tradurre in uscita, ma le dipendenze non sono sufficienti per la previsione. L'intero problema è che le variabili indipendenti sono reciprocamente informative a lag 1, 2, 24.... e la quantità totale di informazioni sulla barra zero è davvero piccola. Dovremmo pensare come opzione di prendere timeframes giornalieri e più vecchi.


Ho dato per scontato fin dall'inizio che la tecnica rileva tutte le dipendenze, sia utili che inutili per le previsioni. Per quanto riguarda la volatilità, ci sono prove certe a sostegno di tale ipotesi. Cioè, quei vostri ritardi "informativi" possono semplicemente essere intasati da questo tipo di informazioni inutili per la previsione.

Penso che il mio tempo in questo thread sia finito o non sia ancora arrivato :). Probabilmente è ora che la fontana si riposi :).

 
Candid:


Ho dato per scontato fin dall'inizio che la metodologia percepisca tutte le dipendenze, sia quelle adatte alla predizione che quelle inutili. Per quanto riguarda la volatilità, ci sono alcune prove a sostegno di questa ipotesi. Cioè, quei vostri ritardi "informativi" possono semplicemente essere intasati da questo tipo di informazioni inutili per la previsione.

Anche io l'ho capito abbastanza bene. Il problema è diventato più complicato al livello di trovare segni informativi di un segno di cambiamento di prezzo. E se si scopre che sui timeframe intraday i ritardi informativi richiesti sono ciclici (sospetto che lo siano), allora la loro informazione totale sulla direzione del movimento del prezzo sulla barra zero sarà molto piccola...

Questo lo controllerò. Poi ci sarà: cercare di indagare le barre giornaliere e probabilmente le settimane possono ancora essere statisticamente affidabili. Ma se i ritardi informativi sono ciclici anche lì, ahimè, penso che l'idea di usare solo i ritardi non funzionerà. Allora potete provare gli indicatori.

L'avevo pianificato così fin dall'inizio, tra l'altro. Ma finché non lo provo, la fontana non va via.

"Quindi questi vostri ritardi "informativi" potrebbero essere solo intasati da questo tipo di informazioni inutili per la previsione".

E cosa intende per "informazioni inutili"? Ok, bene, la volatilità non è nostra amica. Ci sono anche componenti di rumore. Credo che tu abbia deciso presto di eliminare il metodo. Bisogna saper usare qualsiasi strumento, io sto ancora imparando, quindi qui c'è più acqua che calorie.

L'ho già suggerito: postate qualsiasi indicatore e l'obiettivo che indica. Una condizione è che sia per formule in Echel e che ci sia la possibilità di giocare con i suoi parametri. L'obiettivo dovrebbe anche essere specifico, per esempio, il prezzo scenderà in massimo 6 barre, o il prezzo supererà il prezzo attuale di 10 punti. Eseguirò i dati e vi darò una serie di parametri ottimali dell'indicatore in termini di entropia dell'informazione.

 
Avals:
Dovrebbe, in realtà, corrispondere almeno in parte alle statistiche di back-test che ci sono favorevoli.
Sperare in un "favorevole" o avere un'espressione numerica per questo "favorevole". Sopra ho nominato uno dei valori stimati - la variazione della varianza dell'errore di previsione non dovrebbe superare il 5%. Ma questo non è l'unico requisito per un sistema robusto. E il test posteriore dà solo la speranza che non cambierà.
 
faa1947:
Sperare "favorevole" o avere un'espressione numerica per questo "favorevole". Sopra ho nominato uno dei valori calcolati - la variazione della varianza dell'errore di previsione non dovrebbe superare il 5%. Ma questo non è l'unico requisito per un sistema robusto. E il test posteriore dà solo la speranza che non cambierà.


Sì, ci sono metodi per valutare la robustezza.

Applicato all'argomento e al tuo articolo: il modo per portare l'intera serie di prezzi a una forma stazionaria con MO positivo è quello di creare un sistema di inversione redditizio e robusto che sia sempre sul mercato. Questo vale anche per il modo di distinguere una serie reale da un vagabondaggio casuale. Questo è, infatti, l'indicatore che supererà i vostri test e il criterio che distinguerà la serie reale dal SB è l'algoritmo di questo sistema. Pertanto, è ingenuo credere che un indicatore preso a caso o il metodo delle informazioni reciproche sia un tale algoritmo per le quotazioni di mercato. Può accadere solo per puro caso.

 
faa1947:

La teoria del mercato efficiente non è considerata in econometria. Tutte le sue ipotesi si basano sul fatto che il mercato non è efficiente. L'econometria non include Markowitz e i suoi apologeti e i loro portafogli efficienti. L'econometria esiste da oltre 100 anni e non è mai stata smentita da Peters, Mandelbrot e altri, poiché si basa originariamente sull'assunzione che il mercato non sia stazionario.

È l'econometria che giustifica una previsione un passo avanti e mostra le ragioni del deterioramento fatale della previsione diversi passi avanti.


il problema è che gli indicatori macro possono cambiare periodicamente la loro ponderazione ecc...+ il breve periodo di tempo disponibile per un'analisi completa...

Sono d'accordo, naturalmente - la fase deve essere presente nell'analisi...