L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 84

 
Continuo a dire loro che prevedere il mercato per 5 anni non è realistico. Vogliono costruire un modello adeguato per almeno una settimana o due ed esserne felici, ma vogliono costruire un modello per 5 anni. Questa è utopia. E una domanda all'onnisciente Alexey: dimmi come si comporterà il modello se vengono definite due classi assolutamente identiche e la correzione del mercato in esse è diametralmente opposta. Per parlare di dati contraddittori.... come si comporterebbe il modello in un caso simile???? Dopo tutto, il modello in sé non è importante, ciò che conta è la reazione del mercato a questo modello....
 
Mihail Marchukajtes:
Continuo anche a dire loro che prevedere il mercato per 5 anni non è realistico...

È inutile parlare ed esortare. Molte persone hanno distorsioni cognitive tra le quali ci sono anche filtri di informazioni, come: se l'informazione non si adatta alla visione del mondo, o non viene percepita affatto o provoca una risposta dispettosa.

In altre parole, la maggior parte dei residenti qui o non presterà affatto attenzione alle vostre conversazioni, o inizieranno a brontolare e a chiamarvi troll.

Ma non è questo il punto. Il punto è che in jPrediction dalla versione 7 è apparsa la possibilità di valutare la significatività dei predittori. Per fare questo, dopo aver creato (addestrando) un nuovo modello o caricando un modello salvato in precedenza da un file, è necessario chiamare la voce di menu "View a significant of predictors" o premere il tasto "hot" F5:

E puoi guardare un grafico dell'importanza dei predittori:

Il miglior predittore è il migliore - il predittore più significativo. Se si rimuove la colonna "Competitività" da questo campione, si ottiene il messaggio "Garbage in, Garbage out" dopo l'allenamento.

Il peggior predittore è il peggiore - il predittore meno significativo. Se rimuoviamo la colonna "Rischio operativo" dal campione, la capacità di generalizzazione non peggiorerà.

I restanti predittori segnati "-" in Descrizione sono di media importanza. Se vengono rimossi da questo campione, la capacità di generalizzazione sarà notevolmente degradata.

 
Yury Reshetov:

È inutile parlare ed esortare. Molte persone hanno distorsioni cognitive, tra le quali ci sono anche i filtri dell'informazione, come: se l'informazione non si adatta alla visione del mondo, o non viene percepita affatto, o provoca una risposta dispettosa.

In altre parole, la maggior parte dei residenti qui o non presterà affatto attenzione alle vostre conversazioni, o inizieranno a brontolare e a chiamarvi troll.

Ma non è questo il punto. Il punto è che in jPrediction dalla versione 7 è apparsa la possibilità di valutare la significatività dei predittori. Per fare questo, dopo aver creato (addestrando) un nuovo modello o caricando un modello salvato in precedenza da un file, è necessario chiamare la voce di menu "Visualizza un significativo di predittori" o premere il tasto di scelta rapida F5:

E puoi guardare un grafico dell'importanza dei predittori:

Il miglior predittore è il migliore - il predittore più significativo. Se si rimuove la colonna "Competitività" da questo campione, si ottiene il messaggio "Garbage in, Garbage out" dopo l'allenamento.

Il peggior predittore è il peggiore - il predittore meno significativo. Se la colonna "Rischio operativo" viene rimossa da questo campione, la generalizzabilità non si deteriora.

Gli altri predittori segnati "-" nella Descrizione sono di media importanza. Se vengono rimossi da questo campione, la capacità di generalizzazione sarà notevolmente degradata.

Grazie!!! Un'aggiunta estremamente utile. Continuando a girare.... che gira...
 
Yury Reshetov:

È inutile parlare ed esortare. Molte persone hanno distorsioni cognitive, tra le quali ci sono anche i filtri dell'informazione, come: se l'informazione non si adatta alla visione del mondo, o non viene percepita affatto, o provoca una risposta dispettosa.

In altre parole, la maggior parte dei residenti qui o non presterà affatto attenzione alle vostre conversazioni, o inizieranno a brontolare e a chiamarvi troll.

Ma non è questo il punto. Il punto è che in jPrediction dalla versione 7 è apparsa la possibilità di valutare la significatività dei predittori. Per fare questo, dopo aver creato (addestrando) un nuovo modello o caricando un modello salvato in precedenza da un file, è necessario chiamare la voce di menu "View a significant of predictors" o premere il tasto "hot" F5:

E puoi guardare un grafico dell'importanza dei predittori:

Il miglior predittore è il migliore - il predittore più significativo. Se si rimuove la colonna "Competitività" da questo campione, si ottiene il messaggio "Garbage in, Garbage out" dopo l'allenamento.

Il peggior predittore è il peggiore - il predittore meno significativo. Se la colonna "Rischio operativo" viene rimossa da questo campione, la generalizzabilità non si deteriora.

Gli altri predittori segnati "-" nella Descrizione sono di media importanza. Se vengono rimossi da questo campione, la capacità di generalizzazione sarà notevolmente degradata.

Come si calcola la significatività dei predittori?
 
SanSan Fomenko:
Come si calcola la significatività dei predittori?

In breve (ma non molto chiaro), la significatività del predittore è calcolata ponderando i coefficienti ottenuti dopo l'allenamento.

Per maggiori dettagli, vedere l'algoritmo per il calcolo della significatività dei predittori nel codice sorgente di jPrediction. O dovrò scrivere un intero articolo per spiegarlo più chiaramente.

 
Mihail Marchukajtes:
Grazie!!! Un'aggiunta estremamente utile. Continuo spinning.... ....

La cosa principale è che ora puoi calcolare molto rapidamente i predittori di basso valore e sostituirli con altri predittori. Dopo averli sostituiti, è imperativo vedere se la generalizzabilità è aumentata o meno. Se non è aumentato, allora il cambiamento è stato fatto in modo errato, cioè un predittore più significativo è stato sostituito con uno meno significativo.

Ieri ho sperimentato le citazioni. Ha trovato rapidamente gli oscillatori TA più significativi. Ma si è scoperto che ce n'erano solo 5. E inoltre la capacità di generalizzazione non cresce, non importa cosa ci metti dentro. Così si scopre che qualunque cosa si guardi attraverso gli indicatori e gli oscillatori TA, ma in realtà sono tutti basati sugli stessi dati - un piccolo segmento della storia precedente (diverse barre), anche se elaborano questi dati in modo un po' diverso. Tutti gli indicatori e gli oscillatori TA sono le stesse "uova", ma dal lato. Non importa come si mescola il mazzo, esso contiene le stesse carte. Tutti gli indici e gli oscillatori si correlano troppo tra loro e correlano molto poco con il futuro.

Per aumentare la capacità di generalizzazione è necessario prendere qualche altro dato da qualche parte che influenza le citazioni, ma non è derivato dalle citazioni. Cioè abbiamo bisogno di alcune fonti di informazione aggiuntive. Dove posso trovarli? Naturalmente, possiamo provare a usare i seguenti predittori: le fasi della luna, la quantità di macchie solari, i risultati delle partite della squadra di calcio di strada, il livello dell'acqua nel fiume Wonchka o la quantità di pulci per centimetro quadrato del cane Tuzyk. Ma è probabile che siano significativi?

 
Yury Reshetov:

La cosa principale è che ora puoi calcolare molto rapidamente i predittori di basso valore e sostituirli con altri predittori. Dopo averli sostituiti, è imperativo vedere se la generalizzabilità è aumentata o no. Se non è aumentato, allora la sostituzione non è stata fatta correttamente, il predittore più significativo è stato sostituito da uno meno significativo.

Ieri ho sperimentato le citazioni. Ha trovato rapidamente gli oscillatori TA più significativi. Ma ce n'erano solo 5. E inoltre la capacità di generalizzare non cresce, non mi interessa cosa ci metti dentro. Così si scopre che qualunque cosa si guardi attraverso gli indicatori e gli oscillatori TA, ma in realtà sono tutti basati sugli stessi dati - un piccolo segmento della storia precedente (diverse barre), anche se elaborano questi dati in modo un po' diverso. Tutti gli indicatori e gli oscillatori TA sono le stesse "uova", ma dal lato. Non importa come si mescola il mazzo, esso contiene le stesse carte. Tutti gli indici e gli oscillatori si correlano troppo tra loro e correlano molto poco con il futuro.

Per aumentare la capacità di generalizzazione è necessario prendere qualche altro dato da qualche parte che influenza le citazioni, ma non è derivato dalle citazioni. Cioè abbiamo bisogno di alcune fonti di informazione aggiuntive. Dove posso trovarli? Naturalmente, possiamo provare a usare i seguenti predittori: le fasi della luna, la quantità di macchie solari, i risultati delle partite della squadra di calcio di strada, il livello dell'acqua nel fiume Wonchka o la quantità di pulci per centimetro quadrato del cane Tuzyk. Ma è improbabile che siano significativi?

Per quanto riguarda l'astrologia, non scarterei la pratica di migliaia di anni. Come tifoso posso dire che perdere una squadra preferita ha un impatto negativo sulla produttività. Se la flyover town è una monocittà con un monopolista delle risorse come Nornickel, la produzione può calare, come indirettamente indicato dal calo del livello dell'acqua nel fiume Vonyuchka.

È impossibile indovinare quale farfalla, dove e quando, causerà uno tsunami con un battito d'ali.

 
Yury Reshetov:

La cosa principale è che ora puoi calcolare molto rapidamente i predittori di basso valore e sostituirli con altri predittori. Dopo averli sostituiti, è imperativo vedere se la generalizzabilità è aumentata o meno. Se non è aumentato, allora la sostituzione è stata fatta male, cioè il predittore più significativo è stato sostituito da uno meno significativo.

Ieri ho sperimentato le citazioni. Ha trovato rapidamente gli oscillatori TA più significativi. Ma ce n'erano solo 5. E inoltre la capacità di generalizzare non cresce, non mi interessa cosa ci metti dentro. Così si scopre che qualunque cosa si guardi attraverso gli indicatori e gli oscillatori TA, ma in realtà sono tutti basati sugli stessi dati - un piccolo segmento della storia precedente (diverse barre), anche se elaborano questi dati in modo un po' diverso. Tutti gli indicatori e gli oscillatori TA sono le stesse "uova", ma dal lato. Non importa come si mescola il mazzo, esso contiene le stesse carte. Tutti gli indici e gli oscillatori si correlano troppo tra loro e correlano molto poco con il futuro.

Per aumentare la capacità di generalizzazione è necessario prendere qualche altro dato da qualche parte che influenza le citazioni, ma non è derivato dalle citazioni. Cioè abbiamo bisogno di alcune fonti di informazione aggiuntive. Dove posso trovarli? Naturalmente, possiamo provare a usare i seguenti predittori: le fasi della luna, la quantità di macchie solari, i risultati delle partite della squadra di calcio di strada, il livello dell'acqua nel fiume Wonchka o la quantità di pulci per centimetro quadrato del cane Tuzyk. Ma è improbabile che siano significativi?

Prova il delta cumulativo. Distribuzione cumulativa per volumi reali..... Sistema Zscore/ Ye cjjndtcndtyyj dc` 'nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[? nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)
 
Mihail Marchukajtes:
Prova il delta cumulativo. Distribuzione cumulativa per volumi reali..... Sistema Zscore/ Ye cjjndtcndtyj dc` 'nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[? nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)
E naturalmente i dati di altre coppie, anche quelle esotiche non legate alla previsione...
 

Forse qualcuno sarà interessato, ho trovato un pacchetto che può simulare il trading e costruire sistemi di trading chiamato quantstrat

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf