L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1248

 

Penso che se l'overtraining è una conseguenza del ricordare il mercato a causa del rumore, allora ricordare il mercato richiede una certa quantità di memoria sotto forma di una foresta di alberi decisionali e boosting, e modelli come albero singolo e rete neurale con un piccolo numero di neuroni dovrebbero essere meno overtrained. Poi si scopre che c'è una quantità critica di dati che non può essere descritta da, diciamo, un foglio - qual è questo 1% o 10% - dell'intero campione (allenamento, test, controllo) è la domanda. Allora forse dovremmo valutare i dati in termini di quantità di memoria necessaria per ricordare questi dati e cercare di rendere il modello un ordine di grandezza più piccolo di questo volume critico? Come farlo - non lo so, forse ci dovrebbe essere qualcosa di simile con l'archiviazione - se l'archiviatore comprime un campione di 10mb in 1mb, il modello non deve essere più di 102,4 kb. E, poi, sapendo che il modello non ha semplicemente memorizzato il campione, ma ha trovato delle regolarità in esso, possiamo essere meno critici nei test su un campione indipendente e concludere non di overtraining, ma di una mancanza di dati sul campione per l'addestramento, poiché non c'erano situazioni che descrivevano lo stato attuale del mercato, e quindi non c'era semplicemente la possibilità di trovare un tale modello usando i predittori disponibili.

 
Ora facendo un modello a mano basato sui fogli ricevuti e si scopre che circa 20 fogli da comprare e 5 fogli come filtro possono generare ogni anno dal 2014 al 2018, e qui sto pensando, non può essere overtraining e non ci sono abbastanza fogli per il montaggio in qualche modo... quindi è un modello che perderà la sua validità nel 2019?
 
Maxim Dmitrievsky:

un modello deve avere alcuni prerequisiti fondamentali, per esempio, alcuni cicli nel mercato sono fondamentali, o la reazione alle notizie, la volatilità intraday... cose del genere

E se le regolarità non sono chiare da dove vengono, allora non è chiaro cosa succederà dopo.

I modelli sugli alberi e si occupano della questione dell'identificazione dei modelli, un predittore racconta un evento e un insieme di certi eventi dà un modello. Proprio questa è una regolarità non proveniente dal campo dei fenomeni fisici e non può essere costante perché può essere influenzata da fattori sconosciuti (fenomeni non descritti dai predittori disponibili).

In generale, il punto è che l'evento statisticamente ricorrente è rilevato dai metodi di classificazione MO, ed è un po' meglio che adattare semplicemente il mercato con indicatori ottimizzatori, o no?
 
Maxim Dmitrievsky:

La correlazione tra il numero di gonne corte in estate e il benessere finanziario dei cittadini può essere del 90%, ma non significa una correlazione, tanto meno un modello

Ok, sostituiamo la parola "modello" con "presagio" come correlazione inconoscibile all'evento.

Maxim Dmitrievsky:

Anche l'ottimizzatore è un MO.

Quindi lei equipara i due metodi?

 
Maxim Dmitrievsky:

non sono io, è il modo in cui è... l'ottimizzatore minimizza qualsiasi funzione f, l'ottimizzatore della rete neurale ottimizza la funzione f dei pesi

Se stiamo parlando dell'ottimizzazione dei soli filtri TC, allora possiamo essere parzialmente d'accordo sulle stesse azioni, ma se anche il punto di ingresso/uscita è ottimizzato, allora la situazione è leggermente diversa dal solito MO.

 
Maxim Dmitrievsky:

A questo proposito, è necessario studiare il data-mining e l'applicazione ai mercati, se è possibile a tutti, perché il data-mining 1 curva è anche una sorta di cima del più stupido, ma alcune informazioni possono essere estratte )

Studiare per applicarsi in un altro campo?

 
Maxim Dmitrievsky:

capire come estrarre qualcosa di utile dai dati

Così ho notato prima che ho estratto qualcosa di utile - forse è un granello d'oro, forse è un colpo di fortuna... chi lo sa... e non c'è modo di saperlo con certezza.

 
Supponendo che i mercati siano tutti uguali e che il comportamento dei prezzi abbia modelli simili, perché non combinare una dozzina di strumenti in un campione e cercare "segni" comuni a tutti i mercati?
 
Vizard_:

È così che si fa - si generalizza. "Patterns" sono modelli trovati da diversi campioni... Quindi hai appena abbinato un campione di tendenza, e ora ci stai dando un mal di testa))))) Ma bisogna comunque preparare i dati con cura, perché l'idea... Anche se si può essere infallibili, ma è improbabile...

Avevo la formazione per il 2016-2017 e poi ho solo controllato i fogli per il 2014-2018 e ho selezionato quelli che erano redditizi ogni anno e soddisfacevano una serie di altri criteri (crescita complessiva / nessun grande drawdown). Quindi mi sto chiedendo se un tale modello può essere utilizzato.

Per quanto riguarda la combinazione di diversi strumenti, molti predittori qui sono il guadagno in pip su diversi intervalli di tempo, e non funzionerà con diversi strumenti...

 
Maxim Dmitrievsky:

Tutti i mercati sono diversi, naturalmente, così come i modelli, e ciò che funziona per uno è una perdita per l'altro.

Per assumere qualcosa è necessario assumere qualcosa come base per un'assunzione così approssimativa

Quindi presumo che il soggetto sia lo stesso ovunque - un trader, quindi perché dovrebbe cambiare il suo comportamento a seconda dello strumento? Se usa l'analisi tecnica o qualsiasi altro metodo, ma usa questo metodo ovunque, è diverso che può usare un insieme di metodi in momenti diversi ed è più facile adattare un metodo su uno strumento e quando il trader (immagine collettiva) passa ad un altro, il modello si rompe.