L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1806

 

Ciao gente

Sto usando Deep Reinforcement Learning (usando Python) e l'apprendimento sta già avvenendo (come mostrato):

Trabalho de aprendizado por reforço profundo


Oggi uso solo le medie mobili come osservazione del mercato per imparare.

Questo modello esegue diverse azioni (comprare, vendere e aspettare). Così, dopo l'addestramento, il modello converge in molte azioni per "aspettare" solo con le azioni migliori.

Tuttavia, in questo modello l'addestramento è molto lento perché utilizza tutti i tick.

Cosa suggerisce come dati di osservazione del mercato per migliorare la precisione e ridurre le perdite?

Mi scuso per i miei errori di traduzione.

 
ipsec:

Cosa propone come dati di osservazione del mercato per migliorare la precisione e ridurre le perdite?


1) Creare un modello di mercato e addestrare un agente in esso, questo ridurrà la dimensionalità e accelererà la formazione, anche qui è stato fatto così

2) Scelta delle caratteristiche, è come si dice un compito creativo, se ce ne sono molte allora aiuterà anche a ridurre la dimensionalità, ce ne sono molte dal clustering al pca, umap ecc.

Se prendiamo i livelli di supporto e resistenza e decidiamo di comprare o vendere solo se il prezzo è a quel livello, possiamo diminuire il campione di allenamento di ordini di grandezza.

Si potrebbero combinare tutti i punti insieme.

 
ipsec:

Ciao gente

Sto usando Deep Reinforcement Learning (usando Python) e l'apprendimento sta già avvenendo (come mostrato):


Oggi uso solo le medie mobili come osservazione del mercato per imparare.

Questo modello esegue diverse azioni (comprare, vendere e aspettare). Così, dopo l'addestramento, il modello converge in molte azioni per "aspettare" solo con le azioni migliori.

Tuttavia, in questo modello l'addestramento è molto lento perché utilizza tutti i tick.

Cosa suggerisce come dati di osservazione del mercato per migliorare la precisione e ridurre le perdite?

Perdona i miei errori di traduzione

Assottigliare le zecche fino a un errore accettabile.

Identificare le aree in cui l'errore supera l'errore accettabile quando tutte le zecche vengono rimosse.

Addestrare il modello a trovare tali aree, se può, di corso))))

 
Maxim Dmitrievsky:

Beh, questi sono modelli di spazio di stato, funzionano ogni tanto anche loro.

E si può legare l'obiettivo a un cambiamento di tendenza. Il compito non è quello di guadagnare, ma di riconoscere e prevedere. È chiaro che sono compiti completamente diversi, NS non è in grado di riconoscere e prevedere allo stesso tempo)))) Obiettivo di profitto, l'equilibrio riconosce i punti di svolta indirettamente, senza riconoscimento diretto.

Se prendiamo le inversioni a zigzag giornaliere, 4 ore, ore (o qualsiasi altra) e guardiamo per esempio ogni (tutti) i timeframe 120 barre e 120 tick prima e dopo il punto di svolta. Il quotidiano e 4h guardare solo fino alla prossima e precedente inversione o non so come farlo meglio. Qualcosa dovrebbe essere scritto manualmente allora, naturalmente, per preparare i dati.

O c'è qualcosa di simile.

 
Valeriy Yastremskiy:

Oppure si può legare l'obiettivo a un cambiamento di tendenza. Il compito non è quello di guadagnare, ma di riconoscere e prevedere. È chiaro che sono compiti completamente diversi, NS non può riconoscere e prevedere allo stesso tempo)))) Obiettivo di profitto, l'equilibrio riconosce i punti di svolta indirettamente, senza riconoscimento diretto.

Se prendiamo le inversioni a zigzag giornaliere, 4 ore, ore (o qualsiasi altra) e guardiamo per esempio ogni (tutti) i timeframe 120 barre e 120 tick prima e dopo il punto di svolta. Il quotidiano e 4h guardare solo fino alla prossima e precedente inversione o non so come farlo meglio. Qualcosa dovrebbe essere scritto manualmente allora, naturalmente, per preparare i dati.

O c'è qualcosa di simile?

È molto facilmente verificabile dalla presenza di regolarità tra le interruzioni a zig zag, cioè dalla riduzione dell'entropia. Se ci sarà una differenza da sb, allora si può guardare. Ma non ho trovato queste cose. Ci sono pacchetti speciali, usati in medicina per analizzare il DNA e ricavare formule di farmaci. L'entropia di riorganizzazione, per esempio, o casi più complicati con approssimatori, ottimizzatori come q-learning
 
ipsec:

Ciao gente

Sto usando Deep Reinforcement Learning (usando Python) e l'apprendimento sta già avvenendo (come mostrato):


Oggi uso solo le medie mobili come osservazione del mercato per imparare.

Questo modello esegue diverse azioni (comprare, vendere e aspettare). Così, dopo l'addestramento, il modello converge in molte azioni per "aspettare" solo con le azioni migliori.

Tuttavia, in questo modello l'addestramento è molto lento perché utilizza tutti i tick.

Cosa suggerisce come dati di osservazione del mercato per migliorare la precisione e ridurre le perdite?

Scusa per i miei errori di traduzione.

Penso che il rinforzo profondo sia usato solo per compiti multivariati, non per 1-5 dimensioni, come i mercati finanziari. Quindi potete provare metodi più semplici e veloci come REINFORCE con rete neurale o approssimatore lineare.

 
Maxim Dmitrievsky:
Questo è molto facilmente verificabile dalla presenza di regolarità tra le rotture a zig zag, cioè dalla riduzione dell'entropia. Se c'è una differenza da sb, allora si può guardare. Ma non ho trovato queste cose. Ci sono pacchetti speciali, usati in medicina per analizzare il DNA e ricavare formule di farmaci. Per esempio, l'entropia di permutazione o casi più complicati con approssimatori, ottimizzatori come q-learning.

No, la regolarità delle fratture non funziona )))) Qualcosa prima di una frattura deve essere preso senza considerare la regolarità) In generale c'è la possibilità di prendere quelle fratture che hanno le stesse differenze da SB prima della frattura. Non si può fare con i pacchetti normali. E non credo che ci sia qualcosa di significativo per una rottura a metà del trend, se non una durata troppo lunga del trend))))

 
Valeriy Yastremskiy:

No, la regolarità delle fratture non funziona)))) Qualcosa prima della frattura deve essere preso, senza considerare la regolarità) In generale, c'è la possibilità di prendere quelle fratture che hanno le stesse differenze dal SB prima della frattura. Non si può fare con i pacchetti normali. E non penso che ci sia qualcosa di significativo per una rottura nel mezzo del trend, se non che il trend sia troppo lungo))))

Capisco, per analogia con la correlazione TF. Può provare

 
Maxim Dmitrievsky:

Penso che il rinforzo profondo sia usato solo per compiti multivariati, non per 1-5 dimensioni, come i mercati finanziari. Quindi potete provare metodi più semplici e veloci come REINFORCE con rete neurale o approssimatore lineare.

Se si guardano diversi TF si ottengono più dimensioni))))

 
Maxim Dmitrievsky:

Capisco, per analogia con la correlazione TF. Possiamo provare.

Sì. Solo i TF devono essere guardati tutti, non si può determinare quali sono necessari subito. Forse uno o due TF sarebbero meglio, o forse sono tutti necessari))). È difficile pensarci bene)).