L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1393

 
Maxim Dmitrievsky:

La versione classica non funzionerà, purtroppo... è tutta una questione di caratteristiche/obiettivi, anche.

Non essere drammatico. Classic NS ha lavorato per più di un anno. C'è anche qualche progresso con la regressione NS. Non so RL, ma io non ho nessun problema con i classici. Dovresti formulare il compito in modo corretto, non come voglio un uccello arrosto, e non avrai problemi. Non prevedere il prezzo della candela della pista).
 
Yuriy Asaulenko:
Non essere drammatico. La NS classica ha lavorato per più di un anno. Non conosco la RL, ma i classici non hanno alcun problema. Non so RL, ma io non ho problemi con i classici. Dovresti formulare il compito in modo corretto, non come voglio un uccello arrosto, e non avrai problemi. Non prevedere il prezzo della candela della pista).

Sto parlando della mia esperienza

 
Maxim Dmitrievsky:

Sto parlando della mia esperienza

Beh, RL sul mercato è molto vago per me. Anche con gli articoli. Ma l'argomento è molto interessante. Non farò alcun progresso per una settimana o due, e smetterò. Questo è tutto.
Ciò che è interessante di RL è la capacità di rendere il TC completamente autonomo, compreso il supporto e la chiusura dell'affare. Se questo fallisce, non ha molto senso passare da MLP e RF regolari a RL. Come fare? - Non ne ho idea.
 
Yuriy Asaulenko:
Beh, non sono sicuro di RL nel mercato. Non so nulla di RL sul mercato. Ma l'argomento è molto interessante. Mi arrenderò tra una settimana o due. E solo.
Ciò che è interessante di RL è la capacità di rendere TC completamente autonomo, compreso il supporto e la chiusura dell'affare. Se questo fallisce, allora passare da MLP regolari e RF a RL non ha molto senso. Come fare? - Non ne ho idea.

Capisci la differenza tra l'addestramento con un insegnante e l'addestramento con il rinforzo? Sono approcci completamente diversi, assolutamente. Hanno in comune solo che NS è usato come approssimatore

 
Maxim Dmitrievsky:

Capite la differenza tra imparare con un insegnante e imparare con il rinforzo? Sono approcci completamente diversi. L'unica cosa che hanno in comune è che NS è usato come approssimatore

Decisamente, capisco). Cosa c'entra questo? In generale, intendo il risultato finale, non i principi. Se il risultato è lo stesso, non ha senso una soluzione più complicata. E non fa differenza quali siano i loro principi. Finora vedo che la RL applicata all'apertura di un accordo non dà una nuova qualità.
 
Yuriy Asaulenko:
Capisco certamente). Ma cosa c'entra questo? In realtà sto parlando del risultato finale, non dei principi. Se il risultato è lo stesso, non ha senso una soluzione più complicata. E non fa alcuna differenza per i loro principi.

troppo astratto... principio diverso - approccio diverso al problem solving, risultati diversi

In generale, le persone ci hanno dedicato la loro vita, per esempio Sutton, quindi non si può parlare di apprendimento/applicazione "veloce". C'è della roba molto complicata lì dentro, che è di quest'ultimo tipo.
 
Maxim Dmitrievsky:

troppo astratto... principio diverso - approccio diverso al problem solving, risultati diversi

I tuoi risultati con la RL non sono migliori e non peggiori di quelli degli altri. Cosa c'entra l'approccio? L'importante è il risultato. I risultati sono all'incirca gli stessi per una MLP sermene con un insegnante nell'accordo di apertura. Anche se ne hai pochi, meglio. Non cambia significativamente nulla. Avete bisogno di un salto qualitativo dall'applicazione della RL.
Non fraintendete, questa non è affatto una critica ai vostri approcci. State facendo tutto bene.
 
Maxim Dmitrievsky:

troppo astratto... un principio diverso significa un approccio diverso alla soluzione di un problema, risultati diversi

In generale, le persone ci hanno dedicato la loro vita, come Sutton, quindi una padronanza "veloce" è fuori questione. Ci sono cose molto complicate lì dentro che vengono dall'ultimo.

A giudicare dal tuo articolo, non è una cosa molto complicata da padroneggiare per molto tempo.

Prima del primo allenamento, un obiettivo è fissato a caso, e poi dopo ogni ciclo di allenamento, se ha fatto un profitto, viene lasciato, se ha fatto una perdita, viene cambiato.

 
Yuriy Asaulenko:
I tuoi risultati con la RL non sono né migliori né peggiori di altri. Cosa c'entra l'approccio? L'importante è il risultato. I risultati sono quasi gli stessi per il sermone MLP con l'insegnante nell'accordo di apertura. Anche se ne hai pochi, meglio. Non cambia significativamente nulla. Avete bisogno di un salto qualitativo dall'applicazione della RL.
Non fraintendete, questa non è affatto una critica ai vostri approcci. Stai andando bene.

Quando si tratta di risultati - non ho visto nulla di simile al mio nel thread, nemmeno vicino

gli unici risultati che ho visto sono quelli di fxsaber, e non del mo nel pieno senso della parola.

Non ho bisogno di ricordarti i backtest sul tovagliolo.

Non la prendo come una critica, sto solo dicendo che è un approccio molto complesso e mi divertono affermazioni come "lo farò per un paio di settimane e tutto andrà bene".

 
elibrario:

A giudicare dal tuo articolo, non è una cosa particolarmente difficile da imparare.

Prima del primo allenamento - viene impostato un obiettivo casuale, e poi dopo ogni ciclo di allenamento - se ha portato un profitto, viene lasciato, se una perdita, viene cambiato.

anche una cosa così apparentemente semplice, nessuno qui ha scritto su di essa, o su Rl, alglib scaffolding ecc.

quindi di cosa stiamo parlando... così si vede solo che "obiettivo casuale", e come allegare ad esso qualcosa di più complicato non si può pensare, perché per vedere pronto e dire che è facile - sempre facile, ma per migliorare ...

blaterano solo che tutti sono così intelligenti, e in realtà discutono solo di impostazioni ovvie di reti neurali ma non di approcci complessi

Asaulenko ha presentato 20 ricorsi alla griglia ed è felice... non è divertente