L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3049
Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Il concetto di RL non è ridondante per i compiti di scambio? Abbiamo l'influenza dell'ambiente sull'agente, ma esiste un'influenza dell'agente sull'ambiente? È possibile introdurre artificialmente questa seconda influenza, ma ha senso?
Due (o tre) idee tratte dall'articolo non sono affatto superflue per noi: la funzione di perdita deve riflettere esattamente ciò di cui abbiamo bisogno e deve essere regolare (e monotona). Nel nostro caso, dovrebbe essere il profitto e dovrebbe dipendere in modo uniforme e monotono dai parametri del modello.
Probabilmente si può ottenere la liscezza di un analogo del profitto in qualche modo (per esempio, con qualcosa come il kernel smoothing). Ma dubito fortemente della monotonicità.
La base del risultato finanziario del trading è il movimento dei prezzi, un processo casuale non stazionario.
Stiamo cercando di trasformare un processo casuale non stazionario in uno liscio e monotono con qualche trucco? Forse stiamo camminando a vuoto? Soprattutto se consideriamo che un errore di classificazione inferiore al 20%(!) al di fuori del set di allenamento è estremamente difficile da raggiungere. Forse dovremmo iniziare a lavorare sulla riduzione dell'errore di classificazione?
Leggete l'articolo.
A cosa ci serve questo articolo?
È del tutto discutibile.
Il motivo è il seguente.
Non ricordo nessuna pubblicazione sull'IA (MO) che preveda il futuro. Insegnano a un modello a scrivere lettere a mano. Poi cercano di riconoscere queste lettere scritte a mano. Ma al modello non viene insegnato principalmente a prevedere quale lettera verrà scritta successivamente.
Questo è il nostro problema.
Stiamo cercando di utilizzare il MO (lo stesso lavoro che abbiamo fatto con le combinazioni di candele) per trovare alcuni modelli nei predittori che forniranno la previsione corretta. Ma non c'è alcuna garanzia che i modelli trovati forniscano previsioni corrette in futuro. I pattern "giusti" daranno un errore e quelli "sbagliati" prediranno la cosa giusta. Il motivo risiede negli algoritmi di classificazione stessi, che forniscono la VERIDICITÀ di una classe, non il suo valore. Utilizziamo la regolarizzazione più primitiva di 0,5 per dividere in classi. E se durante l'addestramento la probabilità di un modello "corretto" = 0,5000001, perché prendiamo questa probabilità come valore della classe?
Per ovviare a ciò, iniziamo a coltivare un orto, ma i valori dei predittori, tra i quali cerchiamo i pattern, sono NON stazionari o pseudo-stazionari, e hanno una relazione remota con il prezzo!
Abbiamo l'influenza dell'ambiente sull'agente, ma esiste un'influenza dell'agente sull'ambiente? Probabilmente è possibile introdurre artificialmente questa seconda influenza, ma ha senso?
Tutto dipende dal compito da svolgere.
Se prevediamo un obiettivo già pronto, come fa la stragrande maggioranza, allora non abbiamo alcuna influenza sull'ambiente e non c'è bisogno di RL.
Ma se, ad esempio, il compito di gestire le posizioni, gli stop, i take-out...
La gestione delle posizioni è l'ambiente che noi (agente) gestiamo.
L'agente decide di piazzare o meno un ordine.
a quale prezzo,
e quando ritirarlo o spostarlo,
e cosa farà quando la perdita sulla posizione corrente supera gli n pips,
e cosa farà se ha cinque perdite di fila?
Vedete, questo è un livello completamente diverso del compito, con molti stati (output), non un primitivo su/giù nella classificazione.
Per farla ancora più semplice: non possiamo gestire il mercato, ma possiamo gestire la posizione e il rischio, perché possiamo farlo!
L'omogeneità di qualche analogo del profitto, probabilmente, può essere ottenuta in qualche modo (per esempio, con qualcosa come il kernel smoothing). Ma dubito fortemente della monotonicità.
Non capisco bene che cosa si intenda per "levigatezza" e perché la "levigatezza" sia necessaria....
Forse possiamo usare l'ottimizzazione multicriteriale per trovare la soluzione migliore.
tutto dipende dal compito da svolgere.
Se prevediamo un obiettivo già pronto, come fa la stragrande maggioranza delle persone, allora non abbiamo alcuna influenza sull'ambiente e non c'è bisogno di RL stesso....
Ma se, ad esempio, il compito di gestire la posizione, le soste, i prelievi ...
La gestione delle attività è l'ambiente, che noi (l'agente) gestiamo...
L'agente decide di piazzare o meno un ordine.
a quale prezzo,
e quando ritirarlo o spostarlo,
e cosa farà quando la perdita sulla posizione attuale supera gli n punti,
e cosa farà quando avrà cinque perdite di fila...
Vedete, questo è un livello completamente diverso del compito, con molti stati (uscite), non un primitivo su/giù sulla classificazione.
Per dirla ancora più semplicemente: non possiamo gestire il mercato, ma possiamo gestire la posizione e il rischio, eccome!
Non capisco cosa ci sia dietro la "scorrevolezza" e perché ne abbiate bisogno....
Forse possiamo applicare l'ottimizzazione multi-criteri alla ricerca.
È possibile che un agente faccia media.
La base del risultato finanziario del trading è il movimento dei prezzi, un processo casuale non stazionario.
Stiamo cercando di trasformare un processo casuale non stazionario in uno liscio e monotono con qualche trucco? Forse stiamo camminando a vuoto? Soprattutto se consideriamo che un errore di classificazione inferiore al 20%(!) al di fuori del set di allenamento è estremamente difficile da raggiungere. Forse dovremmo iniziare a lavorare sulla riduzione dell'errore di classificazione?
Mi riferivo alle proprietà della funzione di perdita minimizzata dall'addestramento del modello. Più precisamente, della sua forma ideale.
Non capisco cosa ci sia dietro la scorrevolezza e perché sia necessaria.
Sono le basi dell'ottimizzazione. La levigatezza rende possibile l'ottimizzazione attraverso un gradiente. Altrimenti, rimangono solo algoritmi di forza bruta.
Sono le basi dell'ottimizzazione
Sì, lo so, ma di recente si è parlato della scorrevolezza della curva del capitale stessa, quindi non ho approfondito queste discussioni, per questo ti chiedo cosa intendi.
Fuori tema.
uno dei migliori affari di sempre.
oro
rischio/ricompensa 1 su 24
Offtopic...
una delle migliori offerte di sempre.
oro
rischio/ricompensa 1 su 24