L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3095

 
Ho già notato più volte che GPT è a volte più conveniente che cercare su Internet, usando come esempio Python. Nello stesso Pandas ci sono un milione di frasi, non si possono ricordare tutte, e risponde rapidamente, mentre Google richiede più tempo. E la risposta viene data immediatamente nel contesto della domanda, non solo in un esempio astratto. Non male.
 
Renat Fatkhullin #:
Potremmo rilasciare al pubblico un pacchetto per R scritto in precedenza. Dovremmo rivederlo e aggiungere le funzionalità mancanti.

Il pacchetto Python rilasciato in precedenza ha mostrato una crescita esplosiva e continua a crescere. Non ci aspettavamo che ciò accadesse.

Sarebbe un'ottima decisione. Sono disposto a partecipare ai test se necessario.

Buona fortuna

 
Vladimir Perervenko #:

Sarebbe un'ottima soluzione. Sono pronto a partecipare ai test se necessario.

Buona fortuna

Anch'io sono disposto a partecipare.
 
Con il metodo suggerito nell'articolo, non è possibile passare in rassegna diversi modelli per scegliere il migliore (stile ptu). Questo è https://en.wikipedia.org/wiki/Multiple_comparisons_problem.
 
mytarmailS #:

un veicolo è coinvolto in un esperimento

Ho lottato a lungo con l'overfit e ho sussurrato più volte: guardate kozul. Tutte queste tecniche provengono da lì, Prado vi si è ispirato (parzialmente).

È una generalizzazione della statistica al ML.

È possibile effettuare l'inferenza di modelli in base a un determinato criterio (tritematico). Si tratta di eliminare le distorsioni e la varianza dei dati per lavorare meglio su nuovi dati.
 
Maxim Dmitrievsky #:
Con il metodo suggerito nell'articolo, non è possibile passare in rassegna diversi modelli per scegliere il migliore (stile ptu). Questo è https://en.wikipedia.org/wiki/Multiple_comparisons_problem.

Sono ancora curioso di avere maggiori dettagli... come proponete di selezionare un modello con cui lavorare tra migliaia di opzioni?
Quel pacchetto valuta piuttosto la possibilità di addestrare con successo il target selezionato sui predittori selezionati. Se la maggior parte dei modelli ha successo, è probabile che anche il modello selezionato abbia successo.
Non c'è selezione di un modello particolare (come ho capito). Dovrebbe essere selezionato con un altro metodo, che non viene discusso nell'articolo. E ci sono molti avvertimenti e restrizioni (un paio di pagine), alcuni dei quali sono stati raccontati da me.

mytarmailS #: nell'articolo, solo una TC è coinvolta nell'esperimento.

I modelli sono diversi, perché hanno parametri di indicatori diversi. Ma il set di indicatori può essere lo stesso. Credo sia questa la confusione.
Si può dire che la strategia è la stessa, ma i modelli (varianti) sono diversi.

 
Forester #:

Tuttavia, sono curioso di avere maggiori dettagli... come proponete di selezionare un modello con cui lavorare tra migliaia di opzioni?
Il pacchetto valuta piuttosto la probabilità di addestrare con successo il target selezionato sui predittori selezionati. Se la maggior parte dei modelli ha successo, è probabile che anche il modello selezionato abbia successo.
Non c'è selezione di un modello particolare (come ho capito). Dovrebbe essere selezionato con un altro metodo, che non viene discusso nell'articolo. E ci sono molti avvertimenti e restrizioni (un paio di pagine), alcuni dei quali sono stati raccontati da me.

I modelli sono diversi, perché hanno parametri diversi di indicatori. Ma l'insieme degli indicatori può essere lo stesso. Credo sia questa la confusione.

Si può scegliere solo tra quelli buoni, se tutti sono buoni. Se si pone la questione della scelta in questo modo, o con qualche intervallo di confidenza, tutti sono buoni. Altrimenti si pone il problema di cui sopra, che richiede uno sforzo maggiore.

Non so chi fa cosa esattamente, quindi la domanda è vaga per me.

 

faccio esperimenti, scrivo codice...

Ho provato, funziona, poi penso a quali TC è meglio usare, ecc... vado più a fondo...

E si passerà un altro anno a discutere di teoria, poi ci si arrenderà e la cosa finirà lì.

 
Continuo a non capire questa cosa.
Forester #:
Non capisco come facciano la convalida incrociata senza addestramento. Si limitano ad alimentare un set pronto di rendimenti e poi lo mischiano su 12000 varianti. Dovrebbe essere addestrato su ognuno dei 12000 IS e prevedere su ogni OOS corrispondente.
Alimentano i risultati della trayne? E poi lo mescolano su oltre 12000 varianti, presumibilmente IS e OOS.
A mio parere, questa è una delle opzioni per valutare la linearità della curva di equilibrio sulla trayne.
 
Maxim Dmitrievsky #:

Grazie al fatto che eliminiamo i bias (questo è l'aspetto principale) e la varianza attraverso la convalida incrociata, il modello inizia a comportarsi in modo + adeguato sui nuovi dati. Quindi può essere messo a punto.

Bella linea di equilibrio)
È possibile utilizzarlo anche nel trading.