L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2553

 
Dmytryi Nazarchuk #:
Regressione logistica
La regressione foresta/cespuglio è più accurata.
 
elibrario #:

No, è un database di storia memorizzata...

Era una domanda retorica:))

 
mytarmailS #:

Era una domanda retorica:)))

Che sei in tema, lo so))
È per i nuovi arrivati nel MO. Se entrano qui.

 
Vladimir Perervenko #:

Ci sono tre opzioni per gestire i campioni di rumore: cancellare, ri-partizionare (correggere il markup) e separare i campioni di rumore in una classe separata. Nella mia esperienza, circa il 25% del campione è "rumore". Il miglioramento della qualità è di circa il 5%, dipende dai modelli e dalla preparazione dei dati. Lo applico di tanto in tanto.

C'è un altro problema quando si usano i predittori: la loro deriva. E questo problema deve essere identificato e preso in considerazione sia nei test che nel funzionamento. La traduzione allegata dell'articolo (cercane altri in rete) e c'è un pacchetto drifter. Non è l'unico. Ma il punto è che quando si selezionano i predittori bisogna considerare non solo la loro importanza ma anche la loro deriva. Per le alte derive scartare o trasformare, per le basse derive tenerne conto (fare delle correzioni) durante i test e il lavoro.

Buona fortuna

Cosa intendi per "applicare occasionalmente"?

O c'è una sorta di pipelining che si è dimostrato, o sono solo speculazioni inutili.

Rendere il rumore una classe separata teoricamente non migliora il modello (rimane dentro il modello e non va da nessuna parte)

sulla deriva - queste sono le basi, il compromesso bias-varianza
 
Maxim Dmitrievsky #:
Avete provato a prevedere la distribuzione delle quotazioni future?
 
mytarmailS #:
Avete provato a prevedere la distribuzione delle quotazioni future?

Ho fatto qualcosa del genere, ma non capisco di cosa si tratta

Ricordate, ho raggruppato i chunks futuri di lunghezza fissa e ho previsto il numero di cluster. Ogni cluster ha una distribuzione diversa, ognuno ha una strategia diversa per ognuno. Ha funzionato su Traine, fallisce sui nuovi dati se lo si fa di petto.
 
Maxim Dmitrievsky #:

ha fatto qualcosa del genere, ma non ha capito di cosa si trattasse

Ricordate, ho raggruppato i chunks futuri di lunghezza fissa e ho previsto il numero di cluster. Ogni cluster ha la sua distribuzione, ognuno ha la sua strategia. Ha funzionato su Trayne, ma fallisce sui nuovi dati, se lo fai direttamente.

Mi ricordo...

Ho un'idea leggermente diversa...

Se puoi prevedere qualitativamente la distribuzione delle quotazioni future, diciamo, per 50 candele avanti, allora da questa distribuzione puoi disegnare diverse migliaia di serie e allenare il modello, e in questo modo il modello funzionerà adeguatamente per le nuove 50 candele in teoria...

 
Controllo il thread di tanto in tanto, stesse facce, stessa discussione sui modelli, forse qualcuno ha qualcosa da mostrare?
 
Farkhat Guzairov #:
Visito periodicamente il topic, le facce sono le stesse, la discussione dei modelli è la stessa, forse qualcuno ha qualcosa da mostrare?
Questo non è un problema da risolvere