L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1439

 
Maxim Dmitrievsky:


realisticamente riscrivere l'intero TS sotto catbust per provare... c'è un sacco di fastidio, anche. Ma il fatto è che l'apprendimento su piccoli set di dati forestali generalizza bene e funziona, per esempio, su 2-5k campioni, aumentando solo 2 volte, sugli stessi dati, il retraining completo. Questo è un fatto.

Provati brevi set di dati, ci sono settimane con un errore del 30% e la settimana successiva del 60-70%. Il che dà una media del 50%.

 
Elibrarius:

Provati brevi set di dati, a volte una settimana con un errore del 30% e la prossima del 60-70%. Il che equivale a una media del 50%.

Per esempio, se mi alleno per un mese, funziona quasi altrettanto bene per un anno con nuovi dati. Mi alleno per 2-3 mesi - non funziona più... qualche stronzata.

e gli errori del modello sono gli stessi
 
Maxim Dmitrievsky:

Per esempio, se mi alleno per un mese, funziona quasi altrettanto bene per un anno con nuovi dati. Mi alleno per 2-3 mesi - non funziona più... qualche stronzata

Questi risultati sono sul suo sistema di autoapprendimento?
 
elibrario:
È sul tuo sistema di auto-apprendimento questi risultati?

Sì, su di esso, con alcuni trucchi. Uno lo rivelerò: aggiungere campioni intermedi al modello. Per esempio, c'era un segnale per aprire un trade di acquisto, finché è aperto, su ogni nuova barra aggiungere un altro campione con lo stesso marchio di acquisto, con nuove letture di chip, rispettivamente. Questo ridurrà notevolmente l'errore. Una sorta di duplicazione dei campioni.

Potrebbe non ridurre l'errore in alcuni modelli, ma sul mio sì.
 
Maxim Dmitrievsky:

Sì, su di esso, con alcuni trucchi. Uno lo rivelerò: aggiungere campioni intermedi al modello. Per esempio, c'era un segnale per aprire un trade di acquisto, finché è aperto, su ogni nuova barra aggiungere un altro campione con lo stesso marchio di acquisto, con nuove letture di chip, rispettivamente. Questo ridurrà notevolmente l'errore. Una sorta di duplicazione dei campioni.

Beh, è un po' come selezionare un obiettivo alla prima corsa. Il resto dei cicli sono essenzialmente solo di apprendimento con l'insegnante della prima corsa.
Con questo trucco, testerete più varianti.
 
elibrario:
Beh, è una specie di corrispondenza di obiettivi nella prima corsa. Il resto dei cicli sono essenzialmente solo di apprendimento con l'insegnante della prima corsa.
Con questo trucco potrete testare più varianti.

Non capisco davvero. Si tratta piuttosto di una duplicazione di campioni. Di solito ci si limita ad alimentare segnali di acquisto e di vendita senza preoccuparsi di come il mercato si comporta tra questi segnali. Se si aggiungono campioni intermedi di supporto, il modello classifica automaticamente meglio.

Per esempio, se ho effettivamente 1000 campioni-segnali, allora insieme ai rinforzi intermedi sono 5k o più
 
Aleksey Vyazmikin:

La potatura deve controllare la completezza, cioè tagliare ad una copertura del campione di almeno lo 0,5-1%.

Cosa? Tagliare empiricamente alla giusta profondità.

 
Maxim Dmitrievsky:

la completezza di cosa? appena tagliato empiricamente alla giusta profondità

L'elenco dovrebbe contenere almeno una data percentuale di esempi dal campione, se meno, si tagliano gli split. Più esempi, più regolarità probabile - tutto è semplice qui.

 
Maxim Dmitrievsky:

Sì, su di esso, con alcuni trucchi. Uno lo rivelerò: aggiungere campioni intermedi al modello. Per esempio, c'era un segnale per aprire un trade di acquisto, finché è aperto, su ogni nuova barra aggiungere un altro campione con lo stesso marchio di acquisto, con nuove letture di chip, rispettivamente. Questo ridurrà notevolmente l'errore. Una sorta di duplicazione dei campioni.

Forse in qualche modello non riduce l'errore, ma nel mio lo riduce fortemente.

Ho iniziato con questo approccio, ma al contrario ho cercato di trovare la morbidezza della curva di classificazione corretta dal punto di entrata al punto di uscita, ma il mio approccio richiede molta potenza di calcolo - quindi ho dovuto abbandonarlo. Hai l'inverso, è interessante, c'è un potenziale di controtendenza... Sto solo pensando a come posso implementare qualcosa di simile a MO, che funziona nei miei segnali - non so come allenarmi, ma ovviamente c'è del potenziale lì.

 
Maxim Dmitrievsky:

Non capisco davvero. Si tratta piuttosto di una duplicazione di campioni. Di solito si alimentano solo i segnali di acquisto e di vendita senza preoccuparsi di come il mercato si comporta tra questi segnali. Se si aggiungono campioni intermedi di supporto, il modello classifica meglio.

Per esempio, se ho 1000 campioni-segnali, allora insieme al supporto intermedio sono 5k o più.

L'ho anche notato e applicato, ma per quanto ho capito funziona perché i dati fanno schifo, e tale trucco aiuta ad allenarsi su una serie di outlier. Se non lo fai, il modello si adatta a un broker o addirittura a volte smette di funzionare dopo alcuni aggiornamenti di ricarica dei dati sullo stesso terminale.