L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1292

 
Graal:

I volumi aiutano a prevedere il cambiamento di stato da trend a flat ma non "senza difficoltà", in generale la previsione dello stato "trend/ flat" non è molto più accurata della direzione del prossimo incremento, per unità di tempo, da qualche parte intorno al 57% di precisione, quello che hanno detto delle cifre incredibili, chiaramente il risultato di un errore.

quali sono questi numeri?

 

L'apprendimento automatico è un business strano e imprevedibile, dopo tutto. Continuando il lavoro di debug con CatBoost, ho ottenuto un modello che funziona così (training+test+esame)

Forse non molti affari (346) dal 2014-2019, ma ho ottenuto 1299 drawdown per tutto il tempo che è meno del 10%. Naturalmente c'è stato un forte aumento nel 2014, che potrebbe non ripetersi, ma dopo è abbastanza regolare.

Qui sotto c'è un grafico solo sul campione dell'esame (condizionale, perché il campione è più piccolo di questo test)

Ma non sto solo mostrando i grafici, non è insolito qui, e voglio dire che sono rimasto molto sorpreso quando ho guardato il contenuto del modello - ci sono solo 4 predittori su 38!

TimeH - tempo in ore

DonProcVisota_M15 - Larghezza relativa del canale di Donchian a M15

LastBarPeresekD_Down_M15 - Numero di barre dall'ultimo attraversamento del canale di Donchian

BB_PeresekN_Total_M1 - Numero di volte che il prezzo ha attraversato i livelli iDelta durante le ultime x barre

Naturalmente, ho un gran numero di predittori nel mio campione, li fraziono e poi li centellina, e tutto ciò si adatta alla mia teoria che dividere un campione per avidità non è sempre efficace - è solo un metodo che non garantisce nulla.

Questo è il tipo di modello che voglio raccogliere e mettere in comune.

 
Aleksey Vyazmikin:

L'apprendimento automatico è un business strano e imprevedibile, dopo tutto. Continuando il lavoro di debug con CatBoost, ho ottenuto un modello che funziona così (training+test+esame)

Forse non molti affari (346) dal 2014-2019 ma è 1299 drawdown per tutto il tempo che è meno del 10%. Naturalmente c'è stato un forte aumento nel 2014, che potrebbe non ripetersi, ma dopo è abbastanza regolare.

Qui sotto c'è un grafico solo sul campione dell'esame (condizionale, perché il campione è più piccolo di questo test)

Ma non sto solo mostrando i grafici, non è insolito qui, e voglio dire che sono rimasto molto sorpreso quando ho guardato il contenuto del modello - solo 4 predittori su 38 sono usati lì!

TimeH - tempo in ore

DonProcVisota_M15 - Larghezza relativa del canale di Donchian a M15

LastBarPeresekD_Down_M15 - Numero di barre dall'ultimo attraversamento del canale di Donchian

BB_PeresekN_Total_M1 - Numero di volte che il prezzo ha attraversato i livelli iDelta durante le ultime x barre

Naturalmente, ho un gran numero di predittori nel mio campione, li fraziono e poi li centellina, e tutto ciò si adatta alla mia teoria che dividere un campione per avidità non è sempre efficace - è solo un metodo che non garantisce nulla.

Questo è il tipo di modello che voglio raccogliere e mettere in comune.

Abbastanza prevedibilmente, la maggior parte dei predittori sono in realtà rumore o correlati tra loro.

Il marciapiede è cosa? Yandex parla solo di distribuzione di torrent.
 
elibrario:
Abbastanza prevedibilmente, la maggior parte dei predittori sono in realtà rumore o correlati tra loro.

Laterale è cosa? Yandex parla solo di distribuzione di torrent.

L'idea non è che siano rumore, ma che alcuni predittori si sovrappongono ad altri - le relazioni formate sono importanti e devono essere generate.

Sideways, questo è ovviamente un termine che mi sono inventato - applico il flag--random-seed con un valore numerico specifico. È vero, non so quali intervalli abbia questo valore, ma vedo che ha un effetto significativo sull'apprendimento, e questa randomizzazione controllata mi va bene.

 
Ciao, ragazzi. Voglio sapere l'indicatore che fa un grafico di fondi dai risultati del test della strategia nel tester. Non riesco a trovarlo... Me lo ricordo. Se qualcuno ce l'ha a portata di mano me lo lanci. Grazie!
 
Aleksey Vyazmikin:

Sedersi, naturalmente, è un termine che ho inventato io stesso - applico il flag--random-seed con un valore numerico specifico. Anche se non so quali intervalli abbia questo valore, ma vedo che ha un effetto significativo sull'apprendimento, e questa randomizzazione controllata mi va bene.

Sistemare la casualità. Di solito questo è usato per la replicabilità dei risultati nelle repliche.
Preferibilmente, non dovrebbe influenzare troppo il risultato. Altrimenti si ottiene un adattamento ad una particolare casualità. Cioè appare un'altra caratteristica (che incide significativamente), che deve essere ottimizzata.
 
Renat Akhtyamov:

che tipo di numeri?

Credo di aver visto qualcuno qui sopra che ha detto che le tendenze/float sono previste da quasi il 90%, il nipote o l'apprendista di qualcuno credo abbia detto.

 
Graal:

Credo di aver visto qualcuno qui sopra che ha detto che le tendenze/flats sono previste da quasi il 90%, il nipote o l'apprendista di qualcuno ha detto che

Sì, al 100% che ci sarà una tendenza dopo un appartamento. Cosa c'è da prevedere.
 
Graal:

Penso di aver visto qualcuno sopra che ha detto che le tendenze/floats sono previste da quasi il 90%, il nipote di qualcuno o l'apprendista penso che abbia detto

aah

Se non ci sono ticchettii, probabilmente il mercato è piatto al 100%.

e se ci sono molti tic, non è un piatto
 
elibrario:
Sistemare la casualità. Questo è di solito usato per la riproducibilità dei risultati sui riavvii.
Preferibilmente non dovrebbe influenzare troppo il risultato. Altrimenti si ottiene un adattamento ad una particolare casualità. Cioè appare un'altra caratteristica (che incide significativamente), che deve essere ottimizzata.

Sì, ne ho bisogno per riprodurre il risultato in seguito e per generare risultati in generale.

Solo che non è del tutto chiaro come funziona, capisco che questo parametro è responsabile della casualità dei risultati della divisione quando si seleziona l'opzione migliore, ma non riesco a trovare i dettagli da nessuna parte.

E riguardo al montaggio... Dobbiamo assumere che tutto è un potenziale fit, e possiamo solo controllare la stabilità delle connessioni nel tempo e monitorare l'efficacia di quelle connessioni, per esempio quel modello consiste di 4 alberi, ognuno dei quali è anche 4 profondi, cioè a causa del piccolo numero di combinazioni il fit qui è molto efficace, e quindi può essere una sorta di modello, non solo una descrizione del campione.