L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1638

 
elibrario:
Una spiegazione troppo breve.
Non è chiaro se 1 predictor è fuori diviso in più e alimentato già come 5 predictor. Piuttosto è ancora fatto internamente come valori di split pre-calcolati. E dividono per settori.
Sono d'accordo che questo è più efficiente della mezza divisione nell'algoritmo ad albero classico.

Cosa vuol dire fuori o dentro? Da quanto ho capito, si prende un predittore e si cerca di dividere i suoi indicatori in segmenti per conservare un numero sufficiente di attivazioni e per dare ad ogni segmento un certo potere predittivo, si usano diversi metodi per questo - con un passo dato o con un'unione lineare di piccoli passi (per semplificare), si ottengono tali celle con intervalli. Quando si costruiscono tutti gli alberi nell'addestramento, si usano solo insiemi di tali celle. Ma, non è esatto :)

Io, invece, sto cercando di combinare queste cellule in una sola. Guardando questo post di ieri, c'è un accenno al fatto che fanno qualcosa di simile per i predittori categorici.

Nel mio caso c'è un rischio di sovrallenamento - lo controllerò su un campione un po' più tardi, quando i modelli saranno pronti, farò un campione per testarlo allo stesso tempo.

 

È abbastanza sconcertante che il problema della non stazionarietà sia quasi completamente ignorato in questo thread. Per qualche ragione, si presume che i modelli trovati in passato funzioneranno in futuro, e se non funzionano, allora si è verificato un apprendimento eccessivo. Ma, è abbastanza possibile che alcuni modelli semplicemente smettano di funzionare nel tempo - gradualmente o anche a passi da gigante (per esempio come risultato di una crisi come quella attuale).

Il problema che vedo è che i modelli IO sono complessi e mal interpretati dagli umani. Se iniziano ad avere prestazioni scarse, è impossibile distinguere (all'interno dei modelli) la variante dell'apprendimento eccessivo dalla variante della non stazionarietà. Nell'analisi convenzionale si può sempre dire: "cambio di tendenza", "rottura del livello/canale" ecc.

 
Aleksey Vyazmikin:

Con una signora così, è probabile che tu debba fare il bucato e mangiare i tuoi pasti :)

Dipende da come la friggi. Una donna pressata cucina meglio :-)
 
Mihail Marchukajtes:
Dipende da come la friggi. Una donna spremuta cucina meglio :-)

Non te la caverai con la poesia con una signora così, dovrai imparare la matematica a livello di MGO)

 
Aleksey Nikolayev:

È abbastanza sconcertante che il problema della non stazionarietà sia quasi completamente ignorato in questo thread. Per qualche ragione, si presume che i modelli trovati in passato funzioneranno in futuro, e se non funzionano, allora si è verificato un apprendimento eccessivo. Ma, è abbastanza possibile che alcuni modelli semplicemente smettano di funzionare nel tempo - gradualmente o anche a passi da gigante (per esempio come risultato di una crisi come quella attuale).

Il problema che vedo è che i modelli IO sono complessi e mal interpretati dagli umani. Se iniziano ad avere prestazioni scarse, è impossibile distinguere (all'interno dei modelli) la variante dell'apprendimento eccessivo dalla variante della non stazionarietà. Nell'analisi convenzionale è sempre possibile dire: "cambiamento di tendenza", "rottura del livello/canale" ecc.

Non sto tirando a indovinare... La pratica mostra un errore dell'1% sulla trama di allenamento e del 50% sulla nuova trama. Cioè avete bisogno di predittori significativi, e potete anche allenarvi con un singolo albero o qualche regressione.

Un albero, a proposito, sarà molto facile da interpretare.

 
Aleksey Nikolayev:

È abbastanza sconcertante che il problema della non stazionarietà sia quasi completamente ignorato in questo thread. Per qualche ragione, si presume che i modelli trovati in passato funzioneranno in futuro, e se non funzionano, allora si è verificato un apprendimento eccessivo. Ma, è abbastanza possibile che alcuni modelli semplicemente smettano di funzionare nel tempo - gradualmente o anche a passi da gigante (per esempio come risultato di una crisi come quella attuale).

Il problema che vedo è che i modelli IO sono complessi e mal interpretati dagli umani. Se iniziano ad avere prestazioni scarse, è impossibile distinguere (all'interno dei modelli) la variante dell'apprendimento eccessivo dalla variante della non stazionarietà. Nell'analisi convenzionale si può sempre dire: "cambio di tendenza", "rottura del livello/canale" ecc.

Sono completamente d'accordo.

Mi sono ripetutamente interrogato su questo problema, e penso che sia necessario confrontare i risultati del sistema con il suo potenziale in un certo settore.

Ci stavo pensando proprio oggi, a come farlo meglio e più universalmente. Immagino che il processo di apprendimento consista in diverse fasi, la prima delle quali è la marcatura del campione, e si può marcare sulla base di alcune strategie di segnale. Queste strategie dovrebbero essere primitive ma hanno un potenziale, per esempio, l'attraversamento della MA da parte del prezzo genera un segnale di entrata nella direzione di tale incrocio o viceversa. Allora l'allenamento è solo un modo per filtrare i falsi segnali. Se tale ipotesi è accettata, possiamo calcolare quanto in percentuale tale filtraggio sia efficace in ogni intervallo di tempo. La più semplice sarebbe quella di calcolare l'accuratezza e la completezza della classificazione relativamente alla strategia di base. Ci sono altre opzioni: la metrica. Poi possiamo vedere come cambia la performance del modello, anche se inizia a perdere soldi.

 
Aleksey Nikolayev:

È abbastanza sconcertante che il problema della non stazionarietà sia quasi completamente ignorato in questo thread. Per qualche ragione, si presume che i modelli trovati in passato funzioneranno in futuro, e se non funzionano, allora si è verificato un apprendimento eccessivo. Ma, è abbastanza possibile che alcuni modelli semplicemente smettano di funzionare nel tempo - gradualmente o anche a passi da gigante (per esempio come risultato di una crisi come quella attuale).

Il problema che vedo è che i modelli IO sono complessi e mal interpretati dagli umani. Se iniziano ad avere prestazioni scarse, è impossibile distinguere (all'interno dei modelli) la variante dell'apprendimento eccessivo dalla variante della non stazionarietà. Nell'analisi convenzionale è sempre possibile dire: "cambiamento di tendenza", "rottura del livello/canale" ecc.

Ho fatto pratica. Non ho notato alcun cambiamento in un mese dall'ultimo allenamento, anche dopo un grande pullback di bitcoin. L'unica cosa che lo influenza è il periodo immediatamente successivo al movimento manipolativo del bene, durante questo periodo la rete neurale è completamente persa e parla a vanvera, più ci si allontana da tale tempesta più i predicati diventano adeguati.
 
Evgeny Dyuka:
C'è la pratica. In un mese dall'ultimo allenamento non ho notato alcun cambiamento, anche dopo che il bitcoin è stato pesantemente scaricato. L'unica cosa che lo influenza è il periodo subito dopo il movimento del bene manipolato, durante questo periodo la neuronet è completamente persa e mostra ogni tipo di spazzatura; più ci si allontana da tale tempesta, più le previsioni diventano adeguate.

- interessante da guardare... posso avere un link ad esso (il canale) in un messaggio privato?

- alla fine sei riuscito a crearne uno?

 
onedollarusd:

- interessante da guardare... posso avere un link ad esso (il canale) in un messaggio privato?

- sei riuscito a crearne uno come risultato?

- no, utopia, molto tempo e fatica, alla fine sul backtest il bot fa fino a X5 all'anno su una coppia, ma in media 1 volta all'anno si riversa tutto fuori. Nel mercato reale questo "una volta all'anno" è destinato ad accadere rapidamente, specialmente durante le tempeste come adesso. Non credo più nei bot completamente automatizzati, semplicemente non può funzionare, il mercato si adatterà e imbroglierà comunque)

- questo è andato meglio, ora abbiamo un prototipo funzionante.
Stime neuro per BTCUSD prossimi 10-30 minuti, dipende dalla "fiducia" della rete. Più alta è la fiducia, più alta è la probabilità di lavorare intorno ai 15 minuti, più bassa è la fiducia, più confusa è la previsione. Non c'è nessun legame con le candele, la previsione esce ogni minuto.

Se scaricate Expert per MT5, potete ottenerlo qui (per coloro che hanno scaricato Expert Advisor in precedenza, potete aggiornarlo usando questo link, sono disponibili correzioni di bug).
Funziona solo su BTCUSD e solo su timeframe M1, leggi le istruzioni qui sotto.

Secondo questa visualizzazione è chiaro che le previsioni non sono ancora ideali, ma la formazione è solo nella fase iniziale, tutto è in ginocchio. C'è una comprensione di dove andare dopo...

 
Elibrarius:
Non sto supponendo... La pratica mostra l'1% di errore sulla trama di allenamento e il 50% di errore sulla nuova trama. Cioè avete bisogno di predittori significativi, e potete anche allenarvi con un singolo albero o qualche regressione.

Un albero, tra l'altro, sarebbe molto facile da interpretare.

Tutti i predittori hanno la tendenza a cambiare la loro importanza nel tempo. Non si tratta della loro inutilità, ma di cercarne costantemente di nuove e di essere preparati alla perdita di significato di quelle trovate prima.