L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1330

 
Aleksey Vyazmikin:

Sono più perplesso da un'altra domanda - perché i grafici sono molto simili in diversi modelli su diversi campioni, sembra che i modelli riescono a catturare qualche modello evidente, che appare con frequente periodicità e su diverse dimensioni del campione (almeno questo pezzo è costantemente nella finestra), ed è questo modello che il modello sfrutta.

Ho concluso per me stesso che va bene destinare dal 30% al 70% del campione di tutti i dati a una trama di convalida alla ricerca di modelli interessanti, ma sembra che il 30% sia ancora ottimale.

forse perché avete lo stesso modello ma con un seme diverso? ))

Se il modello è randomizzato non significa che il valore di partenza del generatore influenzerà fortemente il risultato.

I modelli normali non cambieranno quasi per niente, è completamente casuale. È solo un controllo di robustezza.

Tutte queste conclusioni si sarebbero potute trarre senza fare assolutamente nulla, nessun esperimento, ma puramente dalla teoria.

30\70 sono risultati puramente casuali. La conclusione che tra 30 e 70 è asintoticamente vicina a 50. È capitato che fosse un sottocampione.

 
Maxim Dmitrievsky:

Forse perché avete lo stesso modello ma con un seme diverso? ))

Se il modello è randomizzato, non significa che il valore iniziale del generatore influenzerà fortemente il risultato.

I modelli normali non cambieranno quasi per niente, è completamente casuale. È solo un controllo di robustezza.

Tutte queste conclusioni si sarebbero potute trarre senza fare assolutamente nulla, nessun esperimento, ma puramente dalla teoria.

Se si guarda attentamente, si può vedere che i risultati finanziari dei modelli in un campione possono variare notevolmente - da 5000 a 1500, cioè in modo significativo, il che significa che Seed ha un impatto sui modelli. Presumo che siano i modelli selezionati che sono simili (controllerò), e hanno margini di profitto leggermente diversi, ma quasi tutti i modelli sono piatti nel mezzo, il che è sorprendente - si sbagliano negli stessi margini (anomalia nei nuovi dati?).

Non capisco l'affermazione "i modelli normali non cambieranno quasi per niente, quelli totalmente casuali sì" - la seconda parte dell'affermazione contraddice la prima.

Maxim Dmitrievsky:

30\70 sono risultati puramente casuali. La conclusione che tra 30 e 70 è asintoticamente vicina a 50. È solo un sottocampione.

Questo è il punto - casuale o no, cioè dipende dal contenuto del campione in questa sezione o dalla quantità di dati nei campioni, questo è ciò che dobbiamo capire, ciò che ha più influenza.

 
Aleksey Vyazmikin:

Se si guarda attentamente, si può vedere che i risultati finanziari dei modelli nello stesso campione possono essere molto diversi - da 5000 a 1500, cioè in modo significativo, il che significa che Seed influenza i modelli. Suppongo che siano i modelli selezionati che sono simili (controllerò), e hanno margini di profitto leggermente diversi, ma quasi tutti i modelli sono piatti nel mezzo, il che è sorprendente - si sbagliano negli stessi margini (anomalia nei nuovi dati?).

Non capisco l'affermazione "i modelli normali non cambieranno quasi per niente, quelli assolutamente casuali sì" - la seconda parte dell'affermazione contraddice la prima.

Questo è il punto - casuale o no, cioè dipende dal contenuto del campione in quella trama o dalla quantità di dati nei campioni, questo è ciò che deve essere capito, che ha più impatto.

I modelli a basso errore, cioè i modelli qualitativi, non sono influenzati dal cambiamento del seme. Se hai un valore Random intorno a 0,5 otterrai un sacco di modelli diversi perché ti sovralimenterai per ogni starnuto di casualità.

 
Maxim Dmitrievsky:

i modelli a basso errore, cioè i modelli di qualità, non sono influenzati dai cambiamenti di seme. Se Random è intorno a 0,5 allora avrete un sacco di modelli diversi, perché gli overfits per ogni starnuto di Random

Questo è probabilmente vero per il 99% di accuratezza, mentre il mio Recall è basso - 20% per buona misura, cioè potenzialmente la maggior parte degli 1 non vengono rilevati e non ci sono input, quindi ci si aspetta che i diversi modelli lavorino nell'intervallo 0-100 con una finestra del 20%.

 
Aleksey Vyazmikin:

Questo è probabilmente rilevante al 99% di accuratezza, ma il mio Recall è basso - 20% per buona misura, cioè potenzialmente la maggior parte degli 1 non vengono rilevati e nessun input viene fatto, quindi ci si aspetta che diversi modelli funzionino tra 0 e 100 con una finestra del 20%.

Questo non è il modo di procedere, si dovrebbe ridurre l'errore complessivo del modello e non reinventare la ruota

allora tutti i tipi di approcci strani cadranno da soli.

Ho scritto 50 volte - non c'è bisogno di reinventare la ruota, questa strada non porta da nessuna parte
 
Maxim Dmitrievsky:

Questo non è il modo di procedere, si dovrebbe ridurre l'errore complessivo del modello e non reinventare la ruota

allora tutti questi strani approcci cadranno da soli.

Te l'ho detto 50 volte - non c'è bisogno di reinventare la ruota, questa strada non porta da nessuna parte

Sto ascoltando attentamente, cos'altro si può usare per ridurre l'errore?

Per questi scopi cambio la composizione del campione, cambio le impostazioni della creazione del modello - cos'altro posso fare?

 

Chiunque si chieda come il seme influenzi i modelli - ha preso un campione del 30%, tutti i modelli - clicca sull'animazione


 
Maxim Dmitrievsky:

Questo non è il modo di procedere, si dovrebbe ridurre l'errore complessivo del modello e non reinventare la ruota

allora tutti i tipi di approcci strani cadranno da soli

Ho scritto 50 volte - non c'è bisogno di reinventare la ruota, questo modo non va da nessuna parte.
Non sono d'accordo. Se i metodi standard di IO funzionassero sul mercato, tutti guadagnerebbero con essi.
Aleksey Vyazmikin:

Ma bisogna inventare le biciclette durante il giorno. E dormire la notte. Salva la tua salute.
 
Elibrarius:
Non sono d'accordo. Se i metodi standard di IO funzionassero sul mercato, tutti guadagnerebbero con essi.
Ma la composizione delle biciclette dovrebbe essere fatta durante il giorno. E dormire la notte. Salva la tua salute.

Il problema non è con i metodi standard, ma con una mancanza di comprensione di base di ciò che si sta cercando di fare con loro e con quale processo si sta lavorando

cioè la mancanza di educazione economica e matematica.

quindi è come una particella browniana che vaga... forse di qua o di là...

E tutti si rifiutano di leggere libri "complicati", specialmente in inglese.

 
Maxim Dmitrievsky:

Il problema non è con i metodi standard, ma con un fraintendimento di base di ciò che si sta cercando di fare con essi.

un primo esempio di stupidità è l'uscita a zig-zag.

La macchina nucleare di Reshetov è la stessa bicicletta che alcuni qui usano. E sembra avere più successo nel trattare con il mercato rispetto a qualcosa di standard.

Quindi sono per le biciclette! ) Ma, naturalmente, bisogna anche capire cosa fare con loro.