C'è uno schema nel caos? Proviamo a trovarlo! Apprendimento automatico sull'esempio di un campione specifico. - pagina 22

 
Aleksey Vyazmikin #:
Ma ho ottenuto questo modello

.

Non è necessario sperare che il miglior modello dell'esame sia redditizio in futuro. La media o la maggioranza dovrebbe essere redditizia.

È proprio come nell'ottimizzatore di tester: i modelli migliori saranno in prugna nel 99% dei casi.

 
elibrarius #:

Le suddivisioni vengono effettuate solo fino al quantum. Tutto ciò che si trova all'interno del quanto viene considerato come lo stesso valore e non viene ulteriormente suddiviso.

Non avete capito: il punto è che ogni divisione riduce il campione per la divisione successiva, che avviene secondo la tabella dei quanti, ma la metrica cambierà ogni volta.

Esistono algoritmi che creano una nuova tabella quantistica dopo ogni split quando addestrano il modello.

elibrarius #:

Non capisco perché stai cercando qualcosa in quantum, il suo scopo principale è quello di accelerare i calcoli (lo scopo secondario è quello di caricare / generalizzare il modello in modo che non ci siano ulteriori suddivisioni, ma puoi anche semplicemente limitare la profondità dei dati float) Non lo uso, faccio solo modelli su dati float. Ho eseguito la quantizzazione su 65000 parti: il risultato è assolutamente identico al modello senza quantizzazione.

Apparentemente vedo l'efficienza, ecco perché la uso. 65000 parti sono troppe, ma lo scopo della quantizzazione è quello di generalizzare i dati per creare una caratteristica categorica, quindi è auspicabile che il 2%-5% dell'intero campione sia quantizzato. È possibile che questo non sia vero per tutti i predittori - gli esperimenti non sono stati completati.

elibrarius #:

Ci sarà uno split che divide i dati in due settori - uno ha tutti 0, l'altro ha tutti 1. Non so come si chiami il quanta, credo che il quanta sia il numero di settori ottenuti dopo la quantizzazione. Forse è il numero di suddivisioni, come intende lei.

Sì, è chiaro, hai ragione sulla scissione, anzi ho sorriso. In generale c'è un concetto di tabella quantistica in CatBoost, ci sono esattamente degli split, e io per me uso dei segmenti - due coordinate, e forse possono essere chiamati quanti o segmenti quantistici. Non conosco la vera terminologia, ma li chiamo così per me stesso.

 
elibrarius #:

Non è necessario sperare che il modello migliore dell'esame sia redditizio in futuro. La media o la maggior parte dovrebbe essere redditizia.

È proprio come nell'ottimizzatore di tester: i modelli migliori saranno plum in avanti il 99% delle volte.

L'obiettivo ora è capire il potenziale a cui possiamo aspirare. Non farò trading su questi modelli.

Mi aspetto che il numero di modelli selezionati aumenti grazie alla minore variabilità nella selezione delle frazioni - lo vedremo più tardi.

 
Aleksey Vyazmikin #:

E mi aspetto che il numero di modelli sottoposti a screening aumenti grazie alla ridotta variabilità della selezione degli split - lo vedremo più tardi.

Ho scoperto che mi sbagliavo: il numero di modelli è solo 79, il profitto medio dell'esame -1379.

 
elibrarius #:

Non è necessario sperare che il modello migliore dell'esame sia redditizio in futuro. La media o la maggior parte dovrebbe essere redditizia.

È proprio come nell'ottimizzatore di tester: i modelli migliori saranno plum in avanti il 99% delle volte.

A proposito, ho deciso di esaminare il campione di un altro modello, anch'esso non in formazione, quello che è stato tagliato in precedenza.

Ecco come appare lo stesso modello su questi dati (2014-2018).

Equilibrio

Penso che non sia male, almeno non è una prugna di 45 gradi. Possiamo cioè aspettarci che un buon modello continui a essere buono?

 
Aleksey Vyazmikin #:

A proposito, qui ho deciso di guardare un campione dell'altro che non era in allenamento, quello che è stato tagliato prima.

Lo stesso modello si presenta così su questi dati (2014-2018).

Penso che non sia male, almeno non è una prugna di 45 gradi. Cioè, possiamo ancora aspettarci che un buon modello continui a essere buono?

forse)

 
elibrarius #:

forse)

Ahimè, ho controllato tutti i modelli - quelli che hanno guadagnato più di 3000 sul treno e sul campione d'esame - 39 pezzi, sul nuovo-vecchio campione solo 18 (46%) hanno mostrato un risultato redditizio. Questo è certamente più di 1/3, ma non è ancora sufficiente.

Questa è la differenza dei saldi dei modelli selezionati tra il campione d'esame regolare e quello scartato (2014-2018).

 
Aleksey Vyazmikin #:

Ahimè, ho controllato su tutti i modelli - quelli che hanno guadagnato più di 3000 sul treno e sul campione d'esame - 39 pezzi, sul nuovo-vecchio campione solo 18 (46%) hanno mostrato risultati redditizi. Questo è certamente più di 1/3, ma non è ancora sufficiente.

Questa è la differenza dei saldi dei modelli selezionati tra il campione d'esame regolare e quello scartato (2014-2018).

In generale, non è ancora 50/50 (in termini di profitto). Se è già difficile proporre nuove caratteristiche legate all'obiettivo, forse l'obiettivo dovrebbe essere cambiato?
 
elibrarius #:
In generale, anche il 50/50 non funziona ancora (in termini di profitto). Se è difficile trovare nuove caratteristiche legate all'obiettivo, forse l'obiettivo dovrebbe essere cambiato?

Si possono inventare nuovi predittori, ci sono ancora idee, ma non sono sicuro che l'addestramento si baserà su di essi tenendo conto del principio di greed.... Forse dobbiamo cambiare l'approccio all'addestramento dei modelli, fare le nostre trasformazioni degli algoritmi conosciuti.

L'obiettivo può essere cambiato, ma in che modo, qualche idea?

 

Ho preso il campione della sesta fase che ho descritto qui e ho scambiato esame e test.

In effetti, l'addestramento è stato eseguito secondo le stesse regole, con gli stessi semi, ma un altro campione - più avanti nella cronologia - è stato incaricato di fermare la creazione di nuovi alberi.

Di conseguenza, il valore medio del profitto sul campione d'esame (ex esame) è di -730,5 - ricordiamo che durante l'addestramento cronologico sul campione d'esame il valore medio era di 982,5, e sul campione d'esame (ex test ) il valore medio del bilancio era di 922,49 punti, mentre nella variante iniziale era di -1114,27 punti.

Figura 1 Istogramma della distribuzione del saldo del campione di prova originale utilizzato come campione d'esame.

Figura 2 Istogramma della distribuzione dell'equilibrio del campione di prova utilizzato come campione d'esame.

Quando i campioni sono stati disposti cronologicamente, il valore medio degli alberi nel modello è stato di 11,47, mentre quando la sequenza di due campioni è stata cambiata, il valore medio degli alberi nel modello è stato di 9,11, vale a dire che ci sono meno modelli da trovare dopo che i campioni sono stati riorganizzati, quindi sono stati necessari meno alberi per descriverli.

Allo stesso tempo, grazie al controllo dell'arresto tramite l'effettivo campionamento dei modelli, il modello è diventato più qualitativo e, come ho indicato sopra, è diventato in media più redditizio.

Da un lato, l'esperimento conferma che i campioni contengono pattern simili che durano per anni, ma allo stesso tempo alcuni di essi diventano meno pronunciati o addirittura spostano la loro probabilità verso la zona negativa dell'esito dell'evento. È stato precedentemente rivelato che non solo i predittori stessi, ma anche il loro utilizzo nel modello influenzano il risultato della formazione.

Di conseguenza, abbiamo:

1. Un campione non rappresentativo.

2. Modelli casuali che possono "oscurare" quelli stabili durante la costruzione del modello, oppure il metodo stesso di costruzione del modello non è sufficientemente affidabile.

3. Dipendenza del risultato del modello dall'area del campione (il precedente treno di campioni ha mostrato buoni risultati nel ruolo di esame).