L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading

Vladimir Perervenko 2018.05.19 18:44 #9301

Ildottor Trader:

La genetica cerca di trovare i parametri corretti per un numero limitato di chiamate di funzioni. Restringendo il numero di varianti di questo parametro (30 invece di 200) il genetista può indagare più in dettaglio la regione da 1 a 30. E giustamente, se si conoscono i limiti specifici per trovare qualche parametro del modello, è meglio dare subito questa informazione al genetista.

In alternativa:

Aggiungete questa linea (quella verde) al codice, allora il genetista avrà 500 individui nella popolazione invece dei 50 di default. E sarà in grado di testare 10 volte più modelli (ma anche il tempo di esecuzione dello script aumenterà di 10 volte), potendo provare il maggior numero possibile di combinazioni di parametri del modello. Anche con un massimo di 200 neuroni penso che la genetica possa trovare un risultato migliore con 0,85, o almeno avvicinarsi ad esso.

Non riesco a capire di quale genetica state parlando. Non c'è genetica in ELM. Basta guardare la teoria ELM o la descrizione del pacchetto elmNN:

"L'algoritmo ELM è un metodo alternativo di addestramento per SLFN (Single Hidden Layer Feedforward Networks) che non ha bisogno di alcun tuning iterativo né di impostare parametri come il tasso di apprendimento, il momentum, ecc, che sono problemi attuali dei tradizionali algoritmi di apprendimento basati sul gradiente (come la backpropagation).

L'addestramento di una SLFN con ELM è un modello di apprendimento in tre fasi:

Dato un insieme di allenamento P = {(xi , ti )|xi E R , ti E R , i = 1,..., N}, la funzione di uscita del nodo nascosto G(a, b, x), e il numero di nodi nascosti L

1) Assegnare casualmente i parametri dei nodi nascosti (ai , bi ), i = 1,..., L. Significa che i pesi dell'arco tra lo strato di input e lo strato nascosto e lo strato nascosto sono generati casualmente.

2) Calcolare la matrice di uscita dello strato nascosto H usando una delle funzioni di attivazione disponibili.

3) Calcolare i pesi di uscita B: B = ginv(H) %*% T (moltiplicazione di matrice), dove T è l'uscita target del set di allenamento.

ginv(H) è l'inverso generalizzato di Moore-Penrose della matrice di uscita dello strato nascosto H. Questo è calcolato dalla funzione ginv del pacchetto MASS.

Una volta che la SLFN è stata addestrata, l'output di un generico set di test è semplicemente Y = H %*% B (moltiplicazione di matrice). Caratteristiche salienti:

- La velocità di apprendimento di ELM è estremamente veloce.

- A differenza dei tradizionali algoritmi di apprendimento basati sul gradiente che funzionano solo per le funzioni di attivazione differenziabili, ELM funziona per tutte le funzioni di attivazione continue piecewise non costanti delimitate.

- A differenza dei tradizionali algoritmi di apprendimento basati sul gradiente che affrontano diversi problemi come minimi locali, tasso di apprendimento improprio e overfitting, ecc, ELM tende a raggiungere le soluzioni in modo diretto senza questi problemi banali.

- L'algoritmo di apprendimento ELM sembra molto più semplice di altri algoritmi di apprendimento popolari: reti neurali e macchine vettoriali di supporto".

Anche con un piccolo numero di neuroni, è impossibile ottenere due reti neurali identiche. State definendo in modo errato la soglia per trasferire l'uscita continua a una classe. Soglia = 0,5 è il caso peggiore. Accettabile = mediano/ Ma ce ne sono di più avanzati.

Buona fortuna

Rete neurale Apprendimento automatico e Reti Machine learning in trading:

СанСаныч Фоменко 2018.05.19 18:53 #9302

Maxim Dmitrievsky:

Oh, sarà qualcosa da leggere, avevo dimenticato cos'è. O meglio, ha dimenticato la differenza tra GBM e XGboost... o non sapeva

gbm può potenziare qualsiasi modello, xgb sembra essere sugli alberi

So che il boosting è leggermente migliore del bagging, attraverso il quale si costruisce la foresta. Non conosco la riqualificazione.

Il riavvio non ha nulla a che fare con il tipo di modello.

Un modello viene riqualificato in due casi:

la presenza di predittori di rumore è un problema importante e si risolve SOLO adattando i predittori
overfitting del modello - "ottimizzazione" dei suoi parametri, di solito su un piccolo campione. Questo tipo di overfitting è risolto dall'esperienza degli sviluppatori.

Regressione bayesiana - Qualcuno Qualcuno ha creato un Errori, bug, domande

Maxim Dmitrievsky 2018.05.19 18:58 #9303

SanSanych Fomenko:

SanSanych, smettila di diventare isterico

Mihail Marchukajtes 2018.05.19 19:01 #9304

Vladimir Perervenko: