L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1609

 
Maxim Dmitrievsky:

Si chiama "model stacking". Non sarà lo stesso, ma non necessariamente più efficiente. L'ho fatto in questo modo, non ho visto alcun miglioramento.

C'è un altro modo, si chiama meta-apprendimento. Si addestra il primo modello per predire le classi, poi si ottengono i risultati e li si alimenta nel secondo modello, sullo stesso o su altri preittori, che permette/nega il trading del primo modello. 1 - commerciare, 0 - non commerciare, a seconda della qualità delle previsioni del primo modello, cioè una sorta di filtro. Riduce fortemente gli errori sui dati di allenamento, ma non così tanto sui nuovi dati (se il modello ha una bassa generalizzabilità). Ma il meta-training in sé è ok.

Potete addestrare il primo modello su alcuni dati e il meta-modello su altri dati, sugli errori del primo modello. Ci possono essere diverse varianti. L'ho fatto in entrambi i modi, in generale c'è un miglioramento, ma è più un ritocco, piuttosto che un modo per ottenere un buon modello che funzionerà nel feedback.

Si può cercare su Google Marcos Lopez De Prado "meta apprendimento", solo sul trading

Grazie per le informazioni, ma ho considerato di dividere i predittori in parti come un modo per risparmiare risorse del computer durante l'addestramento, semplicemente non ho abbastanza tempo per addestrare ad esempio 10 predittori nel modello in una volta sola...

Non voglio rimpicciolire i predittori con la PCA o qualcos'altro, perché ho bisogno di scegliere prima i predittori importanti, quindi sto pensando a come rompere il modello generale in modelli PDP con la minima perdita di informazioni

 
mytarmailS:

Grazie per l'informazione, ma stavo considerando di dividere i predittori in parti come un modo per risparmiare risorse del computer durante l'addestramento, non posso permettermi di addestrare per esempio 10 predittori in un modello in una volta sola...

Non voglio diminuire la dimensione dei predittori con PCA o qualcos'altro perché ho bisogno di selezionare prima i predittori significativi, quindi sto pensando a come dividere il modello generale in modelli PDP con la minima perdita di informazioni

Quali 10 predittori? Rimuovere quelli correlati, vedere l'importanza di quelli rimanenti attraverso la foresta o il boosting e ci saranno 3-10

 

Non si può comunque indovinare al 100%, è stato testato, ci saranno previsioni errate in ogni caso. Questo perché i modelli di allenamento possono essere ripetuti, ma il risultato non è necessariamente lo stesso.

Per esempio, questo è quello che sembra. Certo, potrei non avere un ottimo approccio alla selezione dei modelli (dati formalizzati), ma trovo difficile credere che siano possibili previsioni corrette al 100%.


 
Maxim Dmitrievsky:

Quali 10 predittori? Togliete i correlati, guardate l'importanza di quelli rimanenti attraverso la foresta o il boosting e rimanete con 3-10

e se i predittori sono regole logiche? :)

 
Sono d'accordo che l'addestramento sulla storia profonda non è molto efficace, a volte il sistema si mette a scherzare all'uscita.
 
mytarmailS:

E se i predittori sono regole logiche? :)

chi se ne frega, non esistono così tanti predittori, non è un modello, è spazzatura

forse da qualche parte nel motore di ricerca o nell'analisi delle immagini forse, ma non per le citazioni di sicuro

 
Farkhat Guzairov:

In che forma alimentate i livelli della rete neurale?

 
Maxim Dmitrievsky:

Chi se ne frega, non esistono così tanti predittori, non è un modello, è spazzatura

Perché?

Più il modello è "ricco", peggio è?

Specialmente se non sapete voi stessi quale combinazione di predittori è migliore, non sarebbe giusto alimentare tutte le opzioni possibili nel modello e poi guardare l'importanza dei predittori in termini di modello
 
mytarmailS:

In che forma alimentate i livelli della rete neurale?

No no no, ho provato a usarne uno a due livelli, ma non ho ottenuto il risultato atteso, come ho scritto sopra, forse la selezione non ottimale dei dati (in alcuni casi contraddittori) non ha permesso di vedere alcun accenno a un risultato logicamente corretto. Finora solo la solita neuronica a strati. Prima di costruire una rete multistrato, è necessario sapere se ogni strato darà la giusta soluzione isolatamente.

 
Farkhat Guzairov:

No no no, ho provato a usare il bi-level, ma non ho ottenuto il risultato atteso, come ho scritto sopra, forse la selezione non ottimale dei dati (in alcuni casi contraddittori) non ha permesso di vedere alcun accenno a un risultato logicamente corretto. Finora solo la solita neuronica a strati. Prima di costruire reti multistrato, dovreste capire se ogni strato vi dà la giusta soluzione da solo.

Scusa, intendevo i livelli di supporto e resistenza