L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2018

 
Maxim Dmitrievsky:

Come se l'articolo volesse... Abbozza il succo dell'approccio. Ancora non capisco cosa stai facendo :D

Rimango dell'idea che le caratteristiche dovrebbero essere estratte automaticamente dal modello stesso dalle serie temporali (se ce ne sono). E non c'è bisogno di fare nulla manualmente. Gli incrementi sono sufficienti. La questione è l'architettura. Per esempio come in NLP (elaborazione neurale del linguaggio) la rete neurale stessa determina il contesto nelle sequenze di parole, cioè la connessione tra i campioni di serie temporali.

L'albero genetico e CatBoost sono debolmente collegati, l'articolo che ho intenzione di scrivere su CatBoost. Rinviato a scrivere per il motivo che ho trovato difetti nella stabilità degli indicatori di predittori e hanno gettato tutte le forze sulla correzione, allo stesso tempo e i nuovi predittori ha fatto. Entro la fine della settimana ho intenzione di iniziare il processo di calcolo (altrimenti è fastidioso quando i server sono inattivi) e cercherò di scrivere la prima parte dell'articolo entro la fine del mese. L'articolo sarà sulla mia cucina di modellismo su CatBoost.

Con gli alberi genetici è più complicato, non ci sarà ancora un articolo, ma l'approccio è che selezioniamo le foglie degli alberi che classificano stabilmente una parte dei dati sulla storia - di fatto lo 0,5%-3% di tutte le risposte del campione, più sono tali foglie, meglio è, ora circa 1000 per la compravendita, in più cerco foglie che filtrano anche le foglie selezionate, cioè effettuo un allenamento supplementare che aumenta la loro precisione. Le foglie vengono raggruppate in base alla loro somiglianza (c'è ancora del lavoro da fare), poi le loro risposte vengono pesate all'interno di ogni gruppo sulla storia e viene determinata la soglia alla quale viene generato il segnale da un gruppo di foglie. Un ulteriore filtro è un albero genetico basato sulle risposte di tutte le foglie o solo di gruppi di foglie. Questo approccio permette di aumentare significativamente la completezza della classificazione in un campionamento sbilanciato, nel mio caso con 3 obiettivi, dove l'obiettivo "0" è circa il 65%.

Il lavoro sui criteri di selezione delle foglie e sulla metodologia della loro aggregazione ha un grande potenziale di miglioramento, e quindi i modelli possono essere di qualità superiore.

 
Aleksey Vyazmikin:

Cosa c'entrano i predittori?

Deve essersi confuso, pensando al suo)

 
Maxim Dmitrievsky:

Sono dell'opinione che le caratteristiche dovrebbero essere estratte automaticamente dal modello stesso dalle serie temporali (se ce ne sono). E non c'è bisogno di fare nulla manualmente. Gli incrementi sono sufficienti. La questione è l'architettura. Per esempio, come in NLP (elaborazione neurale del linguaggio) la rete neurale stessa determina il contesto nelle sequenze di parole, cioè la connessione tra campioni di serie temporali.

Sono d'accordo sull'architettura, abbiamo bisogno di un'architettura completamente diversa, abbiamo bisogno di un insieme di reti:

1. Identificazione delle immagini.

2. Determinazione dell'ordine spaziale delle immagini

3. cercando modelli nelle immagini collocate nello spazio

Ora ho il mio cervello che risolve le reti 1 e 2 - componendo i predittori, e con il terzo compito il CatBoost sta facendo. Unire queste reti in una sarà difficile, forse provare a lavorare con ogni direzione separatamente, e poi unire queste reti?

 
Aleksey Vyazmikin:

Ora sto risolvendo le reti 1 e 2 con il mio cervello - componendo i predittori, e CatBoost sta gestendo il terzo compito. Sarebbe difficile unire queste reti in una sola, forse provare a lavorare con ogni direzione separatamente, e poi unire queste reti?

Bisogna guardare le innovazioni, sono in costante miglioramento. Le griglie moderne hanno esattamente lo stesso compito, fare tutto in una volta.

Cercare manualmente i predittori è come colpire una roccia con un piccone. E, come tutti hanno visto, quasi non funziona
 
Maxim Dmitrievsky:

devi tenere gli occhi aperti per i nuovi prodotti, sono in costante miglioramento. Le griglie moderne hanno esattamente lo stesso compito, fare tutto in una volta.

Cercare manualmente i predittori è come usare un piccone su una roccia. E, come tutti hanno visto, quasi non funziona

Deve essere un'architettura molto complessa per fare tutto in una volta, e più complessa è l'architettura, più potenza di elaborazione è necessaria.

Tuttavia, se c'è bisogno di capacità (ci sono vecchi server e GPU), sono pronto a fornirli per l'idea ;)

 
Aleksey Vyazmikin:

Più complessa è l'architettura, più potenza di elaborazione è necessaria.

Tuttavia, se c'è bisogno di potenza (ci sono vecchi server e GPU), sono pronto a fornirla per l'idea ;)

non è complicato, bisogna solo capire

Non ho bisogno di alcun potere. Ho LSTM sul mio portatile che impara in pochi minuti senza alcuna scheda grafica. Il potere è un mito.

 
Aleksey Vyazmikin:

Più complessa è l'architettura, più potenza di elaborazione è necessaria.

Tuttavia, se c'è bisogno di potenza (ci sono vecchi server e GPU), allora sono pronto a fornirla per l'idea ;).

Pronto a lanciare un'idea, di persona?

 
Maxim Dmitrievsky:

Non è complicato, devi solo capirlo.

Non c'è bisogno di alcun potere. Posso imparare LSTM sul mio portatile in pochi minuti senza schede video. Il potere è un mito.

Le architetture non complesse non funzionano, l'hai detto tu stesso. Quelli non complicati hanno bisogno di stazionarietà... cicli.

Wow, un paio di minuti sono una figata, e che topologia di rete è, quanti strati, neuroni?

 
dr.mr.mom:

Pronto a sondare le idee, di persona?

Puoi farlo di persona.

 
Aleksey Vyazmikin:

Le architetture non complicate non funzionano, l'hai detto tu stesso. Quelli non complicati hanno bisogno di stazionarietà... cicli.

Wow, è fresco in un paio di minuti, e che topologia di rete è quella, quanti strati, neuroni?

Oh, amico... non è complicato nel senso che si può capire

di solito un paio di strati sono sufficienti, non c'è bisogno di molta profondità nel forex

Ci sono reti più avanzate per la VR, più fresche di lstm. Potrebbe essere redditizio da lì, non ho ancora controllato. Tutti i "classici" come i boosting e i perseptron non sono adatti alla BP.