L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2017

 
mytarmailS:

Qualcuno ha provato a usare i "livelli rotondi" come segni?

O come un modo di elaborare i prezzi?

Puoi marcare i prezzi con valori circolari per esempio...

È possibile rimuovere i valori che sono uguali in una riga...

È una buona compressione di informazioni, più il filtraggio ... Forse sarà più facile cercare modelli su un tale grafico per un modello ...

Ho intenzione di fare dei predittori, la logica qui è che ci sono strike di opzioni ai livelli, quindi può essere utile per Moex.

I grafici sono interessanti, MQL vorrebbe ottenere un algoritmo veloce...
 
Aleksey Vyazmikin:

Riguardo all'inceppamento - forse dobbiamo cambiare il modo in cui l'errore viene corretto.

Perché scatola nera, se ci sono solo 2-3 strati, allora è abbastanza realistico decifrare per coefficienti. I piccoli coefficienti qui possono essere coartati e azzerati, il che ridurrà il numero di ingressi al neurone.

Cosa intendi per "forse dovresti cambiare"? Impara la matematica e come funzionano i font di attivazione. O gli sviluppatori della rete sono così stupidi da non sapere

Perché entrare in tutte queste cose e reinventare la ruota senza una laurea o un background matematico? È una stupida perdita di tempo. Ci sono delle tecnologie ed è scritto come devono essere usate.

 
Maxim Dmitrievsky:

Cosa intendi per "potrebbe essere necessario cambiare"? Impara la matematica e come funzionano le funzioni di attivazione. O gli sviluppatori della rete sono così stupidi che non l'avrebbero capito

perché è una perdita di tempo, nient'altro che speculazioni e zero specifiche. Hai appena modificato l'autocodificatore, aggiunto i tasti di scelta rapida a un bunching o NS e ci hai mostrato i risultati. Questo è tutto. Non devi elaborare nulla. Le architetture profonde non sono costruite per essere analizzate, ma per ridurre la routine analitica.

Perché entrare in tutto questo e reinventare la ruota senza una laurea o un background matematico? È una stupida perdita di tempo. Ci sono delle tecnologie ed è scritto come devono essere usate, tutto qui. Molte persone ci stanno lavorando.

Se le soluzioni pronte all'uso risolvessero i compiti che mi sono prefissato, non dovrei inventare nulla.

Ora sto preparando un grande campione e addestrerò molti modelli su CatBoost, ho alcune idee su come stimare la qualità del modello per ulteriori applicazioni di successo in tempo reale - condividerò i risultati della mia ricerca.

 
Aleksey Vyazmikin:

Se le soluzioni già pronte fuori dalla scatola avrebbero risolto i compiti che mi ero prefissato, non c'era bisogno di inventare nulla, ma, ahimè.

Ora preparo il grande campione e addestrerò un sacco di modelli su CatBoost, ci sono idee su come stimare la qualità del modello con lo scopo della loro ulteriore applicazione di successo in tempo reale - condividerò i risultati della ricerca.

Non credo che catboost sia la soluzione migliore per la previsione di serie temporali, non funziona con le sequenze.

si può giocare con la classificazione, ma sarà inutile
 
Maxim Dmitrievsky:

Catbust non è adatto alla previsione di serie temporali, non funziona con le sequenze

puramente per giocare con la classificazione, ma è inutile

E come si fa a determinare se funziona o no?

Ho modelli che sono redditizi da un anno (addestrati circa un anno fa) nel tester - stai suggerendo che sono casuali?

Sì, CatBoost è inferiore a un albero genetico con foglie di post-elaborazione, ma è molto veloce da addestrare.

E cosa funziona - NS?

 
Aleksey Vyazmikin:

Come si fa a capire se funziona o no?

Ho modelli che sono stati redditizi per un anno (addestrati circa un anno fa) nel tester - stai suggerendo che sono un colpo di fortuna?

Sì, CatBoost è inferiore a un albero genetico con foglie di post-elaborazione, ma è molto veloce da addestrare.

E cosa funziona - NS?

Non l'ho definito io, l'architettura stessa è per altri compiti

Sì, è tutto casuale.

non funziona ancora nulla)

 
Aleksey Vyazmikin:

I predittori non sono prezzi in forma nuda - molti punti relativi che possono essere simili...

Non sono sicuro che lo screening per correlazione sarebbe efficace...

Perché non provare? Anche un risultato negativo è un risultato (nel senso di uno spunto di riflessione).

Una volta ho anche suggerito la formula del coefficiente di correlazione: C = (n1 - n2)/n, dove n è il numero di barre in cui almeno uno dei due sistemi dà il segnale del trade, n1 è il numero di barre in cui i segnali sono dati da entrambi i sistemi contemporaneamente e nella stessa direzione e n2 è il numero di barre in cui i segnali sono dati da entrambi i sistemi contemporaneamente e in direzioni opposte.

Questa matrice può essere utilizzata per il clustering, il diradamento e la formazione del portafoglio.

 
Maxim Dmitrievsky:

Non l'ho determinato, ma l'architettura stessa è per altri compiti.

Sì, è tutto casuale.

finora non funziona nulla)

Naturalmente, qui non c'è un affinamento delle serie temporali, quindi i predittori dovrebbero contenere informazioni sulle coordinate X, non solo sulle coordinate Y.

Se uno impara a identificare questi modelli casuali, sarà un professionista.

Ho più del 60% delle foglie campionate negli anni precedenti che funzionano, il che è molto, e secondo me, conferma la validità dell'idea di un approccio di elaborazione dei dati poco classificato. Se più persone lavorassero all'idea, il risultato sarebbe migliore, ma ognuno ha il suo bling.

 
Aleksey Vyazmikin:

Naturalmente, qui non c'è un affinamento delle serie temporali, quindi i predittori dovrebbero contenere informazioni sulle coordinate X, non solo sulle coordinate Y.

Se uno impara a identificare questi modelli casuali, sarà un profitto.

Ho più del 60% delle foglie campionate negli anni precedenti che funzionano, il che è molto, e secondo me, conferma la validità dell'idea di un approccio di elaborazione dei dati poco classificato. Se più persone lavorassero all'idea, il risultato sarebbe migliore, ma ognuno ha il suo bling.

Come se l'articolo volesse... Abbozza il succo dell'approccio. Ancora non capisco cosa stai facendo :D

Rimango dell'idea che le caratteristiche dovrebbero essere estratte automaticamente dal modello stesso dalle serie temporali (se ce ne sono). E non c'è bisogno di fare nulla manualmente. Gli incrementi sono sufficienti. La questione è l'architettura. Per esempio come in NLP (elaborazione neurale del linguaggio) la rete neurale stessa determina il contesto nelle sequenze di parole, cioè la relazione tra campioni di serie temporali.

 
Aleksey Nikolayev:

Perché non fare una prova? Anche un risultato negativo è un risultato (nel senso di uno spunto di riflessione).

Credo che una volta ho anche suggerito la formula per il coefficiente di correlazione: C = (n1 - n2)/n, dove n è il numero di barre in cui almeno uno dei due sistemi dà un segnale per il trading, n1 è il numero di barre in cui i segnali sono dati da entrambi i sistemi contemporaneamente e nella stessa direzione e n2 è il numero di barre in cui i segnali sono dati da entrambi i sistemi contemporaneamente e in direzioni opposte.

La matrice di questi rapporti può essere utilizzata per il clustering, il diradamento e la formazione del portafoglio.

Cosa c'entra questo con i predittori?

Faccio qualcosa di simile per la selezione delle foglie, ma c'è una fregatura nel fatto che il numero di risposte delle foglie è diverso nel campione e dovremmo tenere conto che foglie con risposte simili ma di lunghezza diversa possono appartenere allo stesso gruppo.