L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2031

 
mytarmailS:

possiamo cercare di esprimere l'obiettivo in modo più complesso sotto forma di 4 parametri contemporaneamente


Diciamo che decidiamo di comprare...

e la rete non ci dice solo di comprare o vendere

ci dice

a che prezzo comprare, a che prezzo chiudere, dopo quanto tempo comprare e dopo quanto tempo chiudere

puoi anche aggiungere uno stop loss

Previsioni così precise e lontane mi sembrano pesanti da imparare...

Per le prese di profitto, penso che dovremmo fare una classificazione con diverse varianti di presa di profitto e il modello dovrebbe scegliere la più redditizia. È simile a ZZ, ma il modello dovrebbe lavorare su ogni barra da un certo punto, ma questo punto non apparirà su ogni movimento di prezzo dalla posizione aperta.

Un buon posto per entrare è dove la perdita minima può essere ottenuta, cioè, è importante conoscere immediatamente il punto di uscita adatto per impostare SL, se SL è legato a qualche indicatore di livello, allora i punti di entrata sono abbastanza facili da trovare e setacciare, sono simili, e quindi la formazione dovrebbe essere migliore.

Quindi la domanda è come trovare tali punti...

 
Aleksey Vyazmikin:

Un augurio di successo c'è :)

Hai bisogno di una regressione, allora? Non ho molta esperienza in questi modelli.

Conosco questo concetto - ci sono persone che lo fanno - la questione è come creare strategie - nel motore stesso...

Poi per la classificazione fanno l'obiettivo? Lascerò la prima parte della tabella, che riguarda l'entrata, SL, TP e l'ultima colonna +-1 come risultato del commercio. Non ho bisogno di alimentare le informazioni sull'uscita, perché potrebbe essere un indizio.

Di quale motore stiamo parlando? Nella forza bruta fatta in casa o nella genetica, per cominciare.

 
Rorschach:

Poi per classificare l'obiettivo fare? Lascerò la prima parte della tabella, che riguarda l'entrata, SL, TP e l'ultima colonna +-1 come risultato del commercio. Non credo che dovrei dare informazioni sull'uscita, perché è possibile spiarla.

Di quale motore stiamo parlando? Nella forza bruta fatta in casa o nella genetica, per cominciare.

Si può fare una regressione, si può fare un modello, purché sia solo una ricerca, per come la vedo io. Ma per valutare la qualità c'è più complicato - sarà necessario valutare la deviazione dal piano, non so se è possibile valutare immediatamente il vettore di deviazione o ci modulo - non impegnati.

Su un motore che prenderà saggiamente i dati giusti, in modo da non generare condizioni commerciali ovviamente insensate - il processo di generazione della strategia stessa, e dopo che possiamo pensare alla genetica o qualche altro modo per migliorare il modello.

 
Aleksey Vyazmikin:

Si può anche fare la regressione, si può fare un modello, purché sia solo una ricerca, per come la vedo io. Ma è più complicato con la stima della qualità - avremo bisogno di stimare la deviazione dal piano, non so se è possibile stimare il vettore di deviazione o il modulo - non l'ho fatto.

Circa il motore che prenderà saggiamente i dati necessari, in modo da non generare condizioni di trading consapevolmente senza senso - il processo di generazione della strategia stessa, e dopo che possiamo pensare alla genetica o qualcos'altro per addestrare il modello.

In effetti è interessante vedere il clustering, come sarà raggruppato, ci sarà qualche logica.

Possiamo iniziare con martin, anti-martin e overturn. E poi ifelse: se il trade ha chiuso in meno, il prossimo si apre con doppio lotto o solo in direzione opposta o entrambi. È difficile pensare a qualcosa di più complicato da zero.

 
Rorschach:

In realtà è interessante vedere il clustering, come sarà raggruppato, se ci sarà qualche logica.

Per cominciare, possiamo prendere un martin, un anti-martin e un'inversione. E poi ifelse: se un trade ha chiuso in perdita, allora il prossimo si apre con doppio lotto o solo nella direzione opposta o entrambi. È difficile pensare a qualcosa di più complicato da zero.

Posso fornire risorse, non posso fare di più al momento.

 
Aleksey Vyazmikin:

Posso fornire risorse, non posso fare di più al momento.

Catbust ha feature_importances, la capacità di guardare i cluster, come nelle foreste?

La vostra macchina digerirà la tabella 14 per 180.000.000?

 
Rorschach:

Catbust ha feature_importances, la capacità di guardare i cluster, come nell'impalcatura?

La vostra macchina digerirà la tabella 14 per 180.000.000?

"Feature_importances" è l'importanza delle caratteristiche, cosa ha a che fare con i cluster? O mi manca qualcosa. C'è una tale funzione, ma non la uso molto, perché questa importanza è essenzialmente contata dalle cime degli alberi, il che non si adatta al mio concetto.

Ho addestrato i modelli su tabelle da 6 gigabyte. E non consumava più di 2x gigabyte di memoria, come ricordo ora.

 
Aleksey Vyazmikin:

"feature_importances" è l'importanza delle caratteristiche, cosa ha a che fare con i cluster? O mi manca qualcosa? C'è una tale funzione, ma non la uso molto, perché questa importanza è essenzialmente contata dalle cime degli alberi, il che non si adatta al mio concetto.

Ho addestrato modelli su tabelle da 6 gigabyte. E non consumava più di 2 gigabyte di memoria, come ricordo ora.

Per la foresta è possibile vedere l'importanza e i cluster. In catbust è probabilmente plot_tree.

I dati saranno preparati e saranno pubblicati.

Ho fatto una versione di prova per 6 colonne, ci sono voluti 11GB. Notepad++ non può aprirlo, dice che il file è troppo grande. BD Browser per SQLite si è bloccato per 20 minuti.
 
Rorschach:

Per una foresta, c'è un'opzione per guardare l'importanza e i cluster. In catbust è probabilmente plot_tree.

Preparerò i dati e li posterò.

Ho fatto una versione di prova per 6 colonne, ci sono voluti 11GB. Notepad++ non può aprirlo, dice che il file è troppo grande. BD Browser per SQLite è rimasto sospeso per circa 20 minuti.
Total command viewer prende file di grandi dimensioni, il che fa bloccare Notepad++
 
Aleksey Vyazmikin:

"feature_importances" è l'importanza delle caratteristiche, cosa ha a che fare con i cluster? O mi manca qualcosa? C'è una tale funzione, ma non la uso molto, perché questa importanza è essenzialmente contata dalle cime degli alberi, il che non si adatta al mio concetto.

Ho addestrato i modelli su tabelle da 6 gigabyte. E non consumava più di 2 gigabyte di memoria, come ricordo ora.

Mi chiedo come addestrino gli alberi senza prendere tutti i dati in memoria. Se avevamo una tabella di 6 gigabyte, dovevamo usare anche 6 gigabyte di memoria. Un albero deve ordinare ogni colonna nel suo insieme. Se non mettiamo tutto in memoria, ma leggiamo i dati dal disco ogni volta, sarà troppo lento.
L'unica variante è mantenere i dati in memoria nel tipo float invece che double, ma questo ridurrà la precisione. Per noi con 5 cifre di precisione, potrebbe non essere troppo male, ma catbust è un software universale, penso che i problemi fisici e matematici dovrebbero essere risolti in doppia precisione.