L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2130

 
Aleksey Vyazmikin:

Ha già iniziato ad allenarsi senza minuti - vedremo.

Uso anche il tempo di 1/4 di barra - ore, 4 ore, giorni.

In generale si scopre che i modelli in legno hanno bisogno di molti input, che sono pre-divisi il più possibile, cioè hanno il numero minimo di possibili divisioni proprie.

 
elibrarius:

In generale, si scopre che i modelli in legno hanno bisogno di molti input che sono pre-separati il più possibile, cioè hanno il numero minimo di possibili divisioni proprie.

Se fai la quantizzazione da solo, allora sì, ma c'è anche l'automazione incorporata.

Gli istogrammi qui sopra sono solo il diverso numero di quanti per predittore, si può vedere come influenzano il risultato finale.

Se per estrarre le vene di informazioni preziose come un quantum separato del predittore, è possibile codificare questa vena come una caratteristica binaria e alimentarla separatamente.

 
elibrarius:

Generalmente si scopre che i modelli in legno hanno bisogno di essere alimentati con molti input che sono pre-divisi il più possibile, cioè hanno il numero minimo di divisioni proprie possibili.

Equilibrio - T1 con minuti e T2 senza minuti - risultato medio: 3384/3126/3890

Recall - risultato medio: 0,0459/0,0424/0,0458


Precisione - punteggio medio: 0,5216/0,5318/0,5389

In termini di punteggi medi nell'aggregato T2, è emerso lo scenario peggiore.

Ho aperto la tabella per la significatività dei predittori e sono rimasto sorpreso



Non sembra che mi piacciano le ultime modifiche apportate dal metodo di allenamento, forse ho fatto qualcosa di sbagliato?

//день недели, час = ввести через 2 предиктора sin и cos угла от полного цикла 360/7,  360/24
   double tmp[4];
   int nInd=0;
   MqlDateTime dts;
   double pi=3.1415926535897932384626433832795;
   for(int buf=0; buf<2; buf++)
   {
      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/1440.0;
      tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;
      tmp[buf]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));

      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf+2]=(double)(dts.day_of_week*1440+dts.hour*60+dts.min)*360.0/10080.0;
      tmp[buf+2]=(double)dts.day_of_week*360.0/7.0;
      tmp[buf+2]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));
   }


Ho aperto il campione



E ho visto che la colonna TimeHG contiene ore - errore mio - devo rifare tutti i test.


 
Aleksey Vyazmikin:

Equilibrio - T1 con minuti e T2 senza minuti - punteggio medio: 3384/3126/3890

Richiamo - punteggio medio: 0,0459/0,0424/0,0458


Precisione - punteggio medio: 0,5216/0,5318/0,5389

In termini di punteggi medi nell'aggregato T2, è emerso lo scenario peggiore.

Ho aperto la tabella per la significatività dei predittori e sono rimasto sorpreso



Non sembra che mi piacciano le ultime modifiche apportate dal metodo di allenamento, forse ho fatto qualcosa di sbagliato?


Ho aperto il campione



E ho visto che la colonna TimeHG - sono ore - il mio errore - ho bisogno di rifare tutti i test.


E le ore sono rimaste con i minuti.

 tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;

Dovrebbe essere così

 tmp[buf]=(double)(dts.hour)*360.0/24.0;
TimeHG - apparentemente ha preso il controllo di tutto, motivo per cui gli altri orologi non sono stati utilizzati.
 
elibrarius:

E l'orologio è rimasto con i minuti

Dobbiamo fare questo.

OK.

 

Allenamento per 3 mesi - puramente per il gusto di farlo - allenamento all'inizio. L'intero calendario è 2014-2020.

Se si prende un grande periodo, si ottiene un modello mediocre. Allo stesso tempo si possono prendere diversi periodi di 3 mesi in tutto il periodo.

Qui per esempio, si può vedere il periodo di formazione - prima e dopo le dinamiche sono positive.


Futures attuali

L'aspettativa di mat mostra 6,15 su zecche reali.

Ho preso un modello più recente.


È interessante notare che sono diversi e questo dà il potenziale per combinarli in un comitato. L'aspettativa matematica è 12,64.

Qui sotto c'è un istogramma con l'equilibrio stimato, compreso il campione di formazione, a seconda del numero della finestra di formazione - più alto è il numero, più vicino al nostro tempo, vi ricordo che il campione è dal 2014 a ottobre 2020.

È interessante notare che in alcuni luoghi i profitti scendono a quasi la metà del valore massimo. Cosa potrebbe significare: aree più rumorose durante l'allenamento?

 
elibrarius:

E l'orologio è rimasto con i minuti

Dovrebbe essere così

TimeHG - apparentemente ha preso il controllo di tutto, motivo per cui il resto dell'orologio non è stato utilizzato.

Saldo - T1 con minuti e T2 senza minuti - risultato medio: 4209.70/2882.50/3889.90


Recall - risultato medio: 0,0479/0,0391/0,0458


Precisione - punteggio medio: 0.5318/0.5168/0.5389

Importanza dei predittori



In media, l'opzione senza minuti (T2) si fonde.

 
Aleksey Vyazmikin:

Equilibrio - T1 con minuti e T2 senza minuti - punteggio medio: 4209.70/2882.50/3889.90


Richiamo - punteggio medio: 0,0479/0,0391/0,0458


Precisione - punteggio medio: 0.5318/0.5168/0.5389

Importanza dei predittori



In media, l'opzione senza minuti (T2) si fonde.

Qual è la conclusione?
I minuti danno un aumento.
Non capisco cosa sia meglio: il tempo come seno e coseno o solo come numero di giorni, ore e minuti?
 
elibrarius:
Qual è la conclusione?
I minuti danno un aumento.
Cosa è meglio - il tempo come seno e coseno, o solo come numero di giorni, ore e minuti?

Finora possiamo concludere che T2 è chiaramente un'opzione peggiore, e che aggiungere seno e coseno non è identico al tempo lineare. Penso che i risultati siano diversi a causa della rappresentazione dei numeri, cioè la distanza tra di loro. La diversa distanza influenza la formazione della griglia di raggruppamento - da qui la discrepanza.

 
Aleksey Vyazmikin:

Finora possiamo concludere che T2 è chiaramente un'opzione peggiore, e che aggiungere seno e coseno non è identico al tempo lineare. Penso che i risultati siano diversi a causa della rappresentazione dei numeri, cioè la distanza tra di loro. La diversa distanza influenza la formazione della griglia di raggruppamento - da qui la discrepanza.

Teoricamente - dovrebbe essere lo stesso per l'albero.
Il numero di opzioni diverse in giorni, ore e minuti è uguale al numero di opzioni in seni e coseni. Sia lì che lì in 7 giorni sono 10080 valori diversi, che cambiano una volta al minuto.
Se c'è qualche randomizzazione nell'addestramento, può essere dovuta a questa differenza.

Ti sei allenato con cosa, catbust?

Per NS, seno e coseno sono ovviamente migliori, perché 59 e 1 minuto saranno uno accanto all'altro, con la rappresentazione dei numeri sono il più lontano possibile. Se volete che l'albero lo capisca, dovrete fare un paio di spaccate in più, il che potrebbe essere ciò che manca nelle limitazioni di profondità.