L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3226

 
fxsaber #:

Forse dovremmo cercare di risolvere il problema della generazione di nuovi dati attraverso l'approssimazione?

Prendiamo una finestra e cerchiamo di descrivere una serie numerica al suo interno con una precisione diversa, mentre questo approccio permetterà di salvare la dinamica del movimento dei prezzi a livello globale, comprese le fluttuazioni giornaliere.

Inoltre, sarà sufficiente salvare la storia sotto forma di coefficienti di approssimazione.

 
Maxim Dmitrievsky #:

Il vostro TC non cerca tutti i modelli che possono esistere. Ecco perché è necessario abbinarlo

Allora ci troviamo di fronte al problema dell'"uovo e la gallina":

  • Il MO manterrà i pattern se gli vengono forniti dati da un TC funzionante.
  • Sul tsvr originale, il MO deve trovare un TC funzionante.

Altrimenti, attraverso un altro approccio, ma sarà lungo sui tick e in seguito).

Tutti questi sviluppatori sono lontani dal trading. Al posto della media dovrebbe esserci la mediana.

 
Aleksey Vyazmikin #:

Forse dovremmo cercare di risolvere il problema della generazione di nuovi dati attraverso l'approssimazione?

Prendiamo una finestra e cerchiamo di descrivere una serie numerica al suo interno con una precisione diversa, mentre questo approccio permetterà di preservare globalmente la dinamica del movimento dei prezzi, tenendo conto anche delle fluttuazioni giornaliere.

Inoltre, sarà sufficiente salvare la storia sotto forma di coefficienti di approssimazione.

Sembra una buona idea. Quando guardo gli articoli sull'argomento della ricerca IDC, comincio quasi subito a dubitare dei loro approcci, se c'è una ricerca di regolarità sotto l'ipotesi che siano 24 ore su 24.

 
Maxim Dmitrievsky #:

dipendenza con una lunghezza di 1000 tick

E 5.000 tick, oltre a questo.

Con i tick una tale scelta di finestra è strana. È logico legarsi ai timestamp, non agli indici di tick.

Forum sul trading, sui sistemi di trading automatico e sulla verifica delle strategie di trading

Machine Learning nel trading: teoria, modelli, pratica e trading di algoritmi

fxsaber, 2023.09.09 04:40 pm

C'è un errore in questo posto: dovrebbe essere time_msc. Ma non ha alcun effetto sui risultati dopo il post.

Si prega di riavviare in modo che i timestamp siano visualizzati correttamente per le prossime generazioni.
Questo nel caso in cui si decida di fare un bind.
 
Maxim Dmitrievsky #:

dipendenza con una lunghezza di 1000 tick

https://disk.yandex.ru/d/6F8FdUGthpnk3A

.

 
mytarmailS #:
Non si sta cercando di trovare un singolo set di parametri, ma una sorta di gruppo/raggruppamento di set di parametri vicini.

Guardate quanto sono diverse le curve nell'intervallo del campione (tra le linee blu).

Questo suggerisce che si ottengono set di parametri distanti piuttosto che vicini. Se in termini di una funzione target rumorosa, si ottengono risultati vicini a colline diverse.

È chiaro che se non si interrompe il GA, ma si aspetta fino al completamento, si troverà un picco. E tutti i 20 migliori passaggi saranno da lì - le curve dei campioni saranno quasi uguali. Questo non serve a nulla.

 
fxsaber #:

Se non si interrompe il GA, ma si attende che sia terminato, si troverà un picco. E tutti i 20 migliori passaggi saranno da lì - le curve dei campioni saranno quasi uguali.

Ho verificato questa affermazione sullo stesso VDC senza interrompere il GA.

Si vede bene che ci sono insiemi dissimili tra questi 20. Questo suggerisce piuttosto che il GA regolare non è riuscito a fare il suo lavoro. Più precisamente, ha interrotto se stesso inserendo nella top 20 i risultati di picchi diversi.

 
fxsaber #:

Sembra buono. Quando guardo gli articoli sull'argomento della ricerca sui tsvr, inizio quasi subito a dubitare dei loro approcci se c'è una ricerca di schemi che presuppone che siano 24 ore su 24.

Ebbene, posso dire che non per tutti i predittori la suddivisione temporale fornisce un bias di probabilità significativo, almeno per me. Quindi tendo a pensare che il tempo sia un fattore significativo, ma che altri fattori più significativi possano influenzare il risultato se sono in fase attiva.

Penso anche che nella finestra si possa semplicemente prendere una griglia di quantificazione diversa per il prezzo, con un gran numero di intervalli (per una conservazione più accurata della struttura), e testare su tale "segnale compresso" - avrà già delle deviazioni. Oppure si può utilizzare un numero ridotto di intervalli più un rumore casuale nell'intervallo di riferimento tra due intervalli.

Si può anche fissare la griglia e memorizzare solo l'offset per il primo riferimento. In questo caso lo spazio occupato sarà minimo e la trasformazione dovrebbe essere veloce.
 
Maxim Dmitrievsky #:

E con una lunghezza di 5k, per completare il tutto

https://disk.yandex.ru/d/1ypCrzYKk82XdA


Sembra che un grafico di ottimizzazione possa mostrare quanto sia difficile il processo di ricerca. Quindi ecco qui.


 
Aleksey Vyazmikin #:

Posso dire che non per tutti i predittori la suddivisione del tempo fornisce una distorsione significativa della probabilità, almeno per me. Quindi tendo a pensare che il tempo sia un fattore significativo, ma altri fattori più significativi possono influenzare il risultato se sono in fase attiva.

Penso anche che nella finestra si possa semplicemente prendere una griglia di quantificazione diversa per il prezzo, con un gran numero di intervalli (per una conservazione più accurata della struttura), e testare su tale "segnale compresso" - avrà già delle deviazioni. Oppure si può utilizzare un numero ridotto di intervalli più un rumore casuale nell'intervallo di riferimento tra due intervalli.

Si può anche fissare la griglia e memorizzare solo l'offset per il primo riferimento. In questo caso lo spazio occupato sarà minimo e la trasformazione dovrebbe essere veloce.

Sfortunatamente, queste sono tutte ipotesi che richiedono implementazione e test.

@Maxim Dmitrievsky sta provando le sue varianti, io sto provando le mie.