L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2405

 
Maxim Dmitrievsky:

L'idea è generalmente corretta, ma non richiede necessariamente l'addestramento online nella vita reale, può essere fatto solo durante la fase di formazione/addestramento di base e poi utilizzato come tale

Beh sì, ha senso che non ci siano calcoli pesanti quando si fa trading.

 
High-Frequency Financial Trading on FOREX with MDFA and R: An Example with the Japanese Yen
High-Frequency Financial Trading on FOREX with MDFA and R: An Example with the Japanese Yen
  • 2013.02.19
  • Christian Dallas Blakely
  • imetricablog.com
In my previous article on high-frequency trading in iMetrica on the FOREX/GLOBEX, I introduced some robust signal extraction strategies in iMetrica using the multidimensional direct filter approach (MDFA) to generate high-performance signals for trading on the foreign exchange and Futures market. In this article I take a brief leave-of-absence...
 

Ho deciso di confrontare le metriche di prossimità tra loro, che sono più adatte per il riconoscimento dei dati di mercato...

La metrica più comune è "euclidea" , che è usata in quasi il 99% dei casi ed è una specie di standard in MO...

quasi tutti i cluster ci lavorano...

Così 24 metriche sono state confrontate per l'adeguatezza del riconoscimento dei nuovi dati di mercato...

elenco delle metriche e risultato dell'errore

 [1,] "0.51"  "euclidean"  
 [2,] "0.525" "manhattan"  
 [3,] "0.51"  "minkowski"  
 [4,] "0.545" "infnorm"    
 [5,] "0.505" "ccor"       
 [6,] "0.565" "sts"        
 [7,] "0.51"  "dtw"        
 [8,] "0.52"  "edr"        
 [9,] "0.55"  "erp"        
[10,] "0.51"  "lcss"       
[11,] "0.535" "fourier"    
[12,] "0.46"  "tquest"     
[13,] "0.525" "acf"        
[14,] "0.52"  "pacf"       
[15,] "0.525" "cdm"        
[16,] "0.53"  "cid"        
[17,] "0.53"  "cor"        
[18,] "0.5"   "cort"       
[19,] "0.495" "ar.pic"     
[20,] "0.485" "int.per"    
[21,] "0.49"  "per"        
[22,] "0.52"  "mindist.sax"
[23,] "0.535" "ncd"        
[24,] "0.51"  "pdc"

Come potete vedere euclid non è la soluzione migliore per i prezzi ))

 
mytarmailS:

Ho deciso di confrontare le metriche di prossimità tra loro, che sono più adatte per il riconoscimento dei dati di mercato...

La metrica più comune è "euclidea" , che è usata in quasi il 99% dei casi ed è una specie di standard in MO...

quasi tutti i cluster ci lavorano...

Così 24 metriche sono state confrontate per l'adeguatezza del riconoscimento dei nuovi dati di mercato...

elenco delle metriche e risultato dell'errore

Come potete vedere euclid è tutt'altro che la migliore soluzione per i prezzi ))

Questo se avete solo prezzi d'entrata. E se hai anche il tempo dalla barra 0 a quella in cui stai guardando il prezzo, e se hai anche i volumi (tick/reale) o qualcos'altro. Euclidea, e infatti qualsiasi distanza tra i chip sarà inadeguata. Come si possono uguagliare 5 pip di prezzo, 5 barre di minuti, 5 barre di ore, 5 lotti di volume? Non si può.
E il clusterizzatore li considererà uguali.
 
elibrarius:
Questo è se hai solo prezzi di entrata. E se hai anche il tempo dalla barra 0 a quella in cui stai guardando il prezzo, e se hai anche i volumi (tick/reale) o qualcos'altro. Euclidea, e infatti qualsiasi distanza tra i chip sarà inadeguata. Come si possono uguagliare 5 pip di prezzo, 5 barre di minuti, 5 barre di ore, 5 lotti di volume? Non si può.
E il clusterizzatore li considererà uguali.

Puoi usare la metrica Mahalanobis o qualche tipo di normalizzazione dei dati.

 
Aleksey Nikolayev:

Si potrebbe usare la metrica Mahalanobis o qualche tipo di normalizzazione dei dati.

La normalizzazione cambierà semplicemente le scale. Farà un ellissoide da una palla - se i valori di mah non corrispondono. Con 2 ore e 7 lotti, si pareggiano 5 punti.
In ogni caso sta equiparando il caldo al morbido. Dopo la normalizzazione sarà caldo e soffice).

 
elibrarius:

La normalizzazione cambierà semplicemente le masse. Farà un ellissoide da una palla - se i valori di mah non corrispondono. Con 2 ore e 7 lotti, si pareggiano 5 punti.
In ogni caso sta equiparando il caldo al morbido. Dopo la normalizzazione vi sentirete più caldi e confusi))

A volte puoi usare la loro funzione di distribuzione per le SB per normalizzare lecaratteristiche. Per esempio, le lunghezze del ginocchio a zig zag per gli SB sono distribuite esponenzialmente, ecc. Se la distribuzione non è conosciuta esattamente, può essere approssimata da una simulazione Monte Carlo.

 
elibrarius:

La normalizzazione cambierà semplicemente le masse. La palla farà un ellissoide - se i valori di mah non corrispondono. Con 2 ore e 7 lotti, si pareggiano 5 punti.
In ogni caso sta equiparando il caldo al morbido. Dopo la normalizzazione vi sentirete più caldi e confusi))

Caldo con soffice è voler uguagliare -

elibrarius:
barre a 5 ore e 5 lotti di volume
 
Aleksey Nikolayev:

Si potrebbe usare la metrica Mahalanobis o qualche tipo di normalizzazione dei dati.

Perché tutti i matematici famosi hanno nomi così complicati?

 
segreto:

Perché tutti i matematici famosi hanno nomi così complicati?

Indiano) Ne hanno di più complicati).