Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2405

 
Maxim Dmitrievsky:

A idéia é geralmente correta, mas não requer necessariamente treinamento on-line na vida real, só pode ser feita durante a fase de treinamento/reformação básica e depois utilizada como está

Bem, sim, faz sentido que não haja cálculos pesados quando se negoceia.

 
High-Frequency Financial Trading on FOREX with MDFA and R: An Example with the Japanese Yen
High-Frequency Financial Trading on FOREX with MDFA and R: An Example with the Japanese Yen
  • 2013.02.19
  • Christian Dallas Blakely
  • imetricablog.com
In my previous article on high-frequency trading in iMetrica on the FOREX/GLOBEX, I introduced some robust signal extraction strategies in iMetrica using the multidimensional direct filter approach (MDFA) to generate high-performance signals for trading on the foreign exchange and Futures market. In this article I take a brief leave-of-absence...
 

Decidi comparar as métricas de proximidade umas com as outras, que são mais adequadas para o reconhecimento dos dados do mercado...

A métrica mais comum é "Euclidiano" , que é usado em quase 99% dos casos e é algo de padrão no MO...

quase todos os clusters trabalham nele...

Assim, foram comparadas 24 métricas para adequação do reconhecimento de novos dados de mercado...

lista de métricas e resultado de erros

 [1,] "0.51"  "euclidean"  
 [2,] "0.525" "manhattan"  
 [3,] "0.51"  "minkowski"  
 [4,] "0.545" "infnorm"    
 [5,] "0.505" "ccor"       
 [6,] "0.565" "sts"        
 [7,] "0.51"  "dtw"        
 [8,] "0.52"  "edr"        
 [9,] "0.55"  "erp"        
[10,] "0.51"  "lcss"       
[11,] "0.535" "fourier"    
[12,] "0.46"  "tquest"     
[13,] "0.525" "acf"        
[14,] "0.52"  "pacf"       
[15,] "0.525" "cdm"        
[16,] "0.53"  "cid"        
[17,] "0.53"  "cor"        
[18,] "0.5"   "cort"       
[19,] "0.495" "ar.pic"     
[20,] "0.485" "int.per"    
[21,] "0.49"  "per"        
[22,] "0.52"  "mindist.sax"
[23,] "0.535" "ncd"        
[24,] "0.51"  "pdc"

Como você pode ver euclid não é a melhor solução para os preços ))

 
mytarmailS:

Decidi comparar métricas de proximidade umas com as outras, que são as mais adequadas para o reconhecimento dos dados do mercado...

A métrica mais comum é "Euclidiano" , que é usado em quase 99% dos casos e é algo de padrão no MO...

quase todos os clusters trabalham nele...

Assim, foram comparadas 24 métricas para adequação do reconhecimento de novos dados de mercado...

lista de métricas e resultado de erros

Como você pode ver euclid está longe de ser a melhor solução para os preços ))

Isto se você só tiver preços de entrada. E se você também tem tempo de 0 bar até aquele em que você está olhando para o preço, e se você também tem volumes (tick/real) ou algo mais. Euclidiano, e na verdade qualquer distância entre os chips será inadequada. Como se pode equalizar 5 pips de preço, 5 barras de 5 minutos, 5 barras horárias, 5 lotes de volume? Não podes.
E o clusterizador vai considerá-los iguais.
 
elibrarius:
Isto se você só tiver preços de entrada. E se você também tiver tempo de 0 bar até aquele onde você está olhando para o preço, e se você também tiver volumes (tick/real) ou algo mais. Euclidiano, e na verdade qualquer distância entre os chips será inadequada. Como se pode equalizar 5 pips de preço, 5 barras de 5 minutos, 5 barras horárias, 5 lotes de volume? Não podes.
E o clusterizador vai considerá-los iguais.

Você pode usar a métrica Mahalanobis ou algum tipo de normalização de dados.

 
Aleksey Nikolayev:

Você poderia usar a métrica Mahalanobis ou algum tipo de normalização de dados.

A normalização irá simplesmente alterar as escalas. Fará uma elipsóide de uma bola - se os valores mah não corresponderem. Você vai igualar 5 pts com 2 horas e 7 lotes.
Seja como for, está a igualar calor a suavidade. Após a normalização, será quente e fofo).

 
elibrarius:

A normalização irá simplesmente mudar as massas. A bola fará uma elipsóide - se os valores mah não corresponderem. Você vai igualar 5 pts com 2 horas e 7 lotes.
Seja como for, está a igualar calor a suavidade. Após a normalização você vai ficar quente e felpudo))

Às vezes é possível utilizar sua função de distribuição para as SBs para normalizaras características. Por exemplo, os comprimentos em ziguezague do joelho para os SBs são distribuídos exponencialmente, etc. Se a distribuição não for conhecida exatamente, ela pode ser aproximada por uma simulação Monte Carlo.

 
elibrarius:

A normalização irá simplesmente mudar as massas. A bola fará uma elipsóide - se os valores mah não corresponderem. Você vai igualar 5 pts com 2 horas e 7 lotes.
Seja como for, está a igualar calor a suavidade. Após a normalização você vai ficar quente e felpudo))

Quente com fofo é querer igualar -

elibrarius:
5 barras de 5 horas e 5 lotes de volume
 
Aleksey Nikolayev:

Você poderia usar a métrica Mahalanobis ou algum tipo de normalização de dados.

Porque é que todos os matemáticos famosos têm nomes tão complicados?

 
segredo:

Porque é que todos os matemáticos famosos têm nomes tão complicados?

Índio) Eles têm mais complicados).