Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1856

 
Maxim Dmitrievsky:

você vai ficar surpreso se acertar.

Confusion Matrix and Statistics

          Reference
Prediction   1   2   3
         1 266  72  15
         2  54 130  50
         3  17  55 293

Overall Statistics
                                          
               Accuracy : 0.7237          
                 95% CI : (0.6941, 0.7519)
    No Information Rate : 0.3761          
    P-Value [Acc > NIR] : <2 e-16          
                                      
 
mytarmailS:

Isto é sobre oos? Está bem, mas pode ser mais alto.

 
Maxim Dmitrievsky:

Isto é sobre oos? Está bem, mas pode ser mais alto.

sim oos

com duas classes / clusters funciona melhor

Confusion Matrix and Statistics

          Reference
Prediction   1   2
         1 381  79
         2  67 425
                                         
               Accuracy : 0.8466         
                 95% CI : (0.8222, 0.869)
    No Information Rate : 0.5294         
    P-Value [Acc > NIR] : <2 e-16         
                                         
                  Kappa : 0.6927         
                                    



Dados - duas horas a 5 mins da abertura, difundidos e depois em soma cumulativa

agrupados com kohonen - Dados - filas em 2 horas e 5 minutos

agrupados por Floresta - Dados - filasnos primeiros 5 minutos.

 
mytarmailS:

sim oos

com duas classes / clusters é melhor



Dados - duas horas a 5 mins da abertura, difundidos e depois em soma cumulativa

agrupados com kohonen - Dados - filas em 2 horas e 5 minutos

agrupados por floresta - Dados - filaspara a primeira hora e 5 minutos.

Lá estás tu, e estavas a gritar.

 
Maxim Dmitrievsky:

Lá estás tu, e estavas a gritar.

Como o fizeste a 100%? Quais são os teus sinais?

 
mytarmailS:

Como conseguiu 100%? Que sinais você tem?

na trilha 100, escrevi, em oos 0,84, a mesma coisa (3 clusters)

os sinais são os próprios preços relativos ao primeiro. O vídeo diz tudo desde o minuto 25

A partir daqui, você pode usá-lo sem floresta, basta prever o cluster pelo algoritmo de clustering. A floresta foi usada para facilitar a sua transferência para a metáfora. Em seguida, no testador, podemos executar diferentes estratos em clusters.
 
Maxim Dmitrievsky:

na bandeja 100, escrevi, em oos 0.84, a mesma aproximação (3 clusters)

sinais dos próprios preços em relação ao primeiro. O vídeo diz tudo a partir dos 25 minutos.

Eu posso usá-lo sem floresta, basta prever o agrupamento por algoritmo de agrupamento. A floresta foi usada para facilitar a sua transferência para a metáfora

Ta sim , eu concordo , você pode fazer tudo agrupando .


Kmeans Proclustered , o resultado é melhor que o kohonen em +- 10%.

Kmeans

 Reference
Prediction   1   2   3
         1 106  40   0
         2  53 590  42
         3   1  22  98

Overall Statistics
                                          
               Accuracy : 0.834     

kohonen

Confusion Matrix and Statistics

          Reference
Prediction   1   2   3
         1 266  72  15
         2  54 130  50
         3  17  55 293

Overall Statistics
                                          
               Accuracy : 0.7237     


Mas não está claro como os clusters são distribuídos , a matriz mostra que os algoritmos de cluster vêem de forma bem diferente

 
mytarmailS:

Sim, concordo, podes fazer tudo agrupando...


Kmeans Proclustered , o resultado é melhor que o kohonen em +- 10%.

Kmeans

kohonen


Mas não está claro como os clusters são distribuídos, eu posso ver pela matriz que os algoritmos de cluster vêem de maneira bem diferente

Eu também tenho um kameans. Normalmente é melhor e mais rápido do que outros. Aparentemente, a tarefa é simples.

Misturas Gaussianas experimentadas - é um tiro de dados, é pior. Mas ainda não o tentei para esta tarefa.

Visualize os clusters e as estatísticas sobre eles procure métodos diferentes, entenda qual é o melhor. Eu gosto de kamins para boxplots, em princípio.

 
Maxim Dmitrievsky:

Eu também tenho um Camins. Normalmente é melhor e mais rápido que os outros. Aparentemente, o desafio é simples.

Misturas Gaussianas experimentadas - é uma porcaria, é pior. Mas ainda não tentei uma para esta tarefa.

Visualize os clusters e as estatísticas sobre eles procure métodos diferentes, entenda qual é o melhor. Eu gosto de kamins para boxplots, em princípio.

Eu não gosto de kamins, faz um péssimo equilíbrio.

1    2    3 
 529 3093  378 

"2" é uma flauta

o kohonen é mais engraçado

1    2    3 
1243 1497 1260 
 
mytarmailS:

Eu não gosto de kamins, é um péssimo equilíbrio de classes.

"2" é uma flauta.

kohonen é mais divertido

me mostram fotos de grupos de kamins e kohoos, então não está claro