Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2130

 
Aleksey Vyazmikin:

Já começou o treino sem minutos - vamos ver.

Eu também uso 1/4 bar de tempo - horas, 4 horas, dias.

Em geral, acontece que os modelos de madeira precisam de muitos inputs, que são pré-divididos o máximo possível, ou seja, têm o número mínimo possível de divisões próprias.

 
elibrarius:

Em geral, acontece que os modelos de madeira precisam de muitos insumos que são pré-separados o máximo possível, ou seja, têm o mínimo de divisões próprias possíveis.

Se você mesmo faz a quantificação, então sim, mas há também a automação construída.

Os histogramas acima são apenas o número diferente de quanta por preditor, você pode ver como eles afetam o resultado final.

Se para retirar veias de informação valiosa como quantum separado do preditor, é possível codificar esta veia como um recurso binário e alimentá-la separadamente.

 
elibrarius:

Geralmente acontece que os modelos de madeira precisam ser alimentados com muitos insumos que são pré-divididos o máximo possível, ou seja, ter o número mínimo possível de divisões próprias.

Saldo - T1 com minutos e T2 sem minutos - resultado médio: 3384/3126/3890

Recall - resultado médio: 0,0459/0,0424/0,0458


Precisão - pontuação média: 0,5216/0,5318/0,5389

Em termos das pontuações médias no agregado T2, surgiu o pior cenário possível.

Abri a mesa para o significado dos preditores e fiquei surpreendido



Parece que não gosto das últimas mudanças feitas pelo método de treinamento, talvez eu tenha feito algo errado?

//день недели, час = ввести через 2 предиктора sin и cos угла от полного цикла 360/7,  360/24
   double tmp[4];
   int nInd=0;
   MqlDateTime dts;
   double pi=3.1415926535897932384626433832795;
   for(int buf=0; buf<2; buf++)
   {
      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/1440.0;
      tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;
      tmp[buf]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));

      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf+2]=(double)(dts.day_of_week*1440+dts.hour*60+dts.min)*360.0/10080.0;
      tmp[buf+2]=(double)dts.day_of_week*360.0/7.0;
      tmp[buf+2]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));
   }


Eu abri a amostra



E eu vi que a coluna TimeHG contém horas - erro meu - eu preciso refazer todos os testes.


 
Aleksey Vyazmikin:

Saldo - T1 com minutos e T2 sem minutos - pontuação média: 3384/3126/3890

Recall - pontuação média: 0,0459/0,0424/0,0458


Precisão - pontuação média: 0,5216/0,5318/0,5389

Em termos das pontuações médias no agregado T2, surgiu o pior cenário possível.

Abri a mesa para o significado dos preditores e fiquei surpreendido



Parece que não gosto das últimas mudanças feitas pelo método de treinamento, talvez eu tenha feito algo errado?


Eu abri a amostra



E eu vi que a coluna TimeHG - são horas - meu erro - eu preciso refazer todos os testes.


E as horas que restaram com os minutos.

 tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;

Deveria ser assim

 tmp[buf]=(double)(dts.hour)*360.0/24.0;
TimeHG - aparentemente assumiu tudo, e é por isso que os outros relógios não foram usados.
 
elibrarius:

E o relógio fica com os minutos...

Temos de fazer isto.

ESTÁ BEM.

 

Treino durante 3 meses - puramente para a diversão - treino no início. O calendário completo é 2014-2020.

Se você pegar um período grande, você ganha um modelo medíocre. Ao mesmo tempo, você pode levar diferentes períodos de 3 meses em todo o período.

Aqui, por exemplo, você pode ver o período de treinamento - antes e depois que a dinâmica é positiva.


Futuros atuais

A expectativa do tapete mostra 6,15 em carrapatos reais.

Eu levei um modelo mais novo.


Curiosamente, eles são diferentes e isso dá potencial para combiná-los em um comitê. A expectativa matemática é de 12,64.

Abaixo está um histograma com o saldo estimado, incluindo a amostra de treinamento, dependendo do número da janela de treinamento - quanto maior o número, mais próximo do nosso tempo, lembro que a amostra é de 2014 a outubro de 2020.

Curiosamente, em alguns lugares, os lucros caem para quase metade do valor máximo. O que isto poderia significar - áreas mais ruidosas em treinamento?

 
elibrarius:

E o relógio fica com os minutos...

Deveria ser assim

TimeHG - aparentemente assumiu tudo, e é por isso que o resto do relógio não foi usado.

Saldo - T1 com minutos e T2 sem minutos - resultado médio: 4209,70/2882,50/3889,90


Recall - resultado médio: 0,0479/0,0391/0,0458


Precisão - pontuação média: 0,5318/0,5168/0,5389

Importância dos preditores



Em média, a opção sem minutos (T2) funde-se.

 
Aleksey Vyazmikin:

Saldo - T1 com minutos e T2 sem minutos - pontuação média: 4209,70/2882,50/3889,90


Recall - pontuação média: 0,0479/0,0391/0,0458


Precisão - pontuação média: 0,5318/0,5168/0,5389

Importância dos preditores



Em média, a opção sem minutos (T2) funde-se.

Qual é a conclusão?
Os minutos dão um aumento.
Sobre o que é melhor, não entendo - tempo como seno e coseno ou apenas como dia, hora, números de minutos?
 
elibrarius:
Qual é a conclusão?
Os minutos dão um aumento.
Sobre qual é melhor - tempo como seno e cosseno, ou apenas como dia, hora, números de minutos?

Até agora podemos concluir que T2 é claramente uma opção pior, e que adicionar seno e cosseno não é idêntico ao tempo linear. Penso que os resultados são diferentes devido à representação dos números, nomeadamente a distância entre eles. A distância diferente afeta a formação da grade de agrupamento - daí a discrepância.

 
Aleksey Vyazmikin:

Até agora podemos concluir que T2 é claramente uma opção pior, e que adicionar seno e cosseno não é idêntico ao tempo linear. Penso que os resultados são diferentes devido à representação dos números, nomeadamente a distância entre eles. A distância diferente afeta a formação da grade de agrupamento - daí a discrepância.

Teoricamente - deve ser o mesmo para a árvore.
O número de diferentes escolhas em dias, horas e minutos equivale ao número de escolhas em pecados e cossenos. Tanto lá como lá em 7 dias são 10080 valores diferentes, mudando uma vez por minuto.
Se houver alguma randomização no treinamento, esta pode ser a razão para a diferença.

Você já treinou com o que, catbust?

Para NS, seno e coseno são, naturalmente, melhores, porque 59 e 1 minuto estarão um ao lado do outro, com a representação numérica que estão o mais distante possível. Se você quiser que a árvore a entenda, você terá que fazer algumas divisões extras, que podem ser o que lhe falta em limitações de profundidade.