Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2066

 
Aleksey Vyazmikin:

Eu não sei como explicar :)

Eu assumi esta função.

Experimente XOR
 
Aleksey Nikolayev:

A busca de padrões intraday é dificultada por flutuações de volatilidade intraday. Precisamos de nos livrar deles de alguma forma. Possíveis maneiras:

1) Reajuste dos incrementos para contabilizar a volatilidade intradiária.

2) Mudar para um novo tempo intradiário, em que a variância cresce uniformemente.

3) Uso de um padrão em ziguezague. Os valores dos joelhos não dependem das flutuações da volatilidade. O topo do tempo, naturalmente, depende da volatilidade (são mais frequentes onde ela é alta), mas quando se passa para um tempo uniforme estes clusters desaparecem.

O ponto 1 é suficiente? Ou 2 também tem que ser? O que é isso? Explique.
 
elibrarius:
O que é uma pré-análise? Você insere modelos e compara - com e sem esta funcionalidade.

Análise de dados por meio de um matstat, e em um sentido mais restrito, para encontrar diferenças úteis entre preço e SB. A principal diferença com MO é que os modelos são formulados explicitamente e com um pequeno conjunto de parâmetros.

 
elibrarius:
Experimente XOR

Vou tentar outras, talvez mais tarde. Em geral acho que devemos fazer clustering e puxar de clusters semelhantes um fio de cada vez, caso contrário a qualidade da aprendizagem cai de qualquer maneira.

 
elibrarius:
O ponto 1 é suficiente? Ou 2 também tem que ser? O que é isso? Explique.

Talvez seja mais fácil de explicar através de um exemplo de aplicação.

O ponto 1) é um teste à hipótese de flutuações diurnas de persistência-antiperpersividade. É uma verificação de tendência de preço para continuar ou vice-versa - para mudar a sua direcção dependendo da hora do dia. Para isso você precisa saber a correlação.

Pontos 2) e 3) - testar a hipótese de que a inversão de preços "acontece a cada hora" e é melhor fazê-lo na hora "certa".

Ponto 3) - procura dos momentos planos (trendy) da hora do dia através do estudo da distribuição empírica dos comprimentos em ziguezague.

 
Aleksey Nikolayev:

Talvez seja mais fácil de explicar através de um exemplo de aplicação.

ponto 1) - testar a hipótese de flutuações diurnas de persistência-antipersividade. É uma verificação da propensão do preço para continuar ou vice-versa - para mudar sua direção dependendo da hora do dia. Para isso você precisa saber a correlação.

Pontos 2) e 3) - testar a hipótese de que a inversão de preços "acontece a cada hora" e é melhor fazê-lo na hora "certa".

Ponto 3) - procura dos momentos planos (tendência) da hora do dia através do estudo da distribuição empírica dos comprimentos em ziguezague.

Em alguns meses há uma referência apenas ao dia do mês ou também ao dia da semana. Por código apenas para o tempo dentro do período estudado.

 
Aleksey Vyazmikin:

Vou tentar outras, talvez mais tarde. Em geral, eu acho que é necessário fazer clustering e puxar uma linha cada um de clusters similares, caso contrário a qualidade da aprendizagem cai de qualquer maneira.

Cada folha da árvore é um cacho. E não apenas em termos de número de características, mas também em termos da melhor separação de classes
 
elibrarius:
Cada folha da árvore é um cacho. E não apenas em termos de número de características, mas também em termos da melhor separação de classes

Isto é correto, mas se você remover essas cordas, que já estão muito nas folhas, haverá um pouco menos (classe "0"), e a qualidade não deve cair, enquanto os indicadores relativos para "1" serão mais, e assim o modelo será capaz de contabilizar essas opções de folhas na busca, o que anteriormente não era feito estatisticamente corretamente.

Outra opção é remover folhas únicas, o que pode interferir na aprendizagem.

 
Valeriy Yastremskiy:

Em alguns meses, a referência é apenas ao dia do mês ou também ao dia da semana. Por código, apenas o tempo dentro do período em estudo.

Por períodos superiores a um dia, há o problema de separar a influência do fundo das notícias da periodicidade. Eu não entendo bem como se pode resolver isso.

 
Aleksey Nikolayev:

Por períodos superiores a um dia, há o problema de separar a influência do fundo das notícias da periodicidade. Não vejo realmente como pode ser resolvido.

Eu entendo sobre o dia, concordo. A questão é sobre o dia da semana. O tempo dentro do período médio, dias, não está ligado ao dia da semana inicialmente. Inicialmente é possível fazer uma ligação ao dia da semana para detectar a repetibilidade intra-semanal, tendo em conta a hora do dia. Você tem uma ligação apenas com a hora do dia do mês.