Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2067

 
Aleksey Vyazmikin:

Isto é correto, mas se você remover aquelas linhas que já são abundantes em folhas, haverá um pouco menos delas (classe "0"), e a qualidade não deve cair, enquanto os valores relativos para "1" se tornarão maiores, e assim o modelo será capaz de contabilizar essas variantes de folhas na busca, que anteriormente não era estatisticamente correta.

Outra opção é remover folhas únicas, pois elas podem interferir na aprendizagem.

Se existem muitas linhas semelhantes, isso significa que a situação se repete com frequência. Se você removê-los, por exemplo classe 0, e começar a ativar uma folha com classe 1 em um comércio de corrida, então se o padrão não mudar, então você terá novamente um lote de 0's em vez do previsto 1. E sofrer perdas. Você precisa disso?

MO só pode prever no pressuposto de que o padrão se manterá e agirá como no passado. Ao remover padrões do treinamento, você receberá

 
Aleksey Nikolayev:

Talvez seja mais fácil de explicar através de um exemplo de aplicação.

ponto 1) - testar a hipótese de flutuações diurnas de persistência-antipersividade. É uma verificação da propensão do preço para continuar ou vice-versa - para mudar sua direção dependendo da hora do dia. Para isso você precisa saber a correlação.

Pontos 2) e 3) - testar a hipótese de que a inversão de preços "acontece a cada hora" e é melhor fazê-lo na hora "certa".

Ponto 3) - procura dos momentos planos (trendy) da hora do dia através do estudo da distribuição empírica dos comprimentos em ziguezague.

1) Correlação entre o quê e o quê?

 
Valeriy Yastremskiy:

Eu entendo sobre o dia, concordo. A questão é sobre o dia da semana. O tempo dentro do período médio, dias, não está inicialmente ligado ao dia da semana. Você pode detectar a repetibilidade intra-semanal, levando em conta a hora do dia, inicialmente amarrando-a ao dia da semana. Você tem uma ligação apenas com a hora do dia do mês.

Claro que poderíamos fazer uma analogia com os minutos intradiários (por exemplo) com períodos de cinco minutos dentro de uma semana, mas depois temos de separar a periodicidade puramente semanal da periodicidade herdada da periodicidade diária, bem como dos efeitos noticiosos e de outras não-estacionalidades. De qualquer forma, não tenho tanta certeza se a sazonalidade semanal é tão pronunciada.

 
elibrarius:

1) Correlação entre o quê e o quê?

Incrementos adjacentes.

 
Aleksey Nikolayev:

Poderíamos, naturalmente, fazer uma analogia com os minutos intradiários (por exemplo) com períodos intra-semanais de cinco minutos, mas depois teríamos de separar a periodicidade puramente semanal da periodicidade diária herdada, bem como dos efeitos noticiosos e de outras não-estacionalidades. De qualquer forma, não tenho tanta certeza sobre a mesma sazonalidade semanal pronunciada.

Aparentemente, estou a ser obtuso. Eu não considero a média semanal. Como obter a resposta, um evento periódico todos os dias às 9 horas, ou a cada terceiro, quinto e décimo dia do mês, ou todas as quartas-feiras às 9 horas?

 
Valeriy Yastremskiy:

Aparentemente, estou a ser obtuso. Eu não considero a média semanal. Como se obtém a resposta, um evento recorrente todos os dias às 9h, ou a cada terceiro, quinto e décimo dia do mês, ou todas as quartas-feiras às 9h?

Acho que te entendi e escrevi no espírito que um evento que se repete todos os dias às 9 da manhã também seria um evento que se repete todas as quartas-feiras às 9 da manhã. Seria bastante difícil isolar aqueles eventos que têm um período REALMENTE SEMANAL (mas não diurno) por causa da periodicidade diurna muito brilhante. É claro que posso estar errado, mas ainda não notei uma periodicidade semanal clara, por isso não há como detectá-la no meu código.

 
elibrarius:

Se existem muitas filas semelhantes, então a situação repete-se frequentemente. Se você jogá-los fora, por exemplo, classe 0, e começar a ativar uma folha com classe 1 em um comício, se os padrões não mudarem, você receberá novamente muitos 0's em vez dos 1's previstos. E sofrer perdas. Você precisa disso?

MO só pode prever no pressuposto de que o padrão se manterá e agirá como no passado. Ao remover padrões do treinamento, você terá

Existem estratégias, estratégias de tendência que ganham bem com 40% de precisão, mas os métodos MO padrão não permitem treiná-los, descartando a classe "1" para zero se a precisão não for suficiente, e eu só preciso de tais divisões para separar e melhorar, então eu estou procurando por tais métodos. Caso contrário, a recordação é muito pequena à 1.

 
Aleksey Nikolayev:

A busca de padrões intraday é dificultada por flutuações de volatilidade intraday. Precisamos de nos livrar deles de alguma forma. Possíveis maneiras:

1) Reajuste dos incrementos para contabilizar a volatilidade intradiária.

2) Mudar para um novo tempo intradiário, em que a variância cresce uniformemente.

3) Uso de um padrão em ziguezague. Os valores dos joelhos não dependem das flutuações da volatilidade. Os melhores tempos dependem naturalmente da volatilidade (são mais frequentes onde a volatilidade é alta), mas quando se passa para um tempo uniforme estes clusters desaparecem.

isso é em teoria... mas na prática, não importa como se torce os óculos... )

Eu normalizei para volatilidade de incrementos, dispersão equalizada. Eu só perdi informações.

 
Aleksey Vyazmikin:

Existem estratégias, estratégias de tendência que ganham bem com 40% de precisão, mas os métodos padrão de MO não permitem treiná-los, eu deixo a classe "1" para zero se a precisão não for suficiente, e eu só preciso separar e melhorar essas divisões, então eu estou procurando por tais métodos. Caso contrário a Recall é muito pequena a 1.

Se é uma tendência, TP é grande, mas SL é pequeno. Por exemplo, 500 a 100. Então em caso de 80% de erro haverá 20% de sucesso e 80% de perda de negócios. O saldo será quase zero. Se você trocar as folhas com um erro de 70%, você já estará em lucro. E se você encontrar 50/50, o lucro será enorme.


O que queres dizer com "despejado"? 70% dos erros parece que só é largado para a classe 0, você já pode ganhar dinheiro com os restantes 30% da classe 1.

 
Aleksey Vyazmikin:

Maxim, tenho uma suspeita de que o modelo para C++ não está correctamente descarregado do CatBoost - pode comparar com o modelo para python?

Tenho uma discrepância entre os valores de interpretação do modelo em MQL5 onde os valores são retirados do modelo CPP e os valores do modelo binário. O delta é por volta de 0,15 - o que é muito.

A pitão é cpp em um invólucro. Tudo funciona bem.

Quer dizer, pode ser guardado tanto em formato python como em cpp. Guardo-o em cpp e depois converto-o para mql com acções simples, porque o modelo em si é várias matrizes.