Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1534

 
Aleksey Vyazmikin:

Indicadores da amostra em que a formação foi realizada.

E quanto à amostra fora do treino? Nos próximos seis meses, por exemplo?

 
Maxim Dmitrievsky:

Então você tem um logloss de ~1, o que significa que o modelo está totalmente assustado com o que está a acontecer.

Estou cego, onde está a perda de logloss negativo? Eu especifiquei um logloss para o modelo inteiro.

Maxim Dmitrievsky:

Você quer encontrar um logloss separado para uma entrada individual? Ou seja, a quantidade de informação entre os valores da folha e os valores-alvo?

Eu não tenho certeza se logloss é a coisa certa, eu quero encontrar informações de qualidade e logloss está procurando a quantidade de todo o modelo, talvez a quantidade também serve - eu não sei. Alguma ideia de como fazer isto?

Maxim Dmitrievsky:

A classe "não faça nada" é claramente desequilibrada em relação às outras, que é o que escrevi acima que pode ser um problema por causa do modelo de 3 classes. O resto dos indicadores são deprimentes.

Sim, desequilibrado, mas o que se pode fazer... É claro que você poderia fazer duas amostras - dividindo a amostra em vetores, mas novamente algumas das informações que poderiam ser úteis seriam perdidas. Em geral, concordo que a amostra não é equilibrada, mas não sei como fazê-lo sem perder informações. Eu tentei duplicar linhas com um pequeno número de alvos, mas o efeito é negativo.

 
Aleksey Vyazmikin:

Eu sou cego, onde está a perda de logloss negativo? Eu especifiquei um logloss para todo o modelo.

Eu não tenho certeza do que é logloss, eu quero encontrar informações de qualidade, e logloss está procurando a quantidade de todo o modelo, talvez a quantidade também serve - eu não sei. Alguma ideia de como o fazer?

Sim, não é equilibrado, mas o que se pode fazer... É claro que você poderia fazer duas amostras - dividir a amostra em vetores, mas novamente, algumas das informações que poderiam ser úteis seriam perdidas. Em geral, concordo que a amostra não é equilibrada, mas não sei como fazê-lo sem perder informações. Eu tentei duplicar linhas com um pequeno número de alvos - o efeito é negativo.

Não é negativo, mas tende a um, ou seja, máximo. Deve tender para zero.

logloss mostra quão bem as suas características se correlacionam com o alvo, ou seja, 0 é uma correlação completa, ou seja, descrevem bem o alvo. 1 não é nenhuma descrição, ou seja, são completamente não-informativas. Este é um bom indicador no sentido em que nos diz se existe alguma correlação. Não estás a ter nenhuma correlação.

Não sei, faz com que seja uma aula normal de 2 e não de 3.

 
elibrarius:

E numa amostra fora do treino, o quê? Nos próximos seis meses, por exemplo?

E a amostragem fora do treino, por assim dizer... Não, treinado por volta de 1 de março de 2019, decidiu que eu deveria usar todas as informações a partir de 2014.

Mas, decidi ver por mim mesmo o que estas árvores dão, meti-a na EA e fiz três passes com três árvores diferentes de 1 de Março de 2019 a 15 de Setembro de 2019.

1. Primeira etapa dividida


2. Vigésima etapa dividida


3. Quadragésimo oitavo passo da divisão

E, em geral, eu mesmo me surpreendo que os três modelos tenham resultados positivos!

Curiosamente, o 2º modelo é mais suave, enquanto o 3º modelo já está a lutar para rastejar para o lado positivo.

Curiosamente, a precisão dos modelos não se deteriorou muito, e às vezes até melhorou. Abaixo está uma tabela que mostra as mudanças percentuais em relação à amostra de treinamento


Não posso dizer sobre completude e logloss - você tem que pegar os indicadores e fazer a amostragem.

E, sim, a maioria dos modelos vai dar um loop quando treinar a zero, pois há realmente uma preponderância dessa classe em relação às outras duas, e depois os zeros são mais fáceis de encontrar - isso é o que estraga tudo.

 
Maxim Dmitrievsky:

não é negativo, mas tende para um, ou seja, máximo. Deve tender para zero.

O logloss mostra o quanto suas características se correlacionam com o alvo, ou seja, 0 é uma correlação completa, ou seja, eles descrevem bem o alvo. 1 não é nenhuma descrição, ou seja, são completamente não-informativas. Este é um bom indicador no sentido em que nos diz se existe alguma correlação. Não estás a ter nenhuma correlação.

Não sei, faz com que seja uma nota normal 2 em vez de uma nota 3.

Não tenho a certeza se Logloss em multiclasse é uma... Em geral, não consigo descobrir como implementar a fórmula eu mesmo - não entendo estas cifras de fontes públicas. E eu gostaria de ver Logloss não o último, mas para toda a amostra, como ele muda e onde ele fica. E como eu entendi, é mais correcto com uma amostra equilibrada...

 
Aleksey Vyazmikin:

Não tenho a certeza se Logloss para multiclassificação é igual a um... Em geral, eu não consigo entender como implementar a fórmula - não entendo estas cifras de fontes públicas. E eu gostaria de ver Logloss não o último, mas para toda a amostra, como ele muda e onde ele fica. E, tanto quanto sei, está correcto numa amostra mais equilibrada...

Eu não quero atormentar os nossos cérebros... grandes empresas como a Yandex estão a fazer coisas. Eles dizem: faz isto e ficarás bem. Fá-lo e não o faças por tua conta. Vai afogar-se em retórica e abordagens diferentes.

Mostra a mudança ao longo do declive, construindo árvores.
 
Aleksey Vyazmikin:

E a amostragem fora do treino é uma espécie de "não"... Não, treinado por volta de 1 de março de 2019, decidiu que eu deveria usar todas as informações a partir de 2014.

Mas, decidi ver com os meus próprios olhos o que estas árvores dão, enfiei-a na EA e fiz três passes com três árvores diferentes de 1 de Março de 2019 a 15 de Setembro de 2019.

1. Primeira etapa dividida


2. Vigésima etapa dividida


3. Quadragésimo oitavo passo da divisão

E, em geral, eu mesmo me surpreendo que os três modelos tenham resultados positivos!

Curiosamente, o 2º modelo é mais suave, enquanto o 3º modelo já está a lutar para rastejar para o lado positivo.

Curiosamente, a precisão dos modelos não se deteriorou muito, e às vezes até melhorou. Abaixo está uma tabela que mostra as mudanças percentuais em relação à amostra de treinamento


Não posso dizer sobre completude e logloss - você tem que atirar nos indicadores e fazer a amostragem.

E, sim, a maioria dos modelos vai fazer um loop quando treinar a zero, pois há realmente uma preponderância desta classe em relação às outras duas, e depois os zeros são mais fáceis de encontrar - isto é o que estraga tudo.

Nada mal! Aumente o volume e algo já pode ser ganho)
 
Maxim Dmitrievsky:

Isto é o que eu recebo. Apenas moveu toda a lógica bot para python, floresta substituída por impulso. Não consigo encontrar o erro, parece que não espreita. Dependendo das configurações, as acuras podem ser aumentadas até 0,7-0,8, enquanto reduz o número de negociações.

Para o andaime o intervalo de erro é praticamente o mesmo, mas não é acuras, é erro de classificação. E comporta-se de forma semelhante em trayne, ainda melhor. Mas é muito pior no teste.

de aprendizagem:

A aprendizagem é 10 vezes maior


O que está à porta? Preços puros?
 
elibrarius:
O que vem a caminho? Preços puros?

acréscimos

Vou terminar o conector este fim-de-semana e pô-lo à prova. Eu planejo carregar o modelo para a nuvem e recuperar sinais do terminal. Estou a planear colocar o modelo na nuvem e recuperar os sinais do terminal. Posso enviar-lhe o cliente no MT5
 

Uma abordagem simples e interessante sobre como descrever padrões para o MoD

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

A simple algorithm to detect complex chart patterns
A simple algorithm to detect complex chart patterns
  • Kahler Philipp
  • www.quanttrader.com
Finding complex chart patterns has never been an easy task. This article will give you a simple indicator for complex chart pattern recognition. You will have the freedom to detect any pattern with any pattern length. Not just 2-bar candlestick formations, but complex stuff like V-Tops spread over 20 bars. Defining a chart pattern I am using a...