Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1193

 
Maxim Dmitrievsky:

também no mql5... Mas há um bom testador e uma base aqui :)

Eis a questão, eu próprio estou a girar, cansado de ler tudo quando tenho tempo.

Se o objectivo é vender o produto no Mercado, infelizmente, então tudo está na MQL, se o objectivo é o uso pessoal ou distribuição para além deste fórum, então o problema chega à possibilidade de obter .dll e link para a MT

 
Igor Makanu:

Esse é o problema, eu próprio estou a girar, estou cansado de ler tudo quando tenho tempo.

Eu preciso definir os objetivos - pensamentos em voz alta )))), se o propósito é um produto no Mercado, infelizmente, então tudo na MQL, se o propósito de uso pessoal ou distribuição além deste fórum, então a tarefa se resume à capacidade de obter .dll e link para MT

Eu vou usá-lo como um excelente bot MQL, tudo o resto é lixo. Se você escrever para o mercado, então a promoção é mais importante lá, não o desempenho comercial, além de compradores estúpidos vão estourar sua mente (ter experiência). Eu tenho experiência. Você pode pegar quase qualquer indicador ou consultor especializado da codebase e vendê-lo no Mercado... ou colocar 200 deles como Gribachev, todos os dias um novo, mas este não é o caminho dos samurais.

Você tem que colocar sua esposa ou um escravo contratado no computador para se comunicar com os clientes, mas você não vai perder seu tempo :)
 
Maxim Dmitrievsky:

O objetivo é um ótimo bot no modus operandi, o resto é besteira. Se você escrever para o mercado, a promoção é mais importante lá do que o desempenho comercial, além dos compradores estúpidos vão explodir sua mente (eu tive experiência). Eu não tenho nenhum indicador de código base ou consultor especializado, e eles vão vendê-los no Mercado... Ou você pode colocar 200 deles como Gribachev, todos os dias um novo, mas este não é o caminho do samurai.

Se vai fazer isso, é melhor enviar a sua mulher ou um escravo contratado para comunicar com os compradores, já que não vai perder tempo com isso :)

Eu já previ isso, então não acho necessário "ofegar" e que algo que valha a pena colocar no Mercado - não posso dar suporte ao produto, porque vai demorar muito tempo, e coisas armazenadas lá, com a esperança de que haja um peeple que queira dar 30 dólares, como a consciência não permite))))

ZS: Grades de ordens por um simples indicador... Funciona para sempre, para sempre (para cima ou para baixo), e é sempre procurado pelos utilizadores ))))

 
Igor Makanu:

Já o previ, por isso acho que não é necessário "ofegar" e colocar algo que valha a pena no mercado - não vou poder suportar o produto, porque vai demorar muito tempo, e coisas lá armazenadas, na esperança de encontrar um peeple que queira doar 30 dólares, não permito))))

ZS: Grades de ordens por um simples indicador... Funcionará sempre (para cima ou para baixo) e é sempre procurada pelos utilizadores ))))

Martins, grelhas sim ... totós de todos os tipos, é eterno :)

 

Veio-me à mente uma ideia - determinar o sobretreinamento por meio de MO. Eu continuo cavando catbust, lá você pode obter uma previsão em termos probabilísticos - eu tenho espalhado em grupos de 0 a 9 probabilidades - para facilidade de percepção e análise posterior - olhou distribuições, desvio padrão, curtose, assimetria, incluindo uma quebra por alvo e distribuição de erro, a correção das respostas em cada grupo. Agora vou puxar diferentes indicadores padrão para avaliar o modelo, como AUC F1 e outros, lá você pode ver a dinâmica de aprendizagem, mas até agora eu não sei como descrevê-lo melhor.

Há dois modelos no gráfico - grupo de distribuição * grupo de classificação correto. O modelo azul é melhor na amostra do exame.


Em que outros preditores você pode pensar para avaliar o modelo?

 
Aleksey Vyazmikin:

Veio-me à mente uma ideia - determinar o sobretreinamento por meio de MO . Eu continuo cavando catbust, lá você pode obter uma previsão em termos probabilísticos - eu tenho espalhado em grupos de 0 a 9 probabilidades - para facilidade de percepção e análise posterior - olhou distribuições, desvio padrão, curtose, assimetria, incluindo uma quebra por alvo e distribuição de erro, a correção das respostas em cada grupo. Agora vou puxar diferentes indicadores padrão para avaliar o modelo, como AUC F1 e outros, lá você pode ver a dinâmica de aprendizagem, mas até agora eu não sei como descrevê-lo melhor.

Há dois modelos no gráfico - grupo de distribuição * grupo de classificação correto. O modelo azul é melhor na amostra do exame.


Em que outros preditores você pode pensar para avaliar o modelo?

Fixe, na verdade é isso que todos estão a fazer.

As métricas são usadas para estimar o modelo, não os preditores, os padrões geralmente são suficientes, mas você pode fazer a sua própria

Normalmente, quanto maior o erro na floresta menor a dispersão (dispersão) de valores, ou seja, apenas ruído branco em torno de 0,5, nesse sentido a linha azul é pior do que a linha vermelha.
 
Maxim Dmitrievsky:

Óptimo, na verdade é o que todos fazem.

As métricas são usadas para estimar um modelo, não os preditores, os padrões geralmente são suficientes, mas você pode fazer o seu próprio modelo.

geralmente quanto maior o erro na floresta menor a dispersão (dispersão) de valores, ou seja, apenas ruído branco em torno de 0,5, neste sentido a linha azul é pior do que a vermelha

Ha, então trata-se de encontrar um critério de estimativa, não apenas de estimar com diferentes fórmulas de cálculo! Todas estas abordagens com fórmulas avaliam o modelo estacionário, mas não dizem sobre sua capacidade de continuar trabalhando mais, e é exatamente isso que eu quero alcançar, é por isso que eu crio preditores, para que seja possível encontrar um padrão a partir de um conjunto de indicadores diferentes com a ajuda do MO.

Sobre a dispersão - afirmação muito estranha que você fez, talvez só leve em conta o fato de encontrar valores sem levar em conta seu valor de classificação e porcentagem de respostas corretas. No gráfico de zero a 5 no eixo x é o produto de um conjunto de zeros e sua correta classificação, e a partir de 5 oposto é o produto de unidades.

Aqui está um gráfico destes modelos, mas mostra a distribuição do alvo "1".

como pode ver, o modelo vermelho tem uma percentagem de distribuição deslocada para além de 5, o que significa que "os" não têm hipótese de ser classificados correctamente, e os que têm hipótese são menos do que o modelo azul - 23% e 28%, respectivamente.

E aqui está como a fidelidade da classificação muda

Claro que também é possível usar um modelo achatado, mas é necessário mudar a divisão de classificação de 0,5 para 0,7, por exemplo, mas não há muito material para processamento, mas por outro lado, tais modelos achatados podem ser combinados...

 
Aleksey Vyazmikin:

Ha, então trata-se de encontrar um critério de estimativa, não apenas de estimar com diferentes fórmulas de cálculo! Todas estas abordagens de fórmula avaliam o modelo estacionário, mas não nos dizem sobre sua capacidade de continuar trabalhando, que é exatamente o que eu quero alcançar, e é por isso que eu crio preditores, para que eu possa encontrar um padrão a partir de um conjunto de indicadores diferentes por meio de MO.

Sobre a dispersão - afirmação muito estranha que você fez, talvez só leve em conta o fato de encontrar valores sem levar em conta seu valor de classificação e porcentagem de respostas corretas. No gráfico de zero a 5 no eixo x é o produto de um agrupamento de zeros e sua correta classificação, e a partir de 5 oposto é o produto de unidades.

Aqui está um gráfico destes modelos, mas mostra a distribuição do alvo "1".

como pode ver, o modelo vermelho tem uma percentagem de distribuição deslocada para além de 5, o que significa que "os" não têm qualquer hipótese de classificação correcta, e aqueles que têm uma hipótese são inferiores ao modelo azul - 23% e 28%, respectivamente.

E aqui está como a fidelidade da classificação muda

Claro que também podemos usar um modelo achatado, mas é necessário mudar a divisão de classificação de 0,5 para 0,7, por exemplo, mas não sobra muito material para processamento, mas por outro lado, tais modelos achatados podem ser combinados...

o facto de ser tendencioso só fala a favor de alguma classe, pode ser num mercado de tendências, ou seja, uma amostra de aprendizagem (aproximadamente).

E se você pegar o azul você tem uma diminuição acentuada das probabilidades, ou seja, se, idealmente, a probabilidade de sinal deve ser 1, então você tem no máximo 0,6-0,7, ou seja, ambas as classes giram em torno de 0,5, com pequenos desvios para uma ou outra classe, na verdade, há ruído e não sinais, ou o modelo é fortemente regularizado

capacidade de continuar trabalhando em uma amostra de teste por erros... se você conseguir chegar perto dos erros em uma bandeja, o modelo é bom como regra

 
Maxim Dmitrievsky:

o facto de ser tendencioso fala simplesmente a favor de alguma classe, poderia ser num mercado de tendências, ou seja, uma amostra de formação (aproximadamente).

Estamos comparando o modelo nas mesmas condições, aqui estão os mesmos modelos em outras unidades alvo de dados enquadrados na classificação 1 - 35% vs. 39%.

fidelidade de classificação

e como o conjunto de todos os valores está mais próximo do centro, obtemos o produto

Maxim Dmitrievsky:

E se você tomar azul você obtém uma diminuição acentuada das probabilidades, ou seja, se, idealmente, a probabilidade de sinal deve ser 1, então você tem no máximo 0,6-0,7, ou seja, ambas as classes giram em torno de 0,5, com pequenos desvios para uma ou outra classe, na verdade há ruído mas não sinais

capacidade de continuar trabalhando em uma amostra de teste de erros... se você conseguir chegar perto dos erros em uma bandeja, então o modelo é bom, como regra

Por que essa probabilidade deve ser "1" - ao contrário, é excesso de confiança, pelo contrário, acho que no modelo correto (ideal) deve ter duas lombadas entre 0,1 e 0,3 e 0,7 e 0,9 - porque indicará estabilidade e adequação, mas tais modelos ainda não são observados de fato.

Sobre a aproximação dos valores dos coeficientes estimados - sim, concordo - vou olhar para o delta e fazer mais algumas medições sobre a dinâmica - no catbust você pode ver como os valores mudam quando as árvores são adicionadas ao modelo.
 
Aleksey Vyazmikin:

Comparamos o modelo sob as mesmas condições, aqui estão os mesmos modelos em outras unidades de dados alvo enquadrados na classificação 1 - 35% vs. 39%.

fidelidade de classificação

e como a acumulação de todos os valores está mais próxima do centro, obtemos o produto

Porque é que esta probabilidade deveria ser "1" - é antes complacência, na verdade penso que um modelo adequado (ideal) deveria ter duas lombadas entre 0.2 e 0.4 e 0.7 e 0.9 - isto indicaria estabilidade e adequação, mas ainda não vejo tais modelos na prática.

Sobre a aproximação dos valores dos coeficientes estimados - sim, concordo - vou olhar para o delta e fazer mais algumas medições sobre a dinâmica - no catbust você pode ver como os indicadores mudam quando as árvores são adicionadas ao modelo.

quanto maior for a probabilidade do evento, mais preciso é o sinal, ele vem até da definição :) 2 não haverá nenhuma corcunda nos dados ruidosos, e pelo menos porque haverá estados transitórios, mas o modelo deve pelo menos capturar os valores extremos até certo ponto, caso contrário, nunca é certo sobre os inputs