Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 426

 
Ivan Negreshniy:

Você está certo, prevendo que o indicador é redundante. Mas a previsão do preço também é redundante, porque o objetivo da estratégia comercial não é o preço, mas o lucro.

Seguindo esta lógica, devemos modelar não indicadores e não gráficos de preços, mas o comportamento do trader, e a melhor função alvo seria a de indicadores de sua negociação lucrativa.

Na prática, você deve pegar o histórico de negociação ou executar o Expert Advisor no Strategy Tester e ensinar o modelo com padrões de preços como um input e transações como um output.

Então o "lucro" é o retorno (rentabilidade, retorno), ou seja, o aumento do preço normalizado pelo seuvalor absoluto, e este é o notório indicador do "Momentum", conhecendo o futuro Momentum, você é o governante do universo.

 
Maxim Dmitrievsky:

E o que está sendo discutido aqui agora é algum tipo de aplicação do jardim de infância em ziguezague ou não, que diferença faz se a própria abordagem de previsão estiver errada desde o início (ou seja, não vai levar ao sucesso) :)

Está certo, a questão está nos detalhes, não seja muito precipitado. E esta "infantilidade" não diz respeito apenas ao ziguezague, é uma verdadeira armadilha...

 
Aliosha:

Não me atrevo a fazê-lo, nem na tua atitude nem na de mais ninguém. Você não está sozinho na sua ilusão.

Há muito sentido no que você escreveu, o artigo é ótimo, eu o digo sinceramente, breve e conciso. Mas há um pequeno defeito, e já o apontei, já que eu próprio me iludi da mesma maneira durante muito tempo.


Deixa-me tentar explicar a minha posição mais uma vez.


O artigo que você mencionou é material promocional para a aprendizagem de máquinas: ele mostra que o conceito de aprendizagem de máquinas inclui não apenas modelos, mas também a preparação de dados para o modelo e a avaliação do modelo. Também mostra que qualquer pessoa interessada na aprendizagem de máquinas pode tentar tudo com o mínimo esforço.


Os meus pensamentos não estão de todo no artigo. É um anúncio.


Meu pensamento sobre este tópico e outros tópicos do fórum é que o principal, básico na aprendizagem de máquinas NÃO é o modelo, a lógica de que"os preditores são relevantes para a variável alvo".

É "relevante", não o alvo em si ou um conjunto específico de preditores. Dito isto, eu coloco meu próprio significado no sentido de "ter uma relação", diferente do definido pela "importância dos preditores".

Eu nunca anunciei ou justifiquei o uso de ZZ em nenhum lugar: eu simplesmente o usei em meus exemplos como o mais proeminente dos preditores. Eu também indiquei que para o meu próprio conjunto de preditores eu recebo menos de 30% de erro de previsão - não é um mau resultado, devo dizer.

Mas mais uma vez: este resultado é obtido porque sou capaz de filtrar os preditores e deixar de fora aqueles que são "relevantes" para a variável alvo. No meu exemplo, para a ZZ. Mas para o meu método o alvo não importa, o que importa é todo o conjunto de "indicadores de alvo".

 
SanSanych Fomenko:

Além disso, também salientei que para mim pessoalmente, para o conjunto de preditores que tenho, recebo um erro de previsão inferior a 30% - um resultado muito bom, devo dizer.

Mas mais uma vez: este resultado é obtido porque sou capaz de filtrar os preditores e deixar de fora aqueles que são "relevantes" para a variável alvo. No meu exemplo, para a ZZ. Mas para o meu método, o alvo não importa, todo o conjunto de "preditores-alvo" importa.

Não é um mau resultado, é fantástico, tenho a certeza que nem o Renascimento o tem sequer perto, com os seus terabytes de dados por dia. Olha para o live-score em números.ai e pensa porque é que eles têm pelo menos 45% de erro(logloss~0.69) e tu tens 30%.

Mas o que você diz é verdade, você criou sua função de alvo sintético, que está funcionalmente ligada a características de uma forma inteligente (obviamente não óbvia para você) e você tem uma varredura tão boa em Lorn e teste e tudo parece certo... Mas por que você ainda não é um bilionário, embora você poderia facilmente tornar-se um em cerca de um ano se você tivesse 30% de erro na previsão da próxima cor da vela, porque você prevê não futuro, mas passado misturado com futuro através do indicador. Tente prever um futuro puro retornado e tudo se encaixará.

 
Aliosha:

Não é um mau resultado, é um resultado fantástico, tenho a certeza que nem o Renascimento o tem por perto, com os seus terabytes de dados por dia. Veja o live-score em números.ai e pense porque eles têm pelo menos 45% de erro(logloss~0.69) e você tem 30%.

Mas o que você diz é verdade, você criou sua função de alvo sintético, que está funcionalmente ligada às características de uma forma inteligente (obviamente não óbvia para você) e você tem um indicador tão bom em Lorn e teste, tudo parece certo... Mas você ainda não é um bilionário, embora você poderia facilmente tornar-se um em cerca de um ano se você tivesse 30% de erro na previsão da próxima cor da vela, é porque você não prevê o futuro, mas passado misturado com futuro através do indicador. Tente prever um retorno futuro puro e tudo se encaixará no lugar.

ZZ é uma má variável alvo porque o seu ombro começa e termina com o mesmo peso. Se você pegar a variável alvo ANTES da inversão e APÓS a inversão ZZ, eu não consegui encontrar preditores para tal variável alvo - todos os preditores conhecidos por mim para tal variável alvo são apenas ruído. Eu colaborei com um dos foruns, ele tem o seu próprio conjunto de preditores, e ambos temos o mesmo resultado.

Não um bilionário por uma razão muito simples: a estimativa do modelo de aprendizagem da máquina para o meu modelo com um alvo em ZZ (que 30%) é irrelevante para os resultados no testador, pois esse erro é arbitrariamente distribuído ao longo do ombro ZZ, ou seja, os sinais falsos são misturados com os sinais reais. Parece que eu negoceio tendências, mas prevejo a próxima vela. Para superar esta contradição, tenho um Expert Advisor que negociou com sucesso por mais de um ano e, em 7 de outubro, ele apareceu em uma parada que fixou o nível máximo de risco.

Mas isto é uma tendência comercial.

Você continua sugerindo DIVERSOS de negociação, não tendências. Esta é uma profissão diferente e existem modelos melhor desenhados para ela - GARCH. Extremamente bem desenvolvido, repleto de ferramentas prontas, pilhas de exemplos para negociação nos mercados financeiros, incluindo forex. É o que estou a fazer agora. Junte-se a nós.


PS.

Sobre olhar em frente na ZZ.

Você tem que escrever com cuidado. Quando você treina, na história você sempre tem um valor até a última, barra de extrema direita. Não é o caso em EAs: no lado direito da ZZ há sempre um ombro não formado e, além disso, o ombro anterior também pode estar com o ombro a descoberto. Portanto, temos de aprender sobre a história. Em seguida, vá para um novo arquivo e refaça sua reciclagem lá à medida que você for percorrendo o gráfico, levando em conta apenas os valores ZZ que já foram formados. E isso são 100 barras ou mais de atraso. E nada de "espreitar", mas o oposto de ficar para trás.

 

Vou resumir para deixar claro a muitos ....

Existem de facto funções-alvo complexas, ou melhor, o pesquisador decide que o problema está na variável de saída e começa a complicá-lo. Costumava acontecer, eu também costumava fazer isso. Mas com o tempo entendi que não há necessidade de o fazer, basta prever a mudança de preços e se não puder ser feito com um nível de qualidade adequado, então nenhuma produção mais complicada não salvará a situação.

Quanto à curva de equilíbrio, é uma consequência da qualidade da formação. É o tipo desta curva que determina a qualidade da aprendizagem. Duas condições.

Crescimentouniforme da curva de equilíbrio a um ângulo de 45 graus

Ausência de saltos e quedas fortes.

Como esta....

 
SanSanych Fomenko:

ZZ é uma má variável alvo porque o seu ombro começa e termina com o mesmo peso. Se pegarmos a variável alvo ANTES da inversão e APÓS a inversão ZZ, não consegui encontrar preditores para tal variável alvo - todos os preditores conhecidos por mim para tal variável alvo são apenas ruído. Eu colaborei com um dos foruns, ele tem o seu próprio conjunto de preditores, e ambos temos o mesmo resultado.

Não um bilionário por uma razão muito simples: a estimativa do modelo de aprendizagem da máquina para o meu modelo com um alvo em ZZ (que 30%) é irrelevante para os resultados no testador, pois esse erro é arbitrariamente distribuído ao longo do ombro ZZ, ou seja, os sinais falsos são misturados com os sinais reais. Parece que eu negoceio tendências, mas prevejo a próxima vela. Para superar esta contradição, tenho um Expert Advisor que negociou com sucesso por mais de um ano e, em 7 de outubro, ele apareceu em uma parada que fixou o nível máximo de risco.

Mas isto é uma tendência comercial.

Você continua sugerindo DIVERSOS de negociação, não tendências. Esta é uma profissão diferente e existem modelos melhor desenhados para ela - GARCH. Extremamente bem desenvolvido, repleto de ferramentas prontas, pilhas de exemplos para negociação nos mercados financeiros, incluindo forex. É o que estou a fazer agora. Junte-se a nós.


PS.

Sobre olhar em frente na ZZ.

Você tem que escrever com cuidado. Quando você treina, na história você sempre tem um valor até a última, barra de extrema direita. Não é o caso em EAs: no lado direito da ZZ há sempre um ombro não formado e, além disso, o ombro anterior também pode estar com o ombro a descoberto. Portanto, temos que aprender sobre a história. Em seguida, vá para um novo arquivo e refaça sua reciclagem lá à medida que você for percorrendo o gráfico, levando em conta apenas os valores ZZ que já foram formados. E isso são 100 barras ou mais de atraso. E nada de "espreitar", mas o oposto de ficar para trás.


Em relação à inconsistência do "testador" e resultados de previsão que escrevi acima, se nós prevemos retornados, tudo se encaixa perfeitamente, tenho pensado por muito tempo, mas tenho certeza que há uma formalização matemática inequívoca da função de dependência da previsão ML em Sharpe ratio, porque a relação empírica é bastante inequívoca. Tecnicamente, o resultado do "testador" não é muito diferente de uma simples convolução (produto escalar) de uma série de previsões sobre retornos realizados (perdoe-me HFTs), de acordo com o que, quanto mais correlacionadas as previsões com os retornos, melhores os resultados do testador, o real difere nos custos comerciais. Claro que tal função (predict2Sharp) não será de precisão mas sim de logloss uma vez que o número de adivinhações por si só é menos importante do que multiplicado pelos retornos que foram adivinhados.


Sobre o GARCH tanto quanto sei é um modelo linear para prever a volatilidade, não prevê a direção do mercado, ou estou errado?

 
Aliosha:

Quanto à inconsistência dos resultados do "testador" e da previsão, escrevi acima porque, se você prevê retornados, tudo se encaixa perfeitamente, por um longo tempo amadurece idéia, mas eu não posso obter o tempo, matematicamente formalizar a previsão da função de dependência ML em Sharpe ratio, tenho certeza de que há uma exibição inequívoca, porque a relação empírica é bastante inequívoca. Tecnicamente, o resultado do "testador" não é muito diferente de uma simples convolução (produto escalar) de uma série de previsões sobre retornos realizados (perdoe-me HFTs), de acordo com o que, quanto mais correlacionadas as previsões com os retornos, melhores os resultados do testador, o real difere nos custos comerciais. Claro que tal função (predict2Sharp) não será de precisão mas sim de logloss uma vez que o número de adivinhações por si só é menos importante do que multiplicado pelos retornos que foram adivinhados.


Sobre o GARCH tanto quanto sei é um modelo linear para prever a volatilidade, não prevê a direção do mercado, ou estou errado?


Confesso que tentei usar os coeficientes de Sharpe, Sortino, etc. para classificar um sinal da estratégia subjacente e cheguei à conclusão de que todos estes coeficientes são a consequência da estratégia subjacente. Isto é, o resultado da Sharp é exactamente o mesmo, porque o sinal fechou com tal e tal lucro e não com a overrun..... Embora eu não seja um bom programador, posso ter calculado estes coeficientes por engano. Mas o meu Sharp estava no intervalo de -2 a 2. Por isso acho que acertei....

 
Mihail Marchukajtes:

Confesso que tentei usar Sharpe, Sortino, etc. para classificar o sinal da estratégia subjacente e cheguei à conclusão de que todos estes coeficientes são uma consequência da estratégia subjacente. Isto é, o resultado da Sharp é exactamente o mesmo, porque o sinal fechou com tal e tal lucro e não com a overrun..... Francamente falando, sou um programador muito mau, por isso posso ter calculado estes coeficientes por engano. Mas o meu Sharp estava na faixa de -2 a 2, então acho que acertei....

Existem muitos SR genéricos, mas o SR clássico é a métrica mais simples e mais comum para avaliar o desempenho de uma estratégia/comerciante/fundo. SR <1,5 é considerado uma merda, >=2 é ótimo!

SR é, grosso modo, a relação de lucro/risco, em termos quantitativos.
 
Aliosha:

Existem muitos SR genéricos, mas o SR clássico é a métrica mais simples e mais comum para avaliar o desempenho da estratégia do fundo de um trader. SR <1,5 é considerado assustador, >=2 é ótimo!

SR é, grosso modo, a relação de lucro/risco, quantitativamente falando.

Em princípio, isso não importa. Não há previsão de potência aí....