Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 124

 
Alexey Burnakov:
Esta é uma descrição das saídas multivariadas. Fui eu que a implementei. Aumenta a hipótese de um ataque.
Aumenta? É estranho. Diminui-mo.
Como sempre, aparentemente, o diabo está nos detalhes.
 
SanSanych Fomenko:

O principal problema está no sobretreinamento, quando no futuro as árvores existentes não prevêem corretamente a classe, ou melhor, elas prevêem a classe cada vez pior. Esta é a questão abordada neste tópico, ou seja, tentamos provar que as árvores obtidas irão ocorrer no futuro e que o erro de classificação em amostras futuras será aproximadamente o mesmo que na amostra de treinamento.

Embora esteja implícito, prefiro adicioná-lo para torná-lo mais claro.

Normalmente o sobre-aprendizado em modelos tem o efeito de que o modelo se lembra de exemplos de formação de forma muito precisa. A aprendizagem começa com o modelo derivando de algumas regras gerais, valores-alvo dependentes de preditores, mas quanto mais se vai aprendendo, mais rígidas se tornam estas regras no modelo, levando eventualmente a exemplos completamente memorizados, com completa incapacidade do modelo de predizer sobre novos dados. Isto é tratado por validação cruzada, e parar o treinamento quando o modelo tiver aprendido algumas regras generalizadas mas ainda não tiver começado a aprender exemplos específicos, isto dará um melhor desempenho preditivo sobre novos dados.

Isto funciona muito bem em dados onde as dependências permanecem constantes ao longo do tempo - reconhecimento de imagem, ou reconhecimento de som, por exemplo. Mas forex é diferente na medida em que muitas das dependências encontradas não são persistentes com o tempo. O problema não é apenas aprender sem memorizar exemplos de treino, mas também de alguma forma garantir que os padrões encontrados permanecem no futuro.

A tarefa é mais completa: desenvolver uma forma de estimar os preditores em relação à variável alvo que garanta que a relação entre os preditores e a variável alvo seja constante e que também exista em novos dados.

Quais os valores-alvo a utilizar(cor da barra, ou inversão, ou tendência), ou quais os preditores (preços, indicadores, índices) são as nuances. Se pudermos avaliar o conjunto de preditores e sua capacidade de previsão dos valores-alvo, e a mudança dessa capacidade de previsão no tempo, então podemos até encontrar tais combinações de preditores e valores-alvo, que têm a melhor estimativa.
Então podemos pegar qualquer modelo, treiná-lo (talvez até com controle de requalificação, que é importante para a neurônica, por exemplo), e há um graal.

 
Dr. Trader:


Normalmente, a aprendizagem excessiva em modelos tem o efeito de que o modelo se lembra dos exemplos de formação de forma muito precisa. A aprendizagem começa com o modelo derivando algumas regras gerais, a dependência dos valores-alvo em relação aos preditores, mas quanto mais a aprendizagem continua, mais rígidas se tornam estas regras no modelo, levando eventualmente a exemplos completamente memorizados, com uma completa incapacidade do modelo de prever em novos dados.

Parece que somos só nós os dois aqui, pois a posição do Alexey não é totalmente clara para mim.

O resto é a experiência de pessoas que já estão no mercado há muito tempo. Eu acredito que eles são comerciantes de sucesso. Sei pela literatura que algumas pessoas têm tido sucesso usando a heurística por muitos anos, mas o único resultado foi uma monotonia sombria - uma perda do depoimento. Qualquer heurístico não responde à questão da reaprendizagem, é por isso que o fim virá: dentro de um dia, um mês, um ano... mas sempre de forma inesperada e extremamente inoportuna.

PS.

A sobre-aprendizagem é um problema básico da ciência, no sentido em que o tema da ciência é a extracção de algumas leis básicas, das quais muitas particularidades podem ser explicadas.

Por exemplo, a lei de Newton.

Pegue um pedaço de papel - ele é obrigado a cair no chão. Amasse esse pedaço de papel - ele está destinado a cair, mas mais rápido. Newton diz que tudo cai com a mesma aceleração. Como assim? É assim que o homem consegue desfazer-se do particular, que é uma realidade muito, rudimentar e obter uma lei universal, e se ela não funcionar, então esses desvios podem sempre ser explicados.

É assim que a ciência funciona.

O que fazemos é tentar "embrutecer" o quociente, apresentar este quociente sob a forma de um modelo, de modo a ter uma ideia de todos os quocientes futuros.

A luta contra o excesso de formação é um problema básico da negociação.

 
Dr. Trader:

Isto funciona bem em dados onde as dependências permanecem constantes ao longo do tempo - reconhecimento de imagem, ou reconhecimento de som, por exemplo. Mas forex é diferente na medida em que muitas das dependências encontradas não são persistentes com o tempo. O problema não é apenas alcançar a aprendizagem sem memorizar exemplos de treino, mas também de alguma forma garantir que os padrões encontrados permanecem no futuro.

Um pouco fora de tópico, mas só um pouco de informação...

No reconhecimento de voz em particular na fala é um problema quando uma pessoa diz uma palavra - um padrão espectral da palavra alimentado ao algoritmo "HMM" ou "RNN" ...mas o problema é que se a outra pessoa disser a mesma palavra, pelo menos a uma velocidade diferente, esse padrão é o mesmo mas esticado com o tempo, e agora a analogia - a largura do padrão de cabeça e ombros de 33 velas e a mesma largura do padrão de cabeça e ombros de 88 velas, a largura é diferente, mas o padrão é o mesmo .....

Para resolver o problema com o algoritmo de reconhecimento de fala foi desenvolvido - um dinâmico "DTW" de tempo A tarefa do algoritmo é que ele pode encontrar dois vetores similares, mesmo que tenham comprimentos diferentes. Assim, quando diferentes pessoas dizem a mesma palavra este padrão espectral da palavra passa primeiro pelo "DTW" e depois pelo algoritmo "MO" e a palavra é reconhecida com sucesso. Ainda não o usei, por isso não posso dizer nada, mas acho que vou ter de o experimentar, embora se disser que não existem padrões no mercado, então é claro que este algoritmo não vai funcionar, ainda não decidi com a minha visão de mundo...

Pacotes R: "DTW". "dtwclust".

 
Alexey Burnakov:
Esta é a descrição do multivariado que sai de uma profissão. Fui eu que a implementei. Aumenta as hipóteses de ter um bom ajuste.
Andrey Dik:

O método é o seguinte (tudo o que se segue aplica-se igualmente tanto ao ML como ao TS clássico).

A questão é livrar-se da incerteza, o que significa, por um lado, livrar-se do ajuste no treinamento e otimização e, por outro, formular sem ambigüidade os requisitos "suaves" para o sistema. TP e SL na entrada também é uma incerteza, por isso o usamos apenas para saída de emergência (depende da volatilidade do instrumento e selecionamo-lo empiricamente, de modo que 100% das operações são disparadas o mais raramente possível, idealmente - nunca. Prever todo o comércio, da entrada à saída. Consideramos que o resultado com um lucro excluindo o spread e as comissões é uma negociação bem sucedida (o funcionamento do sistema é determinado após verificar se o spread e as comissões são cobertos). Assim que o sinal de entrada é recebido, o sistema entra e depois espera por uma certa quantidade de barras (é determinado empiricamente e depende dos preditores e do instrumento). - Fecha o negócio, se estiver a perder, esperamos por mais um bar. Às vezes uso dois parâmetros: mínimo e máximo (se um comércio não é fechado após o número máximo de barras - é fechado de qualquer forma), e às vezes uso apenas um - o número mínimo de barras.

Muitas pessoas ficarão surpresas, mas muitos, mesmo sistemas aparentemente sem esperança, começam a funcionar, incluindo TS em varinhas, para não mencionar todos os tipos de sistemas com ML. O truque é não exigir de si e da máquina regras de ferro de TC, não tentar descrever completamente os movimentos do mercado e dar aquelas regras muito "suaves" para o ML. Além disso, livramo-nos do mau legado do mercado na forma de caudas pesadas (ou mais precisamente, as caudas deixam de importar), a falta de estacionariedade na BP deixa de importar - porque sabemos que as formas do mercado podem ser escaladas vertical e horizontalmente sem alterar as suas propriedades internas (e isto torna a vida extremamente difícil para os emleoners).

Escrevi sobre isso no 4º fórum, acho que no tópico Swinosaurs, sobre dois tipos de todos os TSs (com limites definidos e indefinidos), mas a idéia não foi completada lá. Agora tudo é mais claramente visível, ou assim...

Em geral, eu uso a minha regra ao desenvolver sistemas de trading: se as mudanças na lógica levam a aumentar a percentagem de variantes de parâmetros bem sucedidos entre todas as variantes possíveis, então é uma boa mudança (a probabilidade de escolher uma variante má para trading é reduzida, não importa como mudamos os parâmetros - estaremos no lado positivo). Esta abordagem permitiu aumentar esta quota no meu TS.

Parece-me que tudo o que você descreveu se encaixa na otimização do modelo ARIMA. Ao otimizar, você seleciona o número de barras sobre as quais o modelo é construído
 
Alexey Burnakov:SanSanych Fomenko:

Qual é o hábito selvagem de responder em duas palavras e citar 100 linhas de interlocutor???? O fórum tem 120 páginas. Se você remover estas citações desnecessárias você tem talvez 60 páginas de texto útil... Respeitar as pessoas que o lêem ou que o irão ler no futuro

 
Andrey Dik:

O método é o seguinte (todos os seguintes se aplicam igualmente tanto ao ML como ao TS clássico) ....

Você pode descrever ponto por ponto o que e como fazer, como um algoritmo, porque eu não entendo realmente como você sugere fazer

 
SanSanych Fomenko:
Parece-me que tudo o que descreveu se enquadra na optimização do modelo ARIMA. Durante a otimização é selecionado o número de barras sobre as quais o modelo é construído
Não um valor fixo de barras, mas possíveis valores "de agora até agora".
 
mytarmailS:

Você pode descrever ponto por ponto o que fazer e como fazê-lo, como um algoritmo, porque eu realmente não entendo como você se propõe a fazer isso.

Você está certo sobre o alongamento no tempo dos valores de preços. Era disso que eu estava a falar, alongamento/escala vertical e horizontal. Mas não são apenas os números como um todo que são esticados de forma diferente, mas também os candelabros individuais dentro deles. Este é um problema adicional e duvido quemétodos de pré e pós-processamento do tipo DTW possam ser aplicados adequadamente.Estas são formas de mercado distorcidas de alguma forma desconhecida.

Para ser mais exacto: temos sinal de compra na barra actual, conte o menor número de barras à frente e verifique se o negócio será rentável, se sim - feche-a, se não - conte mais uma barra à frente e volte a verificá-la. E assim atingimos o número máximo de barras e fechamo-las finalmente. Isto é um mecanismo de aprendizagem.

Em geral, a aprendizagem de dados de mercado pela máquina é semelhante ao seguinte: mostramos à máquina uma combinação de formas gráficas, círculos, quadrados, triângulos, trapézios, formas de diferentes tamanhos e formas. A máquina tem de responder com alguma forma, um triângulo um quadrado ou um círculo (exagerado). Nós colocamos a resposta para o modelo e f*ck! - A forma na resposta não corresponde à merda do modelo! E no processo de aprendizagem, por alguma razão, eles combinaram como a merda de uma pedra. .... Esse é o tipo de problema que estamos a resolver aqui. E eu digo - sem problemas, podemos esticar um pouco o padrão, para que as respostas se tornem corretas mesmo fora dos dados do treinamento.

É um "peixe" básico de um sistema, que já está a funcionar por si só. Mas ninguém proíbe a adição ao TS e o uso em negociação de ferramentas como o SL Breakeven. O sistema permanece o mesmo, mas para isso, quando o mercado se mover na nossa direcção, vamos obter lucros extra para além do "plano" e depois ou arrasto SL, ou iniciar o encerramento parcial de posições, dependendo da distância percorrida em comparação com o movimento estatístico de preços durante um determinado período de tempo, etc.

 
Andrey Dik:
Está a aumentar? É estranho. Mas diminui.
Como sempre, aparentemente, o diabo está nos detalhes.

Você avalia o desempenho da estratégia na história ou há um longo avanço? O diabo pode estar na avaliação da história.

Olha, eu tinha uma estratégia escrita em 100 linhas em MT4 sozinha. Eu escrevi sobre isso no meu perfil em dezembro de 2014:https://www.mql5.com/ru/users/alexeymosc/page3?#userActions

É este o aspecto da última versão, elaborada em Janeiro de 2015:

Eu então experimentei o real, em conjunto com outras estratégias. Eu também escrevi sobre eles em todo o lado.

Isto e aquilo, a mão drenou-o.

Vi hoje um teste prospectivo desde o final da optimização até ao final de Julho com as mesmas configurações. Olha:

Está tudo aí. Spread é 30, lote 0.1.

Vou tentar em todas as carraças também, para ter a certeza que as tomadas funcionam melhor:

Entrada por impulso, saída via OU em várias condições. Em princípio, parece funcionar. Mas se eu entrar no pico, então espere um ano para desistir de um sorteio...

Alexey Burnakov
Alexey Burnakov
  • www.mql5.com
Профиль трейдера