Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 186

 
Yury Reshetov:

Porque está congelado.

Desculpe, mas a pergunta é a mesma que a resposta.

Não entendo o humor, porque para tomar uma decisão, o valor da saída do classificador deve ser comparado com algo, por exemplo, com um valor limite. E como na sua formulação do problema os valores comparáveis por alguma razão são desconhecidos, e apenas aqueles que não são necessários para a classificação são conhecidos, seria uma boa idéia fazer esclarecimentos.

Bygones.
 

Eu completei meus cálculos de múltiplos dias (modelos em 6 preditores selecionados (de 114) para forex).

Aqui está a foto do título. Distribuição da precisão da regressão (contada pela norma L1: soma dos valores de erro absoluto ) na validação para os modelos que foram selecionados como os melhores (pela mesma medida) nas caixas de teste.

Há 99 valores em cada caixa, cada um dos quais é métrico 1 - soma(abs(X-Y))/sum(abs(X-mean(X)) em uma amostra de validação única. Análogo a R^2, estou a ver, sim.

O total obtido é de 8908 modelos... Para todos os instrumentos e alvos em estudo.

Uma redução média de erro de 0,2% (apenas). Mas é significativo... Foi gerada uma amostra de validação única para cada modelo.

Todos os estudos que eu quero publicar. Lá vai mais longe a estimativa do MO modelo e assim por diante até o fim lógico. Se eu publicar (não no MQL), vou dar um link para algumas pessoas com quem me comunico aqui ou vou publicar no meu perfil.

E aí também. Uma imagem muito mais interessante de um ponto de vista prático. A relação entre a expectativa matemática do modelo em blocos de teste (dentro da validação cruzada) e na validação.

Aqui devemos verificar imediatamente se a correlação positiva é significativa (uma vez que a correlação negativa não pode ser razoavelmente explicada) e se existem valores positivos de MPO na validação. Bem, você pode ver por si mesmo.

Os 99 pontos são modelos.

 
Dr. Trader:


Bem, este é um bom exemplo de porque 99% dos comerciantes ingênuos estão perdendo, se você mover a janela esta confusão de pontos também vai morfar aleatoriamente, isto é apenas ruído e MO não vai ajudar aqui
 
Vai ser óptimo, e se também lhe deres um tiquetaque... Onda cerebral)))
 
Eunão estou:
Bem, este é um bom exemplo de porque é que 99% dos comerciantes ingénuos estão a perder...
E este fio é um bom e claro exemplo de que a aprendizagem de máquinas no comércio, é apenas uma teoria...
 
Incompleto:
E este ramo é um bom exemplo claro do facto de que a aprendizagem de máquinas no comércio, é apenas uma teoria...
Se você olhar cuidadosamente para o fio, os habitantes aqui estão divididos em três campos:
  1. R utilizadores (aqui referidos como "parasitas"). Parecem-se com uma espécie de seita destrutiva. Todo o tempo que eles estão bisbilhotando em alguns pacotes, um dia eles estão engajados na classificação, amanhã em regressão, no dia seguinte em algum clustering e assim por diante em círculo. A atividade parece ser impetuosa, mas é inútil, porque o que quer que empreendam, fazem tudo errado e perguntam de novo, por causa disso não conseguem. Isto é expresso nas suas queixas, por exemplo: sobre o destino, o "problema" da reciclagem, os preditores ruidosos e todo o tipo de "radicais e pessoas más" que não reconhecem o R, como o Reshetov.
  2. Aqueles que não usam R. Tais pessoas, como regra, escolheram uma direção particular, onde são boas em alguma coisa. Eles não se queixam do destino, não rumam por vários métodos, ou seja, não jogam as coisas ao redor. Eles estão empenhados no que funciona e melhoram-se pouco a pouco na direcção escolhida.
  3. Aqueles que caíram à porta. Às vezes eles inserem sua opinião, mas muitas vezes de forma inoportuna.
 
Alexey Burnakov:

Eu completei muitos dias de cálculos.

Eu sigo a sua pesquisa, muito informativa, obrigado pelo seu envio. Mas parece-me que embora você resolva com sucesso problemas tão complicados, você pula as tarefas preparatórias e isso estraga o resultado. Nomeadamente você ignora a seleção de preditores.

Você pegou 114 preditores, depois selecionou de alguma forma 6, e depois de treinar os modelos você pode concluir qual é o melhor alvo. Mas este resultado obtido é apenas um máximo local. Você pode dizer não globalmente que "eurusd é melhor em prever 16 barras à frente", mas apenas que "um conjunto de 114 preditores": (pre1, pre2, pre3,...) usando o gbm melhor prevê a direção do preço através de 16 barras".

Se você tomar neurônica ao invés de gbm o melhor alvo será diferente. Se você usar outros 114 preditores, o melhor alvo será diferente novamente. Seus 114 preditores são uma base tão importante que todo o resto da experiência depende disso, e você simplesmente os tirou do teto sem nenhuma preparação.

Há cerca de meio ano, SanSanych publicou um arquivo com os seus preditores. A peculiaridade deles é que a maioria dos modelos em chocalhos tem um pequeno erro e o erro não cresce com novos dados. Você pode treinar modelos em qualquer segmento e fazer o teste dos dados restantes e ver que nada está degradado. Os seus preditores e alvo estão tão relacionados que os modelos encontram a única relação possível entre eles em qualquer barra.
Estou a tentar replicar isto. Utilizo mais de dez mil preditores iniciais (indicadores com diferentes parâmetros e desfasamentos do mt5) e aprendo a selecioná-los para ter a única conexão possível com a barra de destino. Eu recomendo que você faça a mesma experiência, porque eu acho que a capacidade de determinar ou encontrar tais preditores correlacionados e o alvo é o verdadeiro ponteiro para o graal.

Na MQL5 há um gerador Expert Advisor recentemente disponível, quando você seleciona uma lista de indicadores necessários e um Expert Advisor pronto com código é criado imediatamente, além disso é facilmente otimizado pela genética. Em tal Expert Advisor há 20 indicadores, nenhum modelo de aprendizagem de máquina (tudo o que temos são coeficientes de importância atribuídos a cada indicador).
Acabei de adicionar o meu código personalizado para a função de aptidão genética e incluí alguns critérios para fazer com que o alvo e os indicadores sejam considerados como estreitamente relacionados na minha opinião. Aconteceu assim:
(eurusd h1)

O primeiro 2/3 é o backtest (amostra), o último terço é o fronttest (oos). Após 2/3 de tempo não há um dreno, mas o saldo é reposto ao inicial para o teste oos. Tendo um conjunto tão pobre de características e simplesmente acrescentando "critérios grosseiros e inacabados de predição e dependência do alvo", o resultado não é uma perda, embora ruim. 51% dos negócios bem sucedidos em oos. Não é fantástico? Mas poderíamos usar 20000 indicadores em vez de 20, e adicionar algum modelo de aprendizagem de máquinas e remover o limite de 10000 iterações da genética mt5 e teríamos até mesmo um Expert Advisor rentável.

 
inverte45:
E este fio é um bom exemplo claro de que a aprendizagem de máquinas no comércio, é apenas teoria...

Na teoria da negociação não pode existir em princípio, ou melhor, a teoria é sobre a impossibilidade de fazer dinheiro, um mercado eficiente, etc., tudo é levado em conta no preço, no mecanismo de câmbio...Mas as estatísticas e a aprendizagem de máquinas, que se tornaram mais acessíveis recentemente graças a diferentes pacotes matemáticos e bibliotecas, permite que você realmente veja porque é tão triste com TA padrão, não cientistas, mas simples comerciantes, passar uma semana no R-studio ou Matlab.

Se o MO no comércio é "apenas teoria", o que é parcialmente verdade, então o TA não é sequer uma teoria, mas uma treta, como a astrologia ou o vodu.

Mas muitos aqui sabem que ainda é possível fazer dinheiro, um mercado eficiente não é apenas pela vontade de Deus, mas porque alguns conseguiram obter e processar informação melhor do que a maioria. Na minha opinião, o obstáculo mais significativo para os comerciantes é uma ilusão de simplicidade deste tipo de negócio, como se eles conseguissem dinheiro para a sua assinatura, aqui neste fórum eles têm ouvido repetidamente algo como "você não precisa criar um colisor de hadrões para negociar" ...

Mas acontece que você faz....

 
Dr. Trader:

Eu sigo a sua pesquisa, é muito informativa, obrigado pelo seu envio. Mas parece-me que embora você resolva com sucesso problemas tão complexos, você perde tarefas preparatórias e isso estraga o resultado. Nomeadamente você ignora a seleção de preditores.

Você pegou 114 preditores, depois selecionou de alguma forma 6, e depois de treinar os modelos você pode concluir qual é o melhor alvo. Mas este resultado obtido é apenas um máximo local. Você pode dizer não globalmente que "eurusd é melhor em prever 16 barras à frente", mas apenas que "um conjunto de 114 preditores": (pre1, pre2, pre3,...) usando gbm melhor prediz a direção do preço através de 16 barras".

Se você tomar neurônica em vez de gbm, você tem um alvo melhor diferente. Se você usar outros 114 preditores, o melhor alvo será diferente novamente. Seus 114 preditores são uma base tão importante que todo o resto da experiência depende disso, e você simplesmente os tirou do teto sem nenhuma preparação.

Há cerca de meio ano, SanSanych publicou um ficheiro com os seus preditores. Sua peculiaridade é que a maioria dos modelos em chocalhos tem um pequeno erro e, ao mesmo tempo, o erro não cresce com novos dados. Você pode treinar modelos em qualquer segmento e fazer o teste dos dados restantes e ver que nada está degradado. Os seus preditores e alvo estão tão relacionados que os modelos encontram a única relação possível entre eles em qualquer barra.
Estou a tentar replicar isto. Utilizo mais de dez mil preditores iniciais (indicadores com diferentes parâmetros e desfasamentos do mt5) e aprendo a selecioná-los para ter a única conexão possível com a barra de destino. Recomendo que você faça a mesma experiência, porque acredito que a capacidade de determinar ou encontrar tais preditores correlacionados e o alvo é o verdadeiro ponteiro para o graal.

Na MQL5 há um gerador Expert Advisor recentemente disponível, quando você seleciona uma lista de indicadores necessários e um Expert Advisor pronto com código é criado imediatamente, além disso é facilmente otimizado pela genética. Em tal Expert Advisor há 20 indicadores, nenhum modelo de aprendizagem de máquina (tudo o que temos são coeficientes de importância atribuídos a cada indicador).
Acabei de adicionar o meu código personalizado para a função de aptidão genética e incluí alguns critérios para fazer com que o alvo e os indicadores sejam considerados como estreitamente relacionados na minha opinião. Aconteceu assim:
(eurusd h1)

O primeiro 2/3 é o backtest (amostra), o último terço é o fronttest (oos). Após 2/3 de tempo não há um dreno, mas o saldo é reposto ao inicial para o teste oos. Tendo um conjunto tão pobre de opções e simplesmente acrescentando os "critérios grosseiros e inacabados de predição e dependência do alvo", o resultado não é uma perda, embora ruim. 51% dos negócios bem sucedidos em oos. Não é fantástico? Mas poderíamos usar não 20 indicadores mas sim 20000 e adicionar um modelo de aprendizagem de máquina e remover o limite de 10000 iterações da genética mt5 e até conseguiríamos um Expert Advisor rentável.

Certamente um resultado local. Não há oportunidade para a diversificação. Não há tempo. Sem recursos... Isto é exactamente o que o GBM dá aos meus preditores.

A questão não é usar a parte sobre-treinado da experiência para tirar conclusões. E se este resultado local for validado com sucesso, eu ficarei satisfeito.

Aqui está a qualidade da regressão é validada com sucesso. Os modelos treinados dão uma qualidade de previsão diferente de zero significativa. Sem qualquer problema de seleção de modelos.

E é mais complicado com o modus operandi do ofício. Eu não mostrei tudo... Há subamostras (símbolo - alvo) dando MO mediano na validação maior que zero... Mas a tarefa é pegar a cauda dos padrões correlacionados com a validação para aumentar o MO. Mas este também pode ser um caso...

No final será constituído um comité que será validado por outra amostra do futuro. Através de Monte Carlo, claro.

Quanto aos palpiteiros, também é complicado... Há muito tempo para explicar... Mas a questão é que cada um dos 99 modelos para a subamostra do símbolo-alvo utiliza o seu próprio conjunto único de 6 preditores. A combinação resulta numa boa variedade de modelos (mais eles aprendem com dados diferentes). e em geral cada um dos 114 está envolvido em algum lugar.

E não se esqueça da selecção optimista do modelo, por favor. Então não percebo como escolheu a fotografia? Pelo melhor resultado em SI ou SO? É só uma pergunta. Mas muitos resultados de "pesquisa" pecam por não haver resposta a essa pergunta.
 

Conselhos sobre onde obter um EA (robô) que abriria uma troca num determinado momento e depois fecharia a troca num determinado momento.


Por exemplo, abra uma negociação às 12:59 e feche-a às 13:59, independentemente do resultado - lucro ou prejuízo de qualquer forma.