Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1035

 
Roffild:

Estava a responder à pergunta "porque precisamos da Spark?"

Você estava provando a necessidade do sistema de outra pessoa, mas você não podia mostrar o que podia pessoalmente com sua biblioteca e responder minha pergunta específica, e há uma tarefa de habilidades de nível básico. https://www.mql5.com/ru/forum/86386/page1033#comment_8211170

Na verdade, o padrão contém sinais de uma estratégia simples de cruzamento de médias móveis - EMA 9 e EMA 14, ligeiramente barulhentas, para aumentar a rentabilidade).

Estou postando o modelo de resposta completa - soluções com sinais iniciais, sobreposição de indicadores e execução visual no testador de um dos EAs treinados com os sinais acima.

Estou colocando EA_EURUSD_H1_NN - baseado na rede neural, EA_EURUSD_H1_RF - em florestas aleatórias,

Os Expert Advisors são testados no servidor EURUSD H1 MetaQuotes-Demo, os gráficos de teste apropriados são mostrados abaixo.

...neuronete


...florestas aleatórias

Em ambos os gráficos há um período de treinamento, ou seja, o período de sinais de treinamento, veja o padrão.

Машинное обучение в трейдинге: теория и практика (торговля и не только)
Машинное обучение в трейдинге: теория и практика (торговля и не только)
  • 2018.07.29
  • www.mql5.com
Добрый день всем, Знаю, что есть на форуме энтузиасты machine learning и статистики...
Arquivos anexados:
 
Ivan Negreshniy:

Você estava provando a necessidade do sistema de outra pessoa, mas para mostrar o que você pode pessoalmente com sua biblioteca e responder minha pergunta específica, e há uma tarefa para skils de nível de entrada. https://www.mql5.com/ru/forum/86386/page1033#comment_8211170

Na verdade, o padrão contém sinais de estratégia simples de cruzamento de médias móveis - EMA 9 e EMA 14, ligeiramente barulhentas, para aumentar a rentabilidade).

Estou colando o modelo completo da resposta - solução com sinais iniciais, indicadores de sobreposição e execução visual no testador de um dos Expert Advisor treinado nos sinais acima.

Estou colando EA_EURUSD_H1_NN - baseado em rede neural, EA_EURUSD_H1_RF - em florestas aleatórias,

Os conselheiros são testados no servidor EURUSD H1 MetaQuotes-Demo, abaixo estão os gráficos de teste correspondentes.

...neuronete


...florestas aleatórias

Em ambos os gráficos o período de treinamento é marcado, ou seja, o período em que há um sinal de treinamento, veja o padrão.

NN é essa a tua grelha secreta?

e as características são exactamente as mesmas?

 
Maxim Dmitrievsky:

NN é essa a tua grelha secreta? as diferenças são grandes.

e as características são exactamente as mesmas?

Sim, mas a questão é diferente - vamos concordar em formatos e trocar informações sobre IOs para negociação, caso contrário não teremos nenhum progresso, apenas uma dobra de persianas.

PS: As características em ambas as EAs são contadas por barra OHLC, e o seu número e fórmula de cálculo são idênticos.

 
Ivan Negreshniy:

Sim, mas a questão é diferente - vamos concordar em formatos e trocar informações sobre IOs para negociação, caso contrário não faremos nenhum progresso, apenas jogo sujo, estilo cego a cego.

PS: Em ambos os EAs os chips são calculados utilizando a barra OHLC e o seu número e fórmula de cálculo são idênticos.

Deve juntar-se a nós na nossa sala de chat, nós discutimos estratégias lá e negociamos. Há muita segregação por assunto, quem se importa com o que é interessante.

Tópicos importantes ou secretos estão fora dos limites para pessoas de fora

 
Maxim Dmitrievsky:

Há muito tempo que está claro sobre a Centelha, eu não perguntei. Eu estava a perguntar sobre a ideia. Esta abordagem com centelha está fora de controlo devido à forma ineficiente de aprender e à potência necessária

O mesmo pode ser feito através da optimização na nuvem MT5 sem andaimes. Não sei sobre a sua produção e se ela lhe dá lucro, mas não dá e este algoritmo falhará sempre devido ao excesso de roupa.

IMHA

Há uma opinião de que o modelo construído deve sempre retornar 0 ou 1.

Mas e se tratarmos o resultado retornado do modelo como o de um indicador? Tentar estimar tal modelo pelo MSE etc. não servirá de nada. Mas quando você aplica tal modelo com parâmetros de compra > 0,75 e venda < 0,25, você terá bons lucros.

A ideia em si: atirar vários dados de diferentes indicadores para uma floresta aleatória e obter um super indicador.

A forma de procurar o graal requer a verificação de idéias não-padronizadas.

 
Roffild:

Há uma opinião de que um modelo construído deve sempre retornar 0 ou 1.

Mas e se tratarmos o resultado retornado do modelo como um indicador? Tentar estimar tal modelo pelo MSE etc. não servirá de nada. Mas quando você aplica tal modelo com parâmetros de compra > 0,75 e venda < 0,25, você terá bons lucros.

A idéia em si: jogar vários dados de diferentes indicadores em floresta aleatória e obter um super-indicador.

Formas de encontrar o graal requerem testes de idéias prontas para uso.

A Forest não apresenta probabilidades de pertencer a uma classe, por isso estas desigualdades são um disparate.

>< 0,5 e pronto, não há outra maneira. E depois há a questão de qual é melhor - sinais binarizados e saídas ou não.

você pode dividir 0 a 100 em classes, não há diferença, não é o NS
 
Maxim Dmitrievsky:

a floresta não apresenta probabilidades de pertencer a uma classe, por isso estas desigualdades são um disparate.

>< 0,5 e pronto, não há outra maneira. E outra pergunta é o que é melhor - sinais binarizados e saídas ou não.

podes dividi-lo em classes de 0 a 100, não é como a NS.
Se não há nenhuma probabilidade, então o que fazem estas linhas?
static void CDForest::DFProcess(CDecisionForest &df,double &x[],double &y[])
...
//--- calculation
   v=1.0/(double)df.m_ntrees;
   for(i_=0;i_<=df.m_nclasses-1;i_++)
      y[i_]=v*y[i_];
 
Roffild:
Se não há nenhuma probabilidade, então o que fazem estas linhas?

Oh, certo.

o resultado de todos os algoritmos de classificação incluídos na ALGLIB não é a classe a que o objeto pertence, mas um vetor de probabilidades condicionais.

Mas isto não é muito consolador. Haverá menos sinais e não necessariamente mais resultados. Para mim, por exemplo, não. Eu estabeleci um limiar de 0,5 em todo o lado agora.

O que é muito mais importante é a comparabilidade dos erros no traço e no oob.

 
Maxim Dmitrievsky:

Oh, certo.

o resultado de todos os algoritmos de classificação incluídos na ALGLIB não é a classe a que o objeto pertence, mas um vetor de probabilidades condicionais.

Mas isto não é muito consolador. Haverá menos sinais e não necessariamente mais resultados. Para mim, por exemplo, não. Eu estabeleci um limiar de 0,5 em todo o lado agora.

O que é muito mais importante é a comparabilidade dos erros no comboio e no oob.

Mas estas são peculiaridades dos algoritmos modificados.

AlgLib implementa a clássica floresta aleatória sem modificações. É o mesmo em Spark.

Ajustando o limiar para 0,5 = adaptando os dados ao resultado.

P.S. Mesmo os parâmetros de geração de floresta aleatória são diferentes.

 
Roffild:

Mas estas são peculiaridades dos algoritmos modificados.

AlgLib implementa uma clássica floresta aleatória sem modificações. É o mesmo em Spark.

Ajustando o limiar para 0,5 = adaptando os dados ao resultado.

P.S. Até os parâmetros de geração de floresta aleatória são diferentes...

acho que também tenho algLibe )

aqui está uma descrição, não sei como é "clássico".

http://alglib.sources.ru/dataanalysis/decisionforest.php

��� �������� ������� - ���������� ����������
  • alglib.sources.ru
��� �������� �������� ������� �������� ��������� ������������� � ��������� RDF, � ����� �������� ����������� ��� ������ � ������ �������� ������� � ������ ��� �������� �������� �����. ����� ������� ���� �������� ����������� ���������� ������ �� ����� ��������� ����������� ������� ������������� � ���������. ��� ���������� ������ ����������...