Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 570

 
Maxim Dmitrievsky:
  • Floresta Aleatória: Importância de Gini ou Diminuição Média da Impureza (MDI)[2]
  • Floresta Aleatória: Importância da Permutação ou Diminuição Média da Precisão (MDA)[2]
  • Floresta Aleatória: Boruta [3].

https://medium.com/@ceshine/feature-importance-measures-for-tree-models-part-i-47f187c1a2c3

você deve tentar adicionar pelo menos 1 dos métodos às florestas de algas e então tudo pode ser feito automaticamente no MT5 sem R, por exemplo, a recuperação de dados


A mais impressionante seleção de preditores em carpete: gafs - seleção genética de preditores; rfe - seleção de preditores reversa (mais rápido); cofres - robustez simulada de seleção de preditores (recozimento) - mais eficiente.


Se falamos de aprendizagem de máquinas, devemos tomar caretas - é uma concha que inclui todo o ciclo: datamining, modelagem, estimativa.



PS.

Tudo a que se agarra é o "aqui está como terminar...".

 
SanSanych Fomenko:



Não, quero dizer exatamente o método de seleção em RF, não de outras formas. Ou é para RF? Eu entendo que Gini é o mais popular.

Sim, R MDI é usado

 

Sobre a selecção dos preditores...
Inicialmente adicionado ao modelo - dia da semana. Eu assisti à negociação da melhor variante - acabou que em 40 dias (8 semanas) tinha aprendido a comprar na quinta-feira e no teste durante 10 dias (2 semanas) estava a comprar quase todas as quintas-feiras no bar e estava a ganhar. E em outros dias ela ou não negociava ou fazia apenas negócios isolados.
Conclusão: Eu tenho que remover o dia da semana para que a minha negociação fique equilibrada. Agora estou a testar sem ele e vamos ver o que acontece.
Mas eu fui eliminado puramente pelo bom senso, a automação considerou este preditor muito importante.

Então é um pouco exagerado confiar na automação... Embora seja possível que o dia da semana seja a única coisa que você pode ver e entender manualmente, algo mais fino pode não ser notado.

 
elibrarius:

Sobre a selecção de preditores...
Inicialmente adicionado ao modelo - dia da semana. Eu olhei para a negociação da melhor variante e descobri que tinha aprendido durante 40 dias (8 semanas) a comprar na quinta-feira e no teste durante 10 dias (2 semanas) eu quase todas as quintas-feiras estava a comprar e estava a ganhar. E em outros dias ela ou não negociava ou fazia apenas negócios isolados.
Conclusão: Eu tenho que remover o dia da semana para que a minha negociação fique equilibrada. Estou agora a testar sem ele e veremos o que acontece.
Mas esta eliminação é puramente baseada no senso comum, a automação tem considerado este preditor muito importante.

Então é um pouco arriscado confiar na automação...


Estou apenas curioso para entender como funciona, para não ter que fazer nada :) se uma variável não é importante, então basta apagá-la, para não gerar uma dimensionalidade extra

A importância não é se o modelo vai funcionar no futuro, mas como as características no momento descrevem bem o alvo

Por outro lado, para NS ou Deep NS a selecção de características não é muito importante, apenas dá menos peso e as características extra não têm quase nenhum efeito. O ajuste adicional é bom, claro, mas é satanismo de dados para estatísticas e não é adequado para deficientes e dará 5-7% de aumento na qualidade, o que não é nada.

Em si mesma a seleção de preditores em forex é quase uma perda de tempo, a importância varia de conjunto para conjunto. IMHA

 
Maxim Dmitrievsky:

Por outro lado, para NS ou Deep NS a seleção de traços não é muito importante, apenas joga pesos menores e os traços extras quase não têm efeito. A afinação adicional é certamente boa, mas é satanismo de dados para estatísticas, não adequado para handicap

No meu exemplo, quinta-feira revelou-se muito bom para comprar (no intervalo de 50 dias) e aparentemente NS atribuiu ao dia da semana o peso mais alto. Resultou, mas acho que comprar em todos os bares às quintas-feiras é um erro. Afinal, as coisas podem mudar, precisamos de procurar padrões mais profundos.

Talvez um ano de aprendizagem... Mas vai demorar 6 ou 7 vezes mais. Então, talvez o dia da semana tenha uma importância menor.

 
elibrarius:

No meu exemplo, quinta-feira acabou por ser um dia de compras muito bom (no intervalo de 50 dias) e aparentemente o NS deu ao dia da semana o peso mais alto. NS ganhos, mas acho que comprar em todos os bares às quintas-feiras é um erro. Afinal, as coisas podem mudar, precisamos de procurar padrões mais profundos.


Pode mudar, sim :) você precisa ou de uma amostra maior ou de se reciclar e avaliar... Eu faço a segunda. A última corrida, por assim dizer :)

 

Devemos também estudar a frequência das lacunas, lembro-me do gráfico do JPY como se um machado fosse usado para cortar o aumento das cotações. Então, como negociar. Estas amplitudes superiores a 1000 pips devem ser estruturadas (pelos níveis de volatilidade dos gaps) e a probabilidade da sua repetição deve ser calculada. A probabilidade é alta - o Expert Advisor dorme neste gráfico. Ou pode apanhar o aumento da probabilidade de gap e sabendo para que lado irá, use ordens pendentes para tentar montá-lo. Também é importante estudar o que acontece antes da lacuna - porque é claramente feito pelo homem, então eles fazem batota lá antes da lacuna para concentrar as ordens na direção oposta da direção da lacuna que se aproxima. Adicionado.


E eu concordo com o cenário. Mas o conjunto para cada período de tempo é diferente. Por minutos é um dia, por uma hora por mês, etc. Ou, você quer dizer o padrão lucrativo de comportamento de cotação, que ocorre mais frequentemente? Então sim - um conjunto será medido pelo tempo de criação deste "padrão".

E aqueles valores do histórico de cotações ou seus preditores (como eu entendo, eles estão repetindo padrões de comportamento de cotações no gráfico), que estão mais próximos da data atual, devem ter um peso maior, ou seja, o histórico de 1 ano é de interesse apenas para pesquisar esses preditores - a repetição de padrões de comportamento de "lucro" de cotações para o conjunto de preditores e dar-lhes um peso de acordo com sua freqüência de detecção no histórico de cotações. O segundo peso deve aumentar o status do preditor de acordo com a proximidade dos últimos eventos no gráfico.

É como Mendeleev acordar e contar tudo desde o sono. Eu mesmo não entendo))). Boa sorte, estamos à espera dos resultados.

100% por ano e estabilidade na negociação. Não preciso de mais nada. Não exagere.


prognosticador

11.1.5. ЛИНЕЙНЫЙ ПРЕДИКТОР И ФУНКЦИЯ СВЯЗИ
  • lib.alnam.ru
линейный предиктор изменяется на единиц. (Это может быть как реалистичной интерпретацией, так и нереалистичной. В примере с объемом древесины, если радиус ствола дерева увеличивается, то, вероятно, возрастает и его высота.) Ожидаемое значение У связано с линейным предиктором посредством функции связи . В некоторых случаях известны естественные...
 
geratdc:

100% por ano não é suficiente, é necessário um mês :)

 
elibrarius:

Sobre a selecção dos preditores...
Inicialmente adicionado ao modelo - dia da semana. Eu assisti à negociação da melhor variante - acabou que em 40 dias (8 semanas) tinha aprendido a comprar na quinta-feira e no teste durante 10 dias (2 semanas) estava a comprar quase todas as quintas-feiras no bar e estava a ganhar. E em outros dias ela ou não negociava ou fazia apenas negócios isolados.
Conclusão: Eu tenho que remover o dia da semana para que a minha negociação fique equilibrada. Estou agora a testar sem ele e veremos o que acontece.
Mas esta eliminação é puramente baseada no senso comum, a automação tem considerado este preditor muito importante.

Então é um pouco exagerado confiar na automação... Embora seja possível que o dia da semana seja a única coisa que você pode ver e entender manualmente, algo mais fino pode não ser notado.

mas não... depois de remover o dia da semana, tudo continua na mesma. Há 5 bares diários como contexto, talvez venha de lá... Tenho de tentar sem eles.
 
elibrarius:
no... depois de apagar o dia da semana, ainda é o mesmo. Há 5 bares diários como contexto, talvez seja daí que vem... Tenho de tentar sem eles.

significa que tem pouco efeito... como posso entender sem ele? ) Somente se você embaralhar os valores de cada um dos preditores por sua vez, e se reeducar e observar como o erro total muda

só que pode ser uma surpresa que dados embaralhados aleatoriamente de repente se tornem muito importantes :) + muito tempo se houver muitas características. Então, sem características é uma tarefa do sysyphean.