Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 882

 
Vizard_:

A binarização tem matado muita informação útil.

Por um lado, sim. E por outro lado, há um resultado impressionante (se for sem espreitar). Alesha lembrou-se de dizer que é muito difícil conseguir um erro inferior a 45% (e até agora eu também tenho cerca de 45).
 
Aleksey Vyazmikin:

Bosques normais ou aleatórios, ou ambos?

Eu coloquei o Rattle e o R (que falha é esta coisa toda...), e agora não consigo descobrir como fazer configurações comparáveis, como na captura de tela abaixo? Porque as configurações padrão do Rattle deram resultados piores do que o programa que eu estava usando antes.


Floresta normal ou floresta aleatória, ou ambas?

Em chocalhos correm ambos os modelos florestais chamados árvore e ada. Abra a aba log e veja o código R, referências aos pacotes utilizados e você pode entender suas diferenças.

Eu coloquei o Rattle e o R (que falha é esta coisa toda...),

Não sei o que é que está mal, ultimamente tenho andado a gerir um grande número de modelos - está tudo bem.

E agora não consigo entender como fazer configurações comparáveis, como na captura de tela abaixo? Não consigo descobrir como fazer configurações comparáveis, porque obtive resultados piores com o Rattle padrão do que com o programa que eu estava usando antes.

A imagem que você tem do guizo está incompleta. No mínimo, eu deveria mudar para a aba de avaliação adjacente e ver os resultados lá.

Mas o mais importante é que você precisa dividir o arquivo fonte em duas partes com nomes diferentes (muito provavelmente você terá que fazer isso em R).

No primeiro arquivo você constrói TODOS os seis modelos e olha o teste de estimação deles, valida. Depois você escreve o nome do segundo arquivo no campo R Dataset. E nele você recebe marcas novamente. Todas as estimativas devem ser aproximadamente as mesmas!

Se estas estimativas não coincidirem, e o segundo ficheiro mostrar piores resultados dos modelos, então significa que os modelos estão sobretreinados e a razão para isso são os preditores de ruído (não relacionados com a variável alvo).


Este é o momento da verdade: ou você tem um conjunto de preditores relevantes para uma determinada variável alvo ou não tem. E nenhum modelo pode corrigir esta infeliz circunstância. Depois começa o trabalho estúpido de seleccionar um par de "preditores-alvo", os modelos não são nada interessantes, encontrar um par, depois os modelos são apenas sementes em R, você receberá uma dúzia deles num dia e fará conjuntos a partir deles.


PS.

1. Não escute os foruns que não conhecem R: seus resultados não só são impossíveis de repetir, como até mesmo de entender.

2. Não há problema em usar o conselheiro R: tudo funciona e é muito estável.

3. não se esqueça que o guizo regista todas as suas acções em R. Você pode usá-lo como código R habitual.

 
SanSanych Fomenko:

PS.

1. Não dê ouvidos aos forumists que não falam R: não só os seus resultados são impossíveis de replicar, como nem sequer podem ser compreendidos.

2. Não há problema em usar o R EA: tudo funciona e é muito estável.

3. não se esqueça que o guizo regista todas as suas acções em R. Você pode usar este protocolo como código habitual em R

SanSanych, aqui, eu tenho uma pergunta. Você tem algo realmente funcionando e ganhando dinheiro? Basta - sim ou não.

E se sim, o que tem o R a ver com isso? E se não, ainda mais, onde e o que tem o R a ver com isso?

ZZY A resposta pode ser adivinhada com uma probabilidade de 0,95).

 
Yuriy Asaulenko:

SanSanych, aqui, eu tenho uma pergunta. Você tem alguma coisa funcionando e trazendo dinheiro? Isso é suficiente - sim ou não.

E se sim, o que tem o R a ver com isso? E se não, ainda mais, onde e o que tem o R a ver com isso?

ZZY A resposta pode ser adivinhada com uma probabilidade de 0,95).

Eu tive problemas financeiros há dois anos atrás. Resolvi-os no espaço de um ano. O Conselheiro Especialista que resolveu esses problemas tinha uma unidade de decisão = floresta aleatória + indicadores. Não existiam garantias teóricas de que o futuro seria semelhante ao passado.

Os problemas financeiros reapareceram. Acabando um novo desenvolvimento com um bloco de decisão SOMENTE em R. Nenhum detalhe a revelar, exceto um: existem justificações teóricas e testes para apoiar a teoria de que o futuro será semelhante ao passado. O tempo ainda não está claro.

 
SanSanych Fomenko:

Teve problemas financeiros há dois anos. Resolveu-o num ano. O conselheiro que resolveu esses problemas tinha uma unidade de decisão = floresta aleatória + indicadores. Não existiam garantias teóricas de que o futuro seria semelhante ao passado.

Os problemas financeiros reapareceram. Acabando um novo desenvolvimento com um bloco de decisão SOMENTE em R. Nenhum detalhe a revelar, exceto um: existem justificações teóricas e testes para apoiar a teoria de que o futuro será semelhante ao passado. A linha do tempo ainda não está clara.

O interessante aqui é que você estava procurando uma maneira de interagir com R tão recentemente quanto há seis meses ou um ano - o resultado foi a DLL. Antes disso, não havia essa possibilidade.

As florestas também apareceram nos seus postos há cerca de um ano. Antes disso era o ADA, etc.

 
Yuriy Asaulenko:

O interessante aqui é que você estava procurando uma maneira de interagir com R tão recentemente quanto seis meses ou um ano atrás - o resultado foi a DLL. Antes disso, não havia essa possibilidade.

As florestas também apareceram nos seus postos há cerca de um ano. Antes disso havia o ADA, etc.

Você não se lembra do artigo sobre florestas de 2014? https://www.mql5.com/ru/articles/1165 Ou do indicador a partir de 2012? Vá para o seu perfil antes de inventar coisas.

Случайные леса предсказывают тренды
Случайные леса предсказывают тренды
  • 2014.09.29
  • СанСаныч Фоменко
  • www.mql5.com
Изначально целью построения торговой системы является предсказание поведения некоторого рыночного инструмента, например, валютной пары. Цели предсказания могут быть разными, мы же ограничимся предсказанием трендов, а точнее предсказанием роста («лонгов») или падения («шортов») значений котировки валютной пары. Обычно, для решения проблемы...
 
elibrarius:
Você não se lembra do artigo sobre florestas de 2014? https://www.mql5.com/ru/articles/1165

Não, não tenho. Eu sou guiado pelo fio condutor. SanSanych estava a falar da ADA aqui na altura. Mudei para um andaime mais tarde.

Mas o principal é que a ligação entre o terminal e o TC é impossível sem ele. O tópico apareceu - Formulação deTermos de Referência para comunicação MQL4/5 com R-2017.01.02 15:59. Fim - 2017.11.30 10:16.

Portanto, não poderia haver sistema de alguma forma ligado ao R antes de 06.2017.

 

Eu não tenho nada contra SanSanych pessoalmente, ele é um homem muito competente e discreto, fazendo algo de seu próprio desconhecido, ele provavelmente precisa de R

Prefiro píton intuitivamente, embora ainda não tenha inventado o que fazer nele para que seja uau, mas continuo a aprender calmamente, para ver se ajuda :D

 
Yuriy Asaulenko:


O interessante aqui é que você estava procurando uma maneira de interagir com R tão recentemente quanto seis meses ou um ano atrás - o resultado foi a DLL. Antes disso, não havia essa possibilidade.

Coloquei o indicador baseado em R em Maio de 2012, ou seja, há seis anos. Antes disso transferi para a DLL da kodobase para comunicação MT4/R (por 7bit). Portanto, a possibilidade de usar o R do MT4 EA foi há muito tempo.
Um ano atrás eu estava procurando por um implementador que refinaria esta DLL antiga por 64 bits. Agora é possível usar R do MT5.


As florestas também apareceram nos seus postos há cerca de um ano. Antes disso havia o ADA, etc.

Sempre escrevi que gostava mais da ada, mas faltava algo para ela no carpete que usava no desenvolvimento e na operação. Foi por isso que usei o pacote randomForest no meu Expert Advisor.

 
Vizard_:

Malditos mineiros, desculpe Jesus))) Originalmente fizeste no C4.5. No guizo que puseste
uma árvore fraca. Maksimka Stoner escreve sobre madeira aleatória em geral. Alguns podem ir para o bosque, outros para o bosque))))).
Nos seus dados, arquivo Pred_004_Buy dividido ao meio, de cabeça, você pode obter 0,85.
Os dados são lixo e é melhor deitar fora. O resto está a recuperar por si só. Em silêncio...

Como eu executo este algoritmo em Rattle ou outro R add-on, como quer que se chame? Interessado em continuar a utilizar os resultados no MT5.

Se 0,85 é fodido, então deve haver um resultado de 100% para este algoritmo, ou há algum argumento de peso?