Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 950

 
Aleksey Vyazmikin:

Porquê dividir um ficheiro quando tudo já está dividido em dois ficheiros? Só não sei como o fazer em R, ninguém me consegue explicar, acho que sou estúpido.

Talvez seja mais fácil usar https://www.cs.waikato.ac.nz/ml/weka/downloading.html se você não tiver tempo para estudar programação?

Weka 3 - Data Mining with Open Source Machine Learning Software in Java
  • www.cs.waikato.ac.nz
There are two versions of Weka: Weka 3.8 is the latest stable version, and Weka 3.9 is the development version. For the bleeding edge, it is also possible to download nightly snapshots. Stable versions receive only bug fixes, while the development version...
 
SanSanych Fomenko:

Mas aqui está um modelo diferente:

O resultado é TUDO o resto, embora o modelo seja qualitativamente diferente, deve funcionar mal nos seus dados.


Precisamos de melhorar o Forest random

Entendido, obrigado, então vou lidar com árvores e florestas - gosto muito delas e ideologicamente.

SanSanych Fomenko:

Porquê dividir o ficheiro, se já está tudo dividido em dois ficheiros? Só não sei como fazê-lo em R, ninguém não me conseguiu explicar, aparentemente estúpido.

Dividir é canja, o problema é o preconceito contra o R.


Espero muito que a rede seja capaz de superar um Expert Advisor otimizado em história :)

Porquê a rede?

Eu não tenho preconceitos, apenas tenho um fraco conhecimento da língua, não tenho HELP russo (tenho um livro, mas o livro precisa de ser lido, ao contrário da HELP, e não é certo o que é necessário lá), por isso é um problema de aprendizagem. E não está claro porque é que as pessoas não gostam tanto da GUI - poupa tempo...

E sobre a rede, eu falei mal, é apenas sobre o MO em geral.

 
Maxim Dmitrievsky:

Onde é que apanhou tantos mais distantes? seleccionou-os manualmente para se ajustarem à estratégia? louco :)

a lógica do andaime deve ser a mesma.

Escolhi os predicadores por causa da minha amarga experiência em negociação manual, quando perdi dinheiro e não entendo porque cometi um erro quando entrei no mercado. Eu tenho um problema - não gosto de perder dinheiro e por isso tenho dificuldade em fechar uma posição que me causa muitos problemas se eu trocar à mão. Depois de tais eventos você apenas trabalha duro, testando, analisando, procurando uma solução para evitar uma perda - você gera idéias, verifica o histórico, rejeita algumas delas e não outras. Muitas ideias continuam por implementar devido à dificuldade que tenho em programá-las, mas ficam no papel, os papéis enchem a mesa...

Obrigado pela resposta tranquilizadora sobre o andaime!

 
Roffild:

Talvez seja mais fácil de usar https://www.cs.waikato.ac.nz/ml/weka/downloading.html, se for aborrecido estudar programação?

Eu tenho este século - eu só não sei como usá-lo!

E, então, como fazê-lo funcionar com o MT5?

 

Tudo isto ***, em geral Rattle treinou a floresta em 2015, configurações padrão, deu este resultado

Summary of the Random Forest Model
==================================

Number of observations used to build the model: 98573
Missing value imputation is active.

Call:
 randomForest(formula = as.factor(arr_Buy) ~ .,
              data = crs$dataset[crs$sample, c(crs$input, crs$target)],
              ntree = 500, mtry = 8, importance = TRUE, replace = FALSE, na.action = randomForest::na.roughfix)

               Type of random forest: classification
                     Number of trees: 500
No. of variables tried at each split: 8

        OOB estimate of  error rate: 6.89%
Confusion matrix:
      -1     0     1 class.error
-1 24452  2147    27  0.08164952
0   1138 42398  1180  0.05183827
1     36  2265 24930  0.08449928

Aprendi arquivo csv para testar modelo em outros dados para carregar (para este arquivo deve ser aberto primeiro, como um arquivo para trabalhar com dados, e depois exportado e já este arquivo exportado para abrir na aba Avaliar) - Carreguei para 2016.

Tenho este resultado monótono


Error matrix for the Random Forest model on Pred_027_2015_H2_T_sample.csv (counts):

      Predicted
Actual   -1     0    1 Error
    -1 4640 30809 4303  88.3
    0  5210 54059 6090  17.3
    1  3237 28118 5466  85.2

Error matrix for the Random Forest model on Pred_027_2015_H2_T_sample.csv (proportions):

      Predicted
Actual  -1    0   1 Error
    -1 3.3 21.7 3.0  88.3
    0  3.7 38.1 4.3  17.3
    1  2.3 19.8 3.9  85.2

Overall error: 54.7%, Averaged class error: 63.6%

O que é esta requalificação, configurações erradas, mercado drasticamente diferente?

Então porque obtenho melhores resultados na árvore no Deductor Studio com os mesmos dados?


 

Bem-vindo ao mundo da curvafitting

Por falar nisso, eu tenho feito um poked em EMD - a decomposição tem que ser feita em cada nova barra, o que faz o f-u-mode barulhento à medida que todos os mods ricocheteiam para frente e para trás à medida que novos dados são adicionados. Disparate, só é adequado para casos isolados.

bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem bobagem
 
Maxim Dmitrievsky:

Bem-vindo ao mundo da curvafitting

Por falar nisso, eu tenho feito um poked em EMD - a decomposição tem que ser feita em cada nova barra, o que faz o f-u-mode barulhento como todos os mods ricocheteiam para frente e para trás com a adição de novos dados. Disparate, adequado apenas para casos de 1 vez.

Descobri uma nova forma de gerir posições

No início pensei, é isso, já fui repreendido aqui, acontece que a palavra composta tem um significado diferente...

Você acha que a questão é que a minha saída não é por padrão, mas sim por parar a perda e isso distorce seriamente o resultado?

Em relação à EMD, tenho uma ideia para usar esta abordagem para criar canais de contra-tendência...

Qual é a nova forma de gerir posições?
 
Aleksey Vyazmikin:

No início pensei que era isso, já fui repreendido aqui, mas acontece que a palavra composta tem um significado diferente...

Acha que é porque a minha saída não se baseia num padrão, mas num stop-loss, e isso distorce consideravelmente o resultado?

Em relação à EMD, tive a ideia de usar esta abordagem para criar canais de contra-tendência...

Qual é o método de gestão de posições?

A DME na dinâmica não pode ser aplicada de forma alguma devido às razões acima

É uma longa explicação do método, tudo está entrelaçado com RL

Sim e no seu caso - o resultado é esperado em novos dados. Este é quase sempre o caso. Parcialmente resolvido por conjuntos de modelos independentes
 
Aleksey Vyazmikin:

Tem um resultado tão chato


O que é esta requalificação, configurações erradas, mercado drasticamente diferente?

Então por que estou obtendo melhores resultados na árvore no Deductor Studio com os mesmos dados?



Principal prova de reciclagem: NÃO encontrei nenhum indicador de ruído - todo ruído, por isso é que tão bons resultados no treino.

 
Maxim Dmitrievsky:

A DME não pode ser usada em dinâmica de forma alguma devido às razões descritas acima

o caminho é longo para explicar, está tudo entrelaçado com RL

E no seu caso - o resultado é esperado em novos dados. Este é quase sempre o caso. Parcialmente resolvido por conjuntos de modelos independentes

Vou adicionar mais alguns preditores e passar para o ensembles.... e depois começarão os tamborins e a dança.