Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 952

 
Dr. Trader:

Para o último arquivo eu tinha isto com a árvore :

2016, formação


y_pred

y_true-101
-113392388444472
010803767146029
17413376787415


2015, teste:


y_pred

y_true-101
-19552392625429
011495721317509
18581403776835

ao prever -1: -1 ocorrerá de facto um pouco mais vezes do que 1. Mas 0 será o mais frequente de todos, e provavelmente tudo terminará em perdas. Da mesma forma, para a classe "1".


Surgiram problemas com a árvore. A genética escolheu o parâmetro de árvore cp = 0, e isto dá à árvore permissão para um monte de ramos. Infelizmente, deveríamos ter restringido este parâmetro a algum pequeno valor não nulo.

É possível representar a figura em termos de probabilidades, como antes? Talvez haja ramos mais significativos nos dados do teste?

Dr. Trader:

Acho que não há preditores suficientes nos dados para classificar o "0". Precisa de alguns indicadores de planicidade, por exemplo.

Em geral é mau com a árvore. A madeira do SanSanych é muito melhor.


Má configuração do modelo e, como consequência, excesso de treino.

Ele levou apenas um arquivo 2016 (a propósito, em 2015 havia menos um preditor - corrigi-o, posso voltar a carregá-lo), e este ano 2016 estava com tendência para cima!

A árvore está agarrada aos dados das TFs superiores, e há essencialmente poucas estatísticas sobre elas, e por causa disso pode haver um kazoon na história, quando o vetor do movimento global muda (2015 para cima e 2016 para baixo) ou há um flat total (2017).

Quanto ao apartamento, temos objectivos que resolvem a entrada no mercado, bem como a inversão, podemos tentar separá-los de alguma forma?

O apartamento é bem identificado por preditores como Levl, o único problema é que a árvore não consegue conectá-los, pelo menos em uma TF.

 

Você fez lá um robô rentável :)

Entrada em longo - apenas quando se prevê "1" (em azul), dos quais >90% será lucro (em verde).
Entrar curto - somente quando se prevê "-1" (em vermelho), dos quais novamente >90% será lucro (verde).
Previsões de "0" significam não abrir novas posições e esperar por um melhor timing, por isso não importa em nada qual é a precisão real antes de prever esta classe.

Mas é melhor, por exemplo, treinar a floresta no arquivo 2015, e verificá-la no arquivo 2016. Falta apenas uma coluna em 2015, que deve ser removida a partir de 2016 também, para que o barulho não seja confundido.

 
Aleksey Vyazmikin:

A figura pode ser representada em termos de probabilidades como antes?

Não, este é um modo diferente de aprendizagem em árvore, adequado apenas para 2 aulas. Ou por regressão.

 
SanSanych Fomenko:

Que frieza existe - reciclagem e nada mais, ele não tem um único preditor que se relacione com sua variável-alvo - todo o ruído. E fica no guizo e em vez de verificar o barulho, coloca arquivos com lixo aqui.

Sim, os alvos não têm uma ligação clara com os preditores, apenas mostram o resultado financeiro da entrada no mercado em um determinado momento.

Você acha que o resultado será melhor se a lógica das entradas estiver ligada a indicadores de alguns dos preditores, ou seja, se entrarmos em МА crossing, definimos o resultado (1 ou -1) e damos informações sobre o fato de MA cross into predictors?

 
Aleksey Vyazmikin:

A árvore agarra-se aos dados das TFs superiores, mas não há estatísticas suficientes sobre elas e por isso pode haver um kazoon na história, quando o vector de movimento global muda (2015 para cima e 2016 para baixo) ou há um flat total (2017).

Quanto ao apartamento, temos objectivos que resolvem a entrada no mercado, bem como a inversão, podemos tentar separá-los de alguma forma?

O apartamento é bem identificado por preditores como Levl, o único problema é que a árvore não consegue conectá-los, pelo menos em uma TF.

É claro que já temos diferentes indicadores planos, mas a árvore não consegue ligá-los entre si. Então é provavelmente tudo, é o limite das possibilidades da árvore.

Ontem recebi os resultados quase tão precisos, mas com um número menor de entradas em negócios. O que eu tenho hoje não é muito melhor. Alguma coisa correu mal e vou pensar em que ajustes podem ser corrigidos.

 
Aleksey Vyazmikin:

Sim, os alvos não estão claramente ligados aos preditores, apenas mostram o resultado financeiro da entrada no mercado num determinado momento.

Você acha que o resultado será melhor se a lógica dos inputs estiver conectada com indicadores de alguns dos preditores, ou seja, se entrarmos no cruzamento do MA, determinamos o resultado (1 ou -1) e se dermos informações sobre o fato do cruzamento do MA com os preditores?

E essa é a minha opinião: o lixo na entrada é lixo na saída! São as primeiras linhas dos manuais de estatística.

 
Dr. Trader:

Você fez lá um robô rentável :)

Ir longe seria apenas uma previsão de "1" (em azul), dos quais >90% seriam lucrativos (em verde).
Entrar curto - somente quando se prevê "-1" (em vermelho), dos quais novamente >90% será lucro (em verde).
A previsão "0" significa não abrir novas posições e esperar por um melhor timing, por isso não importa realmente qual é a precisão real nesta classe de previsão.

Mas é melhor, por exemplo, treinar a floresta no arquivo 2015, e verificá-la no arquivo 2016. Falta apenas uma coluna em 2015, que deve ser removida também de 2016, para que o chocalhar não seja confundido.

Eu não construí nada - peguei um arquivo pronto e construí o Forest random, mas fui preguiçoso demais para dividi-lo em dois arquivos. O Alexey fez isso por mim e mostrou um resultado assassino, que cobre completamente as minhas "realizações".

 
Dr. Trader:

Oh, estou a ver, já existem vários indicadores planos, mas a árvore não sabe como ligá-los entre si. Então é provavelmente tudo, este é o limite das capacidades da árvore.

Tive quase os mesmos resultados ontem em termos de precisão, mas com um número menor de entradas em negócios. O que eu tenho hoje não é muito melhor. Alguma coisa correu mal, vou considerar que configurações podem ser corrigidas.

Sim, penso que precisamos de uma árvore que possa ser ajudada - para mostrar relações prováveis entre os preditores e para estabelecer condições para comparações prováveis para a tomada de decisões.

Eis como explicar à árvore que a tendência global é para cima e para baixo? É claro que posso usar a mesma ferramenta, desenhar um canal, fazer um percentil, ou seja, indicar claramente para onde o vector de tendência é dirigido, mas a árvore pode simplesmente ignorar este preditor, enquanto que, na minha opinião, deve dividir todo o grupo em pelo menos dois por vector de tendência global.

Não sei, talvez devêssemos ajustar (dividir em partes) a amostra de situações, treinar sobre ela e depois identificar à força a mesma tendência global no Expert Advisor e ouvir uma ou outra árvore dependendo do vetor.

 
SanSanych Fomenko:

O que é que isto tem a ver com a minha opinião: o lixo entra, o lixo sai! Estas são as primeiras linhas dos manuais de estatística.

Não se trata de lixo - o input é na verdade um conjunto de probabilidades de resultados de eventos, estas probabilidades são influenciadas por preditores, e o output é o resultado de muitos eventos diferentes e independentes, embora o resultado possa ser o mesmo. Vou pensar em uma entrada clara e remover todas as variantes sem sinal de entrada - será interessante ver o resultado. Embora eu ainda não consiga obter nenhum feedback dos participantes aqui - devemos marcar o input explicitamente nos preditores, se forem usadas diferentes estratégias de input?

 

Estamos todos à procura de pontos de entrada, mas talvez devêssemos tentar procurar um apartamento?

Talvez alguém tenha um indicador/escrito para detectar apartamentos na história?

Acho que podemos tomar um canal de regressão com o alcance de 100, deslocá-lo em cada barra e se a inclinação for maior/baixa que X, podemos considerar que a área descrita pelo canal é plana. O que você acha?