Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3163

 
Ivan Butko #:

Opinião sobre a tentativa de ensinar forex ensinando os agentes a jogar jogos.

Há algum peixe, talvez tenha tentado algo assim, alguma experiência.
Bem, esse é um problema típico de RL ou deepRL ou de otimização
É essencialmente a mesma coisa, mas diferente)
 
Forester #:

Encontrei outro problema.
Encontrei uma boa variante com treinamento uma vez por semana em 5.000 linhas de M5 (3,5 semanas). E decidi mudar todos os dados para 300 linhas - como treinar não aos sábados, mas às terças-feiras. Como resultado, o modelo em OOS, que era lucrativo, tornou-se não lucrativo.
Essas novas 300 linhas (cerca de 8% do total) trouxeram outras fichas e outras divisões, que se tornaram melhores para dados ligeiramente alterados.
Repeti a mudança em 300 para 50000 linhas. Parece ser apenas 0,8% das novas linhas. Mas as alterações no OOS também são significativas, embora não tão fortes quanto com 5.000 linhas.

Em geral, há um ajuste não apenas ao tamanho da janela, mas também ao início da janela. Pequenos deslocamentos fazem uma grande diferença no resultado. Não há características fortes, tudo está no limite de 50/50 ± 1-2%.

Esse parece ser um problema comum das árvores: falta de robustez.

Há uma pequena esperança de que seja possível fazer alguma melhoria mudando para regras de divisão mais elaboradas (em termos de matstat). Isso é algo parecido com as mesmas "árvores de diferença" sobre as quais forneci um link para um artigo recentemente. Ou algo como as estatísticas de qui-quadrado CHAID.

Obviamente, isso não é uma panaceia e não é um fato que esses exemplos específicos de regras de divisão funcionarão para nós. Mas é um exemplo de que as regras de divisão podem e devem ser tratadas de forma criativa.

A principal ideia a ser extraída do matstat é interromper o crescimento da árvore quando um valor p crítico é atingido, e não por alguns motivos de esquerda.
 
Forester #:

Encontrei outro problema.
Encontrei uma boa variante com treinamento uma vez por semana em 5.000 linhas de M5 (3,5 semanas). E decidi mudar todos os dados para 300 linhas - como treinar não aos sábados, mas às terças-feiras. Como resultado, o modelo em OOS, que era lucrativo, tornou-se não lucrativo.
Essas novas 300 linhas (cerca de 8% do total) trouxeram outras fichas e outras divisões, que se tornaram melhores para dados ligeiramente alterados.
Repeti a mudança em 300 para 50000 linhas. Parece ser apenas 0,8% das novas linhas. Mas as alterações no OOS também são significativas, embora não tão fortes quanto com 5.000 linhas.

Em geral, há um ajuste não apenas ao tamanho da janela, mas também ao início da janela. Pequenos deslocamentos fazem uma grande diferença no resultado. Não há características fortes, tudo está no limite de 50/50 ± 1-2%.

Qual modelo?

 
СанСаныч Фоменко #:

Qual modelo?

de madeira
 
Forester #:
de madeira
Você precisa encontrar um conjunto de núcleos que tenha um padrão e treinar somente nele. Ele pode estar em qualquer parte do gráfico e pode ser encontrado por meio de overshooting. Caso contrário, o ruído não permite que o modelo se concentre. A tendência agora são os coresets - pequenas subamostras representativas. É bastante simples e dá resultados.
 

Artigo interessante sobre árvores e aprendizado por reforço no site.....

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4760114/

============================

ideia principal

2.2 Motivação

Em resumo, o modelo de árvore de aprendizado por reforço (RLT) proposto é um modelo tradicional de floresta aleatória com um tipo especial de seleção de variáveis de separação e supressão de variáveis de ruído. Esses recursos são disponibilizados pela implementação do mecanismo de aprendizado por reforço em cada nó interno. Vamos considerar primeiro um exemplo de tabuleiro de xadrez que demonstra o impacto do aprendizado por reforço: Suponha que X ~ uni f [ 0, 1 ] p e E ( Y | X ) = I { I ( I ( X (1) 0 ,5) = I ( X (2) >0 ,5)} A dificuldade em estimar essa estrutura usando as florestas aleatórias usuais é que nenhuma das duas variáveis fortes apresenta efeitos insignificantes.A recompensa imediata , ou seja, a redução nos erros de previsão, do particionamento nessas duas variáveis é assimptoticamente idêntica à recompensa obtida pelo particionamento em qualquer uma das variáveis de ruído. Portanto, quando p é relativamente grande, é improvável que X (1) ou X (2) sejam escolhidos como a variável de separação. Entretanto, se soubermos de antemão que a divisão em X (1) ou X (2) trará benefícios futuros significativos para divisões posteriores, poderemos forçar com segurança uma divisão em qualquer uma das variáveis, independentemente das recompensas imediatas.

=========================

Bem, e pacote no R de acordo

https://cran.r-project.org/web/packages/RLT/RLT.pdf

Reinforcement Learning Trees
Reinforcement Learning Trees
  • www.ncbi.nlm.nih.gov
In this paper, we introduce a new type of tree-based method, reinforcement learning trees (RLT), which exhibits significantly improved performance over traditional methods such as random forests (Breiman, 2001) under high-dimensional settings. The innovations are three-fold. First, the new method implements reinforcement learning at each...
 
Forester #:
de madeira

Qual é o nome exato? Ou é feito em casa?

Uso diferentes modelos de "madeira" há muitos anos e nunca vi nada parecido com isso.

 
mytarmailS #: No entanto, se soubermos de antemão que a divisão em X (1) ou X (2) trará benefícios futuros significativos para divisões posteriores, poderemos forçar com segurança uma divisão em qualquer variável, independentemente das recompensas imediatas.

Posso forçá-la, mas não sei por qual ficha se deve X1, X2 ou X157

 
СанСаныч Фоменко #:

Qual é o nome exato? Ou é feito em casa?

Uso diferentes modelos de "madeira" há muitos anos e nunca vi nada parecido com isso.

Feito em casa. As possibilidades de experimentos não são limitadas....
 
Maxim Dmitrievsky #:
Você precisa encontrar um conjunto de núcleos que tenha um padrão e treinar somente nele. Ele pode estar em qualquer parte do gráfico e é pesquisado por meio de enumeração. Caso contrário, o ruído não permite que o modelo se concentre. A tendência agora são os conjuntos de núcleos - pequenas subamostras representativas. É bastante simples e produz resultados.

Como fazer a pesquisa? Percorra todos os blocos (por exemplo, 100 por 5.000 pp) e veja com que sucesso as outras 500.000 linhas desse modelo preveem as outras 500.000 linhas?