Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3163
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Opinião sobre a tentativa de ensinar forex ensinando os agentes a jogar jogos.
Há algum peixe, talvez tenha tentado algo assim, alguma experiência.Encontrei outro problema.
Em geral, há um ajuste não apenas ao tamanho da janela, mas também ao início da janela. Pequenos deslocamentos fazem uma grande diferença no resultado. Não há características fortes, tudo está no limite de 50/50 ± 1-2%.Encontrei uma boa variante com treinamento uma vez por semana em 5.000 linhas de M5 (3,5 semanas). E decidi mudar todos os dados para 300 linhas - como treinar não aos sábados, mas às terças-feiras. Como resultado, o modelo em OOS, que era lucrativo, tornou-se não lucrativo.
Essas novas 300 linhas (cerca de 8% do total) trouxeram outras fichas e outras divisões, que se tornaram melhores para dados ligeiramente alterados.
Repeti a mudança em 300 para 50000 linhas. Parece ser apenas 0,8% das novas linhas. Mas as alterações no OOS também são significativas, embora não tão fortes quanto com 5.000 linhas.
Esse parece ser um problema comum das árvores: falta de robustez.
Há uma pequena esperança de que seja possível fazer alguma melhoria mudando para regras de divisão mais elaboradas (em termos de matstat). Isso é algo parecido com as mesmas "árvores de diferença" sobre as quais forneci um link para um artigo recentemente. Ou algo como as estatísticas de qui-quadrado CHAID.
Obviamente, isso não é uma panaceia e não é um fato que esses exemplos específicos de regras de divisão funcionarão para nós. Mas é um exemplo de que as regras de divisão podem e devem ser tratadas de forma criativa.
A principal ideia a ser extraída do matstat é interromper o crescimento da árvore quando um valor p crítico é atingido, e não por alguns motivos de esquerda.Encontrei outro problema.
Em geral, há um ajuste não apenas ao tamanho da janela, mas também ao início da janela. Pequenos deslocamentos fazem uma grande diferença no resultado. Não há características fortes, tudo está no limite de 50/50 ± 1-2%.Encontrei uma boa variante com treinamento uma vez por semana em 5.000 linhas de M5 (3,5 semanas). E decidi mudar todos os dados para 300 linhas - como treinar não aos sábados, mas às terças-feiras. Como resultado, o modelo em OOS, que era lucrativo, tornou-se não lucrativo.
Essas novas 300 linhas (cerca de 8% do total) trouxeram outras fichas e outras divisões, que se tornaram melhores para dados ligeiramente alterados.
Repeti a mudança em 300 para 50000 linhas. Parece ser apenas 0,8% das novas linhas. Mas as alterações no OOS também são significativas, embora não tão fortes quanto com 5.000 linhas.
Qual modelo?
Qual modelo?
de madeira
Artigo interessante sobre árvores e aprendizado por reforço no site.....
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4760114/
============================
ideia principal
2.2 Motivação
Em resumo, o modelo de árvore de aprendizado por reforço (RLT) proposto é um modelo tradicional de floresta aleatória com um tipo especial de seleção de variáveis de separação e supressão de variáveis de ruído. Esses recursos são disponibilizados pela implementação do mecanismo de aprendizado por reforço em cada nó interno. Vamos considerar primeiro um exemplo de tabuleiro de xadrez que demonstra o impacto do aprendizado por reforço: Suponha que X ~ uni f [ 0, 1 ] p e E ( Y | X ) = I { I ( I ( X (1) 0 ,5) = I ( X (2) >0 ,5)} A dificuldade em estimar essa estrutura usando as florestas aleatórias usuais é que nenhuma das duas variáveis fortes apresenta efeitos insignificantes.A recompensa imediata , ou seja, a redução nos erros de previsão, do particionamento nessas duas variáveis é assimptoticamente idêntica à recompensa obtida pelo particionamento em qualquer uma das variáveis de ruído. Portanto, quando p é relativamente grande, é improvável que X (1) ou X (2) sejam escolhidos como a variável de separação. Entretanto, se soubermos de antemão que a divisão em X (1) ou X (2) trará benefícios futuros significativos para divisões posteriores, poderemos forçar com segurança uma divisão em qualquer uma das variáveis, independentemente das recompensas imediatas.
=========================
Bem, e pacote no R de acordo
https://cran.r-project.org/web/packages/RLT/RLT.pdf
de madeira
Qual é o nome exato? Ou é feito em casa?
Uso diferentes modelos de "madeira" há muitos anos e nunca vi nada parecido com isso.
Posso forçá-la, mas não sei por qual ficha se deve X1, X2 ou X157
Qual é o nome exato? Ou é feito em casa?
Uso diferentes modelos de "madeira" há muitos anos e nunca vi nada parecido com isso.
Você precisa encontrar um conjunto de núcleos que tenha um padrão e treinar somente nele. Ele pode estar em qualquer parte do gráfico e é pesquisado por meio de enumeração. Caso contrário, o ruído não permite que o modelo se concentre. A tendência agora são os conjuntos de núcleos - pequenas subamostras representativas. É bastante simples e produz resultados.
Como fazer a pesquisa? Percorra todos os blocos (por exemplo, 100 por 5.000 pp) e veja com que sucesso as outras 500.000 linhas desse modelo preveem as outras 500.000 linhas?