Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1292
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Os volumes ajudam a prever a mudança de estado de tendência para plano mas não "sem dificuldade", em geral a previsão do estado "tendência/ plano" não é muito mais precisa do que a direção do próximo incremento, por unidade de tempo, em torno de 57% de precisão, o que eles disseram sobre alguns números incríveis, claramente o resultado de um erro.
O que são esses números?
A aprendizagem de máquinas é um negócio estranho e imprevisível, afinal de contas. Continuando o trabalho de depuração com CatBoost, tenho um modelo que funciona assim (treinamento+teste+exame)
Talvez não sejam muitos negócios (346) de 2014-2019, mas são 1299 sacadas para todo o sempre, o que é menos de 10%. É claro que houve um forte aumento em 2014, o que pode não voltar a acontecer, mas depois disso é bastante suave.
Abaixo está um gráfico apenas sobre a amostra do exame (condicional, pois a amostra é menor que este teste)
Mas não estou apenas mostrando gráficos, não é incomum aqui, e quero dizer que fiquei muito surpreso quando olhei para o conteúdo do modelo - apenas 4 dos 38 preditores são usados lá!
TimeH - tempo em horas
DonProcVisota_M15 - Largura relativa do canal Donchian na M15
LastBarPeresekD_Down_M15 - Número de bares desde a última vez que o canal Donchian foi atravessado
BB_PeresekN_Total_M1 - Número de vezes que o preço cruzou os níveis iDelta durante as últimas x barras
É claro que tenho um grande número de preditores na minha amostra, fracciono-os e depois bebo-os, e tudo se encaixa na minha teoria de que dividir uma amostra pela ganância nem sempre é eficaz - é apenas um método que não garante nada.
Este é o tipo de modelo que eu quero coleccionar e piscina.
A aprendizagem de máquinas é um negócio estranho e imprevisível, afinal de contas. Continuando o trabalho de depuração com CatBoost, tenho um modelo que funciona assim (treinamento+teste+exame)
Talvez não muitos negócios (346) de 2014-2019, mas consegui 1299 sorteios para todo o tempo, o que é menos de 10%. É claro que houve um forte aumento em 2014, o que pode não voltar a acontecer, mas depois disso é bastante suave.
Abaixo está um gráfico apenas sobre a amostra do exame (condicional, pois a amostra é menor que este teste)
Mas não estou apenas mostrando gráficos, não é incomum aqui, e quero dizer que fiquei muito surpreso quando olhei para o conteúdo do modelo - apenas 4 dos 38 preditores são usados lá!
TimeH - tempo em horas
DonProcVisota_M15 - Largura relativa do canal Donchian na M15
LastBarPeresekD_Down_M15 - Número de bares desde a última vez que o canal Donchian foi atravessado
BB_PeresekN_Total_M1 - Número de vezes que o preço cruzou os níveis iDelta durante as últimas x barras
É claro que tenho um grande número de preditores na minha amostra, fracciono-os e depois bebo-os, e tudo se encaixa na minha teoria de que dividir uma amostra pela ganância nem sempre é eficaz - é apenas um método que não garante nada.
Esse é o tipo de modelo que eu quero coleccionar e piscina.
O quê? Yandex só fala da distribuição de torrentes.
Muito provavelmente, a maioria dos preditores são na verdade ruidosos ou correlacionados uns com os outros.
Laterais é o quê? Yandex só fala da distribuição de torrentes.
A idéia não é que eles sejam ruído, mas que alguns preditores se sobreponham a outros - as relações formadas são importantes e precisam ser geradas.
De lado, é claro que este é um termo que inventei para mim mesmo - aplico a bandeira--semente aleatória com um valor numérico específico. É verdade, não sei que alcance tem esse valor, mas vejo que tem um efeito significativo na aprendizagem, e essa randomização controlada me cai bem.
Sentado, claro, é um termo que inventei para mim mesmo - eu aplico a bandeira--semente aleatória com um valor numérico específico. Embora eu não saiba que alcance tem este valor, mas vejo que tem um efeito significativo na aprendizagem, e esta randomização controlada me cai bem.
De preferência, não deve afectar muito os resultados. Caso contrário, você tem um ajuste a uma particular aleatoriedade. Ou seja, aparece uma outra característica (que afeta significativamente), que deve ser otimizada.
Que tipo de números?
Acho que vi alguém acima que disse que as tendências/flats são previstas por quase 90%, o neto ou aprendiz de alguém, acho que ele disse.
Acho que vi alguém de cima que disse que as tendências/flats são previstas por quase 90%, o neto ou aprendiz de alguém disse que
acho que vi alguém acima dizendo que as tendências/flutuações são previstas por quase 90%, o neto ou aprendiz de alguém, acho que ele disse
Aah!
Bem, se não há carrapatos, o mercado provavelmente está num apartamento, 100%.
e se há muitas carraças, não é um apartamento.A corrigir a aleatoriedade. Isto é normalmente usado para reprodutibilidade de resultados em reinícios.
De preferência, não deve afectar muito o resultado. Caso contrário, você tem um ajuste a uma particular aleatoriedade. Ou seja, aparece uma outra característica (que afeta significativamente), que deve ser otimizada.
Sim, preciso dele para reproduzir o resultado mais tarde e para gerar resultados em geral.
Só não está totalmente claro como funciona, eu entendo que este parâmetro é responsável pela aleatoriedade dos resultados da divisão ao selecionar a melhor opção, mas não consigo encontrar os detalhes em nenhum lugar.
E sobre o encaixe... Temos que assumir que tudo é um ajuste potencial, e só podemos verificar a estabilidade das conexões ao longo do tempo e monitorar a eficácia dessas conexões, por exemplo, esse modelo consiste de 4 árvores, cada uma delas também 4 de profundidade, ou seja, devido ao pequeno número de combinações o ajuste aqui é muito eficaz, e assim pode ser algum tipo de regularidade em vez de apenas uma descrição da amostra.