Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1292

 
Graal:

Os volumes ajudam a prever a mudança de estado de tendência para plano mas não "sem dificuldade", em geral a previsão do estado "tendência/ plano" não é muito mais precisa do que a direção do próximo incremento, por unidade de tempo, em torno de 57% de precisão, o que eles disseram sobre alguns números incríveis, claramente o resultado de um erro.

O que são esses números?

 

A aprendizagem de máquinas é um negócio estranho e imprevisível, afinal de contas. Continuando o trabalho de depuração com CatBoost, tenho um modelo que funciona assim (treinamento+teste+exame)

Talvez não sejam muitos negócios (346) de 2014-2019, mas são 1299 sacadas para todo o sempre, o que é menos de 10%. É claro que houve um forte aumento em 2014, o que pode não voltar a acontecer, mas depois disso é bastante suave.

Abaixo está um gráfico apenas sobre a amostra do exame (condicional, pois a amostra é menor que este teste)

Mas não estou apenas mostrando gráficos, não é incomum aqui, e quero dizer que fiquei muito surpreso quando olhei para o conteúdo do modelo - apenas 4 dos 38 preditores são usados lá!

TimeH - tempo em horas

DonProcVisota_M15 - Largura relativa do canal Donchian na M15

LastBarPeresekD_Down_M15 - Número de bares desde a última vez que o canal Donchian foi atravessado

BB_PeresekN_Total_M1 - Número de vezes que o preço cruzou os níveis iDelta durante as últimas x barras

É claro que tenho um grande número de preditores na minha amostra, fracciono-os e depois bebo-os, e tudo se encaixa na minha teoria de que dividir uma amostra pela ganância nem sempre é eficaz - é apenas um método que não garante nada.

Este é o tipo de modelo que eu quero coleccionar e piscina.

 
Aleksey Vyazmikin:

A aprendizagem de máquinas é um negócio estranho e imprevisível, afinal de contas. Continuando o trabalho de depuração com CatBoost, tenho um modelo que funciona assim (treinamento+teste+exame)

Talvez não muitos negócios (346) de 2014-2019, mas consegui 1299 sorteios para todo o tempo, o que é menos de 10%. É claro que houve um forte aumento em 2014, o que pode não voltar a acontecer, mas depois disso é bastante suave.

Abaixo está um gráfico apenas sobre a amostra do exame (condicional, pois a amostra é menor que este teste)

Mas não estou apenas mostrando gráficos, não é incomum aqui, e quero dizer que fiquei muito surpreso quando olhei para o conteúdo do modelo - apenas 4 dos 38 preditores são usados lá!

TimeH - tempo em horas

DonProcVisota_M15 - Largura relativa do canal Donchian na M15

LastBarPeresekD_Down_M15 - Número de bares desde a última vez que o canal Donchian foi atravessado

BB_PeresekN_Total_M1 - Número de vezes que o preço cruzou os níveis iDelta durante as últimas x barras

É claro que tenho um grande número de preditores na minha amostra, fracciono-os e depois bebo-os, e tudo se encaixa na minha teoria de que dividir uma amostra pela ganância nem sempre é eficaz - é apenas um método que não garante nada.

Esse é o tipo de modelo que eu quero coleccionar e piscina.

Muito provavelmente, a maioria dos preditores são na verdade ruidosos ou correlacionados entre si.

O quê? Yandex só fala da distribuição de torrentes.
 
elibrarius:
Muito provavelmente, a maioria dos preditores são na verdade ruidosos ou correlacionados uns com os outros.

Laterais é o quê? Yandex só fala da distribuição de torrentes.

A idéia não é que eles sejam ruído, mas que alguns preditores se sobreponham a outros - as relações formadas são importantes e precisam ser geradas.

De lado, é claro que este é um termo que inventei para mim mesmo - aplico a bandeira--semente aleatória com um valor numérico específico. É verdade, não sei que alcance tem esse valor, mas vejo que tem um efeito significativo na aprendizagem, e essa randomização controlada me cai bem.

 
Olá, malta. Eu quero saber o indicador que faz um gráfico de fundos pelos resultados dos testes de estratégia no testador. Não consigo encontrá-lo... Eu lembro-me disso. Se alguém o tiver à mão, atira-o a mim. Obrigado!
 
Aleksey Vyazmikin:

Sentado, claro, é um termo que inventei para mim mesmo - eu aplico a bandeira--semente aleatória com um valor numérico específico. Embora eu não saiba que alcance tem este valor, mas vejo que tem um efeito significativo na aprendizagem, e esta randomização controlada me cai bem.

A corrigir a aleatoriedade. Normalmente é usado para reprodutibilidade de resultados durante as repetições.
De preferência, não deve afectar muito os resultados. Caso contrário, você tem um ajuste a uma particular aleatoriedade. Ou seja, aparece uma outra característica (que afeta significativamente), que deve ser otimizada.
 
Renat Akhtyamov:

Que tipo de números?

Acho que vi alguém acima que disse que as tendências/flats são previstas por quase 90%, o neto ou aprendiz de alguém, acho que ele disse.

 
Graal:

Acho que vi alguém de cima que disse que as tendências/flats são previstas por quase 90%, o neto ou aprendiz de alguém disse que

Sim, 100% que depois de um apartamento, vai haver uma tendência. O que há para prever.
 
Graal:

acho que vi alguém acima dizendo que as tendências/flutuações são previstas por quase 90%, o neto ou aprendiz de alguém, acho que ele disse

Aah!

Bem, se não há carrapatos, o mercado provavelmente está num apartamento, 100%.

e se há muitas carraças, não é um apartamento.
 
elibrarius:
A corrigir a aleatoriedade. Isto é normalmente usado para reprodutibilidade de resultados em reinícios.
De preferência, não deve afectar muito o resultado. Caso contrário, você tem um ajuste a uma particular aleatoriedade. Ou seja, aparece uma outra característica (que afeta significativamente), que deve ser otimizada.

Sim, preciso dele para reproduzir o resultado mais tarde e para gerar resultados em geral.

Só não está totalmente claro como funciona, eu entendo que este parâmetro é responsável pela aleatoriedade dos resultados da divisão ao selecionar a melhor opção, mas não consigo encontrar os detalhes em nenhum lugar.

E sobre o encaixe... Temos que assumir que tudo é um ajuste potencial, e só podemos verificar a estabilidade das conexões ao longo do tempo e monitorar a eficácia dessas conexões, por exemplo, esse modelo consiste de 4 árvores, cada uma delas também 4 de profundidade, ou seja, devido ao pequeno número de combinações o ajuste aqui é muito eficaz, e assim pode ser algum tipo de regularidade em vez de apenas uma descrição da amostra.