Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3011

 
Maxim Dmitrievsky #:
Bem, é exatamente a mesma coisa na ficção. Eles têm muitas ideias, não têm tempo para escrevê-las :) e então o conselho editorial, na pessoa de Aleksey Nikolayev, corta tudo.

Um bom editor é bom.

O principal é que ele não deve proibir a publicação do que já funciona, mas ele não entende como.

 
mytarmailS #:

Primeiro, você precisa perceber que o modelo está cheio de lixo por dentro...

Se você decompor um modelo de madeira treinado nas regras internas e nas estatísticas sobre essas regras.

como:


e analisar a dependência do erro da regra de erro em relação à frequência de sua ocorrência na amostra


obtemos


Então, estamos interessados nessa região


onde as regras funcionam muito bem, mas elas são tão raras que faz sentido duvidar da autenticidade das estatísticas sobre elas, porque 10-30 observações não são estatísticas.

Finalmente, o que eu venho dizendo há anos começou a chegar às massas! :)

 
Forester #:

Alguém mais tentou adicionar volumes ao treinamento? Os resultados são os mesmos? Ou eles lhe proporcionam melhorias?

Percebi que modelos como volumes sob o gráfico são executados por meio de indicadores.

Não me aprofundei muito nessa direção - apenas observações.

 
СанСаныч Фоменко #:

Você entendeu completamente mal minha postagem: não existe "esperança", ou há uma estimativa numérica da adequação de uma característica ou não há. E há uma avaliação numérica da adequação da característica no futuro.

Interessante, exatamente sobre o futuro, você revelará os segredos?

 
mytarmailS #:

Trem 5k

validid 60k


treinamento de modelos - 1-3 segundos

extração de regras - 5 a 10 segundos

verificação da validade de cada regra (20-30k regras) - 60k - 1-2 minutos


é claro que tudo isso é aproximado e depende do número de atributos e dados

Que tipo de modelo é esse?

O algoritmo de estimativa de regras é executado em um único núcleo?

 
Aleksey Vyazmikin #:

Que tipo de modelo é esse?

O algoritmo de estimativa de regras é executado em um único núcleo?

Forrest

em um

 
Aleksey Vyazmikin #:

Finalmente aconteceu, o que eu venho dizendo há anos está começando a chegar às massas! :)

Acho que ninguém ainda entende o que você está dizendo).

Ele tem tudo claro e simples, como a navalha de Occam.

 
Forester #:

Esse teste foi feito com volumes reais da CME para EURUSD: volume acumulado, delta, divergência e convergência por 100 barras. Total de 400 colunas + mais 5 de algum tipo.
Sem alterar nenhuma configuração do modelo, apenas excluí 405 colunas com dados da CME (deltas de preço e ziguezagues permaneceram) para um total de 115 colunas e obtive resultados ligeiramente melhores. Ou seja, verifica-se que os volumes às vezes são selecionados em divisões, mas acabam sendo ruído em OOS. E o treinamento fica 3,5 vezes mais lento.

Para comparação, deixei os gráficos com volumes acima e sem volumes abaixo.

Eu esperava que os volumes com CME trouxessem informações/regularidades adicionais que melhorassem o aprendizado. Mas, como você pode ver, os modelos sem volumes são um pouco melhores, embora os gráficos sejam muito semelhantes.
Essa foi minha segunda abordagem à EMC (tentei há 3 anos) e, mais uma vez, não tive sucesso.
Acontece que tudo é levado em conta no preço.

Alguém mais tentou adicionar volumes ao treinamento? Os resultados são os mesmos? Ou você conseguiu que eles apresentassem melhorias?

Fiz mais três testes sem volumes e comparei com os que fiz com volumes. Já alterei os hiperparâmetros do modelo.
Total de 4 testes: em 3 sem volumes, o OOS é melhor e em 1 é pior. Ou seja, às vezes os volumes acrescentam um pouco mais. Em geral, tudo está no nível de erro. Você pode conseguir mais com a força bruta dos hiperparâmetros do que com a adição de volumes. Eles não proporcionam nem melhorias nem deteriorações significativas.

Eu esperava mais dos volumes.

 
Aleksey Vyazmikin #:

Gostaria de saber, especificamente sobre o futuro, se você pode me contar os segredos?

Já escrevi algumas vezes.

 
mytarmailS #:

floresta

em um

Qual porcentagem você está amostrando?

Parece-me que há muito pouca utilidade no forrest se ele dividir usa metade de um preditor cada.