Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1290

 
Aleksey Vyazmikin:

Isto encaixa facilmente na minha teoria sobre o mercado. Simplesmente, alguém com muito dinheiro ligou seu algoritmo para seleção/operação de posição, algum grande banco, talvez o Banco Central, naturalmente isso não é feito rapidamente, mas como esse participante era dominante e a situação do mercado contribuiu para isso, foi possível encontrar sinais de seu algoritmo. Claro que, depois que o participante deixou de influenciar o mercado, os sinais deixaram de funcionar. Há muitos desses participantes (talvez 100), seus algoritmos podem se sobrepor, mas há uma suposição de que eles são semelhantes (lembre-se da análise técnica e dos requisitos para os bancos justificarem suas operações comerciais com base nessa análise (pelo menos na Rússia)), e por esta razão faz sentido analisar uma grande amostra, onde um e o mesmo algoritmo é executado várias vezes, então há uma chance de entender como ele funciona, descrever seus sinais indiretos, mas o modelo deve aprender a identificá-lo e não trabalhar com ruído neste momento, esperando que o algoritmo se ligue, sob o qual Eu acho que isso funcionaria ainda melhor em ações e derivativos, eu não faço MO em forex.

Mas o resultado final é que precisamos de encontrar modelos de 10 que descrevam o algoritmo para os indivíduos com muito dinheiro, e aprender como determinar qual algoritmo é preferível. Como o ciclo do algoritmo pode ser de alguns dias e provavelmente será repetido durante um curto período de tempo, não há problema se entrarmos com um pequeno atraso, o principal é escolher o modelo certo para este algoritmo.

Não sei se consigo encontrar 10 padrões. Mas o fato de a informação que entra no mercado estar estruturada em um ciclo que tem um começo, uma continuação e um fim é certo.

O ponto de bifurcação é exatamente o momento de impacto de uma nova porção explosiva de informação, que é então estruturada no tempo. Um distúrbio que se dispersa em círculos (ondas) durante algum tempo.

É por isso que, por exemplo, os padrões dentro dos contratos de futuros são mais fortes do que dentro de diferentes contratos de futuros.

 
Maxim Dmitrievsky:

na história existe, eu não sei como algoritmá-la

Pode muito bem existir na história. É possível detectá-lo em tempo real, e a tempo, mesmo? Se for desconhecido, então não é certo que a solução exista sequer.

Eu costumo verificar essas coisas com estatísticas. Na sua maioria, os resultados não são nada). Você pode ver com seus olhos, mas as estatísticas dizem que não há nada lá - um reflexo aparente da lua aparente).

 
Yuriy Asaulenko:

Na história, ela pode muito bem existir. É possível detectar isto em tempo real, e a tempo? Se for desconhecido, não é de todo certo que exista sequer uma solução.

Eu costumo verificar essas coisas com estatísticas. Na sua maioria, os resultados não são nada). Você pode ver com os olhos, mas as estatísticas dizem que não há nada lá - um reflexo aparente da lua aparente).

Se você olhar para o gráfico, você pode fazer isso com os olhos, eu não posso fazer isso programático.

 
Maxim Dmitrievsky:

Não sei se consigo encontrar 10 padrões. Mas o facto de a informação que entra no mercado estar estruturada num ciclo que tem um início, uma continuação e um fim é certo.

Para isso você precisa abandonar os algoritmos de flip e ensinar o modelo a não estar sempre no mercado. A minha estratégia permite fazer isto e agora estou a experimentar nesta direcção com modelos de catbust. Infelizmente as folhas da árvore que tenho guardado há meio ano já não podem ser aplicadas, porque fiz algumas alterações nos preditores (houve erros na lógica e atrasos nivelados na abertura dos bares - ou seja, o problema com o cálculo foi em atrasos em tempo real), mas trabalhar com eles confirma que existe a possibilidade de detectar padrões que são mais precisos individualmente do que o poder preditivo da árvore/floresta, e portanto a sua combinação dá bons resultados.

Maxim Dmitrievsky:

E o ponto de bifurcação é justamente quando uma nova porção explosiva de informação é exposta, que depois é estruturada ao longo do tempo. Um distúrbio que se dispersa em círculos (ondas) durante algum tempo.

É por isso que, por exemplo, os padrões dentro dos contratos de futuros são mais fortes do que em diferentes contratos de futuros, tem sido notado.

Portanto, é necessário identificar esses pontos, talvez eles devam ser alvos. E um modelo os identifica e, dependendo do alvo, seleciona um modelo de negociação apropriado. Outra coisa é que devemos pensar novamente em preditores e convolução de dados, a fim de expressar o período de início do ciclo em uma linha, quando o período em si pode ser definido em (ao longo de), digamos, 10 barras.

 
Maxim Dmitrievsky:

Se você colocar no gráfico, você pode fazê-lo com os seus olhos, eu não posso fazer isso programático.

Programmaticamente, é uma história muito longa.

O sistema anterior tinha >30 condições (parâmetros) para entradas longas, o mesmo para calções, e um pouco menos para saídas. Houve muito trabalho, incluindo a construção de muitos conjuntos, e sua separação, eliminação de quaisquer negócios com condições adicionais incluídas nos conjuntos, etc.

 
Aleksey Vyazmikin:
Yuriy Asaulenko:

Programmaticamente, é uma história muito longa.

O sistema anterior tinha >30 condições (parâmetros) para entradas longas, o mesmo para calções, e um pouco menos para saídas. Houve muito trabalho, incluindo a construção de muitos conjuntos, e sua separação, eliminação de quaisquer negócios que caíssem de conjuntos com condições adicionais, etc.

Por isso temos de identificar estes pontos, talvez eles devessem ser alvos. E um modelo identifica esses pontos e o outro seleciona o modelo de negociação correspondente, dependendo do modelo alvo. Outra coisa é que devemos pensar novamente em preditores e convolução de dados, a fim de expressar o período de início do ciclo em uma linha, quando o período em si pode ser definido em (ao longo de), digamos, 10 barras.

Bem, é claro que é um insecto, ninguém argumenta ))

 
Sobre o catbucht, descobriu-se que é possível executar mais de um processamento na GPU via lote, ou seja, executar dois lotes ao mesmo tempo, chamando o aplicativo de console. E neste caso, pelo menos nos meus modelos, a velocidade da GPU para produzir modelos não muda, o que significa que é possível fazer cálculos paralelos. O limite e as limitações ainda não são totalmente compreendidos. Larga a tua algália e vamos torturar o catbust ;)
 
Aleksey Vyazmikin:
Sobre a catbucht, verificou-se que na GPU é possível executar mais de um processamento via lote, ou seja, executar dois lotes ao mesmo tempo, chamando o aplicativo de console. E neste caso, pelo menos nos meus modelos, a velocidade da GPU para produzir modelos não muda, o que significa que é possível fazer cálculos paralelos. O limite e as limitações ainda não são totalmente compreendidos. Larga a tua algália e vamos torturar o catbust ;)

o software é surpreendentemente bom (ao contrário de tudo o resto do Yandex), até usa o CERN para processar os dados do colisor

ainda não há tempo, então talvez mais tarde.

 
Aleksey Vyazmikin:

Existe também um software fixe KNIME de todo o tipo de impulsionamento, análise e visualização de dados

é possível serrar xgboost sem programação, catboost também parece ser possível adicionar

KNIME - Open for Innovation
KNIME - Open for Innovation
  • 2019.01.28
  • www.knime.com
KNIME, the open platform for your data.
 
Maxim Dmitrievsky:

o software é surpreendentemente bom (ao contrário de tudo o resto do Yandex), até usa o CERN para processar os dados do colisor

ainda não há tempo, talvez mais tarde.

Eu acho que há uma contribuição importante do código aberto, que é periodicamente corrigido e novas versões são adicionadas. Eh, se eu pudesse ler esse código... parece-me que há lá um clã de ideias que podes pedir emprestado e desenvolver-te, dando-te o teu próprio impulso.


MaximDmitrievsky:

Existe também um software fixe KNIME de reforço, análise e visualização de dados

você pode escrever xgboost sem programação, catboost parece ser capaz de adicioná-lo também!

Obrigado! Por enquanto o catboost é suficiente para mim porque eu tenho depurado todo o ciclo com ele, desde a criação da amostra até a implementação no Expert Advisor. E ao contrário da ponte via pitão, eu posso usar a otimização para testar diferentes modelos, suas combinações e apenas interpretações das "probabilidades" que eles produzem.

Embora eu não possa trabalhar exatamente com sinais categóricos (recurso CatBoost) - eu não tenho um intérprete de modelos desse tipo, mas minha pesquisa preliminar mostrou que usar tais modelos dá mais estabilidade nos intervalos de tempo, ou seja, os modelos são melhores, embora o treinamento seja 5 vezes mais lento.