Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2018

 
Maxim Dmitrievsky:

Eu acho que o artigo queria... Esboce a essência da abordagem. Eu ainda não entendo o que você está fazendo :D

Mantenho a visão de que as características devem ser extraídas automaticamente pelo próprio modelo da série temporal (se houver alguma). E não há necessidade de fazer nada manualmente. Os incrementos são suficientes. A questão é a arquitectura. Por exemplo, como em PNL (processamento da linguagem neural) a própria rede neural determina o contexto em seqüências de palavras, ou seja, a conexão entre amostras de séries temporais.

A árvore genética e o CatBoost estão fracamente ligados, o artigo que pretendo escrever sobre o CatBoost. Adiei para escrever pela razão de ter encontrado falhas na estabilidade dos indicadores de previsão e de ter lançado todas as forças para corrigi-la, ao mesmo tempo e os novos preditores fizeram. No final da semana pretendo iniciar o processo computacional (caso contrário é incômodo quando os servidores estão ociosos) e tentarei escrever a primeira parte do artigo até o final do mês. O artigo será sobre a minha cozinha de fazer modelos no CatBoost.

Com árvores genéticas é mais complicado, ainda não haverá um artigo sobre isso, mas a abordagem é que selecionamos folhas de árvores que classificam de forma estável uma parte dos dados sobre a história - na verdade 0,5%-3% de todas as respostas da amostra, quanto mais folhas assim, melhor, agora cerca de 1000 para compra e venda, além disso eu procuro folhas que também filtram as folhas selecionadas, ou seja, eu realizo treinamento adicional que aumenta sua precisão. As folhas são agrupadas de acordo com sua semelhança (ainda há algum trabalho a ser feito), então suas respostas são ponderadas dentro de cada grupo no histórico e o limiar no qual o sinal de um grupo de folhas é gerado é determinado. Um filtro adicional é uma árvore genética baseada nas respostas de todas as folhas ou apenas de grupos de folhas. Esta abordagem permite aumentar significativamente a exaustividade da classificação na amostragem desequilibrada, no meu caso com 3 metas, onde a meta "0" é de cerca de 65%.

O trabalho sobre critérios de seleção de folhas e metodologia de sua agregação tem um grande potencial de melhoria e, portanto, os modelos podem ser de maior qualidade.

 
Aleksey Vyazmikin:

O que têm os preditores a ver com isso?

Deve ter ficado confuso, pensando no seu próprio)

 
Maxim Dmitrievsky:

Sou de opinião que as características devem ser extraídas automaticamente pelo próprio modelo da série temporal (se houver). E não há necessidade de fazer nada manualmente. Os incrementos são suficientes. A questão é a arquitectura. Por exemplo, como em PNL (processamento da linguagem neural) a própria rede neural determina o contexto em seqüências de palavras, ou seja, a conexão entre amostras de séries temporais.

Eu concordo sobre arquitetura, precisamos de uma arquitetura completamente diferente, precisamos de um conjunto de redes:

1. identificação de imagens.

2. determinação da ordenação espacial das imagens

3. Procura de padrões nas imagens colocadas no espaço

Agora eu tenho meu próprio cérebro resolvendo para 1 e 2 redes - inventando preditores, e com a terceira tarefa que o CatBoost está fazendo. Para combinar estas redes em uma, será difícil, talvez tentar trabalhar com cada direção separadamente, e depois unir estas redes?

 
Aleksey Vyazmikin:

Agora eu estou resolvendo para 1 e 2 redes com meu cérebro - compondo preditores, e CatBoost está lidando com a terceira tarefa. Seria difícil fundir essas redes em uma só, talvez tentar trabalhar com cada direção separadamente, e depois fundir essas redes?

Você tem que observar as inovações, elas estão constantemente melhorando. As redes modernas têm exatamente a mesma tarefa, fazer tudo de uma só vez.

Procurar por preditores manualmente é como bater numa pedra com uma picareta. E, como todos já viram, quase não funciona.
 
Maxim Dmitrievsky:

você tem que ficar de olho em novos produtos, eles estão constantemente melhorando. As redes modernas têm exatamente a mesma tarefa, fazer tudo de uma só vez.

Procurar por preditores manualmente é como usar uma picareta em uma pedra. E, como todos já viram, quase não funciona.

Tem de ser uma arquitectura muito complexa para fazer tudo ao mesmo tempo, e quanto mais complexa for a arquitectura, mais poder de processamento é necessário.

No entanto, se houver necessidade em capacidades (existem servidores antigos e GPU), estou pronto a fornecê-los para a ideia ;)

 
Aleksey Vyazmikin:

Quanto mais complexa for a arquitectura, mais poder de processamento é necessário.

No entanto, se houver necessidade de energia (existem servidores e GPUs antigos), estou pronto a fornecê-la para a ideia ;)

não é complicado, você só precisa entender

Eu não preciso de energia nenhuma. Eu tenho LSTM no meu laptop aprende em poucos minutos sem nenhuma placa gráfica. Sobre o poder é um mito.

 
Aleksey Vyazmikin:

Quanto mais complexa for a arquitectura, mais poder de processamento é necessário.

No entanto, se houver necessidade de energia (há servidores e GPUs antigos), estou pronto para fornecê-la para a idéia ;).

Pronto para flutuar uma ideia, pessoalmente?

 
Maxim Dmitrievsky:

não é complicado, só tens de descobrir.

Você não precisa de energia nenhuma. Eu posso aprender LSTM no meu laptop em poucos minutos sem placas de vídeo. Sobre o poder é um mito.

Arquiteturas não complexas não funcionam, você mesmo o disse. Os descomplicados precisam de estacionaridade... ciclos.

Uau, alguns minutos é legal, e que topologia de rede é essa, quantas camadas, neurônios?

 
dr.mr.mom:

Pronto para soar as ideias, pessoalmente?

Você pode fazer isso pessoalmente.

 
Aleksey Vyazmikin:

Arquiteturas descomplicadas não funcionam, você mesmo disse. Os descomplicados precisam de estacionaridade... ciclos.

Uau, um par de minutos é legal, e que topologia de rede é essa, quantas camadas, neurônios?

Oh, meu... não é complicado no sentido em que se pode descobrir

geralmente um par de camadas é suficiente, você não precisa de muita profundidade em forex

Existem redes mais avançadas para VR, mais frias do que a lstm. Pode ser lucrativo a partir daí, ainda não verifiquei. Todos os "clássicos", como os impulsos e perseverança, não são adequados para a BP.