Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2563

 
Maxim Dmitrievsky #:

então você precisa ser mais específico.

Estou a pensar em escrever um artigo a explicar com mais detalhes o que estou a fazer.

Eu queria discutir abordagens semelhantes aqui, mas afinal não havia interesse.

Em resumo, eis o que eu faço por etapas:

1. Por meio do CatBoost eu salvo diferentes tipos de tabelas quânticas com diferentes números de "quanta" (pré-splits forçados).

2. eu analiso cada quantum pelo roteiro para estabilidade e capacidade de previsão do indicador.

2.1 Ultrapassar o limiar de completude e precisão de toda a amostra.

2.2 Avaliação da estabilidade do desvio do indicador preditor do indicador alvo em relação ao indicador alvo na área da amostra - Retiro 7 pontos e peneio por RMS.

3. selecciono os melhores quanta de todas as tabelas para cada preditor tendo em conta a sua não sobreposição no espaço de alcance para o qual a quantização teve lugar.

4. Eu crio uma nova amostra (dois tipos combinados em todos os quanta e nenhum) onde o preditor do quanta tem um sinal de 0 ou 1.

5. Excluo os preditores que têm um sinal semelhante na amostra.

6. Ensinar o modelo.

Se após o ponto 5 também fizermos uma verificação de robustez na amostra de teste e exame e selecionarmos apenas os preditores que mostram um resultado satisfatório, então os resultados do treinamento melhoram consideravelmente. Isto é uma espécie de fraude, mas se vale a pena usar ou não, é uma questão de experimentação. O meu pressuposto é que quanto mais tempo os indicadores estiverem estáveis, mais provável é que continuem estáveis.

Se você tiver alguma dúvida sobre uma determinada etapa, pergunte, tentarei lhe dar mais informações.

P.S. Você também poderia simplesmente salvar a tabela de quant amostra, excluir preditores ineficientes e treinar em uma amostra regular - isso também melhorará o aprendizado.
 
Aleksey Vyazmikin #:

Estou a pensar em escrever um artigo a explicar com mais detalhes o que estou a fazer.

Eu queria discutir abordagens semelhantes aqui, mas afinal não havia interesse.

Em resumo, eis o que eu faço por etapas:

1. Por meio do CatBoost eu salvo diferentes tipos de tabelas quânticas com diferentes números de "quanta" (pré-splits forçados).

2. eu analiso cada quantum pelo roteiro para estabilidade e capacidade de previsão do indicador.

2.1 Ultrapassar o limiar de completude e precisão de toda a amostra.

2.2 Avaliação da estabilidade do desvio do indicador preditor do indicador alvo em relação ao indicador alvo na área da amostra - Retiro 7 pontos e peneio por RMS.

3. selecciono os melhores quanta de todas as tabelas para cada preditor tendo em conta a sua não sobreposição no espaço de alcance para o qual a quantização teve lugar.

4. Eu crio uma nova amostra (dois tipos combinados em todos os quanta e nenhum) onde o preditor do quanta tem um sinal de 0 ou 1.

5. Excluo os preditores que têm um sinal semelhante na amostra.

6. Ensinar o modelo.

Se após o ponto 5 também fizermos uma verificação de robustez no teste e na amostra do exame, e seleccionarmos apenas os preditores que mostraram um resultado satisfatório, então os resultados do treino melhoram consideravelmente. Isto é uma espécie de fraude, mas se vale a pena usar ou não, é uma questão de experimentação. O meu pressuposto é que quanto mais tempo os indicadores estiverem estáveis, mais provável é que continuem estáveis.

Se houver perguntas sobre um determinado passo - pergunte, eu tentarei dar mais informações.

P.S. Você também poderia simplesmente salvar a tabela de quant amostra, excluir preditores ineficientes e treinar em uma amostra regular - isto também melhorará o aprendizado.

O que são mesas quânticas? Mesas divisórias de árvores? Nunca fiz tal coisa.

melhor um artigo com exemplos
 
Maxim Dmitrievsky #:

o que são mesas quânticas? mesas divisórias de árvores? eu nunca fiz uma

artigo melhor com exemplos

As tabelas quânticas estão dividindo um preditor em limites/granjas, que estão então envolvidos na aprendizagem. Sim, já escrevi sobre isso muitas vezes.

 
Aleksey Vyazmikin #:

As tabelas quânticas são uma partição do preditor em limites/fronteiras, que depois são envolvidas na aprendizagem. Sim, já escrevi sobre isso muitas vezes.

Oh, estou a ver. Parece que a quantificação dos chips é usada apenas para acelerar a aprendizagem. Ou é uma difícil? Sou apenas um apoiante da abordagem clássica mais um pouco das minhas próprias perversões.
 
Vladimir Baskakov #:
Vocês ainda não mostraram nada de útil, só tagarelice. Nerds

Continua a vigiar.

 
Aleksey Vyazmikin #:

As tabelas quânticas são uma partição do preditor em limites/fronteiras, que depois são envolvidas na aprendizagem. Sim, já escrevi sobre isto muitas vezes.

A questão é o que quantificamos, como e com que propósito.

 
Aleksey Nikolayev #:

É tudo sobre o que quantificamos, como o quantificamos e com que propósito.

Uma vez tentei quantificar por lotes de Monotonicidade Equivalente, quando se usa um preditor em vez de tempo. Eu não vi nada especialmente bom.

 
Alguém tentou associar o paradoxo do montichol ao comércio/tomada de decisão?
 
Maxim Dmitrievsky #:
Ah, entendi. Parece que o recurso de quantização só é usado para acelerar a aprendizagem. Ou é uma difícil? Sou apenas um apoiante da abordagem clássica, mais um pouco das minhas próprias perversões.

A aceleração da aprendizagem é uma das vantagens, mas há também o efeito da agregação de estados preditores semelhantes. Grosso modo, eu considero a seção de partição como um preditor binário separado que permite remover o ruído do preditor básico.

Além do efeito de uma melhor aprendizagem, consigo reduzir o número de árvores no modelo que dão resultados semelhantes, e assim reduzir o ruído no modelo.

Estou a experimentar tabelas de quadros rígidos, isto é quando a partição não se baseia em dados, mas em determinados critérios, por exemplo, os níveis de Fibonacci...

 
Aleksey Nikolayev #:

É tudo sobre quantum, como e com que propósito.

Foi o que escrevi - que o propósito é identificar um padrão consistente que dê uma vantagem estatística em uma determinada área. E nós quantificamos os preditores - qualquer preditor.

E "como" fazê-lo é uma questão em aberto - até agora apenas uma pesquisa de tabelas pré-fabricadas feitas em suposições empíricas ou algoritmo de particionamento estatístico CatBoost.

Na figura 3 "quanta" - o mais provável é que seja escolhido o intervalo médio, o que tem alguma vantagem estatística.