Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2595

 
elibrarius #:

Acontece então que você tem que treinar em uma seção o mais curta possível. Para que, após a mudança do padrão, o novo padrão comece a funcionar mais rapidamente.

Por exemplo, se você treinar por 12 meses, então após uma mudança de padrão em 6 meses, o novo e o antigo padrão será 50/50. E dentro de cerca de um ano haverá treinamento e negociações sobre o novo padrão. Isto é, durante quase um ano inteiro o padrão tem sido negociado em um padrão ultrapassado e muito provavelmente perdendo.

Se você treinar por 1 mês, o padrão irá aprender a trabalhar corretamente novamente em um mês.

Seria bom treinar durante uma semana... Mas não há dados suficientes.

Não vale a pena ir por um curto período, tenho a certeza. E faltarão os dados para os modelos e o risco de adaptação excessiva às condições do mercado. O conceito de adaptação parece bom, mas por causa do atraso (enquanto dados acumulados, o estado pode já ter mudado) dificilmente é um graal. Vários modelos podem ser experimentados ao mesmo tempo - um é responsável por padrões de longo prazo, outro/outros por padrões de curto prazo (corrente), a solução é uma função das soluções de todos estes modelos.

 
Aleksey Nikolayev #:
Existem mais questões interessantes sobre o uso de MO nas negociações. Por exemplo, um algoritmo para determinar qual o intervalo do histórico a ser utilizado para o treinamento. Talvez possa ser definido por alguns meta-parametros que são otimizados pela validação cruzada. Eu preciso de ler Prado).

Provavelmente é melhor rolar para a frente, tem sempre OOS depois do comboio. No SW apenas a primeira passagem será assim, o resto utilizará os dados pré e pós-trane para trane.

 
Replikant_mih #:

Não vale a pena ir embora a curto prazo, tenho a certeza. E haverá uma falta de dados para os modelos e um risco de sobreajuste às condições do mercado. O conceito de adaptação parece bom, mas devido ao atraso (no momento em que os dados foram acumulados, o estado pode já ter mudado) dificilmente é um graal. Você pode experimentar vários modelos ao mesmo tempo - um é responsável por padrões de longo prazo, outro/outros por padrões de curto prazo (corrente), a solução é uma função das soluções de todos estes modelos.

De acordo com experiências recentes em 5000 linhas de M5 (cerca de 2 meses), há algo interessante. Aos 3000 já é mau. Mas isto é para chips+alvo específicos tomados. Talvez haja um conjunto diferente de ficções e alvos quando o modelo funciona após o treinamento em um pequeno enredo. Vamos ter de experimentar...
 
elibrarius #:
De acordo com experiências recentes em 5000 linhas de M5 (cerca de 2 meses), há algo interessante. Aos 3000 já é mau. Mas isto é para os chips+alvo específicos tomados. Talvez haja um conjunto diferente de características e objetivos quando o modelo funciona após o treinamento em um pequeno enredo. Vamos ter de experimentar...

Depende do número de funcionalidades, eu gosto de mais funcionalidades, normalmente 5000 não é suficiente, se você tem até 5 funcionalidades, talvez 5000 é ok.

 
elibrarius #:

Acontece então que você tem que treinar em uma seção o mais curta possível. Para que, após a mudança do padrão, o novo padrão comece a funcionar mais rapidamente.

Por exemplo, se você treinar por 12 meses, então após uma mudança de padrão em 6 meses, os padrões novos e antigos serão 50/50. E após cerca de um ano, haverá treinamento e negociação sobre o novo padrão. Isto é, durante quase um ano inteiro o padrão tem sido negociado em um padrão ultrapassado e muito provavelmente perdendo.

Se você treinar por 1 mês, o padrão irá aprender a trabalhar corretamente novamente em um mês.

Seria bom treinar durante uma semana... Mas ainda não há dados suficientes.

Então pode não aprender, dar menos lucro... é uma espécie de questão de selecção aqui. Às vezes a amostragem das distribuições atuais pode ajudar para amostras curtas, como nos artigos
 
Replikant_mih #:

Sobre o barulho, sim. No entanto, não pensei nisso em termos de levar partes da história com e sem ruído. E a propósito, como é que isto é entendido antes do treino modelo? Tipo, de forma iterativa? Você treina toda a área, vê onde ela tem melhor desempenho, deixa essas áreas e treina somente essas áreas primeiro? Isso dá origem à segunda questão que pode ser chamada filosófica antes da validação experimental: é melhor para o modelo ver imediatamente diferentes áreas, incluindo áreas ruidosas, mas treinar em média em dados ruidosos ou treinar em dados mais limpos, mas não ver dados ruidosos de todo?


E o que há de errado com tamanhos gigantes? Para além do aumento do tempo de computação?

Bem, gostar de treinar no último histórico em diferentes comprimentos de bandejas e comparar como os modelos trabalharam no histórico anterior, se eles pararem de trabalhar ao mesmo tempo em algum lugar, então esse é o "horizonte de aplicabilidade no passado", levando em conta o último histórico. Você não sabe como será no futuro, mas você pode determinar o critério para parar o bot - se ele começar a negociar pior do que na história, por exemplo.

Em uma amostra longa, um padrão geral que aparece em subamostras pode desaparecer. Se as regularidades das subamostras se contradizem, teremos que aprender apenas com o ruído, o que é um sucesso na maioria dos casos :)
 
elibrarius #:

Provavelmente, é melhor com um transitário, tem sempre OOS atrás da Trayn. Em SW, apenas o primeiro passe será assim, o resto usará tanto o pré como o pós-trainer.

Há uma série especial de KV no catbust, por exemplo. Mas então o conjunto de dados não pode ser embaralhado. E se não se baralha, é como se fosse adequado deslocar secções de igual comprimento. E se você embaralhar, então o treinamento é mais para sinais locais, não depende, grosso modo, da mudança de tendências. Quem sabe o que é melhor :)
 
Maxim Dmitrievsky #:
E se você não misturar, é como encaixar em seções alternadas de igual comprimento.
Eu também vou trocar dessa maneira. A duração será igual a uma semana. Uma semana de negociações, um fim de semana de treino. E a marcha para a frente faz o mesmo.
 
Insensatez
 
elibrarius #:

Provavelmente, é melhor com um transitário, tem sempre OOS atrás de trincheiras. Em SW apenas a primeira passagem será assim, o resto usará tanto antes como depois do OOS para rastrear dados.

Concordo contigo se responderes à pergunta "Como negociar no próximo período?". Se responder à pergunta "Existe um padrão nesta secção da história?", então o TDR é bastante aplicável.