Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3226

 
fxsaber #:

Talvez devêssemos tentar resolver o problema de gerar novos dados por meio de aproximação?

Pegue uma janela e tente descrever uma série numérica nela com precisão diferente, enquanto essa abordagem permitirá salvar a dinâmica do movimento de preços globalmente, incluindo as flutuações diárias.

Além disso, será suficiente salvar o histórico na forma de coeficientes de aproximação.

 
Maxim Dmitrievsky #:

Seu TC não está procurando todos os padrões que possam existir. É por isso que você precisa fazer a correspondência

Então nos deparamos com o problema do "ovo e da galinha":

  • O MO manterá os padrões se receber dados de um TC em funcionamento.
  • No tsvr original, o MO deve encontrar um TC em funcionamento.

Caso contrário, ele poderá usar outra abordagem, mas ela será longa em relação aos ticks e depois)

Todos esses desenvolvedores estão longe de negociar. Em vez de Média, deveria ser Mediana.

 
Aleksey Vyazmikin #:

Talvez devêssemos tentar resolver o problema de gerar novos dados por meio de aproximação?

Pegue uma janela e tente descrever uma série numérica nela com precisão diferente, enquanto essa abordagem permitirá preservar globalmente a dinâmica do movimento de preços, inclusive levando em conta as flutuações diárias.

Além disso, será suficiente salvar o histórico na forma de coeficientes de aproximação.

Parece bom. Quando olho para os artigos sobre o tópico da pesquisa do IDC, quase imediatamente começo a duvidar de suas abordagens, se houver uma busca por regularidades sob a suposição de que elas são ininterruptas.

 
Maxim Dmitrievsky #:

dependência com um comprimento de 1000 ticks

E 5.000 ticks, além disso.

Com ticks, essa escolha de janela é estranha. É lógico vincular-se a registros de data e hora, não a índices de ticks.

Fórum sobre negociação, sistemas de negociação automatizados e teste de estratégias de negociação

Aprendizado de máquina na negociação: teoria, modelos, prática e negociação de algoritmos

fxsaber, 2023.09.09 04:40 pm

Há um erro neste local: deveria ser time_msc. Mas isso não tem efeito sobre os resultados após a postagem.

Reinicie para que os registros de data e hora sejam exibidos corretamente nas próximas gerações.
Isso é para o caso de você decidir vincular.
 
Maxim Dmitrievsky #:

dependência com um comprimento de 1000 ticks

https://disk.yandex.ru/d/6F8FdUGthpnk3A

.

 
mytarmailS #:
Você não está tentando encontrar um único conjunto de parâmetros, mas algum tipo de aglomerado/agrupamento de conjuntos de parâmetros próximos.

Veja como as curvas são diferentes no intervalo de amostragem (entre as linhas azuis).

Isso sugere que você obtém conjuntos de parâmetros distantes em vez de próximos. Se em termos de uma função-alvo ruidosa, são obtidos resultados próximos a diferentes colinas.

Está claro que se não interrompermos o AG, mas esperarmos até a conclusão, um pico será encontrado. E todas as 20 melhores passagens serão a partir daí - as curvas de amostra serão praticamente as mesmas. Isso não tem utilidade.

 
fxsaber #:

Se você não interromper o AG, mas esperar até que ele termine, um pico será encontrado. E todas as 20 melhores passagens partirão desse ponto - as curvas de amostragem serão praticamente as mesmas.

Verifiquei essa afirmação no mesmo VDC sem interromper o AG.

É fácil perceber que há conjuntos diferentes entre esses 20. Em vez disso, isso sugere que o AG regular não conseguiu realizar seu trabalho. Mais precisamente, ele se interrompeu ao colocar os resultados de diferentes picos entre os 20 primeiros.

 
fxsaber #:

Parece bom. Quando leio artigos sobre o tópico de pesquisa de tsvr, quase que imediatamente começo a duvidar de suas abordagens se houver uma busca por padrões, supondo que eles sejam ininterruptos.

Bem, posso lhe dizer que, pelo menos para mim, nem para todos os preditores, uma divisão de tempo fornecerá uma tendência de probabilidade significativa. Portanto, tendo a pensar que o tempo é um fator significativo, mas outros fatores mais significativos podem afetar o resultado se estiverem na fase ativa.

Também acho que, na janela, você pode simplesmente usar uma grade de quantificação diferente para o preço, com um grande número de intervalos (para uma preservação mais precisa da estrutura), e testar esse "sinal comprimido" - ele já terá desvios. Ou você pode usar um pequeno número de intervalos mais ruído aleatório no intervalo de referência entre dois intervalos.

Você pode até mesmo fixar a grade e armazenar apenas o deslocamento para a primeira referência. Assim, ele ocupará pouco espaço e a transformação deverá ser rápida.
 
Maxim Dmitrievsky #:

E com um comprimento de 5k, para completar

https://disk.yandex.ru/d/1ypCrzYKk82XdA


Parece que um gráfico de otimização pode mostrar o quão difícil é o processo de pesquisa. Então vamos lá.


 
Aleksey Vyazmikin #:

Bem, posso dizer que, para nem todos os preditores, uma divisão de tempo dará um viés significativo na probabilidade, pelo menos para mim. Portanto, tendo a pensar que o tempo é um fator significativo, mas outros fatores mais significativos podem afetar o resultado se estiverem na fase ativa.

Também acho que, na janela, você pode simplesmente usar uma grade de quantificação diferente para o preço, com um grande número de intervalos (para uma preservação mais precisa da estrutura), e testar esse "sinal comprimido" - ele já terá desvios. Ou você pode usar um pequeno número de intervalos mais ruído aleatório no intervalo de referência entre dois intervalos.

Você pode até mesmo fixar a grade e armazenar apenas o deslocamento para a primeira referência. Assim, ele ocupará pouco espaço e a transformação deverá ser rápida.

Infelizmente, todas essas são hipóteses que precisam ser implementadas e testadas.

@Maxim Dmitrievsky está testando suas variantes, e eu estou testando as minhas.