Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3287

 
Forester #:

Eu uso o Valking Forward pelos mesmos motivos.
E sim - forte dependência do tamanho da seção do trem. Por exemplo, em 20000 linhas é encontrado algo no avanço, mas em 5000 ou 100000 - aleatório.

Se "algo" for encontrado, qual é sua vida útil fora do treinamento normalmente?

 
Maxim Dmitrievsky #:
😀

Eu nem sei o que os quadrados significam. Provavelmente o que o cara da maçã escreve :)

 
Aleksey Vyazmikin #:

Se "algo" for encontrado, qual é a sua vida útil fora do ensino normalmente?

Eu apenas retreino o modelo uma vez por semana. Pode ser que dure mais, não pesquisei isso.... mas pode ser menos e é necessário treinar novamente como SanSanych em cada barra (se H1, é possível em princípio).
Para mim, uma vez por semana é aceitável em termos de velocidade - 5 anos para 260 retreinamentos passam aproximadamente.
 
Aleksey Vyazmikin #:

Podemos concluir provisoriamente que, de fato, o sucesso do treinamento depende do tamanho da amostra. No entanto, observo que os resultados da amostra "-1p1-2" são comparáveis, e até melhores segundo alguns critérios, com a amostra "-1p2-3", enquanto que para a amostra "0p1-2" os resultados são duas vezes piores em termos do número de modelos que atendem ao critério determinado.

Agora, executei uma amostra com cronologia invertida, em que a amostra de treinamento consiste na amostra inicial exame+teste+trein_p3, e a amostra de teste é train_p2, e o exame é train_p1. O objetivo é verificar se é possível criar um modelo bem-sucedido com dados mais recentes que teriam funcionado há 10 anos.

Qual você acha que será o resultado?

Não precisei esperar muito - o resultado está na última coluna da tabela

Tentarei comentar de forma não tendenciosa. Por um lado, podemos dizer que a alteração da cronologia da amostra piorou significativamente os resultados pelo critério principal - o número de modelos adequados, mas, por outro lado, o próprio fato de que esses modelos foram encontrados diz que há alguns padrões estáveis nos dados. Ou é aleatório? Sim, é claro, precisamos coletar outras amostras e realizar estudos semelhantes, e só então poderemos tirar conclusões com mais confiança. Por enquanto, essas são apenas informações para reflexão.

Objetivamente, há muitos dados - geralmente uso múltiplos de amostras menores para treinamento, embora comparáveis ao curso cronológico. Quanto mais triste a taxa de recuperação parece em todos os experimentos. Fico até surpreso que ninguém tenha prestado atenção a isso. Em geral, podemos dizer repetidamente que as métricas padrão dão uma indicação ruim do resultado financeiro se não forem usados takeouts e stops fixos.

Se você tiver alguma ideia/desejo de combinar aqui (gráficos de amostra) com alguma coisa, diga-me - tentarei verificar o que acontecerá.

 
Forester #:
Eu apenas retreino o modelo uma vez por semana. Ele pode viver mais tempo, não pesquisei isso.... mas talvez menos, e é necessário retreinar como SanSanych em cada barra (se H1, então, em princípio, é possível).
Para mim, uma vez por semana é aceitável em termos de velocidade - 5 anos para 260 retreinamentos se passam aproximadamente.

Qual é o resultado desse retreinamento em conjunto?

 
Aleksey Vyazmikin #:

Qual é o resultado desse retreinamento no total?

Todos os gráficos que mostrei no ano passado foram obtidos dessa forma. Somente OOS por Valking-forward.
 
Andrey Dik #:

Max, não entendo por que está tirando sarro de mim.

Se não houver suposições, não diga nada; se houver, diga, como "o resultado será péssimo".

Se for engraçado, você pode rir, e se for triste, você pode chorar.

O que Aleksey Vyazmikin está discutindo aqui não pode causar sugestões e é impossível avaliar "merda - não merda".

Por exemplo, um homem chega e diz:

- vamos mandar um ferro para a lua.

Nós olhamos com surpresa.

E o homem diz:

- e vamos mudar a temperatura do ferro e colocar diferentes quantidades de água nele.

Você reagirá "se não houver suposições - fique em silêncio, se houver - fale, como "o resultado será uma merda"?

O que o leksey Vyazmikin faz não tem nada a ver com os problemas do MoD. Ele se baseia em uma ópera e tenta obter uma resposta de outra ópera - tudo conversa fiada de um homem com uma bagunça na cabeça.

 
Forester #:
Todos os gráficos que mostrei no ano passado foram obtidos dessa forma. Somente OOS por Valking Forward.

A julgar pelas imagens, o Recall também é baixo, ou seja, o modelo tem pouca confiança em qualquer coisa e é muito cauteloso nas previsões.

 
Forester #:
Eu apenas retreino o modelo uma vez por semana. Ele pode viver mais tempo, não pesquisei isso.... mas talvez menos , e é necessário retreinar como SanSanych em cada barra (se H1, então, em princípio, é possível).
Para mim, uma vez por semana é aceitável em termos de velocidade - 5 anos para 260 retreinamentos passam aproximadamente.

Descobri um problema fundamental aqui: olhar para frente. Ele se manifesta da seguinte maneira: pegamos partes de um arquivo grande, as ensinamos, depois as testamos e verificamos - tudo está normal, o erro é praticamente o mesmo. Mas assim que executamos fora desses três arquivos, que são partes de um arquivo grande, o resultado é fundamentalmente diferente, geralmente catastrófico.

Se treinarmos novamente a cada etapa, o problema de "olhar para frente" será eliminado, pois a previsão é feita com os mesmos valores de previsão do treinamento.

E se não ensinarmos em cada etapa, todos os preditores, inclusive a seção de treinamento, serão ensinados com alguns valores e, em seguida, previstos com base neles. E aqui está a pergunta: os novos valores dos preditores coincidirão com os valores dos preditores no gráfico de aprendizado ou não?

 
СанСаныч Фоменко #:

Aqui descobri um problema fundamental: olhar para frente. Ele se manifesta da seguinte maneira: pegamos partes de um arquivo grande, estudamos, testamos e verificamos - tudo está normal, o erro é aproximadamente o mesmo. Mas assim que executamos fora desses três arquivos, que são partes de um arquivo grande, o resultado é fundamentalmente diferente, geralmente catastrófico.

Se treinarmos novamente a cada etapa, o problema de "olhar para frente" será eliminado, pois a previsão é realizada com os mesmos valores de previsão do treinamento.

E se não ensinarmos em cada etapa, todos os preditores, inclusive a seção de treinamento, serão ensinados com alguns valores e, em seguida, previstos com base neles. E aqui está a pergunta: os novos valores dos preditores coincidirão com os valores dos preditores no gráfico de aprendizado ou não?

Onde está essa dica que você tem?

Eu o li algumas vezes e não vi a lógica por trás das palavras.

Eles inventam problemas e depois os resolvem heroicamente - um está olhando para o futuro, o outro está procurando a marcação perfeita....