Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3210

 
mytarmailS #:

Todo o ramo de pesquisadores de mercado ativos está sentado aqui no R, isso é meio que um resumo...

Ativo quem?) primeiro a equipe de pesquisa precisa crescer.
 

O problema mencionado acima é que há um modelo que tem excelentes resultados em um arquivo de treinamento e um arquivo OOS. Entendo que o arquivo de treinamento pode ser obtido até mesmo por amostragem aleatória por amostra, e o OOS é um resíduo do arquivo de treinamento.

Mas ao executar o modelo em um arquivo externo, o resultado é catastroficamente ruim.

Lembrei-me de que tive uma variante desse tipo há alguns anos.

Consegui descobrir o motivo. O motivo era olhar para frente, um motivo extremamente inconveniente, porque é muito difícil entender o que é olhar para frente.

Então, criei um modelo em que o professor é o incremento de ZZ, e há muitos preditores, em cujo cálculo ZZ estava envolvido. Por exemplo, a diferença entre o preço e o ZZ. Durante o treinamento, simplesmente cortei uma parte do arquivo que não continha os links corretos de ZZ. E, ao calcular os preditores, os valores de ZZ ausentes foram estendidos pelo último link.

Os três arquivos (isso está no Rattle) que fornecem uma amostra aleatória apresentaram um erro de classificação de cerca de 5%. Entretanto, o quarto arquivo, que não tem relação com os três primeiros, apresentou um erro aleatório.

No entanto, se removermos todos os preditores nos quais o ZZ está envolvido no cálculo, tudo se encaixará: o erro de classificação é praticamente igual em todos os quatro arquivos.

Isso é olhar para frente.

Com o retreinamento, fica claro: seja extremamente cuidadoso ao usar a otimização no testador e, no R, limpe a lista de preditores do lixo. Mas como detectar a antecipação?

Com base na experiência anterior, o seguinte é óbvio: se o erro de classificação no treinamento, teste e validação for inferior a 10%, você deverá descartar os preditores um a um até que o erro aumente para 20% 30% ....

 
Os ziguezagues devem ser criados para o momento da barra, não para o futuro.
 
Forester #:
Os ZigZags devem ser plotados no momento da barra, não no futuro.

Para o treinamento do modelo, o ZZ não foi estendido, porque não é necessário: o padrão que o modelo está procurando é uma linha - as linhas vizinhas não são levadas em conta, e a amostra para treinamento é de 1.500 barras.

 
De onde veio essa besteira de zigue-zague, quem a inventou primeiro?

Sanych, quando você se lembrará de que um professor é um alvo + fichi?))) não um alvo

E volatilidade se escreve sem H.
 
СанСаныч Фоменко #:

Com base na experiência anterior, aplica-se o seguinte: se o erro de classificação no treinamento, teste e validação for inferior a 10%, descarte os preditores um a um até que o erro aumente para 20% 30% ....

Genius)))))

Como encontrar preditores reais com erro menor que 10%?

Não me diga que eles não existem, é uma questão de fé....

 
Maxim Dmitrievsky #:
De onde veio essa besteira de zigue-zague, quem a inventou primeiro?

Você está interessado ou não está nem um pouco interessado em escrever sobre a essência do problema, em vez de exibir seu ego favorito?

 
СанСаныч Фоменко #:

Consegui encontrar o motivo. O motivo é olhar para frente, um motivo extremamente inconveniente, porque é extremamente difícil entender o que é olhar para frente.

Então, usei um modelo no qual o professor é o incremento de ZZ, e há muitos preditores no cálculo dos quais ZZ estava envolvido. Por exemplo, a diferença entre o preço e o ZZ. Durante o treinamento, simplesmente cortei uma parte do arquivo que não continha os links corretos de ZZ. E, ao calcular os preditores, os valores ausentes de ZZ foram estendidos pelo último link.

Para evitar o peeking, Forester diz corretamente que você deve calcular os preditores no loop a cada iteração sem peeking....

Essa é a solução.

 
mytarmailS #:

Genius)))))

Como, então, encontrar preditores reais com menos de 10% de erro?

Não me diga que não há nenhum, é uma questão de fé.....

É fácil.

Escrevi acima como fiz isso com o exemplo do ZZ.

Mas não se trata de ZZ: colocamos os cantos do professor em preditores e obtemos felicidade antes de correr no arquivo externo.

E você não pode correr para o arquivo OUT e viver feliz, como Maxim faz com imagens muito bonitas.

Mas voltando ao problema de olhar para frente. Sugerimos uma ultrapassagem brusca. Ou talvez haja algo mais?

 
СанСаныч Фоменко #:

Você está interessado ou não está nem um pouco interessado em escrever sobre os méritos do problema em vez de se exibir como seu favorito?

Não é nada interessante resolver os problemas mentais de outras pessoas