Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3352

 

Incrementos comuns com defasagem arbitrária. Não há logaritmos ou barras zero. A pergunta era sobre sinais. O principal problema é a baixa relação sinal/ruído. Mas eles contêm todas as informações.

O telefone para surdos está evoluindo :)

Eu não leio artigos recentes, especialmente de autores prolíficos sobre a água, com ciclos completos da água :)
 
Maxim Dmitrievsky #:

Incrementos comuns com defasagem arbitrária . Não há logaritmos ou barras zero. A pergunta era sobre sinais. O principal problema é a baixa relação sinal/ruído. Mas eles contêm todas as informações.

Claramente, todas elas. Mas se usarmos incrementos entre barras vizinhas, para entender que houve uma tendência nas últimas 100 barras, o modelo deve somar todas as 100 barras e obter o incremento a partir da barra 0. E, ao alimentar a partir da barra 0 de uma só vez, facilitamos seu trabalho.
Talvez as redes neurais consigam levar em conta todos os 100 incrementos e encontrar uma tendência, mas é improvável que os modelos de madeira sejam usados. Você mesmo disse (e eu obtive o mesmo resultado) que os modelos funcionam melhor com vários recursos (até 10), e uma tendência completa de 100 não será formada a partir de 10. E, além dos incrementos, pode haver sinais mais úteis.

É por isso que minha defasagem arbitrária para incrementos é sempre a partir da barra 0, para que o modelo veja a tendência. Os incrementos entre as barras vizinhas - nunca são usados, porque os considero ruído. Por exemplo, um incremento de 0,00010 pt entre 120 e 121 barras, ou seja, 2 horas atrás, que influência ele pode ter sobre a situação atual? - Nenhuma.

 
Forester #:

Está claro que todas elas. Mas se usarmos incrementos entre barras vizinhas, para entender que houve uma tendência nas últimas 100 barras, o modelo deverá somar todas as 100 barras e obter o incremento a partir da barra 0. E, ao alimentar a partir da barra 0 de uma só vez, facilitamos seu trabalho.
Talvez as redes neurais consigam levar em conta todos os 100 incrementos e encontrar uma tendência, mas é improvável que os modelos de madeira sejam usados. Você mesmo disse (e eu obtive o mesmo resultado) que os modelos funcionam melhor com vários recursos (até 10), e uma tendência completa de 100 não será formada a partir de 10. E, além dos incrementos, pode haver sinais mais úteis.

É por isso que minha defasagem arbitrária para incrementos é sempre a partir da barra 0, para que o modelo veja a tendência. Os incrementos entre as barras vizinhas - nunca são usados, porque os considero ruído. Por exemplo, um incremento de 0,00010 pt entre 120 e 121 barras, ou seja, 2 horas atrás, que influência ele pode ter sobre a situação atual? - Nenhuma.

Uma tendência é uma mudança nos incrementos médios. Portanto, ela também está no gráfico de incremento. O problema com vários atributos é explicado do ponto de vista dos fatores de confusão, ou seja, torna-se mais difícil separar a influência de cada atributo de todos os outros. Afinal, cada um deles introduz um erro adicional na estimativa final. A inferência causal torna-se mais complicada e a incerteza é adicionada. Aparentemente, há alguma limitação na complexidade do modelo de primeiro plano, que depende da relação sinal/ruído.

A defasagem dos incrementos está diretamente relacionada à duração da negociação prevista em barras. Por exemplo, se a duração for de 1 barra, é melhor usar incrementos com um pequeno atraso e uma pequena profundidade de janela. À medida que a duração das negociações aumenta, a defasagem dos incrementos também aumenta naturalmente. E o spread, é claro, afeta.
 

Escrevi um Expert Advisor que registra os dados de cada tick e forma um arquivo csv com os dados e, ao lado dele, executei uma rede neural que analisa esse arquivo, realiza o treinamento e, com base na última linha do primeiro arquivo, gera uma previsão de onde o preço irá e por quantos pontos. Escrito em python. Quem já fez algo semelhante e quais dados podem ser aprendidos para cobrir o quadro completo. Agora a experiência é baseada em 'Abertura', 'Máximo', 'Mínimo', 'Fechamento', 'Volume'.

Não sei como inserir uma tela

 
Андрей Escrevi um Expert Advisor que registra os dados de cada tick e forma um arquivo csv com os dados e, ao lado dele, iniciei uma rede neural que analisa esse arquivo, executa o treinamento e, com base na última linha do primeiro arquivo, gera uma previsão de onde o preço irá e por quantos pontos. Escrito em python. Alguém já fez algo semelhante e quais dados podem ser aprendidos para cobrir o quadro completo? Agora a experiência se baseia em "Abertura", "Máximo", "Mínimo", "Fechamento", "Volume".

Não sei como inserir uma tela

registrar e analisar os ticks de TODOS os pares de moedas e metais.

adicionar hora do dia, dia da semana

classificação das notícias esperadas

segundos antes das notícias

classificação de notícias passadas

segundos após a notícia

===

em geral, algo para manter você e o python ocupados :-)

 
Ainda não analisamos todos os MOs, portanto não podemos lhe dar uma pista :)
 
Maxim Dmitrievsky #:
Ainda não dominamos todos os IOs, portanto, não podemos lhe dizer logo de cara :)

Por que dominar todos os MOs? Existem várias centenas de modelos... E os modelos são claramente menos da metade do problema.

Talvez dominar alguns modelos, mas aprender a obter de forma consistente aproximadamente o mesmo erro de classificação em OOV e OOS de menos de 20%? E, ao mesmo tempo, ter uma prova básica de que não há aprendizado excessivo, olhar para o futuro e, o que é mais importante, ter uma prova do erro de classificação resultante no futuro?

 
СанСаныч Фоменко #:

Por que dominar todos os MoDs? Há várias centenas de modelos apenas... E os modelos são claramente menos da metade do problema.

Que tal dominar alguns modelos, mas aprender a obter de forma consistente aproximadamente o mesmo erro de classificação em OOV e OOS de menos de 20%? Ao mesmo tempo em que se tem uma prova básica de que não há aprendizado excessivo, olhando para o futuro e, o mais importante, uma prova do erro de classificação resultante no futuro?

Em todos os IOs há abordagens e práticas comuns. Por exemplo, você pode obter probabilidades de classe para classificação binária? Se sim, de que forma?
 
Maxim Dmitrievsky #:
Em todos os MOEs há abordagens e práticas comuns. Por exemplo, você pode obter probabilidades de classe para classificação binária? Em caso afirmativo, de que forma?

Não consigo pensar imediatamente em pacotes que NÃO produzam probabilidades de classe. Portanto, eu tinha a impressão de que esse era o padrão.

 
СанСаныч Фоменко #:

Não consigo pensar imediatamente em pacotes que NÃO emitam probabilidades de classe. Portanto, pareceu-me que esse era o padrão.

O pensamento em lote está na moda. Essas não são essas probabilidades, elas são assim chamadas por causa do loess phs aplicado, para estimativa de probabilidade.

Como você obtém probabilidades de classe reais?