Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 55

 
Vadim Shishkin:

Vou acrescentar intriga -- você não precisa mudar a taxa de câmbio de um item negociado.

É como arrastares-te pelos cabelos para fora de um pântano.

Procure também por outras fontes de dados.

Que o lucro esteja com você!

:)

Se é isso que queres dizer? Bem, é uma descoberta americana. Eu ficaria feliz em incluir mais informações, mas além do histórico de preços, é difícil conseguir mais alguma coisa neste volume.

E arrastar pelo cabelo está errado. Os dados contêm o sinal. E há o suficiente para cobrir os custos e ter lucro. Foi praticamente confirmado, embora na história. E aqueles que não a conseguem extrair, dançam com pandeiro. Tenho alguma experiência no vidro, mas ainda não tenho certeza se posso fazer algo com eles.

 

***...

Haverá um estado?

 
Alexey Burnakov:

Sugiro a leitura de algumas boas notas sobre a construção de sistemas de negociação a partir de uma posição quant (uma posição quant sénior em um grande fundo de investimento). As ideias pareciam-me razoáveis.

...

Com o que você concorda ou discorda? O que você gostaria de estudar melhor?

Bem, pelo menos com divisão rigorosa em treinamento e amostra de teste por datas, em vez de mistura aleatória preliminar de amostras com distribuição igual na amostra geral e depois dividindo-a em partes. Pode acontecer que uma parte da amostra contenha principalmente tendências verticais, enquanto a outra parte contenha tendências laterais. Se aplicarmos uma mistura aleatória, a probabilidade de recolha de padrões semelhantes em diferentes partes da amostra diminui.

A propósito, tal desvantagem também está presente no testador de estratégia integrado do MetaTrader, ou seja, divide a amostra de treinamento e o teste de avanço estritamente por datas. Como resultado, as mudanças de tendência de mercado próximas à linha divisória podem levar a um excesso deliberado de treinamento.

 
Vadim Shishkin:
Rapaz, sai daqui.
 
Combinador:
Caramba, saiam daqui.
É isso? Não tens mais nada a dizer para além de rudeza, pois não?
 
Alexey Burnakov:

Em particular, eu gostei desta:

Assim, você separa rigorosamente o conjunto de formação e o conjunto devalidação

separar os dados exactamente por datas (antes do dia X - treino, depois - validação)

você usa Monte Carlo para evitar viés de ponto de partida; - gere vários resultados da estratégia de negociação, de modo que você não obterá um ajuste para pontos de entrada e saída.

e você tenta vários truques de robustez. - Aplicar técnicas de robustez.

O que mais você faz para garantir que não está se enganando?

Tudo parece certo (mas eu mesmo ainda não tentei tudo), exceto o primeiro. Parece-me que se você usar estritamente um conjunto de dados de treinamento, e escolher preditores para isso, você obtém um ajuste excessivo desses mesmos preditores, que podem não ser confiáveis em outros intervalos de tempo. Agora eu crio uma nova amostra de treinamento e validação cada vez antes de treinar o modelo ao selecionar os preditores. É melhor recriar amostras 3 vezes e treinar o modelo e obter uma precisão média do que usar sempre as mesmas amostras de treinamento e validação.

Gosto daquela sobre redes neurais protéicas :) . Por vezes, devido a uma topologia infeliz, produzem de facto resultados muito inadequados.

 
Vadim Shishkin:

***...

Haverá um estado?

Não. É preciso ser mais esperto do que isso para perceber isso há muito tempo. Há um desenvolvimento aqui.
 
Alexey Burnakov:
Não. É preciso ser mais esperto para o entender há muito tempo. Há um desenvolvimento.
Sim. Pode dizer em que ano está a decorrer o desenvolvimento e onde pode ver os seus resultados? :)
 
Dr. Trader:

Tudo parece certo (mas eu mesmo ainda não tentei tudo), exceto o primeiro. Parece-me que a utilização estrita de um conjunto de dados de treinamento e preditores adequados a ele resultará no ajuste excessivo desses mesmos preditores, o que pode não ser válido em outros períodos de tempo. Agora eu crio uma nova amostra de treinamento e validação cada vez antes de treinar o modelo ao selecionar os preditores. É melhor recriar amostras 3 vezes e treinar o modelo e obter uma precisão média do que usar sempre as mesmas amostras de treinamento e validação.

Gosto daquela sobre redes neurais proteicas :) . Por vezes, devido a uma topologia infeliz, produzem resultados muito inadequados.

Sim. Eu gostaria muito de ver os resultados deles. Eu tenho algo para mostrar.

E você?

No entanto, a questão parece ser retórica.

 
Vadim Shishkin:
Sim. Pode dizer-me quantos anos de desenvolvimento estão a decorrer, e onde posso ver os resultados? :)
Vários anos. Aqui no fio está o resultado.