Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 655

 
Dr. Trader:

Eu também tenho pensado muito nisto.

Se o modelo de regressão prevê ganhos de preço por barra e a pontuação R2 está acima de zero nos testes frontais e nos testes de retaguarda, isso já é um bom começo. O problema é que o resultado, embora estável, é pequeno, a propagação não pode ser vencida.

Analisicamente, o problema é que o R2 penaliza mais o modelo por grandes erros e ignora pequenos erros e direcções comerciais erradas. Se você olhar para a distribuição dos ganhos, a maioria dos movimentos de preços são apenas um par de pips. E o modelo, em vez de prever a direção correta de movimentos tão pequenos, aprende a prever as longas caudas da distribuição para a qual obterá um R2 mais alto. Como resultado, o modelo pode de alguma forma prever grandes movimentos, mas nos pequenos comete sempre um erro na direção e perde a propagação.

Conclusão - as estimativas de regressão padrão para forex são ruins. É necessário criar uma função de aptidão de algum tipo, para que ambas as direcções de negócios sejam tidas em conta, bem como a sua dispersão e precisão. Então, mesmo com uma precisão um pouco superior a 50%, há uma chance de lucro.
Precisão, Sharp ratio, fator de recuperação e outras funções que analisam gráficos comerciais são muito discretos, a neurônica com um backprop padrão não vai sair do mínimo local e não pode aprender corretamente.

Uma conclusão alternativa é ignorar completamente os sinais fracos do neurónio. Troca apenas com os mais fortes. O problema é que podemos sempre definir o limiar que dá bons resultados no backtest, mas não dará bons resultados no fronttest. Aqui, também, precisamos de pensar em algo.

Ainda assim, a própria idéia de usar modelos de regressão para a aprendizagem de máquinas parece altamente questionável. E especialmente para a previsão incremental. E duplamente para NS, que são no sentido de uma caixa negra com algumas camadas e perseverança. Que significado económico ou estatístico têm estas palavras?

Afinal, não é à toa que os modelos GARCH são usados para incrementos. e são os mais comuns no momento. A idéia básica de superar a não-estacionariedade pela decomposição de séries não-estacionárias em componentes, que têm um sentido econômico e estatístico bastante significativo, é muito atraente.


No GARCH o modelo consiste nos seguintes passos:

  • A série original é detendida pelo logaritmo (diminuindo o efeito de outliers) a proporção de barras vizinhas.
  • uma vez que normalmente não se pode livrar completamente da não-estacionariedade, então
  • modelar a tendência restante (ARIMA)
  • nuances de modelo da ARCH
  • modelar a distribuição dos incrementos.

Todo trabalho significativo e significativo.

Se adicionarmos a possibilidade de adicionar regressores externos obtemos uma ferramenta bastante rica, infelizmente extremamente variada e por isso intensiva em mão-de-obra.

 
ARIMA+GARCH Trading Strategy on the S&P500 Stock Market Index Using R | QuantStart
ARIMA+GARCH Trading Strategy on the S&P500 Stock Market Index Using R | QuantStart
  • www.quantstart.com
In this article I want to show you how to apply all of the knowledge gained in the previous time series analysis posts to a trading strategy on the S&P500 US stock market index. We will see that by combining the ARIMA and GARCH models we can significantly outperform a "Buy-and-Hold" approach over the long term. Strategy Overview The idea of the...
 
SanSanych Fomenko:

  • a série original é impedida pelo logaritmo(diminuindo a influência das emissões) da relação das barras vizinhas.

com base em quê?

 
SanSanych Fomenko:

Ainda assim, a própria idéia de usar modelos de regressão para a aprendizagem de máquinas parece altamente questionável. E isto é especialmente verdade em relação à previsão incremental. E duplamente para NS, que são no sentido de uma caixa negra com algumas camadas e perseverança. Que significado económico ou estatístico têm estas palavras?

Afinal, não é à toa que os modelos GARCH são usados para incrementos. e são os mais comuns no momento. A ideia básica de derrotar a não-estacionariedade decompondo uma série não-estacionária em componentes que têm um significado económico e estatístico bastante significativo é muito apelativa.

Você está errado SanSanych. NS é uma espécie de equivalente da lógica difusa. Aprende-se. Pessoalmente, não vejo nada de misterioso nisso. Você pode usar outras analogias.

Bem, e não-estacionariedade. Qualquer processo, se quebrado em pedaços, se tornará não-estacionário, e se não for, não será aleatório.

A propósito, pelo aspecto das distribuições em diferentes trechos longos (vários em 3 meses) não notei nenhuma diferença significativa entre os dois.

Quanto ao sentido económico - bem, eu não sei. Presumo que o mercado é aleatório para o observador. Se é realmente aleatório ou não, realmente não importa. A palavra-chave aqui é para o observador.

 

Você é um homem interessante! Acontece que você sabe tudo!

 
Maxim Dmitrievsky:

com base em quê?

Eu tenho registo, que diferença faz?

 
SanSanych Fomenko:

Eu tenho registo, que diferença faz?

Porque o logaritmo neste caso não se livra de outliers: o cálculo de incrementos com n-lag se livra de outliers.

logaritmo centra simplesmente o gráfico em relação a 0

e para se livrar de outliers por logaritmo, tem de introduzir uma escala logarítmica.

incrementos simples

logaritmo dos incrementos (natural)


 
Maxim Dmitrievsky:

porque o logaritmo, neste caso, não evita aberrações: o cálculo de incrementos com n-lag evita aberrações

logaritmo centra simplesmente o gráfico em relação a 0.

e para se livrar de aberrações por logaritmos é necessário introduzir uma escala logarítmica

incrementos simples

logaritmo dos incrementos (natural).


As emissões são uma coisa complicada. As emissões excessivamente grandes são melhor substituídas por um máximo mais aceitável.

Não é possível livrar-se completamente das emissões. Mas para minimizar o seu impacto na distribuição não só pode e deve ser feito por logaritmo.

> summary(diff(eur))
     Index                       diff(eur)         
 Min.   :2016-01-04 00:00:00   Min.   :-0.0230100  
 1 st Qu.:2016-04-14 19:00:00   1 st Qu.:-0.0005300  
 Median :2016-07-27 12:00:00   Median : 0.0000100  
 Mean   :2016-07-27 12:01:14   Mean   :-0.0000036  
 3 rd Qu.:2016-11-08 06:00:00   3 rd Qu.: 0.0005200  
 Max.   :2017-02-17 23:00:00   Max.   : 0.0143400  


> summary((diff(eur, log=T)))
     Index                     (diff(eur, log = T))
 Min.   :2016-01-04 00:00:00   Min.   :-0.0206443  
 1st Qu.:2016-04-14 19:00:00   1st Qu.:-0.0004810  
 Median :2016-07-27 12:00:00   Median : 0.0000090  
 Mean   :2016-07-27 12:01:14   Mean   :-0.0000034  
 3rd Qu.:2016-11-08 06:00:00   3rd Qu.: 0.0004755  
 Max.   :2017-02-17 23:00:00   Max.   : 0.0127862  
                               NA's   :1


Se tomarmos um caso hipotético com aspas adjacentes 10 e 2

10/2 = 5

log (10/2) = 0,69

 
Maxim Dmitrievsky:

Porque o logaritmo neste caso não evita aberrações: o cálculo de incrementos com n-lag evita aberrações.



n-lag é um aumento da TF, e quanto maior a TF, maior o incremento.

O seu atraso 50 é n8, só que mais preciso no sentido de que o seu TF=8 horas começa a cada minuto, ao contrário do gráfico normal.

 
SanSanych Fomenko:

As emissões são uma coisa complicada. É melhor substituir emissões demasiado elevadas por um máximo mais aceitável.

Não é possível livrar-se completamente das emissões. Mas não só é possível como necessário reduzir a sua influência na distribuição e isso é feito por logaritmo.



Se tomarmos um caso hipotético com aspas adjacentes 10 e 2

10/2 = 5

log (10/2) = 0,69

bem, tudo bem, você encontrou o poder de e para obter o valor do incremento original

mas não te livraste dos aberrantes.

Eu citei 2 fotos acima