English Русский 中文 Español Deutsch 日本語 한국어 Français Italiano Türkçe
Analisando os parâmetros estatísticos dos indicadores

Analisando os parâmetros estatísticos dos indicadores

MetaTrader 5Estatística e análise | 19 fevereiro 2014, 15:59
4 012 0
СанСаныч Фоменко
СанСаныч Фоменко

Introdução

Os negociantes usam amplamente os indicadores que mostram as cotações básicas "mais claramente", permitindo que eles realizem análises e prevejam o movimento de preços de mercado. Estes problemas com relação a validade da transformação e a credibilidade dos resultados obtidos são geralmente considerados, e, na melhor situação, substituídos com o teste de sistema de negociação com base em indicadores.

é bastante óbvio para mim que não há sentido em utilizar indicadores, e muito menos aplicá-los na criação de sistemas de negociação, a menos que possamos resolver as questões relativas à transformação de cotações iniciais e a credibilidade do resultado obtido. Neste documento, mostramos que existem sérios motivos para tal conclusão. Consideraremos problemas em potencial utilizando três indicadores: linha de tendência direta, média móvel exponencial e filtro Hodrick-Prescott.


1. Um pouco de teoria

Para a conveniência do leitor, mencionarei alguns termos da teoria da probabilidade e estatísticas matemáticas que serão utilizadas mais adiante. Não vou fornecer os links, já que os termos aplicados aqui são completamente equivalentes aos correspondentes usados nas caixas de texto.

1,1. A descrição probabilística das observações econômicas

As cotas que observamos são medidas seletivas indiretas (a população geral é desconhecida para nós) de algum processo estocástico em um nível fundamental, incluindo:

  • componentes determinísticos medidos precisamente, por exemplo, negociações de compra ou venda de moeda executadas;
  • componentes determinísticos medidos com um erro, como a quantidade de moeda vendida em um intervalo de tempo, por exemplo, em um dia;
  • componente estocástico, o que não pode ser medido - o humor da população. A maioria do tempo, a característica principal deste componente é um movimento aleatório com uma tendência.

A interação destes componentes resulta em um processo estocástico que inclui:

  • tendências (determinística e estocástica);
  • ciclos com duração de períodos estocásticos e fixos;
  • movimento aleatório com uma tendência.

Não estacionária, é uma característica comum de um processo estocástico, o que é refletido em cotas de moeda. O conceito do processo estocástico não estacionário é importante para nós apenas porque não fornece quase nenhum meio para sua análise, então, deve ser dividido em um conjunto de processos separados que são possíveis ser analisados. Ao aplicar os indicadores, um comerciante não pensa sobre a aplicabilidade do indicador a uma cota de símbolo específica. Porém, não existem ferramentas econométricas que permitam avaliar a possibilidade de aplicar um indicador e o resultado desta aplicação.


1.2.Evento aleatório. Probabilidade

Um evento aleatório (comprar e vender moeda, em nosso caso) é um evento que pode ou não acontecer. Sabemos que o número de negócios em dias diferentes e em diferentes momentos de um dia é diferente, e, na realidade, é um valor aleatório, mas apenas os eventos em pontos distintos no tempo (como minuto, hora, dia, etc.) são levados em conta mais comumente.

Frequência relativa de um evento aleatório é a proporção de um número de ocorrências de tal evento M com relação ao número geral das observações realizadas N. Com o crescimento do número de observações (em teoria, até o infinito) a frequência tende ao número chamado de probabilidade de evento. De acordo com a definição, a probabilidade é um valor de zero a um. O termo "probabilidade" geralmente será usado neste artigo em vez da frequência relativa.

Valor aleatório é uma quantidade que considera diferentes valores com certas probabilidades.

Conjunto geral significa todos os possíveis valores que um aleatório pode suportar. Sempre lidamos com uma amostra do conjunto geral no mercado, geralmente utilizando cotas para algum período de tempo. é bastante natural que as estatísticas obtidas utilizando uma amostra seja diferente das estatísticas calculadas no conjunto geral, como a frequência relativa difere da probabilidade. Maiores cálculos são realizados para avaliar as diferenças entre as estatísticas obtidas utilizando uma amostra e aquela calculada no conjunto geral. Tal abordagem é impossível no caso de indicadores, como os preços, por exemplo, um preço aproximado, são considerados como valores determinísticos por um indicador durante os cálculos.

Outra observação interessante. Devido a estarmos tentando observar o conjunto geral, podemos ignorar as diferenças nas cotas enviadas por diferentes centros de negócios, por ser fácil mudar os valores das cotas, mas é muito difícil mudar suas propriedades estatísticas.


1,3. Características de variáveis aleatórias

1.3.1. Estatísticas descritivas

Conjuntos de quantidades aleatórias (cotas de moeda, em nosso caso) são caracterizados por uma série de parâmetros. Alguns destes parâmetros serão usados adiante.

Histograma é um gráfico mostrando a frequência do valor aleatório. Neste caso extremo, é um gráfico mostrando a densidade da distribuição de probabilidade.

Média aritmética (média) é a soma de todos os valores de observações dividido pelo número de observações (o número de períodos em nosso caso). Não é aplicável para todas as distribuições e mais popular para os normais quando coincide com a mediana. Estritamente falando, isto implica que o indicador de média móvel mais popular pode ser aplicado no caso de as cotas terem o direito de distribuição, para o qual existe o valor médio.

A mediana divide todas as observações em uma amostra em duas partes: no primeiro caso, todas as observações são menos pelo valor da mediana, no segundo, os valores das observações excedem pelo valor de mediana. A mediana existe para qualquer distribuição e não é sensível a valores discrepantes. No caso de a média ser igual (ou próxima) à mediana, é um dos recursos de lei de distribuição normal.

O desvio da média é uma questão bastante interessante. Dispersão é um valor médio dos quadrados do desvio de um valor aleatório de sua expectativa matemática. A raiz quadrada da dispersão é um desvio quadrado médio (padrão).

O desvio padrão e a dispersão não são resistentes a valores discrepantes.

Uma quantidade sem dimensão chamada proporção assimétrica (obliquidade) serve como o indicador de um grau de assimetria da distribuição da curva de densidade. Se o valor da obliquidade for menor que «seis dividido pelo número de observações», a distribuição da probabilidade de um valor aleatório depende da lei normal.

Outro valor que caracteriza a densidade de distribuição é a curtose. Ela é igual a 3 em condições normais. No caso de a curtose ser maior que três, o topo é pontudo e a cauda «pesada» cai de uma forma lenta de ângulo.

Como podemos ver, muitos dos conceitos são aplicáveis a variáveis aleatórias tendo a lei de distribuição normal. Não é tão ruim, já que um grande número de leis de distribuição é reduzido para normal quando o número de observações aumenta.

1.3.2. Distribuição normal

A distribuição normal (Gaussiana) é um caso extremo de quase todas as distribuições de probabilidade.

O teorema do limite de Lyapunov serve como base teórica estabelecendo que a distribuição das somas dos valores aleatórios independentes tendo qualquer distribuição inicial será normal no caso de haver várias observações e sua contribuição é pequena. Além disso, é amplamente utilizado em muitas aplicações reais da teoria da probabilidade.

A distribuição normal é uma curva em forma de sino simétrica, estendendo-se por todo o eixo do número. A distribuição gaussiana depende de dois parâmetros: μ (expectativa matemática) e σ (desvio padrão).

A expectativa matemática e a mediana de dada distribuição é igual a μ, enquanto a dispersão é igual a σ2. A curva de densidade de probabilidade é simétrica à expectativa matemática. A proporção de assimetria e excesso é de γ = 0, ε = 3.

A densidade de distribuição normal é geralmente descrita não como função de variável x, mas como z = função de variável σ / (x − μ) tendo a expectativa matemática zero e dispersão igual a 1.

A distribuição com μ = 0 e σ = 1 é chamada de distribuição normal padrão (i.i.i).

Fig. 1. Distribuição normal

Fig. 1. Distribuição normal

1.3.3. Distribuição de Student (distribuição-t)

O parâmetro principal é o grau de liberdade (o número de elementos na amostra). Com o aumento no número de graus de abordagens da distribuição de Student de liberdade, o normal padronizado, e no caso n > 30, a distribuição de Student pode ser substituída pela distribuição normal. No caso n < 30, a distribuição de Student tem caudas mais pesadas.

Fig. 2. Distribuição de Student

Fig. 2. Distribuição de Student

A estatística-t é amplamente utilizada para hipóteses estatísticas.

1.3.4. Quadrado-chi (Distribuição de Pearson)

Em caso de Xi os valores aleatórios serem independentes tendo i.i.i, então a soma de seus quadrados está sujeita à distribuição-χ2. A densidade depende de um único parâmetro (geralmente chamado o número de graus livre) igual ao número de variáveis aleatórias independentes. Se o número de graus livres →∞, a distribuição-χ2 tende para a distribuição normal tendo o centro v e dispersão 2ν. A densidade de distribuição é assimétrica, unimodal e também se torna mais plana e simétrica com aumento de graus de liberdade.

Fig. 3. Distribuição de Pearson (quadrado-chi)

Fig. 3. Distribuição de Pearson (quadrado-chi)

1.3.5. Distribuição Fisher - F

A distribuição Fisher-F é uma distribuição de uma relação de dispersão, ou seja, a proporção de duas séries de dispersão.

Se duas variáveis aleatórias independentes tiverem uma distribuição quadrada-chi com graus de liberdade (V1, V2), sua proporção tem a distribuição Fisher.

Fig. 4. Distribuição Fisher

Fig. 4. Distribuição Fisher


1.3.6. Razão de determinação quadrada-R

A razão de determinação mostra qual proporção da dispersão de resultado é explicada pela influência de variáveis independentes. No caso de duas variáveis que sejam quadradas de correlação Pearson. Ela mostra a quantidade de dispersão total entre as duas variáveis.

A significância da proporção de correlação depende do número de observações ou a estatística-F Fisher. Quando o número de candlesticks em uma cota excede a 100, mesmo pequenos desvios dos valores observados de zero são suficientes para confirmar a significância do indicador.

1,4. Determinando hipóteses

A quais conclusões podemos chegar sobre alguns parâmetros de conjunto geral, no caso de termos um valor seletivo deste parâmetro? A resposta para esta questão depende se temos informações antecipadas sobre o tamanho do parâmetro geral.

Se a informação antecipada sobre a magnitude geral do parâmetro estiver ausente, podemos avaliar este parâmetro por um valor seletivo, configurando o intervalo de confidência para isso, ou seja, a faixa dentro da qual seu valor é localizado com uma determinada probabilidade confiável.

Na prática, geralmente precisamos verificar algumas especificidades e, na maioria dos casos, apenas uma hipótese Mas. Esta hipótese é considerada ser nula. Para testar a hipótese, alguns critérios são utilizados permitindo aceitá-la ou rejeitá-la. Os tipos de estatísticas listadas abaixo são usadas com mais frequência como o critério: estatística-t, estatística-F e estatística de quadrado-chi. Ao utilizar algum software específico para estatística (por exemplo, STATISTICA) ou econometria (como EViews), o critério calculado é acompanhado pelo valor de significância - valor-p. Por exemplo, o valor-p de 0.02 (2%) significa que o critério correspondente não é significante em um nível de significância de 1% e significante a um nível de significância de 5%. Equivalentemente, pode ser presumido que a hipótese nula não é válida com a probabilidade igual a "valor-p 1".

A seleção de um valor-p é subjetiva e determinada pela gravidade das consequências de uma avaliação errônea de um critério específico.


1,5. Características estatísticas de cotas

1.5.1. Estatísticas descritivas

Estatísticas descritivas incluem:

  • Um histograma que deve abordar a lei de distribuição quando a quantidade de candlesticks em uma cota aumenta;
  • Medidas de tendência principais: média, mediana;
  • Medida de dispersão: derivação padrão;
  • Medidas de forma: obliquidade e curtose;
  • Critério de normalidade Jarque-Bera.

Critério Jarque-Bera. Hipótese nula Mas: a distribuição é normal. Por exemplo, a probabilidade que acompanha o valor de critério é igual a 0.04. Parece que a seguinte conclusão pode ser feita: a probabilidade da aceitação de hipótese nula é igual a 4%. Porém, isso não está completamente correto, já que o valor calculado é um critério valor-p e a probabilidade de aceitação da hipótese nula é igual a 96%.


1.5.2. Autocorrelação e estatística Q

Correlação é a medida da relação entre duas variáveis. A proporção de correlação pode variar de -1.00 a +1.00. O valor -1.00 significa uma correlação completamente negativa, o valor +1.00 significa uma correlação completamente positiva. O valor 0.00 significa a ausência de correlação.

A correlação entre os elementos de uma cota é chamada de autocorrelação. Pode ser bastante útil ao encontrar tendência. A presença de autocorrelação desafia qualquer conclusão sobre as cotas como variáveis aleatórias, porque o fator mais significativo ao determinar um valor aleatório é a independência de vários preços em diferentes períodos de tempo.

Em um software de análise estatística a autocorrelação é acompanhada pela estatística-Q de Ljung-Box com o valor-p. A hipótese nula é: a autocorrelação ausente, ou seja, no caso do valor-p ser igual a zero podemos concluir que a correlação está ausente antes de algum candlestick definitivo em uma cota.

A exclusão de autocorrelações (tendências) de cotas é a primeira etapa para obter a possibilidade de uso de métodos de estatísticas matemáticas.


1.5.3. Cotas estacionárias

Consideraremos as cotas como estacionárias, no caso de suas expectativas matemáticas e dispersão não dependerem do tempo. Mesmo esta definição de estacionária é muito estrita e não muito adequada para aplicação prática. As cotas são com muita frequência consideradas estacionárias, no caso de desvios da expectativa matemática e/ou dispersão compreenderem muitos porcento (geralmente não mais de 5%) dentro de algum tempo.

As cotas reais no mercado Forex não são estacionárias. Elas têm os seguintes desvios:

  • A presença de uma tendência gerada pela dependência entre as observações com tempo. A dependência é um recurso característico de cotas de moedas e observações econômicas em comum;
  • Ciclicidade;
  • Dispersão variável (heterocedasticidade).

As cotas desviando das estacionárias são chamadas de não-estacionárias. Elas são analisadas pela decomposição sucessiva dos componentes. O processo de decomposição termina com o recebimento do saldo de uma série estacionária com quase constante expectativa e/ou dispersão.

Existem vários testes para cotas estacionárias. Os básicos são testes de raiz unitária. O teste de raiz unitária mais famoso é o teste Dickey-Fuller. A hipótese nula Mas: cotas não são estacionárias (elas têm uma raiz unitária), ou seja, a média e dispersão dependem do tempo. Devido a haver uma dependência quase constante de tempo (uma tendência), a presença de uma tendência nas cotas deve ser indicada quando realizar o teste. Nesta fase, são determinadas visualmente.


1,6. Especificação de indicadores (regressão)

Um olhar superficial nos textos dos indicadores escritos usando tais linguagens como MQL5, por exemplo, permite identificar duas formas de sua configuração: analítica (mais comum) e tabular (aplicada para os indicadores, que são chamados de filtros, por exemplo, indicadores Kravchuk).

Mas, usaremos o termo 'regressão' - um termo comum em estatística matemática e econometria.

Tendo a ideia do que queremos obter com as cotas, precisamos definir os seguintes parâmetros para formular a regressão (indicador).

  • A lista de variáveis independentes usada para o cálculo do indicador;
  • Proporções das variáveis independentes;
  • A equação do cálculo do indicador que será usada para o cálculo de variável dependente.

Embora existam algumas dificuldades em criar indicadores de moeda múltipla, não há muitas dificuldades na regressão.

Tendo essas três posições, será necessário adequar a regressão à cota. Em contraste com os fóruns de negócios, a palavra «adequar, adequação» não é uma palavra ruim em econometria, mas o procedimento padrão, durante o qual a conformidade da regressão (indicador) para cotas é calculada utilizando um dos vários métodos de avaliação. O melhor método conhecido para avaliação seria o de Mínimos quadrados ordinários (OLS).

A avaliação revela dois pontos de interesse:

  • A conformidade do indicador com as cotas – o valor do erro restante;
  • Estabilidade dos parâmetros da regressão calculada no futuro.

As respostas a estas perguntas são dadas durante a disposição dos indicadores.


1,7. Diagnóstico de indicadores

O diagnóstico de indicadores (regressão) é dividido em três grupos:

  • Diagnóstico de razões;
  • Diagnóstico de resíduos;
  • Diagnóstico de estabilidade;

Cada procedimento de verificação descrito abaixo inclui a especificação da hipótese nula que é utilizada como uma hipótese de verificação. O resultado da verificação consiste em selecionar os valores de uma ou mais estatística e seus valores-p anexos. O último indica a probabilidade de execução da condição da hipótese nula, o que é a base da estatística de verificação.

Assim, os pequenos valores-p levam à rejeição da hipótese nula. Por exemplo, se um valor-p está entre 0.05 e 0.01, a hipótese nula é desviada em um nível de 5%, não 1%.

Deve ser observado que existem várias sugestões e resultados de distribuição conectados com cada verificação. Por exemplo, algumas estatísticas têm distribuições de teste finitas (geralmente distribuições t ou F). Outras, são grandes amostras da estatística de teste como distribuições assintóticas χ2.


1.7.1. Diagnóstico de razões

O diagnóstico de razões fornece informações e define as limitações das razões avaliadas, incluindo o caso especial das verificações para variáveis redundantes e perdidas. As seguintes verificações das razões da equação de regressão serão utilizadas:

  • Elipses de confiança permitem revelar a correlação entre as razões da equação;
  • O teste das variáveis faltantes permite determinar a necessidade das variáveis adicionais na equação de regressão;
  • O teste das variáveis redundantes permite revelar variáveis excessivas;
  • O teste de quebra permite determinar a reação da equação de regressão a mudanças de uma tendência. é aconselhável criar uma equação de regressão que possa ser igualmente boa em refletir as cotas nos segmentos de cotas plano, descendente e ascendente.


1.7.2. Diagnóstico de resíduos

Já mencionamos a importância de estudar os resíduos ao tentar transformar as cotas não estacionárias em estacionárias.

Um teste de raiz unitária pode mostrar que os resíduos são distribuídos bem próximos da lei normal em comparação com as cotas normais. A palavra "próximo" reflete o fato de que os resíduos têm uma média e dispersão dependendo do tempo que leva para a estabilidade das proporções da equação de regressão.

Utilizando termos dos fóruns de negócios, podemos dizer que não devemos "otimizar demais (aqui está nossa famosa adequação!)" um sistema de negócio, ou seja, ele não deve perder suas características nos próximos segmentos. O sistema não é adequado para os segmentos de cota futuros porque a expectativa matemática e dispersão mudam com o tempo.

Os seguintes testes serão realizados para os resíduos: correlação de série, normalidade, heterocedasticidade e heterocedasticidade condicional de resíduos.

Correlogramas - Estatística-Q mostram as autocorrelações dos resíduos e calculam a estatística-Q de Ljung-Box para os lags apropriados com a indicação do valor-p.

Histograma - teste de normalidade mostra o histograma e estatística dos resíduos descritivos, incluindo a estatística Jarque-Bera ao testar por normalidade. Se os resíduos forem normalmente distribuídos, o histograma deve ser no formato sino e a estatística Jarque-Bera não deve ser significante.

Testes de heterocedasticidade verificam a heterocedasticidade dos resíduos da equação. Se houver evidência de heterocedasticidade, é necessário trocar a especificação da regressão (mudar o indicador), ou modelo de heterocedasticidade.

Vamos usar o teste de heterocedasticidade de White com a hipótese nula com relação a ausência de heterocedasticidade com relação ao teste de heterocedasticidade de uma forma conhecida e comum.

White descreve seu método como teste comum para a especificação de erro de modelo, como a hipótese nula, o teste é baseado em sugestões de que os erros sejam tanto homocedásticos como independentes das variáveis independentes, e que a especificação do modelo linear é correta. A exclusão de quaisquer destes parâmetros pode levar a uma estatística significante de teste. Ao contrário, estatística insignificante de teste implica que nenhum destes três parâmetros foram violados.


1.7.3. Diagnóstico de estabilidade

A estabilidade do diagnóstico é o mais importante e interessante neste caso, devido aos resultados dos diagnósticos revelarem as capacidades preditivas do indicador. No MT4 e MT5 a estabilidade pode ser diagnosticada utilizando o testador de estratégia. Mais adiante, mostraremos que o Strategy Tester não pode diagnosticar a estabilidade futura de um sistema de negócio criado utilizando os indicadores. Ele pode apenas fornecer algumas avaliações sobre o sistema de negócio com base nos dados do histórico.

Como durante os testes de sistemas de negócio, o método comum do diagnóstico de estabilidade é que as barras de cota Т são divididas em observações Т1 que serão usadas para a avaliação e Т2 = Т Т1 barras que serão usadas para teste e avaliação.

No caso do sistema de negócio ser testado em dois segmentos, o problema de sua estabilidade futura não poder ser resolvida, devido ao teste no segundo segmento mostrar apenas que este novo segmento é similar ao anterior por seus parâmetros estatísticos desconhecidos. Ao mesmo tempo, os problemas estatísticos que foram solucionados durante a criação do sistema de negócio permanece desconhecido.

Claro, segmentos de cotas diferentes são selecionados durante o teste dos sistemas de negócio, mas é impossível detectar visualmente, ou seja, as áreas de heterocedasticidade ou os segmentos de cotas onde as razões de regressão serão instáveis.

Diversos testes (nem todos testes de estabilidade) são listados abaixo. Com estes testes podemos nos certificar que o sistema de negócio mostrará um resultado estável, no caso de as condições de teste aparecerem em uma cota no futuro.

Por exemplo, a mudança de uma direção de tendência de descendente para ascendente ou vice e versa é um teste de breakpoint. Se este teste não for considerado breakpoint, podemos garantir que o indicador mostrará resultados estáveis de uma tendência.

Teste breakpoint Quandt-Andrews

A hipótese nula: a ausência de breakpoints entre duas observações, espaçadas pelas extremidades da amostra em 15%.

O teste de breakpoint Quandt-Andrews realiza a verificação para um ou mais breakpoints de estrutura desconhecida em uma amostra para uma dada equação. A ideia básica do teste de Quandt-Andrews é que um teste separado de breakpoint Chow é realizado entre duas datas ou observações t1 e t2. Mil das estatísticas de teste dos testes Chow são então somadas em uma estatística de teste para o teste contra a hipótese nula com relação a ausência de breakpoints entre t1 e t2.

Teste RESET de Ramsey

A hipótese nula: o erro em gerenciar a regressão é um valor distribuído normalmente com média zero.

Correlação de série, heterocedasticidade ou lei de distribuição normal para todos viola a suposição de que ruídos são distribuídos normalmente.

RESET - um teste comum para os seguintes tipos de erros de especificação:

  • Variáveis faltantes; X não inclui todas as variáveis apropriadas;
  • Forma funcional incorreta: algumas ou todas as variáveis em y e x devem ser transformadas por um algorítimo, uma potência, um valor inverso ou de alguma outra forma;
  • A correlação entre X e E pode ser causada por alguns fatores, inclusive o erro de medição X ou a presença de um volume de lag e uma correlação na série de ruído.

Com tais erros de especificação, as avaliações OSL serão alternadas (o erro no sistema não é igual a zero) e inválidas (não são adequadas para a quantidade avaliada por sua probabilidade quando aumentar o número de observações), deste modo, os procedimentos de saída comuns serão injustificados.

Resíduos recursivos

Os testes de resíduos recursivos são baseados em avaliações de regressão múltiplas com o aumento gradual no número de barras.

Um passo a frente do teste de previsão

Se olharmos a definição dos resíduos recursivos previamente apresentados, podemos ver que cada resíduo recursivo é um passo a frente do erro de previsão. Se quisermos verificar a possibilidade do valor da variável dependente para passar pelo modelo adequado junto com todos os dados até o ponto para o momento t, cada erro deve ser comparado com seu desvio padrão a partir da amostra completa.

Estimativas recursivas de razão

Este tipo permite rastrear a mudança nas estimativas para qualquer razão quando a quantia de dados de estimativa em uma amostra aumenta. A figura mostra razões selecionadas na equação para todas as estimativas recursivas. As figuras mostram dois intervalos padrão acerca das razões estimadas.

No caso da razão mostrar uma mudança significativa ao adicionar os dados à equação de avaliação, este é um sinal seguro de instabilidade. As imagens da razão podem algumas vezes pular dramaticamente, devido a equação postulada tentar superar uma quebra estrutural.

A análise técnica possui uma ampla gama dos chamados indicadores "adaptáveis", embora não existam tentativas para determinar a necessidade real para tal adaptação. As estimativas recursivas da razão podem resolver este problema.


2. Preparando dados iniciais

Vamos considerar os preços de cotas diárias EURUSD de 11 de novembro de 2010 a 23 de março de 2011 para nossa análise. As cotas são recebidas do terminal MT4 por F2 e exportadas para o Excel.

O gráfico linear de cotas é da seguinte forma:

Fig. 5. Gráfico EURUSD

Fig. 5. Gráfico EURUSD

Este exemplo mostra a necessidade de controlar dados perdidos nos indicadores. Podemos pensar que as cotas mostradas são apenas um caso especial de cotas de baixa qualidade. As omissões de dados podem ocorrer devido a vários fatores. Além do que, devemos levar em conta os dados perdidos durante os feriados americanos. O problema de dados perdidos se torna particularmente ruim ao construir sistemas de negócio com base em vários fatores econômicos, como correlação de câmbio e índices de estoque que não são negociados diariamente.

Em nosso caso simples, é possível realizar a interpolação linear e menos a influência de dados perdidos em cálculos em ao menos algum grau.

Além disso, existe o problema de valores discrepantes. O problema dos valores discrepantes é mais complicado do que o problema de dados faltantes. Antes de começarmos a buscar por valores discrepantes, devemos responder a seguinte questão: o que é um valor discrepante? Eu considero um valor discrepante um movimento de preço que excede os três desvios padrão por um futuro forte movimento de preço.

Os valores discrepantes são determinados não pelas cotas, mas por seus resíduos: vamos calcular a série subtraindo o valor do preço anterior do próximo – eurusd(i) – eurusd(i+1) (na notação do MQL). A notação Inglesa possui diversos nomes para este valor. Está 'diferenciado' no gráfico. A palavra 'retornos' é usada mais frequentemente. Usarei a palavra 'resíduo' aqui e abaixo. é um valor obtido após a remoção de uma tendência nas cotas. O gráfico de resíduos do EURUSD é da seguinte forma:


Fig. 6. Resíduo EURUSD

Fig. 6. Resíduo EURUSD

O desvio padrão para cotas EURUSD é igual a 0.033209. Então, não existem valores discrepantes em nossas cotas de acordo com o critério de valores discrepantes formulado.

Em caso de haver valores discrepantes, eles podem ser substituídos por, digamos, valores para dados perdidos e depois interpolados.

O método fornecido para remover valores discrepantes não é apenas um, e mais importante, não está correto. Se o resíduo for composto de resíduos de cotas após uma remoção de tendência, é bem evidente que o tamanho dos valores discrepantes dependem do método em que a tendência é determinada, ou seja, os valores discrepantes devem ser considerados após o problema de determinação de tendência ser solucionado.

Neste ponto, a preparação de dados básicos para futura análise é considerada concluída.


3. Análise dos parâmetros estatísticos

A análise dos parâmetros estatísticos de cotas Forex e a análise de cotas EURUSD em particular são realizadas para verificar a possibilidade de aplicação de indicadores para análise e criação de sistemas de negócio.

O algoritmo típico para criação de um sistema de negócio é da seguinte forma:

  1. Um indicador é selecionado (por exemplo, Média móvel) e um sistema de negócio é criado em sua base;
  2. Geralmente é impossível construir um sistema de negócio com base em um único indicador, indicadores adicionais são implementados para evitar entradas de mercado falsas.

Além disso, o mantra "não sobreajuste, apenas não sobreajuste" pode ser expressado neste estágio.


3,1. Estatísticas descritivas

Sabemos pelas estatísticas que se uma cota tiver sido sujeita à lei de distribuição normal como um valor aleatório, o valor de erro de cálculo de média pode ter mudado no caso de mudanças no número de períodos e pode ter coincidido em infinito com a expectativa matemática que é uma constante para a lei normal. As cotas podem ter sido substituídas com uma linha horizontal, stop loss e take profit podem ter sido definidos em níveis de desvio padrão. Mas, este não é o caso. Vamos examinar alguns motivos.

Verificaremos a conformidade das cotas com a lei de distribuição normal.

Vamos criar o histograma das cotas EURUSD que parece da seguinte forma:

Fig. 7. Histograma EURUSD

Fig. 7. Histograma EURUSD

O histograma mostra quantas vezes um preço definitivo emergiu dentro da faixa que nós selecionamos.

De acordo com sua aparência, a distribuição não está normal, dois topos estragam a imagem inteira. Vamos realizar o teste de Jarque-Bera de normalidade com hipótese nula H0: a distribuição é normal. O resultado é mostrado abaixo:

Parâmetro Valor (fato) Valor teórico
Média
1,3549
A média deve ser igual à mediana
Mediana
1,3580
A mediana deve ser igual à média
Desvio padrão
0,0332
-
Assimetria (inclinação)
0,0909
0,0
Curtose
2,1052
3,0
Jarque-Bera
3,5773
0,0
Probabilidade
0,1671
1,0


Tabela 1. Resultado do teste de normalidade de distribuição

De acordo com o critério Jarque-Bera, a conclusão sobre a não conformidade com a normalidade não é tão dogmática porque:

  • A média e a mediana quase coincidem
  • A assimetria é próxima de zero
  • A curtose é próxima de três
  • As discrepâncias existentes são todas refletidas pela última linha de "Probabilidade", o que mostra que a distribuição é normal com a probabilidade de 16.7186%.

Podemos ter diferentes atitudes com esta figura. Por um lado, não podemos rejeitar a hipótese (uma cota é distribuída normalmente) no nível convencional de significância, como 95%. Por outro lado, é impossível considerar a distribuição como normal em 16%.

Devido a média quase coincidir com a mediana (uma das características da distribuição normal), vamos verificar se podemos confiar nos valores calculados da média. Vamos realizar o teste para a igualdade da média dividindo as cotas em seções.

Os resultados são os seguintes:

EURUSD
QuantidadeMédia
Desvio padrão
Erro médio
[1.25, 1.3)
4
1,2951
0,0034
0,0017
[1.3, 1.35)
42
1,3262
0,0125
0,0019
[1.35, 1.4)
48
1,3740
0,0133
0,0019
[1.4, 1.45)
9
1,4131
0,0083
0,0027
Todos
103
1,3549
0,0332
0,0032


Tabela 2. Comparando os valores da média nos segmentos

Como mostrado por este teste, a média é calculada com um erro tendo o valor mais comum de 19 pips que pode chegar até 32 pips.

Levando isso em conta, concluímos que não podemos usar a média.

O valor do desvio padrão de 0.033209 parece muito suspeito. Isso são 332 pips! Falando em termos gerais, um desvio padrão tão grande é óbvio: A cota EURUSD tem uma tendência, que, na realidade, é um componente determinístico regular distorcendo qualquer característica estatística das cotas.


3,2. Teste da a autocorrelação das cotas

O conceito de "aleatoriedade" é baseado na independência de valores de quantidade aleatória relativos uns aos outros. A aparência das cotas permite encontrar as seções de movimento direcional - tendências.

O determinismo (presença de tendência) implica na dependência de valores EURUSD adjacentes que podem ser verificados calculando a autocorrelação (ACF), ou seja, a correlação entre os valores EURUSD adjacentes.

Os resultados são mostrados abaixo:

Fig. 8. Função de autocorrelação de cotas EURUSD

Fig. 8. Função de autocorrelação de cotas EURUSD

A probabilidade reunida com a estatística-Q é a mesma em todos os lugares e igual a zero.

Os cálculos mostram que:

  • O valor da função de autocorrelação diminui vagarosamente e esta diminuição é provavelmente regular.

A probabilidade calculada se refere ao teste com a hipótese nula, mas não há correlação até 16 lag (em nosso caso). Devido a probabilidade ser igual a zero para todos os lags, absolutamente rejeitamos a hipótese nula sobre a ausência de autocorrelação (tendência) nas cotas.


3,3. Análise das cotas estacionárias

Realizaremos a análise das cotas estacionárias EURUSD utilizando o teste Dickey-Fuller em suas três versões: com um deslocamento, com uma tendência e sem um deslocamento ou tendência.

O resultado do teste consiste em duas partes: para EURUSD e para cotas EURUSD diferenciadas denotadas como D(EURUSD).

A hipótese nula deste teste é que EURUSD não é estacionária (possui uma raiz unitária). Realizaremos os cálculos não apenas de uma única raiz unitária, mas também das características estatísticas dos resultados de diferenciação EURUSD. O gráfico de diferenciação é apresentado abaixo:

Fig. 9. Resíduo de cotas EURUSD

Fig. 9. Resíduo de cotas EURUSD

Pode ser concluído visualmente que as cotas diferenciadas EURUSD são oscilações aleatórias localizadas aproximadamente ao redor de zero.

Vamos examinar os três métodos de cálculo do teste de estacionariedade das cotas EURUSD.

1. As cotas sem um deslocamento (uma constante) e uma tendência, para as quais a regressão tem a seguinte forma:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1))

A probabilidade de aceitação da hipótese nula (a série não é estacionária): 0,6961

VariávelRazão
Estatística-tProbabilidade de ser igual a zero
EURUSD(1)
3.09E-05
0,0488
0,9611
D(EURUSD(1))
0,2747
2,8759
0,0049

Tabela 3. Resultados do teste de estacionariedade sem considerar o deslocamento e tendência

Avaliação da adequação de regressão D(EURUSD) por R-quadrado: 0,07702.

As seguintes conclusões podem ser obtidas destes dados:

  1. As cotas EURUSD devem ser reconhecidas como não estacionárias com alta probabilidade (69%). Não rejeitamos a hipótese nula estritamente;
  2. O incremento D(EURUSD) não depende do valor do preço EURUSD anterior com a probabilidade de 99.5%;
  3. D(EURUSD) depende completamente do incremento D(EURUSD(1)) anterior;
  4. O valor da razão de determinação de R-quadrado = 0.077028 mostra a não conformidade completa da regressão com cotas D(EURUSD) diferenciadas.

2. Cota EURUSD com um deslocamento (uma constante), para qual a regressão parece da seguinte forma:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3)
VariávelRazão
Estatística-tProbabilidade de ser igual a zero
EURUSD(1)
-0,0445
-1,6787
0,0964
D(EURUSD(1))
0,3049
3,1647
0,0021
С 0,0603 1,68030,0961


Tabela 4. Resultados do teste de estacionariedade considerando o deslocamento

A probabilidade de aceitação da hipótese nula (a série não é estacionária): 0,4389

Avaliação da adequação de regressão D(EURUSD) por R-quadrado: 0,1028

As seguintes conclusões podem ser obtidas destes dados:

  1. As cotas EURUSD devem ser reconhecidas como não estacionárias com uma probabilidade bem alta (43%). Não rejeitamos a hipótese nula estritamente;
  2. Não devemos incluir o valor de preço EURUSD anterior e uma constante (deslocamento) na equação de regressão para incremento D(EURUSD), já que consideramos estas razões iguais a zero para o nível de significância de 5%.
  3. D(EURUSD) depende completamente do incremento D(EURUSD(1)) anterior;
  4. O valor da razão de determinação de R-quadrado = 0.102876 mostra a não conformidade completa da regressão com cotas D(EURUSD) diferenciadas.

3. Cota EURUSD com um deslocamento (uma constante) e uma tendência, para qual a regressão parece da seguinte forma:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3) + С(4) * TREND

A probabilidade de aceitação da hipótese nula (a série não é estacionária): 0,2541

VariávelRazão
Estatística-t
Probabilidade de ser igual a zero
EURUSD(-1)
-0,0743
-2,6631
0,0091
D(EURUSD(-1))
0,2717
2,8867
0,0048
C
0,0963
2,5891
0,0111
TENDêNCIA(01/11/2010)
8.52E-05
2,7266
0,0076

Tabela 5. Resultados do teste de estacionariedade considerando o deslocamento e tendência

Avaliação da adequação de regressão D(EURUSD) por R-quadrado: 0,1667

As seguintes conclusões podem ser obtidas destes dados:

  1. As cotas EURUSD devem ser reconhecidas como não estacionárias com uma probabilidade bem alta (25%). Não rejeitamos a hipótese nula estritamente;
  2. Embora a probabilidade da razão ser igual a zero durante uma tendência ser menor que 1%, o valor desta razão é extremamente pequeno, ou seja, a tendência é uma linha horizontal;
  3. O valor da razão de determinação de R-quadrado = 0.166742 mostra a não conformidade completa da regressão com cotas D(EURUSD) diferenciadas.

A partir destes cálculos, a seguinte conclusão pode ser obtida: no caso de cotas EURUSD básicas não serem estacionárias, então sua primeira diferença, obtida subtraindo o valor do preço anterior do seguinte, é provavelmente estacionária.

Neste caso, removemos uma tendência e um deslocamento, o que pode ser descrito pela seguinte equação:

eurusd = c(1) * tendência + c(2),

onde c(1) e c(2) são constantes que podem ser avaliadas pelo método de mínimos quadrados.

Esta equação é uma equação de regressão comum completamente coincidindo com a ferramenta "regressão" no terminal MT4. Ou seja, substituímos a cota básica pela linha reta. é um método amplamente utilizado em análises técnicas, já que podemos facilmente lembrar uma variedade de instrumentos que consistem em linhas retas: canais, níveis de suporte e resistência, níveis de Fibonacci, Gann, etc.

Linhas retas são a primeira ferramenta usada por qualquer negociante. Mas, por que confiamos nessa ferramenta? Por que consideramos as linhas retas como confiáveis? Responderemos esta questão posteriormente neste artigo.

Além das linhas retas, os indicadores que substituem as cotas básicas com algumas curvas também são utilizados em análises técnicas. Faremos da mesma forma e retiraremos dois indicadores bem conhecidos para análise: média de movimento exponencial e filtro Hodrick-Prescott.


4. Destendência de cotas

O uso do termo «destendência» pretende enfatizar a conexão desta seção com a noção correspondente da econometria. Mais precisamente e de acordo com o modelo declarado anteriormente de mercados financeiros, devemos falar sobre a remoção (destendência) de um componente regular das cotas.

Determinamos três componentes regulares em nosso caso: tendência linear, média móvel exponencial e filtro Hodrick-Prescott.

Todos os componentes regulares serão definidos em séries de tempo.


4,1. Tendência linear

Vamos definir a tendência linear adicionando a um valor prévio.

Avaliaremos as razões da regressão linear:

eurusd = c(1) * tendência + c(2),

Obtemos o gráfico combinado de uma cota básica EURUSD, linha de regressão reta deslocada verticalmente e o resíduo obtido pela dedução da linha de regressão da cota:

Fig. 10. Gráfico EURUSD, regressão linear e resíduo

Fig. 10. Gráfico EURUSD, regressão linear e resíduo

Agora avaliamos a seguinte equação utilizando o método de mínimos quadrados:

EURUSD = С(1)*TENDêNCIA + С(2)

A avaliação da equação de regressão é acompanhada pelos seguintes dados:

Variável
Razão
Estatística-t Probabilidade de ser igual a zero
TENDêNCIA
0,0004
4,4758
0,0000
C
1,3318
223,3028
0,0000

Tabela 6. Resultados do teste de estacionariedade da tendência linear

Avaliação da adequação de regressão à cota de R-quadrado = 0.1655.

As seguintes conclusões podem ser obtidas deste resultado:

  1. De acordo com a razão de determinação de R-quadrado, a linha reta pode explicar as mudanças nas cotas apenas em 16% dos casos.
  2. O resíduo da dedução da tendência linear da cota difere insignificantemente da cota em si. Aparentemente, terá as mesmas falhas estatísticas como a cota.


4.2. Suavização exponencial

O algoritmo Holt-Winters sem um componente sazonal com parâmetros de suavização para uma cota (nível) e uma tendência será selecionado para suavização exponencial.

A ideia principal do método:

  • Remover a tendência da série de tempo separando o nível da tendência;
  • Suavizar o nível (um parâmetro);
  • Suavizar a previsão de tendência (parâmetro-b).

O resultado obtido é mostrado na figura.

Fig. 11. Média móvel exponencial

Fig. 11. Média móvel exponencial

Recebemos uma média móvel exponencial padrão que atrasa um pouco, mas exibe bem a cota. Os parâmetros de suavização são exibidos no topo, a seleção de parâmetros não foi realizada.

Agora avaliamos a seguinte equação utilizando o método de mínimos quadrados:

EURUSD = С(1)*EURUSD_EX +С(2)

A avaliação da equação de regressão é acompanhada pelos seguintes dados:

Variável
Razão
Estatística-tProbabilidade de ser igual a zero
EURUSD_EX
0,9168
24,3688
0,0000
C
0,1145
2,2504
0,0266


Tabela 7. Resultados da avaliação de regressão linear

Avaliação da adequação de regressão à cota de R-quadrado = 0.8546

As seguintes conclusões podem ser obtidas deste resultado:

  1. De acordo com a razão de determinação de R-quadrado, a média móvel exponencial pode explicar as mudanças nas cotas apenas em 84% dos casos;
  2. O resíduo da dedução da média exponencial da cota é similar a um processo aleatório com distribuição normal. Vamos considerar que há algum sentido em uma análise futura deste resíduo.


4,3. Filtro Hodrick-Prescott

O filtro Hodrick-Prescott tem o parâmetro lambda.

Não lidaremos com a seleção deste parâmetro e tomaremos como sendo igual a 8162.

O resultado é mostrado abaixo:

Fig. 12. Filtro Hodrick-Prescott

Fig. 12. Filtro Hodrick-Prescott

Agora avaliamos a seguinte equação utilizando o método de mínimos quadrados:

EURUSD = С(1)*EURUSD_HP + С(2)

A avaliação da equação de regressão é acompanhada pelos seguintes dados:

Variável
Razão
Estatística-t
Probabilidade de ser igual a zero
EURUSD_HP
1,0577
23,9443
0,0000
C
-0,0782
-1,3070
0,1942


Tabela 8. Resultados da adequação da regressão às cotas

Avaliação da adequação de regressão à cota de R-quadrado = 0.8502

As seguintes conclusões podem ser obtidas deste resultado:

  1. A probabilidade da segunda razão (a constante) sendo igual a zero é de 19%. O que coloca em dúvida o uso da constante na equação de regressão.
  2. De acordo com a razão de determinação de R-quadrado, o filtro Hodrick-Prescott pode explicar as mudanças nas cotas em 85% dos casos;
  3. O resíduo da dedução do filtro Hodrick-Prescott da cota é similar a um processo aleatório com a distribuição normal, e faz sentido uma análise posterior.


5. Diagnóstico de razões

O diagnóstico de razões inclui os seguintes testes:

  1. A elipse de confiança define a correlação entre as razões da equação de regressão: a elipse mais próxima de um círculo, quanto menos correlação;
  2. O intervalo de confiança define os limites da variação das razões da equação. Na análise técnica, as razões são as constantes que geralmente podem ser mudadas utilizando o parâmetro "período" ou de alguma outra forma. Mas em qualquer caso, as razões não são consideradas como valores aleatórios. Vamos verificar se é verdade;
  3. Teste de variáveis perdidas - a hipótese nula é considerada: uma variável independente adicional não é significante.
  4. Teste de variáveis redundantes - a hipótese nula: razão da variável adicional é igual a zero;
  5. O teste de breakpoint determina a presença de pontos de mudança das características estatísticas da cota. Vamos verificar os pontos de mudança de tendência na função dos pontos de mudança mencionados. Na cota EURUSD analisada podemos alocar ao menos duas tendências - descendente e ascendente (aqui ignoramos um movimento plano).

5,1. Elipse de confiança

Vamos criar elipses de confiança para cada uma das equações de regressão:

Fig. 13. Elipse de confiança para a equação de regressão 1

Fig. 13. Elipse de confiança para a equação de regressão 1

Fig. 14. Elipse de confiança para a equação de regressão 2

Fig. 14. Elipse de confiança para a equação de regressão 2

Fig. 15. Elipse de confiança para a equação de regressão 3

Fig 15. Elipse de confiança para a equação de regressão 3


As seguintes conclusões podem ser obtidas destas situações:

  1. A correlação das razões para a regressão de tendência linear está presente e pode ser avaliada completamente em 0.5;
  2. A correlação para a regressão com a média móvel exponencial e o filtro de Hodrick-Prescott é praticamente igual a um, o que requer a exclusão de constantes das equações de regressão. A probabilidade significante da constante sendo igual a zero suporta a ideia de sua exclusão da equação de regressão com o filtro Hodrick-Prescott.


5,2. Intervalo de confiança

Vamos verificar a suposição de que as constantes na equação de regressão sejam valores aleatórios.

Para isso, devemos criar intervalos de confiança:

Variável Razão Intervalo de confiança de 90% Intervalo de confiança de 95%
Limite inferior
Limite superior
% do intervalo
Limite inferior Limite superior % do intervalo
TENDêNCIA
0,0004
0,0002
0,0006
74,3362
0,0002
0,0006
88,7168
C
1,3318
1,3219
1,3417
1,4868
1,3200
1,3436
1,7767
EURUSD_EX
0,9168
0,8543
0,9793
13,6247
0,8422
0,9914
16,2810
C
0,1145
0,0300
0,1991
147,5336
0,0135
0,2155
176,2960
EURUSD_HP
1,0577
0,9844
1,1310
13,8661
0,9701
1,1453
16,5694
C
-0,0782
-0,1776
0,0211
254,0276
-0,1970
0,0405
303,5529


Tabela 9. Níveis de confiança das razões de regressão

Observando os intervalos de confiança, podemos ver que a razão é um valor aleatório que se comporta de acordo com seu status - conforme a confiança aumenta (largura do canal diminui), a largura do intervalo se expande.

A coluna «% do intervalo» é de grande interesse, já que representa a relação de porcentagem da largura do intervalo do valor de razão ao valor da razão. Como podemos ver, esta quantidade para as constante de regressão com a média exponencial e o filtro possui valores completamente inaceitáveis de mais de 100%! é necessário mencionar novamente que as razões de correlação entre duas razões destas equações são quase iguais a um.

Vamos remover a constante das equações e reavaliar as razões de regressão.

O seguinte resultado será obtido:

Variável Razão Intervalo de confiança de 90% Intervalo de confiança de 95%
Limite inferior Limite superior % do intervalo Limite inferior Limite superior % do intervalo
EURUSD_EX1,0014
0,9999
1,0030
0,3131
0,9996
1,0033
0,3742
EURUSD_HP
1,0000
0,9984
1,0015
0,3127
0,9981
1,0018
0,3737

Tabela 10. Intervalos de confiança das razões de regressão recalculadas

Não vou mostrar os novos cálculos para as regressões com a média exponencial e o filtro para não deixar o artigo muito grande.

Vou apenas mencionar que as seguintes equações de regressão serão usadas daqui em diante:

EURUSD = 1.00149684612*EURUSD_EX

EURUSD = 1.00002609628*EURUSD_HP


5,3. Variáveis excessivas e perdidas (indicadores)

Um algoritmo simples de criação de sistema de negócio consiste em duas etapas. Alguns indicadores são usados para teste de um sistema de negócio. Depois, um indicador adicional é adicionado para classificar ativadores falsos do sistema de negócio, etc.

Este algoritmo não pode mostrar quando um negócio deve fechar. Ele não é capaz de indicar se alguns indicadores adicionais são necessários ou se é necessário excluir alguns indicadores do sistema de negócio. A teoria existente de criação de sistemas de negócio não pode responder estas questões, mas as respostas podem ser encontradas ao realizar o teste para variáveis excessivas e perdidas (indicadores).

Teste de variáveis perdidas - a hipótese nula é considerada: uma variável independente adicional não é significante.

Vamos criar um indicador complexo a partir dos três que temos:

EURUSD = C(1)*TENDêNCIA+ C(2) + C(3)*EURUSD_EX + C(4)*EURUSD_HP

Ao avaliar as razões deste indicador integral (regressão), teremos os seguinte resultado:

EURUSD = 1.41879198369e-05*TENDêNCIA - 0.00319950161771 + 0.50111527265*EURUSD_EX + 0.501486719095*EURUSD_HP

A probabilidade das razões adequadas serem iguais a zero é mostrada na seguinte tabela:

Variável RazãoProbabilidade de ser igual a zero
TENDêNCIA
1.42E-05
0,7577
C
-0,0032
0,9608
EURUSD_EX
0,5011
0,0000
EURUSD_HP 0,5014 0,0004


Tabela 11. Avaliação da probabilidade das razões do indicador serem iguais a zero

A tabela mostra que não devemos incluir o indicador TENDêNCIA e a constante, já que podemos estar certos de que suas razões são iguais a zero.

Vamos adicionar mais um indicador integral (o quadrado da média exponencial eurusd_ex^2) ao anterior e realizar o teste de variável perdida (eurusd_ex^2) com a hipótese nula: a variável adicional eurusd_ex^2 não é significante.

De acordo com o t calculado e a estatística-F, a probabilidade da variável adicional (eurusd_ex^2) não ser significante é igual a 44.87%. Com base nisso, pode ser argumentado que indicadores tradicionais não são necessários em nosso sistema de negócio.

Mas a coisa ainda mais interessante é a estimativa do indicador geral com eurusd_ex^2 adicionado mostrado na tabela:

Variável
RazãoProbabilidade de ser igual a zero
TENDêNCIA
1.69E-05
0,7154
C
1,9682
0,4496
EURUSD_EX
-2,3705
0,5317
EURUSD_HP
0,4641
0,0020
EURUSD_EX^2
1,0724
0,4487

Tabela 12. Avaliação da probabilidade das razões do indicador geral serem iguais a zero com eurusd_ex^2

A tabela mostra que apenas o indicador baseado no filtro Hodrick-Prescott é de algum interesse.

Teste de variáveis redundantes - a hipótese nula: razão da variável adicional é igual a zero.

Vamos tentar examinar isso de fora e realizar o teste de variáveis redundantes com a hipótese nula: a razão da variável redundante é igual a zero. Vamos indicar a tendência c como variáveis redundantes em nosso indicador de complexidade.

De acordo com o t calculado e a estatística-F, a probabilidade da tendência e variáveis redundantes c serem iguais a zero é de 92,95%. Deste modo, pode ser discutido que nosso sistema de negócio possui tendência e variáveis redundantes. Isso corresponde bem o suficiente aos resultados anteriores.

A avaliação do indicador geral consiste na média exponencial e o filtro de Hodrick-Prescott tem a seguinte aparência:

Variável
Razão
Probabilidade de ser igual a zero
EURUSD_EX
0,4992
0,00
EURUSD_HP
0,5015
0,00


Tabela 13.
Avaliação da probabilidade das razões do indicador geral serem iguais a zero, no caso deste indicador, consiste na média móvel exponencial e filtro de Hodrick-Prescott

ou seja, não temos dúvidas sobre a utilidade de usar estes indicadores no sistema de negócio.


6. Diagnóstico de resíduos

6,1. Autocorrelação - Estatística Q

Fig. 16. Função de autocorrelação após a dedução da tendência linear

Fig. 16. Função de autocorrelação após a dedução da tendência linear

O correlograma mostra que a dedução da tendência linear da cota básica não nega a presença de uma tendência, como mostrado por ACF. A probabilidade da ausência de correlação é igual a zero, ou seja, rejeitamos estritamente a hipótese nula de todos os níveis de significância.

Fig. 17. Função de autocorrelação após a dedução da suavização exponencial

Fig. 17. Função de autocorrelação após a dedução dasuavização exponencial

O correlograma mostra que a dedução da curva exponencial da cota básica excluiu a tendência em todos os candlesticks maiores que a segunda, como mostrado por ACF.

De acordo com os cálculos, a probabilidade da ausência de correlação é igual a zero, ou seja, rejeitamos estritamente a hipótese nula de todos os níveis de significância.

Mas, se colocarmos esforços adicionais e excluirmos a correlação nos primeiros dois candlesticks, então, poderemos ser capazes de obter o resíduo sem as correlações.

Fig. 18. Função de autocorrelação após a dedução do filtro de Hodrick-Prescott

Fig. 18. Função de autocorrelação após a dedução do filtro de Hodrick-Prescott

O correlograma mostra que a dedução do filtro de Hodrick-Prescott da cota básica excluiu a tendência em todos os candlesticks maiores que a terceira, como mostrado por ACF. A probabilidade da ausência de correlação é igual a zero, ou seja, rejeitamos estritamente a hipótese nula de todos os níveis de significância. Mas, se colocarmos esforços adicionais e excluirmos a correlação nos primeiros dois candlesticks, então, poderemos ser capazes de obter o resíduo sem as correlações.

Conclusão. A tentativa de remover o componente determinístico deduzindo nossos indicadores da cota básica EURUSD falhou completamente para a tendência linear e foi bem sucedida parcialmente para a média móvel exponencial e filtro de Hodrick-Prescott.

A análise posterior de nossos indicadores se tornou sem sentido por causa da autocorrelação (componente determinístico). Devemos encontrar um indicador que permita excluir a autocorrelação nos resíduos. Faremos isso na próxima seção.


7. Criação e exame da análise de consideração do indicador

No momento, não temos a teoria formal para criar um conjunto de indicadores. A única forma é a busca direta com a seleção de algum conjunto de acordo com os resultados da análise.

A partir da análise de autocorrelação prévia, foi concluído que a autocorrelação nos primeiros candlesticks de cotas permaneceu após a destendência.

Vamos examinar a seguinte equação considerando o fato mencionado:

EURUSD = C(1)*EURUSD_HP(1) + C(2)*D(EURUSD_HP(1)) + C(3)*D(EURUSD_HP(2))

D(EURUSD_HP(1)) significa o resíduo entre a cota e a suavização do filtro de Hodrick-Prescott, o primeiro lag (a segunda barra, não a primeira ao calcular as barras começando por um).

A avaliação das razões da equação com o uso do método de mínimos quadrados leva aos seguintes resultados:

VariávelRazão
Probabilidade de ser igual a zero
EURUSD_HP(1)
1,0001
0,0000
D(EURUSD(1))
0,8262
0,0000
D(EURUSD(-2))
-0,48810,0000


Tabela 14. Resultados da avaliação das razões utilizando o método dos mínimos quadrados

De acordo com o teste de variáveis excessivas e o t calculado e a estatística-F, a probabilidade do fato das razões na presença das variáveis de eurusd(1) e eurusd(2) serem iguais a zero é nula, ou seja, duas variáveis não são excessivas.

A autocorrelação mostra a ausência das dependências até lag 16 com a probabilidade maior que 70% (primeira linha de assinatura):


Fig. 19. Autocorrelação de resíduo

Fig. 19. Autocorrelação de resíduo

O teste de heterocedasticidade de White dá o resultado com relação a estatística-F confirmando que a heterocedasticidade está ausente com a probabilidade de 80%.

O exame do breakpoint de acordo com o teste Quandt-Andrews com a hipótese nula: «sem breakpoints» fornece o resultado: a hipótese nula com a probabilidade de 71% é aceita (sem breakpoints).

Deve ser mencionado, mais uma vez, que as cotas examinadas têm pelo menos um breakpoint (uma tendência reversa) de acordo com a análise de técnica padrão. Mas nosso indicador tem parâmetros estatísticos similares tanto para tendências descendentes como ascendentes e, por isso, é invariável para o estado do mercado.

Teste integral de Ramsey com a hipótese nula: «os erros ao gerenciar a regressão são normalmente um valor distribuído» com a probabilidade de 48% t e a estatística-F é aceita. Deste modo, podemos negligenciar a autocorrelação de resíduos e sua heterocedasticidade.

Além disso, isso significa que os quadrados lineares não são deslocados (a expectativa matemática do valor examinado coincide com o valor examinado) e é possível realizar o teste de resíduos recursivos.

Vamos testar um passo à frente da previsão de resíduos recursivos. A parte superior da figura fornece os resíduos recursivos e as linhas de limitação em dois desvios padrão. Além disso, o eixo esquerdo mostra a probabilidade para os candlesticks de cotas, nos quais a hipótese de constância da razão do indicador poderia ser desviada a um nível de significância de 5%, 10% e 15%. Não existem muitos destes pontos, mas sua existência significa o acionamento falso de stop losses e take profits.

Fig. 20. Teste de previsão de resíduos recursivos

Fig. 20. Teste de previsão de resíduos recursivos

Vamos nomear as estimativas recursivas das razões de equação de regressão. O gráfico é formado da seguinte forma: os valores das razões para a barra mais à esquerda são calculados. Então, uma barra é adicionada e os valores das razões são calculado repetidamente até a última barra. Em caso de uma pequena quantia de barras no lado esquerdo, os valores das razões são muito instáveis, é claro. Porém, embora o número de barras usadas para o cálculo tenha aumentado, a estabilidade (constância) também se fortifica.

Fig. 21. Estimativas recursivas da razão C(1)

Fig. 21. Estimativas recursivas da razão C(1)

Fig. 22. Estimativas recursivas da razão C(2)

Fig. 22. Estimativas recursivas da razão C(2)

Fig. 23. Estimativas recursivas da razão C(3)

Fig. 23. Estimativas recursivas da razão C(3)

As figuras mostram que determinada instabilidade foi observada no início do intervalo de cotas mas, então, pode ser considerado que os valores das razões tenham se estabilizado. Porém, estritamente falando, as razões de nossa equação de regressão não são constantes.


Conclusão


Este artigo apresentou uma prova a mais do fato de que dados financeiros não são estacionários. Foi utilizado o método padrão da divisão de dados não estacionários na soma dos dados para obter um resíduo estacionário.

Tendo o resíduo estacionário das cotas básicas, podemos responder a principal questão com relação à estabilidade.

As informações apresentadas no artigo são apenas o começo da criação de um sistema de negócio que pode e deve ser baseada nas previsões das cotas.


Lista de referência

EViews 7. Guia do usuário II.

Traduzido do russo pela MetaQuotes Ltd.
Artigo original: https://www.mql5.com/ru/articles/320

Usando a Análise Discriminante para Desenvolver Sistemas de Negociação Usando a Análise Discriminante para Desenvolver Sistemas de Negociação
Ao desenvolver um sistema de negócio, geralmente surgem problemas ao selecionar a melhor combinação de indicadores e seus sinais. A análise discriminante é um dos métodos para encontrar tais combinações. O artigo fornece um exemplo do desenvolvimento de um EA para a coleta de dados do mercado e ilustra o uso da análise discriminante para construir modelos de prognóstico para o mercado FOREX no software Statistica.
Previsão de séries temporais utilizando suavização exponencial Previsão de séries temporais utilizando suavização exponencial
O artigo familiariza o leitor com os modelos de suavização exponencial usados para previsão de curto prazo de séries de tempo. Além disso, ele toca em assuntos relacionados com a estimativa e otimização dos resultados de previsão e fornece alguns exemplos de scripts e indicadores. Este artigo será útil como primeira familiarização com os princípios de previsão baseados nos modelos de suavização exponencial.
Previsão de séries temporais utilizando suavização exponencial (continuação) Previsão de séries temporais utilizando suavização exponencial (continuação)
Este artigo busca atualizar o indicador criado anteriormente e lida brevemente com um método para estimar intervalos de confiança de previsão usando auto inicialização e quantis. Como resultado, teremos o indicador de previsão e os scripts a serem usados para estimar a precisão da previsão.
MQL5 Wizard para leigos MQL5 Wizard para leigos
No início de 2011, lançamos a primeira versão do MQL5 Wizard. Este novo aplicativo fornece uma ferramenta simples e conveniente para gerar robôs de negociação automaticamente. Qualquer usuário do MetaTrader 5 pode criar um Expert Advisor personalizado sem precisar saber como programar em MQL5.