Previsão de mercado com base em indicadores macroeconômicos - página 12

 
avtomat:


só é verdade para a classe limitada de modelos que "suas universidades" lhe ensinaram.


Eu não o estudei em universidades. Eu sou autodidata. Eu penso com meu próprio cérebro. Eu questiono e verifico tudo novamente. A própria necessidade de estacionaridade veio até mim após múltiplas tentativas mal sucedidas de obter um modelo sobre dados não estacionários. Posso provar em detalhes, mas lamento pelo tempo, já que todos vão se ater às suas opiniões.

Meu interesse neste tópico começou após assistir às notícias do mercado, onde o professor Steve Keen estava se gabando de como seu modelo econômico previu o crash de 2008, mas o modelo DSGE usado pelo Fed não foi capaz de prever nada. Assim, estudei o modelo DSGE e o modelo da Keen. Para aqueles que querem seguir meu caminho, sugiro começar com este artigo Matlab sobre o modelo DSGE. Ele possui todos os códigos necessários, incluindo o código para trocar dados econômicos do banco de dados fedreserve FRED:

http://www.mathworks.com/help/econ/examples/modeling-the-united-states-economy.html

O modelo Fed utiliza os seguintes preditores:

% Descrição da Série FRED% ---------------------------------------------------------------------------% COE Remuneração paga aos funcionários em bilhões de dólares% CPIAUCSL Índice de preços ao consumidor% FEDFUNDS Taxa efetiva de fundos federais% GCE Despesas de consumo e investimento do governo em bilhões de dólares% PIB Produto interno bruto em bilhões de dólares% PIBDEF Deflator de preços do produto interno bruto% GPDI Investimento interno privado bruto em bilhões de dólares% GS10 Rendimento de títulos do tesouro a dez anos % HOano rendimento dos títulos do tesouro% HOANBS Índice de horas trabalhadas do setor comercial não agrícola% M1SL M1 oferta de dinheiro (dinheiro estreito)% M2SL M2 oferta de dinheiro (dinheiro amplo)% PCEC Despesas de consumo pessoal em bilhões de dólares% TB3MS Rendimento dos títulos do tesouro a três meses% UNRATE Taxa de desemprego


Depois veja as palestras de Steve Keen no YouTube:

https://www.youtube.com/watch?v=aJIE5QTSSYA

https://www.youtube.com/watch?v=DDk4c4WIiCA

https://www.youtube.com/watch?v=wb7Tmk2OABo

E leia seus artigos.

Modeling the United States Economy - MATLAB & Simulink Example
  • www.mathworks.com
The Smets-Wouters model (2002, 2004, 2007) is a nonlinear system of equations in the form of a Dynamic Stochastic General Equilibrium (DSGE) model that seeks to characterize an economy derived from economic first principles. The basic model works with 7 time series: output, prices, wages, hours worked, interest rates, consumption, and...
 
O programaminsky (simulador econômico) é anexado, e o site de onde é puxado, o site tem muitos vídeos explicando como ele funciona, e muitas outras coisas.

/go?link=http://www.ideaeconomics.org/minsky/

Arquivos anexados:
 
ProfSteveKeen
ProfSteveKeen
  • www.youtube.com
Rethinking Economics at the London School of Economics I was invited by the Rethinking Economics student association at the London School of Economics to give a talk about Greece, Austerity, Post Keynesian Economics and anticipating the crisis. There...
 
E para os subdesenvolvidos, em linguagem legível
 
Vinin:
E para os subdesenvolvidos em linguagem fácil de ler

Para os Alemães :)

https://translate.google.com.ua/translate?sl=en&tl=ru&js=y&prev=_t&hl=ru&ie=UTF-8&u=http%3A%2F%2Fen.wikipedia.org%2Fwiki%2FSteve_Keen&edit-text=

 
gpwr:

Portanto, a tarefa é prever o índice S&P 500 com base nos indicadores econômicos disponíveis.

Passo 1: Encontre os indicadores. Os indicadores estão disponíveis publicamente aqui: http://research.stlouisfed.org/fred2/ Existem 240.000 deles. O mais importante é o crescimento do PIB. Este indicador é calculado a cada trimestre. Por isso, nosso passo é de 3 meses. Todos os indicadores em prazos mais curtos são recalculados para 3 meses, os demais (anuais) são descartados. Também descartamos os indicadores para todos os países, exceto os EUA e os indicadores que não têm um histórico profundo (pelo menos 15 anos). Assim, peneiramos laboriosamente um monte de indicadores, e obtemos cerca de 10 mil indicadores. Formulamos uma tarefa mais específica para prever o índice S&P 500 para um ou dois trimestres à frente, tendo 10 mil indicadores econômicos com um período trimestral. Eu faço tudo em Matlab, embora também seja possível fazê-lo em R.

Passo 2: Converta todos os dados para uma forma estacionária, diferenciando e normalizando. Há muitos métodos. O principal é que os dados transformados podem ser recuperados a partir dos dados originais. Nenhum modelo funcionará sem estacionaridade. A série S&P 500 antes e depois da transformação é mostrada abaixo.

Passo 3: Escolha um modelo. Você poderia ter uma rede neural. Pode ser umaregressão linear multivariável. Pode ser uma regressão polinomial multi-variável. Depois de experimentar modelos lineares e não lineares, concluímos que os dados são tão ruidosos que não faz sentido encaixar um modelo não linear como o gráfico y(x) onde y = S&P 500 e x = um dos 10 mil indicadores é quase uma nuvem redonda. Assim, formulamos a tarefa de forma ainda mais concreta: prever o índice S&P 500 para um ou dois trimestres à frente tendo 10 mil indicadores econômicos com um período trimestral, utilizando a regressão linear multivariável.

Passo 4: Selecione os indicadores econômicos mais importantes entre 10 mil (reduzir a dimensão do problema). Este é o passo mais importante e difícil. Suponha que pegamos a história do S&P 500 que tem 30 anos de duração (120 trimestres). A fim de representar o S&P 500 como uma combinação linear de vários indicadores econômicos, é suficiente ter 120 indicadores para descrever com precisão o S&P 500 durante esses 30 anos. Além disso, os indicadores podem ser absolutamente qualquer tipo de indicador, a fim de criar um modelo tão preciso de 120 indicadores e 120 valores de S&P 500. Assim, reduziremos o número de entradas abaixo do número de valores das funções descritas. Por exemplo, estamos à procura de 10-20 indicadores/inputs mais importantes. Tais tarefas de descrição de dados por um pequeno número de entradas selecionadas de um grande número de bases de candidatos (dicionário) são chamadas de codificação esparsa.

Há muitos métodos para selecionar as entradas dos preditores. Eu tentei todas elas. Aqui estão os dois principais:

  1. Classificamos todos os dados 10k por sua capacidade de previsão do S&P 500. A capacidade preditiva pode ser medida pelo coeficiente de correlação ou informação mútua.
  2. Vamos olhar todos os 10 mil indicadores um por um e selecionar aquele que deu o modelo linear y_mod = a + b*x1 descrevendo o S&P 500 com o erro mínimo. Em seguida, selecionamos a segunda entrada novamente, tentando os 10 mil -1 indicadores restantes para que descreva o resíduo y - y_mod = c + d*x2 com o erro mínimo. E assim por diante. Este método é chamado de regressão por etapas ou busca de correspondência.

Aqui estão os primeiros 10 indicadores com o coeficiente de correlação máximo com o S&P 500:

Série ID Lag Corr Informações mútuas
PPICRM 2 0.315 0.102
CWUR0000SEHE''. 2 0.283 0.122
CES1021000001 1 0.263 0.095
B115RC1Q027SBEA''. 2 0.262 0.102
CES1000000034 1 0.261 0.105
A371RD3Q086SBEA''. 2 0.260 0.085
B115RC1Q027SBEA''. 1 0.256 0.102
CUUR0000SAF111''. 1 0.252 0.117
CUUR0000SEHE'. 2 0.251 0.098
USMINE 1 0.250 0.102

Aqui estão os 10 principais indicadores com o máximo de informações mútuas com o S&P 500:

Série ID Lag Corr Informações mútuas
CPILEGSL 3 0.061 0.136
B701RC1Q027SBEA''. 3 0.038 0.136
CUSR0000SAS 3 0.043 0.134
GDPPOT 3 0.003 0.134
NGDPPOT''. 5 0.102 0.134
OTHSEC 4 0.168 0.133
3 "LNU01300060 3 0.046 0.132
LRAC25TTUSM156N''. 3 0.046 0.132
LRAC25TTUSQ156N''. 3 0.046 0.131
CUSR0000SAS 1 0.130 0.131

Lag é o atraso da série de entrada em relação à série simulada S&P 500. Como você pode ver nestas tabelas, diferentes métodos de escolha das entradas mais importantes resultam em diferentes conjuntos de entradas. Como meu objetivo final é minimizar o erro do modelo, escolhi o segundo método de seleção de entrada, ou seja, enumerar todas as entradas e selecionar a entrada que deu o menor erro.

Passo 5: Escolha um método para calcular o erro e os coeficientes do modelo. O método mais simples é o método RMS, e é por isso que a regressão linear usando este método é tão popular. O problema com o método RMS é que ele é sensível a aberrações, ou seja, essas aberrações têm um efeito significativo nos coeficientes do modelo. Para reduzir esta sensibilidade, pode ser usada a soma dos valores de erro absoluto em vez da soma dos quadrados de erros, o que leva a um método de menor módulo (LMM) ou regressão robusta. Este método não tem solução analítica para os coeficientes do modelo, ao contrário da regressão linear. Normalmente, os módulos são substituídos por funções aproximadas suaves/diferenciáveis e a solução é numérica e longa. Eu tentei os dois métodos (regressão linear e LNM) e não notei nenhuma vantagem em particular do LNM. Ao invés de DOM, eu fui de rotunda. Na segunda etapa de obtenção de dados estacionários diferenciando-os, acrescentei uma operação de normalização não-linear. Ou seja, a série original x[1], x[2], ... x[i-1], x[i] ... é primeiramente convertida em uma série de diferenças x[2]-x[1] ... x[i]-x[i-1] ... e então cada diferença é normalizada substituindo-a por sinal(x[i]-x[i-1])*abs(x[i]-x[i-1])^u, onde 0 < u < 1. Quando u=1, obtemos o método RMS clássico com sua sensibilidade a aberrações. Em u=0, todos os valores das séries de entrada são substituídos por valores binários +/-1, quase sem valores aberrantes. Em u=0,5, conseguimos algo próximo a RMS. O valor ideal de u está algures entre 0,5 e 1.

Observe que um dos métodos populares de conversão de dados para uma forma estacionária é substituir os valores das séries pela diferença de logaritmos desses valores, ou seja, log(x[i]) - log(x[i-1]) ou log(x[i]/x[i-1]). A escolha desta transformação é perigosa no meu caso, pois há muitas linhas com valores zero e valores negativos no dicionário de entradas de 10k. O logaritmo também tem a vantagem de reduzir a sensibilidade do método RMS a valores aberrantes. Como tal, minha função de transformação sign(x)*|x|^u tem a mesma finalidade do log(x) mas sem os problemas associados a valores zero e negativos.

Passo 6: Calculamos a previsão do modelo ajustando os novos dados de entrada e calculando a saída do modelo usando os mesmos coeficientes do modelo encontrados pela regressão linear na seção anterior do histórico. É importante lembrar que os indicadores econômicos trimestrais e os valores de S&P 500 vêm quase simultaneamente (dentro de 3 meses). Portanto, a fim de prever o S&P 500 para o próximo trimestre, o modelo deve ser construído entre o valor trimestral atual do S&P 500 e as entradas atrasadas em pelo menos 1 trimestre (Lag>=1). Para prever o S&P 500 um trimestre adiante, o modelo deve ser traçado entre o valor trimestral atual do S&P 500 e os insumos atrasados em pelo menos 2 trimestres (Lag>=2). E assim por diante. A precisão das previsões diminui significativamente com atrasos superiores a 2.

Passo 7: Verifique a exatidão das previsões sobre o histórico anterior. O primeiro método descrito acima (escrever cada entrada no histórico anterior, escolher a entrada com o RMS mais baixo e usar o valor mais recente dessa entrada para gerar uma previsão) deu previsões ainda piores do que as previsões aleatórias ou nulas. Eu me perguntava o seguinte: por que um input que se encaixa bem no passado deveria ter uma boa capacidade de previsão do futuro? Faz sentido selecionar as entradas do modelo com base em seu erro de previsão anterior, em vez de se basear no menor erro de regressão sobre dados conhecidos.

Afinal de contas, meu modelo pode ser descrito passo a passo assim:

  1. Descarregamos dados econômicos da stlouisfed (cerca de 10k indicadores).
  2. Transformar os dados em uma forma estacionária e normalizá-los.
  3. Selecione um modelo linear do índice S&P 500, resolvido analiticamente pelo método RMS (regressão linear).
  4. Selecionamos a duração da história (1960 - T2 2015) e a dividimos em um período de treinamento (1960 - T4 1999) e um período de teste (T1 2000 - T2 2015).
  5. Iniciamos as previsões com 1960 + N + 1 anos, onde N*4 é o número inicial de valores trimestrais conhecidos do S&P 500.
  6. A partir dos primeiros dados N, um modelo linear y_mod = a + b*x é construído para cada indicador econômico, onde y_mod é o modelo S&P 500 e x é um dos indicadores econômicos.
  7. Prevemos N + 1 barras com cada modelo.
  8. Calcular os erros de previsão de N + 1 barras por cada modelo. Lembre-se desses erros.
  9. Aumentamos o número de valores conhecidos do S&P 500 em 1, ou seja, N + 1, e repetimos os passos 6-9 até chegarmos ao final do período de treinamento (4º trimestre de 1999). Nesta etapa, memorizamos os erros de previsão de 1960 + N +1 anos até o quarto trimestre de 1999 para cada indicador econômico.
  10. Começamos a testar o modelo no segundo intervalo histórico (T1 2000 - T2 2015).
  11. Para cada uma das 10 mil entradas, calculamos o erro raiz-medida das previsões para o período 1960 - T4 1999.
  12. A partir de 10 mil entradas, escolha a que tiver o menor erro de previsão RMS de 1960 - 4º trimestre de 1999.
  13. Construímos um modelo linear y_mod = a + b*x para cada indicador econômico para 1960 - 4º trimestre de 1999.
  14. Prevemos o primeiro trimestre de 2000 por cada modelo.
  15. Selecionamos a previsão da entrada selecionada com o RMS mais baixo das previsões para o período de tempo anterior (1960 - 4º trimestre de 1999) como nossa principal previsão do 1º trimestre de 2000.
  16. Calcular os erros de previsão de todas as entradas no 1T 2000 e adicioná-los ao RMS das mesmas entradas no intervalo de tempo anterior (1960 - 4T 1999).
  17. Vamos ao segundo trimestre de 2000 e repetimos os passos 12-17 até chegarmos ao final da seção de testes (segundo trimestre de 2015) com um valor desconhecido do S&P 500, cuja previsão é nossa principal meta.
  18. Acumulamos os erros de previsão para o 1T 2000 - 4T 2014 feitos pelas entradas com o RMS mais baixo das previsões nos segmentos anteriores. Este erro (err2) é nosso modelo de previsão de erros fora da amostra.

Em resumo, a escolha do preditor depende de seu RMS de previsões de valores anteriores do S&P 500. Não há como olhar para o futuro. O prognosticador pode mudar com o tempo, mas no final do segmento de teste ele basicamente pára de mudar. Meu modelo escolheu o PPICRM com 2 trimestres de atraso como a primeira entrada para prever o segundo trimestre de 2015. A regressão linear do S&P 500 pela entrada selecionada do PPICRM(2) para 1960 - T4 2014 é mostrada abaixo. Os círculos negros são a regressão linear. Círculos multicoloridos são dados históricos para 1960 - 4º trimestre de 2014. A cor do círculo indica o tempo.


Previsões do S&P 500 em forma estacionária (linha vermelha):

Previsões S&P 500 na forma bruta (linha vermelha):

O gráfico mostra que o modelo prevê um aumento no S&P 500 no segundo trimestre de 2015. A adição de uma segunda entrada aumenta o erro de previsão:

1 err1=0,900298 err2=0,938355 PPICRM (2)

2 err1=0,881910 err2=0,978233 PERMIT1 (4)

Onde err1 é o erro de regressão. Obviamente, ele diminui ao acrescentar uma segunda entrada. err2 é o erro de predição raiz-medo quadrado dividido pelo erro de predição aleatória. Portanto err2>=1 significa que a previsão de meu modelo não é melhor que previsões aleatórias. err2<1 significa que a previsão de meu modelo é melhor que previsões aleatórias.

PPICRM = Producer Price Index: Materiais brutos para processamento posterior

PERMIT1 = Novas Unidades Habitacionais Privadas Autorizadas por Licenças de Construção - Em Estruturas com 1 Unidade

O modelo descrito acima pode ser reformulado desta forma. Reunimos 10 mil economistas e lhes pedimos para preverem o mercado para o trimestre seguinte. Cada economista faz a sua previsão. Mas em vez de escolher algumas previsões com base no número de livros didáticos que eles escreveram ou prêmios Nobel que receberam no passado, nós esperamos alguns anos, coletando suas previsões. Depois de um número significativo de previsões, vemos qual economista é mais preciso, e começamos a acreditar em suas previsões até que algum outro economista as supere em precisão.

A resposta é simples - comércio em prazos anuais....
 
IvanIvanov:
A resposta é simples - comércio em prazos anuais....
Isto é uma piada?
 
gpwr:
Isto é uma piada?

:-) eu não sei.... se a análise está em anos..... não sei em que comercializar... No m5 é pouco provável que tenha qualquer efeito prático...

Como opção, tente aplicar sua análise ao H4...

 

gpwr:

...Depois de um número significativo de previsões, vemos qual economista é mais preciso e começamos a acreditar em suas previsões até que algum outro economista o supere em precisão...


Mmmm, esse tipo de coisa contradiz o Taleb com seu cisne preto. Como podem os economistas que predizem bem em um ambiente prever o colapso?

Não quero dizer como, mas por que isso vai acontecer? porque eles têm muita certeza de que estão certos, por que revisariam esse direito, para que os lemingues se apressem com entusiasmo a entrar no abismo.

 

Aqui está o artigo de Keane sobre seu modelo:

http://keenomics.s3.amazonaws.com/debtdeflation_media/papers/PaperPrePublicationProof.pdf

Embora eu diga logo de cara que não gosto de seu modelo. Seu objetivo é explicar ciclos econômicos e colapsos, não para prever com precisão o mercado ou o desempenho econômico como PIB. Por exemplo, seu modelo previa que o aumento do endividamento das famílias levaria ao colapso da economia. Mas quando exatamente seu modelo previu. Tampouco é capaz de prever o que acontecerá após o colapso. Todas as suas curvas teóricas vão até o infinito e ficam lá indefinidamente, embora o mercado e a economia dos EUA tenham se recuperado em 2009. Deve ser por isso que ele continua sendo muito negativo sobre esta recuperação, não acreditando nela e afirmando que está chegando uma grande depressão pior do que a de duas décadas do Japão. Penso que este é o problema de todos os modelos econômicos dinâmicos: eles são difíceis de estabilizar e se se tornam instáveis, eles se trancam e não podem mais prever o futuro. Embora um famoso fundo de hedge tenha contratado a Kean como assessor econômico.