Econometria: um passo à frente na previsão - página 116

 
faa1947:

Eu mesmo não entendo.

Padrão quebrado: zz_high eurusd(-1 a -100) c @trend

Estou prevendo uma variável dependente que toma valores de "0" - sem sinal e "1" - um sinal de inversão para baixo. Tomamos 100 barras EURUSD como uma variável dependente, ou seja, um valor aleatório. Após estimarmos o coeficiente de regressão que obtemos:

ZZ_HIGH = 1-@CNORM(-(1033.56764818*EURUSD(-1) + 361.005725087*EURUSD(-2) - 659.271726689*EURUSD(-3) + 1289.20797453*EURUSD(-4) - 1024.9175822*EURUSD(-5) - 173.354947231*EURUSD(-6) - 500.755211559*EURUSD(-7) + 487.538133239*EURUSD(-8) - 1741.90012073*EURUSD(-9) + 1250.27027863*EURUSD(-10) + 1204.01840496*EURUSD(-11) - 625.209628018*EURUSD(-12) - 88.4193896778*EURUSD(-13) - 821.374855285*EURUSD(-14) - 754.491291165*EURUSD(-15) + 538.519551372*EURUSD(-16) + 3220.86311608*EURUSD(-17) - 518.070207767*EURUSD(-18) - 2332.53473806*EURUSD(-19) + 569.684891562*EURUSD(-20) - 1619.61207529*EURUSD(-21) + 1641.76931445*EURUSD(-22) - 1414.74117489*EURUSD(-23) - 114.280781428*EURUSD(-24) + 450.449461697*EURUSD(-25) - 337.460964818*EURUSD(-26) + 908.232164753*EURUSD(-27) + 601.738993689*EURUSD(-28) + 861.74494980071*EURUSD(-29) + 259.833316285*EURUSD(-30) - 46.5215488696*EURUSD(-31) - 820.583809759*EURUSD(-32) - 1423.98506887*EURUSD(-33) + 935.96945151579*EURUSD(-34) - 803.436564451*EURUSD(-35) + 221.143701299*EURUSD(-36) + 335.777492236*EURUSD(-37) + 650.456824302*EURUSD(-38) + 350.318958532*EURUSD(-39) - 467.38453535354*EURUSD(-40) - 1463.62960078*EURUSD(-41) + 1023.33692559*EURUSD(-42) + 531.53858297*EURUSD(-43) - 1804.43807812*EURUSD(-44) + 505.327400995*EURUSD(-45) - 20.3151847226*EURUSD(-46) + 1454.71062626*EURUSD(-47) + 149.481921853*EURUSD(-48) - 1985.4346906*EURUSD(-49) + 8.64522845766*EURUSD(-50) + 1301.22397609*EURUSD(-51) + 1398.9062339*EURUSD(-52) - 1812.25415112*EURUSD(-53) - 815.17727151*EURUSD(-54) - 465.973849717*EURUSD(-55) + 891.665097704*EURUSD(-56) - 33.8677278433*EURUSD(-57) + 1802.96642724*EURUSD(-58) + 103,739651059*EURUSD(-59) + 395,877119657*EURUSD(-60) - 1358,3140469*EURUSD(-61) + 17,0144218275*EURUSD(-62) + 645,959444744*EURUSD(-63) - 1935.40489961*EURUSD(-64) + 847,657103772*EURUSD(-65) - 348,287297241*EURUSD(-66) + 1674,82953896*EURUSD(-67) - 1399,09585978*EURUSD(-68) + 442,848712733*EURUSD(-69) + 498.667519817*EURUSD(-70) + 175,460595585*EURUSD(-71) - 3,23177058628*EURUSD(-72) - 502,970783886*EURUSD(-73) - 486,45378574*EURUSD(-74) - 1284,12753179*EURUSD(-75) + 2212,99339275*EURUSD(-76) + 1011.83438787*EURUSD(-77) - 2762.97407148*EURUSD(-78) + 1603.46426721*EURUSD(-79) - 441.847609369*EURUSD(-80) - 173.0306096*EURUSD(-81) - 672.051786135*EURUSD(-82) - 1106.57500684*EURUSD(-83) + 337.977251734*EURUSD(-84) + 1392.23135411*EURUSD(-85) + 1222.020799*EURUSD(-86) + 327.446848701*EURUSD(-87) - 1208.41468022*EURUSD(-88) + 741.85661795*EURUSD(-89) + 1585.08937121*EURUSD(-90) - 2098.86445785*EURUSD(-91) + 58.0598765644*EURUSD(-92) - 166.744222595*EURUSD(-93) + 67.6457712184*EURUSD(-94) + 98.7949064574*EURUSD(-95) + 1406.32082135*EURUSD(-96) - 1658.83294022*EURUSD(-97) - 273.851042947*EURUSD(-98) + 93.5879401275*EURUSD(-99) + 243.060588194*EURUSD(-100) - 1295.0210728 + 0.08150857192*@TREND))

Tudo parece estar lá.

O cálculo da previsão é de alguma forma completamente o mesmo que o fato.


Eu gostaria de entender o modelo. O que é CNORM? Em qual intervalo o modelo foi treinado e em qual foi testado? Entendo corretamente que as primeiras 100 fileiras de planilhas Excel são dados de treinamento? Por que eles são tão poucos (igual ao número de variáveis dependentes no modelo)?
 
gpwr:

Eu gostaria de entender o modelo. O que é CNORM? Em qual intervalo o modelo foi treinado e em qual foi testado? Entendo corretamente que as primeiras 100 fileiras de planilhas Excel são dados de treinamento? Por que eles são tão poucos (igual ao número de variáveis dependentes no modelo)?

@cnorm(x)

distribuição cumulativa normal (CDF)


São necessárias 500 barras. As primeiras 100 barras não são tomadas, pois são barras na fórmula como um período na ondulação. Não treinamento, estimando coeficientes em 500 barras

 
faa1947:

@cnorm(x)

distribuição cumulativa normal (CDF)


São tomadas 500 barras. As primeiras 100 barras não são tomadas porque são barras na fórmula como um período na ondulação. Não treinamento, estimar coeficiente a 500 bar

Tais modelos podem às vezes dar previsões precisas simplesmente devido à alta probabilidade de coincidência devido ao pequeno número de estados finais possíveis e não significa nada - basta tomar como exemplo o incremento real para fechar no período das próximas 500 barras por coeficientes derivados das 500 barras anteriores e medir a correlação com o incremento da previsão - que é a diferença em valores detalhados. O coeficiente obtido estimará objetivamente a qualidade da previsão, no seu caso você pode utilizar a avaliação da correlação quantitativa. Mas novamente não é uma solução para o problema de previsão, porque para usá-lo como um sistema "útil" você deve ser capaz não só de "entrar no mercado" com sucesso, mas também de "sair dele". Você está errado ao assumir que o erro de previsão acumulará uma barra para frente se mais barras forem tomadas, na verdade, não está prometido... O mesmo que selecionar o significado das variáveis é uma tarefa separada de extração de conhecimento solvível (Data Mining) e já existem métodos para isso e não é feito por princípio - é ou não é preciso 100 ou 500 barras...
 
dasmen:
Tais modelos podem às vezes dar previsões precisas, simplesmente pela alta probabilidade de coincidência, devido ao pequeno número de estados finais possíveis e isso não significa nada - basta tomar por exemplo o incremento real para fechar no período das próximas 500 barras por coeficientes extraídos em 500 barras anteriores e medir a correlação com o incremento da previsão - que é a diferença nos valores de detalhe. O coeficiente obtido estimará objetivamente a qualidade da previsão, no seu caso você pode utilizar a avaliação da correlação quantitativa. Mas novamente não é uma solução para o problema de previsão, porque para usá-lo como um sistema "útil" você deve ser capaz não só de "entrar no mercado" com sucesso, mas também de "sair dele". Você está errado ao assumir que o erro de previsão acumulará uma barra para frente se mais barras forem tomadas, na verdade, não está prometido... Assim como a seleção de significância variável é uma tarefa separada de extração de conhecimento resolúvel (Data Mining) e já existem técnicas para isso e não é feita com base no princípio de se são necessárias 100 ou 500 barras...

O tópico inteiro é mais rico do que o último post que você comentou. A questão do significado variável já foi tratada muitas vezes. A acumulação de erro de previsão é um fato médico, já que se toma o valor da previsão anterior para a próxima previsão devido à falta de fato. Se um fato for tomado, é uma previsão um passo à frente.

Mas estas são questões menores e técnicas.

O uso de incrementos foi. Nada funciona, porque nos incrementos não há tendência, mas há uma tendência prevista. e aqui está a questão principal do tópico: que propriedades do modelo dão uma garantia de previsibilidade? Foi sugerido todo um conjunto de tais propriedades para um modelo regressivo comum. O que você está comentando é um modelo de fuga e há outros modelos aqui que eu não entendo.

Eu ficaria grato se você pudesse comentar sobre qualquer um dos muitos pontos deste tópico.

 
faa1947:

...O uso de incrementos foi. Nada funciona, pois não há tendência nos incrementos, mas a tendência é prevista. e aqui a questão principal do tópico é: que propriedades do modelo dão uma garantia de previsibilidade? Foi sugerido todo um conjunto de tais propriedades para um modelo regressivo comum. O que você está comentando é um modelo de probit e há outros modelos aqui que eu não entendo...

  1. Está matematicamente provado há muitos anos que se o modelo e o processo em análise forem os mesmos (em seus termos "o modelo certo"), então a melhor previsão de 1 passo à frente é dada pelo filtro Kalman. Procure-o no fórum...
  2. Já lhe foi dito muitas vezes, seu modelo está errado. Você está preso a este modelo de regressão que nenhum outro modelo existe ?...o mundo inteiro em toda sua diversidade é descrito por este modelo simples ?...
  3. E sobre o tipo de ACF que já lhe foi dito aqui mais de uma vez, e suas propriedades ...

Aqui está um link para meu trabalho que já existe há muito tempo(https://www.mql5.com/ru/code/8295).... ACF e se você olhar de perto, há duas curvas. A primeira curva é (linha azul), a segunda vermelha é a ACF das citações. Você pode compará-los (visualmente) ...

Existe um modelo (ele existe e é conhecido há muito tempo) com o qual você pode descrever o corit com precisão suficiente para a prática e não é um modelo de regressão. É verdade que os livros escolares econométricos provavelmente não dizem nada sobre este modelo... procurar outros livros escolares

Boa sorte a todos. Felicidade e saúde no próximo ano!

 

Feliz Ano Novo! Que todos os modelos conquistem.

 
faa1947:

O uso de incrementos foi. Nada funciona, pois não há uma tendência nos incrementos, mas a tendência é prevista.

Você declara:

1. Que ao mudar para incrementos a tendência é perdida. Isto não é verdade, pois a presença de uma tendência afetará diretamente a expectativa condicional dos incrementos. Assim, a previsão de uma é equivalente à previsão da outra.

2. Que o modelo incremental não tem a propriedade de reversibilidade. Mais uma vez, isto não é verdade, porque conhecemos o último nível de preço. Prevendo os incrementos, retirando deles uma soma cumulativa e adicionando o último valor de preço conhecido - obtemos uma transição de um para um no espaço tempo/preço.

Temos um modelo de regressão primitivo. É mostrado que dentro da amostra tem um fator de lucro muito maior do que 10. Fora da amostra, é um pouco mais de 1 e até mesmo isso é duvidoso. Este modelo é construído "corretamente".

Pergunta: por que este modelo "correto" não tem a propriedade da estabilidade ou da previsibilidade?

Você pode ser um teórico e construir modelos com R^2 próximo a um e não ganhar nada. Você pode ser um profissional e avaliar modelos em termos de lucros esperados e riscos associados. O primeiro caso é bom se você quiser escrever um artigo/dissertação/ou qualquer coisa. Se você quiser ganhar dinheiro, estime primeiro os modelos por lucro/risco, e só depois por R^2 e outras estatísticas.

Você só pode observar os testes dentro da amostra depois de obter um resultado positivo estável fora da amostra. Caso contrário, você estará perdendo seu tempo.

Próximo passo. Aplicabilidade de difusores estocásticos ao mercado, links, por favor.

As difusoras são particularmente populares na avaliação de derivativos, tais como opções. Também há aplicações na arbitragem estatística.

É o mesmo para você. O NS em pacotes (EViews não o tem, mas outros o têm) toma o lugar do alisamento, e esta é apenas uma pequena parte do problema e não a mais importante a resolver. No caso da NS, é uma arte. Se você pegar estrias e wavelets, é matemática.

NS toma o lugar dos modelos de regressão não-linear.

 
gpwr:

Eu gostaria de entender o modelo. O que é CNORM? Em qual intervalo o modelo foi treinado e em qual foi testado? Entendo corretamente que as primeiras 100 fileiras de planilhas Excel são dados de treinamento? Por que eles são tão poucos (igual ao número de variáveis dependentes no modelo)?

Gostaria de entender uma coisa, se você está prevendo ZZ, como você calcula a etapa ZigZag prevista?
 
Trolls:
  1. Está matematicamente provado há muitos anos que se o modelo e o processo em análise coincidem (em seus termos o "modelo correto"), então o filtro Kalman dá a melhor previsão de 1 passo à frente. Procure-o no fórum...
  2. Já lhe foi dito muitas vezes, seu modelo está errado. Você está preso a este modelo de regressão que nenhum outro modelo existe ?...o mundo inteiro em toda sua diversidade é descrito por este modelo simples ?...
  3. E sobre o tipo de ACF que já lhe foi dito aqui mais de uma vez, e suas propriedades ...

Aqui está um link para meu trabalho que já existe há muito tempo(https://www.mql5.com/ru/code/8295).... ACF e se você olhar de perto, há duas curvas. A primeira curva é (linha azul), a segunda vermelha é a ACF das citações. Você pode compará-los (visualmente) ...

Existe um modelo (ele existe e é conhecido há muito tempo) com o qual você pode descrever o corit com precisão suficiente para a prática e não é um modelo de regressão. É verdade que os livros escolares econométricos provavelmente não dizem nada sobre este modelo... procurar outros livros escolares

Boa sorte a todos. Felicidade e saúde no próximo ano!!!

(em seus termos "modelo correto")

Correto significa que tem certas propriedades. Estas propriedades não são discutidas por ninguém.

então a melhor previsão 1 passo à frente é o filtro Kalman. Você pode pesquisar o fórum aqui...

Em EViews há um modelo chamado espaço de estado, portanto, o filtro Kalman. Mas não posso formular tal modelo, apesar de ser o mais promissor, segundo todas as contas.

  1. E sobre o tipo de ACF você já foi informado aqui mais de uma vez, e suas propriedades...

Aqui está um link para meu trabalho há muito tempo(https://www.mql5.com/ru/code/8295).... ACF e se você olhar de perto, há duas curvas. A primeira curva é (linha azul), a segunda vermelha é a ACF das citações. Você pode compará-los (visualmente)...

Seu posto sobre o AFC não entendo nada.

existe um modelo (ele existe e é conhecido há muito tempo) que pode ser usado para descrever kotir com precisão suficiente para a prática, e não é um modelo de regressão.

E se você não intrigar?

 

anonymous:



1. Que a tendência é perdida na transição para incrementos. Isto não é verdade, pois a presença de uma tendência afetará diretamente a expectativa condicional dos incrementos. Assim, a previsão de uma é equivalente à previsão da outra.

2. Que o modelo incremental não tem a propriedade de reversibilidade. Mais uma vez, isto não é verdade, porque conhecemos o último nível de preço. Prevendo os incrementos, retirando deles a soma acumulada e adicionando o último valor conhecido do preço - obtemos uma transição inequívoca no espaço tempo/preço

Afirmo apenas uma coisa - o resultado em incrementos é muito pior do que em níveis. Esse sou eu e não generalizo esse resultado. É possível para outra pessoa obtê-lo.

Pode-se ser um teórico, construir modelos com R^2 próximo a um e não ganhar nada com isso. É possível ser um profissional e avaliar modelos a partir da perspectiva do lucro esperado e dos riscos associados. O primeiro caso é bom se você quiser escrever um artigo/dissertação/ou qualquer coisa. Se você quiser ganhar dinheiro, estime primeiro os modelos por lucro/risco, e só depois por R^2 e outras estatísticas.

Você só pode olhar os testes dentro da amostra depois de obter um resultado positivo estável fora da amostra. Caso contrário, você estará perdendo seu tempo.

Discordo de muitos no fórum sobre este ponto. Se você quiser um caminhão e conseguir uma bicicleta, um teste de bicicleta bem sucedido não provará que você tem um caminhão. É tudo aleatoriedade que deve vir à tona no mundo real.

NS toma o lugar dos modelos de regressão não-linear.

Mais uma vez. NS não resolve problemas em toda a sua diversidade. Seu comentário sobre a não-linearidade mostra isso. O que são modelos de regressão não-linear ? por variáveis ou por parâmetros ? E os parâmetros são aproximadamente constantes ou variáveis aleatórias? e se aleatórias, quais são suas características? Isto é para a questão da NS. Eles têm seu próprio lugar.