Économétrie : une prévision d'avance - page 116

 
faa1947:

Je ne le comprends pas moi-même.

Patron cassé : zz_high eurusd(-1 to -100) c @trend

Je prévois une variable dépendante qui prend les valeurs "0" - aucun signal et "1" - un signal d'inversion à la baisse. Nous prenons 100 barres EURUSD comme variable dépendante, c'est-à-dire une valeur aléatoire. Après avoir estimé le coefficient de régression, nous obtenons :

ZZ_HIGH = 1-@CNORM(-(1033.56764818*EURUSD(-1) + 361.005725087*EURUSD(-2) - 659.271726689*EURUSD(-3) + 1289.20797453*EURUSD(-4) - 1024.9175822*EURUSD(-5) - 173.354947231*EURUSD(-6) - 500.755211559*EURUSD(-7) + 487.538133239*EURUSD(-8) - 1741.90012073*EURUSD(-9) + 1250.27027863*EURUSD(-10) + 1204.01840496*EURUSD(-11) - 625.209628018*EURUSD(-12) - 88.4193896778*EURUSD(-13) - 821.374855285*EURUSD(-14) - 754.491291165*EURUSD(-15) + 538.519551372*EURUSD(-16) + 3220.86311608*EURUSD(-17) - 518.070207767*EURUSD(-18) - 2332.53473806*EURUSD(-19) + 569.684891562*EURUSD(-20) - 1619.61207529*EURUSD(-21) + 1641.76931445*EURUSD(-22) - 1414.74117489*EURUSD(-23) - 114.280781428*EURUSD(-24) + 450.449461697*EURUSD(-25) - 337.460964818*EURUSD(-26) + 908.232164753*EURUSD(-27) + 601.738993689*EURUSD(-28) + 861.74494980071*EURUSD(-29) + 259.833316285*EURUSD(-30) - 46.5215488696*EURUSD(-31) - 820.583809759*EURUSD(-32) - 1423.98506887*EURUSD(-33) + 935.969451579*EURUSD(-34) - 803.436564451*EURUSD(-35) + 221.143701299*EURUSD(-36) + 335.777492236*EURUSD(-37) + 650.456824302*EURUSD(-38) + 350.318958532*EURUSD(-39) - 467.384535354*EURUSD(-40) - 1463.62960078*EURUSD(-41) + 1023.33692559*EURUSD(-42) + 531.53858297*EURUSD(-43) - 1804.43807812*EURUSD(-44) + 505.327400995*EURUSD(-45) - 20.3151847226*EURUSD(-46) + 1454.71062626*EURUSD(-47) + 149.481921853*EURUSD(-48) - 1985.4346906*EURUSD(-49) + 8.64522845766*EURUSD(-50) + 1301.22397609*EURUSD(-51) + 1398.9062339*EURUSD(-52) - 1812.25415112*EURUSD(-53) - 815.17727151*EURUSD(-54) - 465.973849717*EURUSD(-55) + 891.665097704*EURUSD(-56) - 33.8677278433*EURUSD(-57) + 1802.96642724*EURUSD(-58) + 103.739651059*EURUSD(-59) + 395.877119657*EURUSD(-60) - 1358.3140469*EURUSD(-61) + 17.0144218275*EURUSD(-62) + 645.959444744*EURUSD(-63) - 1935.40489961*EURUSD(-64) + 847.657103772*EURUSD(-65) - 348.287297241*EURUSD(-66) + 1674.82953896*EURUSD(-67) - 1399.09585978*EURUSD(-68) + 442.848712733*EURUSD(-69) + 498.667519817*EURUSD(-70) + 175.460595585*EURUSD(-71) - 3.23177058628*EURUSD(-72) - 502.970783886*EURUSD(-73) - 486.45378574*EURUSD(-74) - 1284.12753179*EURUSD(-75) + 2212.99339275*EURUSD(-76) + 1011.83438787*EURUSD(-77) - 2762.97407148*EURUSD(-78) + 1603.46426721*EURUSD(-79) - 441.847609369*EURUSD(-80) - 173.0306096*EURUSD(-81) - 672.051786135*EURUSD(-82) - 1106.57500684*EURUSD(-83) + 337.977251734*EURUSD(-84) + 1392.23135411*EURUSD(-85) + 1222.020799*EURUSD(-86) + 327.446848701*EURUSD(-87) - 1208.41468022*EURUSD(-88) + 741.85661795*EURUSD(-89) + 1585.08937121*EURUSD(-90) - 2098.86445785*EURUSD(-91) + 58.0598765644*EURUSD(-92) - 166.744222595*EURUSD(-93) + 67.6457712184*EURUSD(-94) + 98.7949064574*EURUSD(-95) + 1406.32082135*EURUSD(-96) - 1658.83294022*EURUSD(-97) - 273.851042947*EURUSD(-98) + 93.5879401275*EURUSD(-99) + 243.060588194*EURUSD(-100) - 1295.0210728 + 0.08150857192*@TREND))

Tout semble être là.

Le calcul des prévisions est en quelque sorte complètement identique au fait.


J'aimerais comprendre le modèle. Qu'est-ce que le CNORM ? Sur quel intervalle le modèle a-t-il été entraîné et sur lequel a-t-il été testé? Ai-je bien compris que les 100 premières lignes des feuilles de calcul Excel sont des données de formation ? Pourquoi sont-elles si peu nombreuses (égales au nombre de variables dépendantes dans le modèle) ?
 
gpwr:

J'aimerais comprendre le modèle. Qu'est-ce que le CNORM ? Sur quel intervalle le modèle a-t-il été entraîné et sur lequel a-t-il été testé ? Ai-je bien compris que les 100 premières lignes des feuilles de calcul Excel sont des données de formation ? Pourquoi sont-elles si peu nombreuses (égales au nombre de variables dépendantes dans le modèle) ?

@cnorm(x)

distribution cumulative normale (CDF)


Il faut 500 barres. Les 100 premières barres ne sont pas prises, car elles sont des barres dans la formule comme une période dans l'ondulation. Pas de formation, estimation des coefficients sur 500 barres

 
faa1947:

@cnorm(x)

distribution cumulative normale (CDF)


500 barres sont prises. Les 100 premières barres ne sont pas prises car ce sont les barres de la formule comme période dans l'ondulation. Pas de formation, coefficient d'estimation à 500 bars

Ces modèles peuvent parfois donner des prévisions précises simplement en raison de la forte probabilité de coïncidence due au petit nombre d'états finaux possibles et cela ne veut rien dire - il suffit de prendre par exemple l'incrément réel de clôture à la période des 500 prochaines barres par les coefficients dérivés des 500 barres précédentes et de mesurer la corrélation avec l'incrément de prévision - c'est-à-dire la différence entre les valeurs détaillées. Le coefficient obtenu permettra d'estimer objectivement la qualité de la prédiction, dans votre cas vous pouvez utiliser l'évaluation de la corrélation quantitative. Mais là encore, ce n'est pas une solution au problème de la prévision, car pour l'utiliser comme un système "utile", il faut être capable non seulement d'"entrer sur le marché" avec succès, mais aussi d'en "sortir". Vous avez tort de supposer que l'erreur de prédiction s'accumulera une barre plus loin si d'autres barres sont prises, en fait, ce n'est pas promis... De même que la sélection de l'importance des variables est une tâche d'extraction de connaissances solvable distincte (Data Mining) et il existe déjà des méthodes pour cela et cela ne se fait pas par principe - faut-il ou non 100 ou 500 barres....
 
dasmen:
De tels modèles peuvent parfois donner des prédictions précises, simplement du fait de la forte probabilité de coïncidence, en raison du petit nombre d'états finaux possibles et cela ne veut rien dire - il suffit de prendre par exemple l'incrément réel à la clôture sur la période des 500 prochaines barres par des coefficients extraits sur les 500 barres précédentes et de mesurer la corrélation avec l'incrément prévu - c'est-à-dire la différence entre les valeurs de détail. Le coefficient obtenu permettra d'estimer objectivement la qualité de la prédiction, dans votre cas vous pouvez utiliser l'évaluation de la corrélation quantitative. Mais là encore, ce n'est pas une solution au problème de la prévision, car pour l'utiliser comme un système "utile", il faut être capable non seulement d'"entrer sur le marché" avec succès, mais aussi d'en "sortir". Vous avez tort de supposer que l'erreur de prédiction s'accumulera une barre en avant si d'autres barres sont prises, en fait, ce n'est pas promis... Tout comme la sélection de l'importance des variables est une tâche d'extraction de connaissances solvable distincte (Data Mining) et il existe déjà des techniques pour cela. Elle n'est pas effectuée sur le principe de savoir s'il faut 100 ou 500 barres...

L'ensemble du sujet est plus riche que le dernier billet que vous avez commenté. La question de la signification des variables a été traitée à de nombreuses reprises. L'accumulation d'erreurs de prédiction est un fait médical, car on prend la valeur de la prédiction précédente pour la prédiction suivante par manque de faits. Si un fait est pris, il s'agit d'une prédiction avec un pas d'avance.

Mais ce sont des problèmes mineurs et techniques.

L'utilisation d'incréments était. Rien ne fonctionne, car dans les incréments, il n'y a pas de tendance, mais il y a une tendance prévue. Et voici la question principale du sujet : quelles propriétés du modèle donnent une garantie de prévisibilité ? Un ensemble de propriétés de ce type pour un modèle de régression ordinaire a été suggéré. Ce que vous commentez est un modèle de rupture et il y a d'autres modèles ici que je ne comprends pas.

Je vous serais reconnaissant de bien vouloir commenter l'un des nombreux points de ce fil de discussion.

 
faa1947:

...L'utilisation des incréments était. Rien ne fonctionne, car il n'y a pas de tendance dans les incréments, mais la tendance est prédite. et ici la question principale du sujet est : quelles propriétés du modèle donnent une garantie de prédictibilité ? Un ensemble de propriétés de ce type pour un modèle de régression ordinaire a été suggéré. Ce que vous commentez est un modèle probit et il y a d'autres modèles que je ne comprends pas...

  1. Il est mathématiquement prouvé depuis de nombreuses années que si le modèle et le processus analysé sont les mêmes (dans vos termes "le bon modèle"), la meilleure prédiction à un pas en avant est donnée par le filtre de Kalman. Cherchez-le sur le forum...
  2. On vous l'a dit plusieurs fois, votre modèle est faux. Êtes-vous coincé avec ce modèle de régression qu'aucun autre modèle n'existe ?...le monde entier dans toute sa diversité est décrit par ce simple modèle ?....
  3. Et à propos du type d'ACF, on vous l'a déjà dit ici plus d'une fois, ainsi que ses propriétés ...

Voici un lien vers mon travail qui est là depuis longtemps(https://www.mql5.com/ru/code/8295).... ACF et si vous regardez de près, il y a deux courbes. La première courbe est (ligne bleue), la seconde, rouge, est l'ACF des cotations. Vous pouvez les comparer (visuellement) ...

Il existe un modèle (il existe et est connu depuis longtemps) avec lequel vous pouvez décrire le corit avec une précision suffisante pour la pratique et ce n'est pas un modèle de régression. Il est vrai que les manuels d'économétrie ne parlent probablement pas de ce modèle... cherchez d'autres manuels...

Bonne chance à tous. Bonheur et santé pour l'année à venir !

 

Bonne année ! Que tous les modèles conquièrent.

 
faa1947:

L'utilisation d'incréments était. Rien ne fonctionne, car il n'y a pas de tendance dans les incréments, mais la tendance est prédite.

Vous déclarez :

1. Qu'en passant aux incréments, la tendance est perdue. Ce n'est pas vrai, car la présence d'une tendance affecte directement l'espérance conditionnelle des incréments. Ainsi, la prédiction de l'un est équivalente à la prédiction de l'autre.

2. Que le modèle incrémental n'a pas la propriété de la réversibilité. Là encore, c'est faux, car nous connaissons le dernier niveau de prix. En prévoyant les incréments, en en tirant une somme cumulée et en ajoutant la dernière valeur connue du prix, on obtient une transition biunivoque dans l'espace temps/prix.

Nous avons un modèle de régression primitif. Il est démontré qu'à l'intérieur de l'échantillon, il a un facteur de profit bien plus grand que 10. En dehors de l'échantillon, c'est un peu plus de 1 et même cela est douteux. Ce modèle est "correctement" construit.

Question : pourquoi ce modèle "correct" ne possède-t-il pas la propriété de stabilité ou de prévisibilité?

Vous pouvez être un théoricien et construire des modèles avec un R^2 proche de un et ne rien gagner. Vous pouvez être un praticien et évaluer les modèles en termes de bénéfices attendus et de risques associés. Le premier cas est bon si vous voulez écrire un article/dissertation/quelque chose. Si vous voulez gagner de l'argent, estimez d'abord les modèles en fonction du rapport bénéfice/risque, et seulement ensuite en fonction du R^2 et d'autres statistiques.

Vous ne pouvez examiner les tests à l'intérieur de l'échantillon qu'après avoir obtenu un résultat positif stable à l'extérieur de l'échantillon. Sinon, vous perdez votre temps.

Prochaine étape. Applicabilité des diffuseurs stochastiques au marché, liens, s'il vous plaît.

Les diffuseurs sont particulièrement appréciés pour l'évaluation des produits dérivés tels que les options. Il existe également des applications dans l'arbitrage statistique.

Il en est de même pour vous. Le NS dans les paquets (EViews ne l'a pas, mais d'autres l'ont) prend la place du lissage, et ce n'est qu'une petite partie du problème et non le plus important à résoudre. Dans le cas de NS, c'est un art. Si vous prenez les splines et les ondelettes, c'est des maths.

NS se substitue aux modèles de régression non linéaires.

 
gpwr:

J'aimerais comprendre le modèle. Qu'est-ce que le CNORM ? Sur quel intervalle le modèle a-t-il été entraîné et sur lequel a-t-il été testé ? Ai-je bien compris que les 100 premières lignes des feuilles de calcul Excel sont des données de formation ? Pourquoi sont-ils si peu nombreux (égaux au nombre de variables dépendantes dans le modèle) ?

J'aimerais comprendre une chose, si vous prédisez ZZ, comment calculez-vous l'étape ZigZag prédite ?
 
Trolls:
  1. Il est mathématiquement prouvé depuis de nombreuses années que si le modèle et le processus analysé coïncident (dans vos termes, le "modèle correct"), le filtre de Kalman donne la meilleure prédiction à un pas en avant. Cherchez-le sur le forum...
  2. On vous l'a dit plusieurs fois, votre modèle est faux. Êtes-vous coincé avec ce modèle de régression qu'aucun autre modèle n'existe ?....le monde entier dans toute sa diversité est décrit par ce simple modèle ?....
  3. Et à propos du type d'ACF, on vous l'a déjà dit ici plus d'une fois, ainsi que ses propriétés ...

Voici un lien vers mon travail qui est là depuis longtemps(https://www.mql5.com/ru/code/8295).... ACF et si vous regardez de près, il y a deux courbes. La première courbe est (ligne bleue), la seconde, rouge, est l'ACF des cotations. Vous pouvez les comparer (visuellement) ...

Il existe un modèle (il existe et est connu depuis longtemps) avec lequel vous pouvez décrire le corit avec une précision suffisante pour la pratique et ce n'est pas un modèle de régression. Il est vrai que les manuels d'économétrie ne parlent probablement pas de ce modèle... cherchez d'autres manuels...

Bonne chance à tous. Bonheur et santé pour l'année à venir !!!

(dans vos termes "modèle correct")

Correct signifie qu'il a certaines propriétés. Ces propriétés ne sont discutées par personne.

alors la meilleure prédiction avec un pas d'avance est le filtre de Kalman. Vous pouvez le chercher sur le forum ici...

Dans EViews, il existe un modèle appelé espace d'état, donc un filtre de Kalman. Mais je ne peux pas formuler un tel modèle, bien qu'il soit de l'avis général le plus prometteur.

  1. Et à propos du type d'ACF, on vous l'a déjà dit ici plus d'une fois, ainsi que ses propriétés...

Voici un lien vers mon travail qui est là depuis longtemps(https://www.mql5.com/ru/code/8295).... ACF et si vous regardez de près, il y a deux courbes. La première courbe est (ligne bleue), la seconde, rouge, est l'ACF des cotations. Vous pouvez les comparer (visuellement)...

Votre post sur les AFC, je n'ai rien compris.

il existe un modèle (il existe et est connu depuis longtemps), il peut être utilisé pour décrire les kotir avec une précision suffisante pour la pratique, et ce n'est pas un modèle de régression.

Et si vous n'intriguez pas ?

 

anonymous:



1. Que la tendance se perd dans le passage aux incréments. Ce n'est pas vrai, car la présence d'une tendance affecte directement l'espérance conditionnelle des incréments. Ainsi, la prédiction de l'un est équivalente à la prédiction de l'autre.

2. Que le modèle incrémental n'a pas la propriété de la réversibilité. Là encore, c'est faux, car nous connaissons le dernier niveau de prix. En prévoyant les incréments, en prenant la somme cumulée de ceux-ci et en ajoutant la dernière valeur connue du prix - nous obtenons une transition non ambiguë dans l'espace temps/prix.

Je n'affirme qu'une chose - le résultat sur les incréments est bien pire que sur les niveaux. C'est moi et je ne généralise pas ce résultat. Il est possible que quelqu'un d'autre l'obtienne.

On peut être un théoricien, construire des modèles avec un R^2 proche de un et ne rien gagner de cela. Il est possible d'être un praticien et d'évaluer les modèles du point de vue du bénéfice attendu et des risques associés. Le premier cas est bon si vous voulez écrire un article/dissertation/quelque chose. Si vous voulez gagner de l'argent, estimez d'abord les modèles en fonction du rapport bénéfice/risque, et seulement ensuite en fonction du R^2 et d'autres statistiques.

Vous ne pouvez examiner les tests à l'intérieur de l'échantillon qu'après avoir obtenu un résultat positif stable à l'extérieur de l'échantillon. Sinon, vous perdez votre temps.

Je ne suis pas d'accord avec de nombreux membres du forum sur ce point. Si vous voulez un camion et que vous avez un vélo, un test de vélo réussi ne prouvera pas que vous avez un camion. Ce n'est qu'une question de hasard qui ne peut manquer de se manifester dans le monde réel.

NS se substitue aux modèles de régression non linéaires.

Encore une fois. La NS ne résout pas les problèmes dans toute leur diversité. Votre commentaire sur la non-linéarité en est la preuve. Que sont les modèles de régression non linéaires ? par variables ou par paramètres ? Et les paramètres sont-ils des constantes ou des variables aléatoires ? et s'ils sont aléatoires, quelles sont leurs caractéristiques ? Il s'agit de la question des SN. Ils ont leur propre endroit.