Prédiction du marché basée sur des indicateurs macroéconomiques - page 10

 
avtomat:
Cela ne ferait pas de mal de donner une définition claire, ou au moins de préciser ce que l'on entend par "prédiction", "prévision", etc. Sans cela, les "prédictions" n'ont aucun sens. Car, selon l'horizon, la même "prévision" peut être correcte pour un horizon et incorrecte pour un autre horizon. De plus, ces parcelles peuvent alterner plusieurs fois.

Je ne me lance pas dans des généralisations universelles, mais je vais donner la définition suivante de la prédiction et du pronostic. Ces définitions sont basées sur des algorithmes disponibles dans R (et pas seulement). Je pourrais probablement donner d'autres définitions, mais mes définitions sont constructives dans le sens où elles ont un code de programme.

Donc.

1. Prédiction. Le principe est que la valeur précédente est toujours utilisée pour la prédiction. C'est-à-dire que les barres de l'histoire réelle sont utilisées pour faire des prévisions à une étape. Et puis il y a les nuances suivantes. Pour une prévision à deux étapes, la valeur de la première étape est toujours utilisée. Pour une prévision à 3 étapes, les valeurs des 2 étapes précédentes sont utilisées, etc. Cette étape est fondamentale car elle additionne les erreurs de toutes les étapes précédentes de la prévision. Vous obtenez donc un graphique d'erreur de type entonnoir en expansion. L'erreur sur n pas en avant est toujours plus grande que l'erreur sur n-1 pas en avant. Le représentant le plus connu de cette orientation est le paquet de prévisions.

2. Prédiction. Ici, vous spécifiez l'ensemble des valeurs à partir desquelles la prévision est faite, et on parle de prédiction pour la distinguer, car il est possible de prévoir à partir d'un ensemble de barres à 1 pas, à 2 pas et à n pas. Le fait que les valeurs de prédiction soient utilisées ou non n'est pas déterminé par l'algorithme et est déterminé par un développeur. Le comportement de l'erreur de prédiction est inconnu. On peut décider de ce qu'on veut. S'il y a des prédicteurs dans un ensemble de prédicteurs de H1 qui ont intrinsèquement une capacité prédictive à H4, alors il peut y avoir moins d'erreur à chaque quatrième heure qu'à la troisième heure. Les prédicteurs sont tous des modèles de type classification.

 
faa1947:

Je ne ferai pas de généralisations universelles, mais je donnerai la définition suivante de la prédiction et du pronostic.

Dans ce cas, il n'y a pas besoin de généralisations universelles (pour toutes les occasions). Il suffit d'avoir des points de base dans le sujet pour comprendre et parler le même langage.
 
faa1947:

Pour les régressions - la non-stationnarité des séries financières est un problème de base. Ainsi, lors du choix d'un outil, il faut voir comment l'outil choisi résout le problème de non-stationnarité. L'ARIMA que j'ai mentionné résout le problème de non-stationnarité dans une certaine mesure, mais je n'ai jamais entendu dire que les séries de Taylor résolvaient le problème de non-stationnarité.

La non-stationnarité est considérée comme un problème lors de l'application de modèles stationnaires. Si un modèle non-stationnaire est utilisé, alors la non-stationnarité n'est pas un problème, mais un problème à résoudre.

L'ARIMA ne résout pas le soi-disant "problème de non-stationnarité" - il n'est pas conçu pour cela.

Les séries de Taylor sont en quelque sorte universelles : si les coefficients sont constants, on a un modèle stationnaire (et ARIMA est là aussi), mais si les coefficients sont des fonctions du temps ou de l'état, on a un modèle non stationnaire. C'est l'essentiel, en quelques mots, pour une référence rapide.

 
Dans mon cas, la prévision à 1 étape (trimestre) d'avance avec la date E utilise toutes les valeurs disponibles des entrées aux dates e=0 à e=D-1. La prévision à 2 étapes avec la date E utilise toutes les valeurs disponibles des entrées aux dates e=0 à e=D-2. Et ainsi de suite. En d'autres termes, la prévision en deux étapes à la date E n'utilise pas la prévision à la date J-1 car cela signifie que si la prévision à la date J-1 a utilisé un ensemble d'entrées aux dates 0...J-2, alors les mêmes entrées peuvent être directement utilisées pour la prévision en deux étapes à la date D sans prévision intermédiaire à la date J-1.
 
gpwr:
Dans mon cas, la prévision à 1 étape (trimestre) d'avance avec la date E utilise toutes les valeurs disponibles des entrées aux dates e=0 à e=D-1. La prévision 2 étapes à l'avance avec la date E utilise toutes les valeurs disponibles des entrées aux dates e=0 à e=D-2. Et ainsi de suite. En d'autres termes, la prévision en deux étapes à la date E n'utilise pas la prévision à la date J-1 car cela implique que si la prévision à la date J-1 a utilisé un ensemble d'entrées aux dates 0...J-2, alors les mêmes entrées peuvent être directement utilisées pour la prévision en deux étapes à la date D sans prévision intermédiaire à la date J-1.
Dans ma définition, peu importe ce qu'il y a à travers l'un. Ce qui est important, c'est l'autre chose : y a-t-il ou non des valeurs prédites précédemment dans la formule de prédiction ? Dans un premier temps, il est évident que les termes prévision et prédiction coïncident. Dans votre schéma, cela coïncide-t-il pour une prédiction à deux pas, mais à trois, quatre pas en avant ? Toute cette casuistique pourrait être écartée si nous ne sommes pas prêts à nous attaquer à la source des erreurs. Dans une prédiction, l'erreur ne dépend pas des autres prédictions, mais dans la prévision, l'erreur de prédiction dépend des prédictions précédentes. C'est une question de principe.
 
avtomat:

La non-stationnarité est considérée comme un problème lors de l'application de modèles stationnaires. Si un modèle non-stationnaire est utilisé, alors la non-stationnarité n'est pas un problème, mais un problème à résoudre.

L'ARIMA ne résout pas le soi-disant "problème de non-stationnarité" - il n'est pas conçu pour cela.

.

Soit on admet la présence de la non-stationnarité, soit on ne l'admet pas.

Si c'est le cas, alors soit notre modèle doit immédiatement manger des données non stationnaires, soit il est plus probable que nous ayons besoin d'un certain nombre d'actions préliminaires qui prépareront les données brutes afin qu'elles soient adaptées au modèle.

Et ici, l'ARIMA est un exemple classique. Il s'agit précisément d'un modèle pour les données non stationnaires. Dans la première étape, la série originale non stationnaire est convertie en série stationnaire, puis la série résultante est modélisée.

Plus précisément.

Pour les données stationnaires, il s'agit d'un modèle sans la lettre I, qui signifie combien de fois il faut différencier (prendre des différences) les données originales pour qu'elles deviennent stationnaires et que le modèle ARMA puisse être appliqué. Une autre chose est que les critères qui sont utilisés pour déterminer la stationnarité dans les modèles ARIMA, faible en conséquence de laquelle le modèle ARMA appliqué aux résultats de la différenciation, ne sont pas applicables à ces résultats et nécessitent des recherches supplémentaires, généralement sur la modélisation de la variance - ARCH, et il ya aussi des nuances...... En conséquence, il s'avère que vous avez une citation à l'entrée, vous modélisez quelque chose de disséqué, mais il est impossible de comprendre où mettre le résultat.

 
faa1947:

Soit nous reconnaissons la présence de la non-stationnarité, soit nous ne le faisons pas.

Si nous reconnaissons, alors soit notre modèle doit immédiatement absorber des données non stationnaires, soit il est probable qu'un certain nombre d'actions préliminaires soient nécessaires pour préparer les données brutes afin qu'elles soient adaptées au modèle.

Et ici, l'ARIMA est un exemple classique. Il s'agit précisément d'un modèle pour les données non stationnaires. Dans la première étape, la série originale non stationnaire est convertie en série stationnaire, puis la série résultante est modélisée.

Plus précisément.

Pour les données stationnaires, il s'agit d'un modèle sans la lettre I, qui signifie combien de fois il faut différencier (prendre des différences) les données originales pour qu'elles deviennent stationnaires et que le modèle ARMA puisse être appliqué. Une autre chose est que les critères qui sont utilisés pour déterminer la stationnarité dans les modèles ARIMA, faible en raison de laquelle le modèle ARMA appliquée aux résultats de la différenciation, pas applicable à ces résultats et nécessite des recherches supplémentaires, généralement par la modélisation de la variance - ARCH, et il ya des nuances trop...... En conséquence, il s'avère que vous avez une citation à l'entrée, vous modélisez quelque chose de disséqué, mais il est impossible de comprendre où mettre le résultat.

Vous répétez à nouveau la vieille erreur, sur laquelle beaucoup de choses ont déjà été dites...

Il est impossible d'effectuer une transformation de la série originale non stationnaire en une série stationnaire équivalente. Il est possible de faire toutes sortes de manipulations avec la série initiale, mais il faut comprendre que le résultat obtenu peut ne pas être équivalent au résultat initial. C'est exactement ce qui se passe lorsqu'on effectue une "transformation de séries non stationnaires en séries stationnaires".

Beaucoup de choses ont déjà été dites à ce sujet. Mais je vois que vous ne remarquez pas les points principaux. Au sens figuré, convertir un chat en chien en le conduisant en laisse ne fonctionnera pas.

 
avtomat:

Vous répétez encore une fois la vieille erreur, qui a déjà été dite à maintes reprises...

Il est impossible de transformer une série initiale non stationnaire en une série stationnaire équivalente. Il est possible de faire toutes sortes de manipulations avec la série initiale, mais il faut comprendre que le résultat obtenu peut ne pas être équivalent au résultat initial. C'est exactement ce qui se passe lorsqu'on effectue une "transformation de séries non stationnaires en séries stationnaires".

Beaucoup de choses ont déjà été dites à ce sujet. Mais je vois que vous ne remarquez pas les points principaux. Au sens figuré, convertir un chat en chien en le conduisant en laisse ne fonctionnera pas.

Pourquoi je ne le vois pas ? Je suis tout à fait d'accord avec vous ! Relisez la fin de mon message.
 
Chers participants à la discussion de ce sujet ! J'ose vous assurer à tous que mes recherches ont montré qu'aucune des méthodes connues d'analyse de régression, y compris les transformées de Fourier, les réseaux neuronaux, les modèles de régression linéaire et non linéaire et autres modèles, méthodes et techniques utilisés pour décrire et/ou prédire le comportement d'une série numérique, y compris le flux des prix du marché, ne peut rivaliser avec le modèle de régression universel proposé par moi, et connu de tous, https://www.mql5.com/ru/articles/250 par un quelconque paramètre d'évaluation. Je suis prêt à contester toute objection avec des exemples spécifiques et comparatifs d'analyses de séries. Je serais heureux de trouver, avec votre aide, les lacunes de mon modèle, le cas échéant. Je suis sûr que dès que vous étudierez et comprendrez sérieusement le modèle proposé, vous découvrirez sa puissance et son omnivocité. Pour expliquer de façon primitive, le modèle est une extension de la MOC gaussienne au domaine non linéaire, et en tant que cas particulier, il couvre également la MOC gaussienne. Par conséquent, si dans le domaine linéaire le MNA gaussien est le favori reconnu, alors dans le cas général la méthode proposée peut s'avérer l'être. Je suis prêt à répondre aux objections, s'il y en a. Respectueusement, Yusufkhoja.
 
yosuf:
Chers participants à la discussion de ce sujet ! J'ose vous assurer que mes recherches ont montré qu'aucune des méthodes connues d'analyse de régression, y compris les transformées de Fourier, les réseaux neuronaux, les modèles de régression linéaire et non linéaire et autres modèles, méthodes et techniques utilisés pour décrire et/ou prédire le comportement d'une série numérique, y compris le flux des prix du marché, ne peut rivaliser avec le modèle de régression universel que j'ai proposé et connu de tous par aucun paramètre d'évaluation. Je suis prêt à contester toute objection avec des exemples spécifiques, comparatifs, de toute analyse de série. Je serais heureux de trouver, avec votre aide, les inconvénients de mon modèle, le cas échéant. Je suis sûr que dès que vous étudierez et comprendrez sérieusement le modèle proposé, vous découvrirez sa puissance et son omnivocité. Pour expliquer de façon primitive, le modèle est une extension de la MOC gaussienne au domaine non linéaire, et en tant que cas particulier, il couvre également la MOC gaussienne. Par conséquent, si dans le domaine linéaire le MNA gaussien est le favori reconnu, alors dans le cas général la méthode proposée peut s'avérer l'être. Je suis prêt à contrer les objections, s'il y en a. Respectueusement, Yusufhoja.
Peut-être cette naïveté provient-elle de l'absence de mise en œuvre de ce modèle ?