Prédiction du marché basée sur des indicateurs macroéconomiques - page 43

 
СанСаныч Фоменко:

Eh bien, voici une pensée claire de Hazin.

Pour 2010, le total des instruments financiers sur le NYCE NASDAQ = 17,796 + 12,659 trillions de dollars. Et le PIB est deux fois moins élevé. Et la part de la finance dans le PIB est risible. Comment est-ce possible ?

Tout ce qui concerne les statistiques aux États-Unis doit être fait avec une extrême prudence. Il faut se plonger dans la méthodologie de calcul du PIB... Est-ce nécessaire ?

Le PIB prend en compte le montant des services financiers fournis au cours d'une année, et non la capitalisation nominale du marché boursier national.
 
Дмитрий:
Le PIB compte le montant des services financiers rendus au cours d'une année, et non la capitalisation nominale du marché boursier national.

Eh bien, vous voyez, vous en avez fait deux. La marge de courtage est donc prise en compte. C'est moins que le nôtre - un montant ridicule.

Et le reste de l'argent ? Vous achetez le pantalon, c'est une vente, mais vous achetez une action, un contrat à terme, c'est quoi ? Vous devez compter le chiffre d'affaires des comptes...

 
СанСаныч Фоменко:

Eh bien, vous voyez, vous en avez fait deux. La marge de courtage est donc prise en compte. C'est moins que le nôtre - un montant ridicule.

Et le reste de l'argent ? Vous achetez le pantalon, c'est une vente, mais vous achetez l'action, les contrats à terme, c'est quoi ? Il faut compter le chiffre d'affaires dans les comptes...

L'ensemble de l'économie de marché ....

Il faut compter en nature, en grandes gueules. Et la valeur monétaire, et même dans des monnaies différentes, ne peut fonctionner qu'avec des prix et des taux stables. Et aujourd'hui ? Tout le monde est coincé avec le rouble... Et regardez les graphiques des paires de devises ! Ou regardez les graphiques de l'indice du dollar. De quels prix pouvons-nous parler ?

À quoi la comparons-nous ? Une partie du PIB américain pour l'électronique dont la production réelle et physique se fait en Chine ? De l'air avec du vrai fer ?

 

Comme je l'ai déjà écrit, je ne choisis pas les prédicteurs, mais le code par erreur de prédiction. Je regarde juste le modèle final et je vérifie les indicateurs. Par exemple, un indicateur est le début de la construction de logements :

https://research.stlouisfed.org/fred2/series/HOUST1F

En observant ce graphique, vous pouvez constater une tendance à la baisse des mises en chantier avant les récessions. Les indicateurs choisis par le code dépendent en grande partie de la méthode de conversion des données. J'accepte tout à fait que les contrats à terme aient un impact sur le PIB. S'il existe une série chronologique reflétant les futures, montrez-moi le lien. Tous mes prédicteurs sont tirés de la base de données FRED2 de la Fed. Il existe des indicateurs économiques et financiers :

https://research.stlouisfed.org/fred2/categories

Le problème de ces indicateurs est qu'il en existe environ 300 000. Beaucoup de données régionales et internationales. J'ai dû éliminer manuellement les données "inutiles" pour éviter de charger le code. Nous avons environ 10 000 indicateurs. Mais tous ces indicateurs ne sont pas publiés par le gouvernement depuis longtemps : certains sont publiés depuis 1800, d'autres ont commencé à être publiés au cours des dix dernières années. Mon code ne considère que les indicateurs qui ont été produits depuis 1960 comme ayant suffisamment de données pour construire le modèle, c'est-à-dire 55 ans d'histoire ou 220 données dans chaque indicateur. Les 10 000 indicateurs sélectionnés se réduisent à 2 000. On pourrait discuter du fait que le marché d'aujourd'hui est sensiblement différent de celui d'il y a 50 ans. Et je suis tout à fait d'accord avec cela : ordinateurs, internet, influence chinoise, ingérence du gouvernement américain dans la gestion économique, etc. Mais si je ne prends que les données des 15 dernières années, je n'obtiens que 60 valeurs pour chaque indicateur, seulement deux récessions, et cela, comme le savent les statisticiens, n'est pas suffisant pour construire un modèle. Donc je dois aller plus loin dans l'histoire, quand l'économie était différente. Il en résulte d'autres difficultés : ce qui décrivait l'économie à l'époque, ne la décrit pas bien aujourd'hui. Au fait, j'ai essayé de raccourcir l'histoire de 15 à 20 ans, mais les prédictions étaient bien pires.

Privately Owned Housing Starts: 1-Unit Structures
Privately Owned Housing Starts: 1-Unit Structures
  • fred.stlouisfed.org
Units: Display integer periods instead of dates (e.g. ...,-1,0,1,...) with the value scaled to 100 at period 0. Use a formula to modify and combine data series into a single line. For example, invert an exchange rate a by using formula 1/a, or calculate the spread between 2 interest rates a and b by using formula a - b. Use the...
 
Vladimir:

Comme je l'ai déjà écrit, je ne choisis pas les prédicteurs, mais le code par erreur de prédiction. Je regarde juste le modèle final et je vérifie les indicateurs. Par exemple, un indicateur est le début de la construction de logements :

https://research.stlouisfed.org/fred2/series/HOUST1F

En observant ce graphique, vous pouvez constater une tendance à la baisse des mises en chantier avant les récessions. Les indicateurs choisis par le code dépendent en grande partie de la méthode de conversion des données. J'accepte tout à fait que les contrats à terme aient un impact sur le PIB. S'il existe une série chronologique reflétant les futures, montrez-moi le lien. Tous mes prédicteurs sont tirés de la base de données FRED2 de la Fed. Il existe des indicateurs économiques et financiers :

https://research.stlouisfed.org/fred2/categories

Le problème de ces indicateurs est qu'il en existe environ 300 000. Beaucoup de données régionales et internationales. J'ai dû éliminer manuellement les données "inutiles" pour éviter de charger le code. Nous avons environ 10 000 indicateurs. Mais tous ces indicateurs ne sont pas publiés par le gouvernement depuis longtemps : certains le sont depuis 1800, d'autres ont commencé à l'être au cours des dix dernières années. Mon code ne considère que les indicateurs qui ont été produits depuis 1960 comme ayant suffisamment de données pour construire le modèle, c'est-à-dire 55 ans d'histoire ou 220 données dans chaque indicateur. Les 10 000 indicateurs sélectionnés se réduisent à 2 000. On pourrait discuter du fait que le marché d'aujourd'hui est sensiblement différent de celui d'il y a 50 ans. Et je suis tout à fait d'accord avec cela : ordinateurs, internet, influence chinoise, ingérence du gouvernement américain dans la gestion économique, etc. Mais si je ne prends que les données des 15 dernières années, je n'obtiens que 60 valeurs pour chaque indicateur, seulement deux récessions, et cela, comme le savent les statisticiens, n'est pas suffisant pour construire un modèle. Donc je dois aller plus loin dans l'histoire, quand l'économie était différente. Il en résulte d'autres difficultés : ce qui décrivait l'économie à l'époque, ne la décrit pas bien aujourd'hui. Au fait, j'ai essayé de raccourcir l'histoire de 15 à 20 ans, mais les prédictions étaient bien pires.

Je regarde votre travail avec beaucoup d'intérêt. Et les contrats à terme... je m'en fiche
 
Yuriy Asaulenko:

Comme le dit une de mes vieilles connaissances qui vit au Canada : votre numéro huit, on vous le demandera après.

Il est important de connaître votre place dans cette file d'attente.

C'est en quelque sorte dégradant et insultant pour nous-mêmes. N'y a-t-il aucun sens de la dignité ? Vous n'irez pas loin avec une telle attitude.

Je ne suis pas un expert en économie et je ne sais pas à quel point le numéro 1 est sage, mais dans mon domaine scientifique, je peux vous assurer que les professeurs d'université en savent beaucoup moins que les personnes travaillant pour des entreprises, les praticiens. Je suppose que c'est la même chose en économie : seuls quelques experts sont capables d'élaborer de nouvelles théories, et les autres sont, comme disent les Américains, en train de polir la pomme. Pensez-vous que les banques fédérales emploient des sommités qui savent comment prédire l'économie ? Et en 2008 ? Bernanke a refusé de baisser les taux jusqu'en septembre 2007, soit 3 mois avant le début officiel de la récession. Et que dire du fonds spéculatif Long-Term Capital Management qui a fait faillite à la fin des années 1990 et a été renfloué par les banques de rachat et le gouvernement ? Ce fonds était dirigé par deux lauréats du prix Nobel, Scholes et Merton.Scholes, comme vous le savez peut-être, est l'un des auteurs dumodèlefinancierBlack-Scholes(modèle d'évaluation desoptions) pour lequel il a reçu son prix Nobel. Comment se fait-il que les riches investisseurs (et c'était le cas des membres de LTCM) gagnent de l'argent ou en perdent, mais qu'ils le récupèrent toujours, tout au plus auprès du gouvernement, alors que les autres investisseurs perdent de l'argent en bourse et c'est tout, personne ne les renfloue.

https://en.wikipedia.org/wiki/Long-Term_Capital_Management

Long-Term Capital Management - Wikipedia, the free encyclopedia
Long-Term Capital Management - Wikipedia, the free encyclopedia
  • en.wikipedia.org
Long-Term Capital Management Industry Founded Founder Defunct Headquarters Products LTCM Partners John W. Meriwether headed Salomon Brothers' bond arbitrage desk until he resigned in 1991 amid a trading scandal.4 According to Chi-Fu Huang, later a Principal at LTCM, the bond arbitrage group was responsible for 80-100% of...
 

Honnêtement, je ne l'ai pas lu moi-même, mais quelqu'un a-t-il lu Didier Sornetto ?

 
MQL5: Анализ и обработка отчетов Commodity Futures Trading Commission (CFTC) в MetaTrader 5
MQL5: Анализ и обработка отчетов Commodity Futures Trading Commission (CFTC) в MetaTrader 5
  • 2010.03.17
  • Aleksey Sergan
  • www.mql5.com
В данной статье представлен пример решения задачи по разработке инструмента трейдера для получения и анализа различных показателей отчетов CFTC. Концепция, в которой реализован инструмент, заключается в следующем: разработать один индикатор, который позволял бы получать показатели отчетов непосредственно из файлов данных, предоставляемых комиссией без промежуточных обработок и преобразований.
 

Je vais vous exposer mon expérience en matière de transformation des données d'entrée. Il existe plusieurs façons de transformer les données décrites dans les articles sur la modélisation économique :

1. Différence : x[i] - x[i-1]. Applicable si l'entrée x[] a une variance constante. J'ai environ 2 000 prédicteurs dont l'historique remonte à 1960. Pour voir comment leur variance varie avec le temps, j'ai calculé la différence x[i] - x[i-1], je l'ai élevée au carré, puis j'ai calculé la moyenne en utilisant le filtre de Hodrick-Prescott avec lambda 1e7 et j'ai pris la racine pour voir la variance en fonction du temps. J'ai ensuite divisé la variance à la fin de l'histoire (Q4 2015) par la variance au début de l'histoire (Q1 1960) pour chaque variable d'entrée et j'ai fait un histogramme :

De nombreuses entrées ont une variance plus ou moins constante (le rapport de la variance au début et à la fin de l'histoire est d'environ 1). Mais il y a aussi beaucoup d'entrées avec un rapport de variance de 3 ou plus. La variance du PIB est multipliée par 4 environ entre 1960 et aujourd'hui. Comme il n'est pas possible de construire un modèle de PIB avec des entrées dont la variance ne change pas, la transformation des entrées par la variance est insuffisante.

2. Momentum : x[i]/x[i-1] - 1 ou log(x[i]/x[i-1]). Normalise automatiquement les entrées avec une variance différente, mais ne fonctionne que si toutes les données sont positives. La formule x[i]/x[i-1] - 1 = (x[i] - x[i-1])/x[i-1] peut être considérée comme le calcul de la croissance en %, c'est-à-dire x[i] - x[i-1] en pourcentage de x[i-1]. Si x[i-1] est égal à zéro, cette formule n'a aucun sens et donne une valeur infinie. Lorsque x[i-1] est négatif, cette formule n'a pas non plus de sens. Environ 15 % des indicateurs économiques présentent à la fois des valeurs positives et négatives. Vous pouvez essayer d'utiliser le momentum pour les séries positives et la variance pour les séries négatives, dans l'espoir que les séries négatives aient une variance approximativement constante. Malheureusement, certains indicateurs économiques présentent des valeurs positives et négatives et la variance augmente fortement avec le temps. Par exemple :

3. La variance normalisée par la variance est (x[i] - x[i-1])/StdDev[i]. D'après mon expérience, il s'agit de la meilleure transformation, la plus polyvalente et adaptée à tous les types de données. Il y a deux problèmes sérieux ici : (1) comment calculer correctement la variance de StdDev en fonction du temps, et (2) comment reconvertir la prédiction sous la forme de la série originale si la variance future est inconnue.

 

Je diviserais toutes les mathématiques économiques modernes en deux parties

  • analyser le passé
  • pour prédire l'avenir.

Cette division semble erronée, car il est impossible de prédire l'avenir sans analyser le passé.

Dans la pratique, cependant, j'ai constaté que ce n'est pas le cas. Une distinction existe, et elle est fondamentale.

1. Il y a une analyse en soi. Nous analysons le chômage et recherchons les facteurs qui l'ont influencé dans le passé.

2. Et il y a une autre analyse. Dans un premier temps, nous essayons de prédire le chômage et de rechercher les facteurs qui ont influencé ce chômage dans le futur.

Dans le premier cas, si nous voulons prédire l'avenir, nous extrapolons les résultats de notre analyse. Ici, nous rencontrons une situation dans laquelle la différence entre la valeur extrapolée et la valeur actuelle tombe dans l'intervalle de confiance, ce qui signifie que le meilleur prédicteur basé sur l'extrapolation est la valeur actuelle !

Dans le second cas, nous ne sommes pas intéressés par la valeur précédente. Nous calculons une nouvelle valeur future (tendance) sur la base de données historiques, plutôt que de poursuivre le passé dans le futur. Dans ce cas, lorsque de nouvelles données arrivent, le modèle fait une prédiction basée sur la connaissance de situations passées, qui ne sont pas nécessairement antérieures, mais qui ont existé dans le passé.

Autrement dit, l'extrapolation doit être rigoureusement distinguée de la prédiction.

Ces différences apparemment subtiles entraînent des conséquences très graves.

1. La variable cible elle-même. Il s'avère que cette question est loin d'être futile. Il est impossible de le faire sans une analyse approfondie des propriétés de la variable cible, notamment en tenant compte du point 2.

Sélection des prédicteurs qui sont pertinents pour la variable cible. Sélection de prédicteurs qui ont un potentiel de prédiction des propriétés de la variable cible. Par exemple, la variable cible : croissance-décroissance. Nous avons besoin de prédicteurs qui sont pertinents pour la croissance/déclin de la variable cible, mais nous ne sommes pas intéressés par les prédicteurs qui prédisent la valeur de la variable cible.

PS.

Par expérience. Dans cette approche de prédiction de variables nominales, je n'ai trouvé aucun effet sur la capacité prédictive des prédicteurs en les prétraitant comme décrit ci-dessus, et par des méthodes plus radicales comme la conversion en un ensemble de composantes principales (PCA ou autres), qui ont des propriétés surprenantes pour nous, et aucune utilité.