基于宏观经济指标的市场预测 - 页 50

 
Дмитрий:

在这种规模下很难用眼睛分辨。

我曾经旋转过一个多因素模型,但模型的准确性低于公开的预测结果

只拿HOUST1F或PRFI这样一个指标来说,你的模型已经比公开的预测更准确了。加上几个消费者指标和收益率曲线,你就有了一个超级模型。

下面是1959年以来GDP增长和S&P500指数的图表。你不能否认,在GDP负增长(经济衰退)期间,S&P500指数已经下跌。

 

我自己有很多 "超级模特"。只有正向测试由于某种原因显示出比公布的预测更差的预测准确性

 
Vladimir:

只拿一个指标,如HOUST1F或PRFI,你的模型就已经比公开的预测更准确了。加上几个消费者指标和收益率曲线,你就有了一个超级模型。

下面是1959年以来GDP增长和S&P500指数的图表。你不能否认S&P500在GDP负增长(经济衰退)期间的下跌。


你在有选择地回应我的帖子,不知为何。

自然,给出的图形就像一辆电车。电车正在运行--所有的乘客都在走,stop....而乘客之间的联系是一个--他们是在同一辆电车上--在我们的情况下是同一个经济体。

该指数和GDP来自于国家的经济状况,它们之间没有任何联系。

2008年的危机是一场房地产危机,国内生产总值和指数以及其他很多数字都来自于这场危机。而指数并不跟随GDP,指数也不跟随GDP--它们充其量是同步的(并不总是如此--你可以在你之前提出的图表中看到)。

经济中存在着决定其未来走势的过程,一堆指标会反映出这种走势。

今天美国经济的基本动向是什么?

就个人而言,我加入了那些认为美国经济 的主要问题是零利率的人。整个社会部门(保险和养老基金)从投资政府证券中获利。在零利率的情况下,这些组织无法获得他们需要的利润。如果他们开始使这种类型的组织破产,这将是另一个层次的问题,他们不是网络公司。顺便说一下,GDP和所有的指数将朝着同一个方向发展--向下,垂直地发展。

 
СанСаныч Фоменко:

该指数和GDP来自于国家的经济状况,它们之间没有任何联系。

2008年的危机是一场房地产危机,国内生产总值和指数数字以及电车中的许多其他数字都来自于这场危机。而指数并不跟随GDP,指数也不跟随GDP--它们充其量是(并不总是--你可以在你之前提出的图表中看到),它们显示了相同的情况。

经济中存在着决定其未来走势的过程,一堆指标会反映出这种走势。

今天美国经济的基本动向是什么?

就个人而言,我加入了那些认为美国经济 的主要问题是零利率的人。整个社会部门(保险和养老基金)从投资政府证券中获利。在零利率的情况下,这些组织无法获得他们需要的利润。如果他们开始使这种类型的组织破产,这将是另一个层次的问题,他们不是网络公司。顺便说一下,GDP和所有的指数都会朝同一个方向发展,向下的,垂直的。

我同意所有的说法。我试图找到我说市场指数由于GDP的下降而下降的地方,但没有找到。如你所言,这两种下跌都反映了经济状况。市场指数的下降很难预测,国内生产总值的下降则更容易预测。由于指数和GDP的下降是同步发生的(你自己写的,虽然从我的观察来看,指数比GDP早1个季度开始下降),人们可以通过预测GDP的下降来预测指数的下降,这就是我在这里所做的。房屋开工率的下降比市场和GDP要早得多。因此,作为最后的手段,如果我不能创建一个好的S&P500和GDP模型,我将只观察HOUST和房价,并在它们下跌时退出市场。到目前为止,还没有观察到这样的事情。当HOUST达到1.6-1.7M时,我会仔细观察。当HOUST下降到1.2-1.3M以下时,过去的经济衰退就合法地开始了。

https://research.stlouisfed.org/fred2/series/HOUST

关于今天经济的问题是什么,我认为私人债务仍然有很大问题。银行仍在向无力偿还的人放贷。在美国,银行正疯狂地用信用卡购物,并给予折扣。每个品牌店都有信用卡:沃尔玛、塔吉特、梅西百货、Starbuks和其他数百家。在中国,私人债务占GDP的比例已经达到了比美国经济衰退前更高的水平。也许中国终究会成为下一次经济衰退的原因。

 
Vladimir:

至于今天经济的问题是什么,我认为私人债务仍然是一个大问题。银行仍在向无力偿还的人放贷。在美国,银行正疯狂地用信用卡购物,并给予折扣。每个品牌店都有信用卡:沃尔玛、塔吉特、梅西百货、Starbuks和其他数百家。在中国,私人债务占GDP的比例已经达到了比美国经济衰退前更高的水平。也许中国终究会成为下一次经济衰退的原因。

关于中国的GDP是在昨天的 "有趣和幽默 "主题中提到的。根据 "万物通论",中国的GDP增长与时间(t-t0)成2/3比例。


 

让我们开始一步一步地浏览预测器。首先,让我们如上所述,通过对其平均值的绝对增量进行归一化来转换所有数据。然后跑完整个历史,用线性回归的方法看看转换后的GDP的预测误差。下面是按预测误差增加排序的前10个预测器的列表。

'系列' '延迟'。 '错误'。 'Corr Coeff'。 '相互信息' 说明'。
'a012rc1q027sbea'。 1 0.785084491 0.521239874 0.207278508 私人固定投资:住宅:结构
'PRFI'。 1 0.785370338 0.52030199 0.205244075 '私人住宅固定投资'
'a756rc1q027sbea'。 1 0.788998988 0.513150108 0.203337794 '新结构中的私人固定投资:住宅结构
'dfdhra3q086sbea'。 1 0.792817832 0.509246158 0.238935402 '实际个人消费支出:耐用品:家具和耐用家用设备(链式数量指数)' 。
'w988rc1q027sbea' 。 1 0.792819625 0.512427741 0.209527444 私人国内投资总额:家庭和机构
'A713RX1Q020SBEA'。 1 0.79292839 0.511152419 0.227008161 '对国内购买者的真正最终销售
'b713ra3q086sbea'。 1 0.792933677 0.511052828 0.227015597 '对国内购买者的实际最终销售(连锁型数量指数)'
'w791rc1q027sbea' 。 1 0.795610445 0.509720881 0.220612324 国内净投资:私人:家庭和机构
'a943rc1q027sbea'。 1 0.799721554 0.493581939 0.198662644 '私人固定投资:住宅:结构:永久场地
'a011re1q156nbea'。 1 0.802124995 0.476308607 0.198071775 '国内生产总值的份额:国内私人投资总额:固定投资:住宅'

我们可以看到,从投资主题来看,有很多预测因素,特别是在房地产和家用设备方面。预测误差最小的预测因子与GDP的相关系数也最高,相互信息量大。A012RC1Q027SBEA或PRFI都适合作为模型的第一个预测因子。例如,让我们看一个转变后的GDP对PRFI(1)的依赖性的图表。

点的颜色根据时间沿着光谱平滑变化,即例如蓝色的点属于同一个时间区间。从图中可以看出,随着时间的推移,GDP对PRFI的依赖性没有特别的变化。在这种情况下,线性依赖性并不比非线性依赖性差,而且由于其简单性而更受欢迎。顺便说一下,我们可以讨论一下,当输入数据如此嘈杂时,非线性神经网络在金融模型中是否有任何优势。

现在我们来看看基于PRFI(1)的过去和未来的GDP预测。

相当不错,而且只有一个预测器,比银行的预测好。在这些预测中,没有对未来进行展望,因为在过去的每一个历史点上,都使用了截至该点的GDP和PRFI数据。唯一的前瞻性见解存在于预测器本身的选择中(PRFI在历史上一直被选择)。

 

让我们继续前进。第二个预测器的选择并不那么简单。我使用一种逐步回归的方法。这个想法是,在找到第一个预测器和GDP模型的基础上,我从GDP中减去其模型。由此产生的残余物成为一个新的建模系列,我为其找到第二个预测器,以此类推。熟悉数学的人知道,以这种方式选择的所有预测因子应该是正交的(预测因子之间的相关性为零),而大多数经济指标的情况并非如此。这方面有几个解决方案,我们将在后面讨论。

所以我们有一个残差(GDP减去基于第一个预测因素的模型)。我们开始浏览所有可用的预测器,并计算它们预测残差的误差,以及它们与残差的相关性和相互信息。我们得到以下表格(只显示前11个预测因子)。

拖延"。 '错误'。 'Corr Coeff'。 '相互信息'。
ㄊ、区、县 3 0.726557236 0.284915131 0.127184886
宿命3 3 0.726787378 0.315902493 0.130087104
掠夺者4 2 0.727334208 0.277286708 0.128992973
掠夺者5 1 0.728784473 0.308420433 0.129030595
ㄊ、区、市)。 3 0.729279452 0.292608987 0.134332245
掠夺者7 3 0.729297628 0.283750358 0.125613004
掠夺者8 1 0.732298245 0.314324885 0.152677285
9.pred9 1 0.732362897 0.301421196 0.134899474
预定10 1 0.732917749 0.290449918 0.126357606
掠夺者11 1 0.7342473 0.307902294 0.16423315
预定12 2 0.734315072 0.327789051 0.165246136

在这种情况下,预测误差是第一个预测器和本表中每个预测器的综合误差。这里应该谨慎选择第二个预测因子。虽然pred2与第一个预测器(PRFI或pred1)结合时,会给我们带来最低的误差,但这个预测器的相关系数和相互信息没有那么高。Pred12看起来更有希望,所以我将选择它。残差对pred12的依赖关系图。

云已经变得更加模糊。基于pred1和pred12的预测。

 
Vladimir:

在这些预测中没有对未来的窥视,因为在过去的每一个历史点上都使用了到那时为止的GDP和PRFI数据。对未来的唯一窥视存在于对预测器本身的选择中(PRFI在整个历史上都被选择)。

对未来的窥视。太糟糕了,它是对未来的一种窥视。

当你有一组非常大的输入变量时,你总是可以选择一个最适合预测变量的选定区间的变量,但不知道该变量与先前的函数之间的函数关系是存在的这一事实。

也就是说,变量 "安哥拉医院收治的食物中毒患者人数 "对于预测的美国GDP的选定部分很可能没有问题,但显然不存在功能关系。

再一次,只有前锋是决定性的,没有窥视(甚至在可变选择中)。

大量变量的陷阱。

 
Дмитрий:

也就是说,变量 "安哥拉医院收治的食物中毒患者人数 "很可能完全符合所选的美国GDP预测图,但显然不存在功能关系。

我在优化专家 时经常遇到类似的问题。例如,你可以优化一个专家顾问的10年历史,得到最好的结果,然后从这样的设置中一无所获。问题是,专家顾问使用那里发现的设置停滞了9年,然后在短短一周内发布了设置意外匹配并导致了大量利润。这样的事故在未来不太可能发生。一个好的解决方案是将整个交易历史按年划分,分别计算每一年的利润,并取最差的一年的结果。

为了找到最佳相关性,我会使用以下误差函数:MAX(error(2000-2016), error(2000), error(2001), ..., error(2014), error(2015))。我不保证什么,我没有试过这种方法的统计。

 
Дмитрий:

对未来的窥视。太糟糕了,它是对未来的一种窥视。

当你有一组非常大的输入变量时,你总是可以选择一个最适合所选择的预测变量区间的变量,但却不知道因子和提供的函数之间的函数关系是存在的这一事实。

也就是说,变量 "安哥拉医院收治的食物中毒患者人数 "对于预测的美国GDP的选定部分很可能没有问题,但显然不存在任何功能关系。

再一次,只有前锋是决定性的,没有窥视(甚至在可变选择中)。

大量变量的陷阱。

我同意,甚至自己也在这里的某个地方写过这样的东西。在所有的历史上挑选一个预测者,然后从相同的历史中使用远期测试,这是一种自欺欺人的做法,从交易员到学者都是如此。许多关于预测经济的文章都是先列出一些选定的预测因素,然后报告 "伟大 "的结果。交易者选择基于反弹或突破的策略,因为 "它在过去是有效的",并希望它在未来也是有效的,并展示过去的前瞻性测试,却没有意识到他们对策略本身的选择是基于他们对所有历史的研究,包括前瞻性测试的历史。对我来说,对我的GDP和市场模型的远期测试将是未来,所以我开了这个话题--发布预测,看看它们如何实时实现。工作还没有完成。有很多关于非线性数据转换 的想法。例如,一些预测因素如HOUST通过一些阈值函数影响GDP增长。