基于宏观经济指标的市场预测 - 页 12

 
avtomat:


只对 "你们的大学 "教给你们的有限的一类模型是真实的。


我没有在大学里学习。我是自学成才。我用自己的大脑思考。我质疑并反复检查每一件事。静止性的必要性本身是在我多次尝试在非静止数据上获得一个模型未果后产生的。我可以详细地证明,但我很抱歉没有时间,因为每个人都会坚持自己的观点。

我对这个话题的兴趣是从看市场新闻开始的,在新闻中,Steve Keen教授吹嘘他的经济模型如何预测了2008年的崩溃,但美联储使用的DSGE模型却无法预测任何事情。所以我研究了DSGE模型和Keen的模型。对于那些想走我的路的人,我建议从这篇关于DSGE模型的Matlab文章开始。它有所有必要的代码,包括从FRED fedreserve数据库交换经济数据的代码。

http://www.mathworks.com/help/econ/examples/modeling-the-united-states-economy.html

美联储模型使用以下预测因素。

% FRED系列描述% ---------------------------------------------------------------------------% COE 以亿美元计的雇员支付报酬% CPIAUCSL 消费者价格指数% FEDFUNDS 有效联邦基金利率% GCE 以亿美元计的政府消费支出和投资% GDP 以亿美元计的国内生产总值% GDPDEF 国内生产总值价格平减指数% GPDI 以亿美元计的私人国内投资总额% GS10 十年 期国债收益率 % HO年国债收益率% HOANBS 非农商业部门工作时间指数% M1SL M1货币供应量(狭义货币% M2SL M2货币供应量(广义货币% PCEC 个人消费支出(十亿美元% TB3MS 三个月国库券收益率% UNRATE 失业率


然后在YouTube上观看Steve Keen的讲座。

https://www.youtube.com/watch?v=aJIE5QTSSYA

https://www.youtube.com/watch?v=DDk4c4WIiCA

https://www.youtube.com/watch?v=wb7Tmk2OABo

并阅读他的文章。

Modeling the United States Economy - MATLAB & Simulink Example
  • www.mathworks.com
The Smets-Wouters model (2002, 2004, 2007) is a nonlinear system of equations in the form of a Dynamic Stochastic General Equilibrium (DSGE) model that seeks to characterize an economy derived from economic first principles. The basic model works with 7 time series: output, prices, wages, hours worked, interest rates, consumption, and...
 
附上明斯基 程序(经济模拟器) ,以及它的网站,网站上有很多解释它如何工作的视频,还有很多其他东西。

/go?link=http://www.ideaeconomics.org/minsky/

附加的文件:
 
ProfSteveKeen
ProfSteveKeen
  • www.youtube.com
Rethinking Economics at the London School of Economics I was invited by the Rethinking Economics student association at the London School of Economics to give a talk about Greece, Austerity, Post Keynesian Economics and anticipating the crisis. There...
 
而对于不发达地区的人,用可读的语言来说
 
Vinin:
并以易懂的语言为不发达的人服务

对于德国人来说 :)

https://translate.google.com.ua/translate?sl=en&tl=ru&js=y&prev=_t&hl=ru&ie=UTF-8&u=http%3A%2F%2Fen.wikipedia.org%2Fwiki%2FSteve_Keen&edit-text=

 
gpwr:

因此,任务是根据现有的经济指标来预测标普500指数。

第1步: 找到指标。这些指标在这里公开提供:http://research.stlouisfed.org/fred2/,有24万个。最重要的是GDP增长。该指标每季度计算一次。因此,我们的步骤是3个月。所有时间较短的指标都被重新计算为3个月,其余的(年度)则被舍弃。我们还放弃了除美国以外的所有国家的指标以及没有深厚历史(至少15年)的指标。因此,我们费力地筛选出一堆指标,得到大约1万个指标。让我们制定一个更具体的任务--提前一两个季度预测标准普尔500指数,有一万个经济指标,以季度为周期。我在Matlab中做所有的事情,但也有可能在R中做。

第2步: 通过微分和归一化将所有数据转换为静止的形式。有很多的方法。最主要的是,转换后的数据可以从原始数据中恢复出来。没有静止性,任何模型都无法工作。转型前后的标普500指数系列如下所示。

第3步: 选择一个模型。你可以有一个神经网络。它可以是一个多变量的线性回归。可以是一个多变量的多项式回归。在尝试了线性和非线性模型后,我们得出结论,数据的噪声很大,没有必要去拟合一个非线性模型,因为y(x)图中y=标准普尔500指数,x=一万个指标中的一个,几乎就是一个圆云。因此,我们更具体地制定了任务:利用多变量线性回归,在拥有1万个具有季度性的经济指标的情况下,预测标普500指数未来一到两个季度的情况。

第四步: 从一万个经济指标中选择最重要的指标(减少问题的维度)。这是最重要和最困难的一步。假设我们以标普500指数的历史为例,该指数长达30年(120个季度)。为了将标准普尔500指数表现为各种经济指标的线性组合,有120个指标足以准确描述这30年中的标准普尔500指数。此外,这些指标绝对可以是任何种类的指标,以便建立这样一个120个指标和120个标普500指数值的精确模型。因此,我们应将输入的数量减少到描述函数值的数量以下。例如,我们正在寻找10-20个最重要的指标/输入。这种通过从大量候选基数(字典)中选择少量输入来描述数据的任务被称为稀疏编码。

有许多选择预测器输入的方法。我都试过了。这里是主要的两个。

  1. 我们按照对标普500指数的预测能力对所有的10k数据进行分类。预测能力可以用相关系数或相互信息来衡量。
  2. 让我们逐一查看所有一万个指标,并选择一个给出描述标普500指数的线性模型y_mod = a + b*x1且误差最小的指标。然后,我们通过尝试剩余的1万个-1指标再次选择第二个输入,使其以最小的误差描述残差y - y_mod = c + d*x2。以此类推。这种方法被称为逐步回归或匹配追求。

以下是与标普500指数相关系数最大的前10个指标。

系列标识 滞后 ǞǞǞ 彼此的信息
'PPICRM 2 0.315 0.102
'CWUR0000SEHE' 2 0.283 0.122
'ces1021000001' 1 0.263 0.095
'b115rc1q027sbea'。 2 0.262 0.102
'ces1000000034' 1 0.261 0.105
'a371rd3q086sbea'。 2 0.260 0.085
'b115rc1q027sbea'。 1 0.256 0.102
'cuur0000saf111' 1 0.252 0.117
'cuur0000sehe'。 2 0.251 0.098
'USMINE' 1 0.250 0.102

以下是与标普500指数相互信息量最大的前10个指标。

系列标识 滞后 ǞǞǞ 彼此的信息
ǞǞǞ 3 0.061 0.136
'b701rc1q027sbea'。 3 0.038 0.136
'CUSR0000SAS' 3 0.043 0.134
'GDPPOT' 3 0.003 0.134
'NGDPPOT' 5 0.102 0.134
'OTHSEC' 4 0.168 0.133
3 'lnu01300060' 3 0.046 0.132
'Lrac25ttusm156n'。 3 0.046 0.132
'lrac25ttusq156n' 。 3 0.046 0.131
'CUSR0000SAS' 1 0.130 0.131

滞后是指输入序列相对于模拟标普500序列的滞后。从这些表格中可以看出,选择最重要的投入的不同方法导致了不同的投入集。由于我的最终目标是使模型误差最小化,我选择了第二种输入选择方法,即列举所有的输入并选择误差最小的输入。

第五步: 选择一种方法来计算模型的误差和系数。最简单的方法是有效值法,这就是为什么使用这种方法的线性回归如此受欢迎。RMS方法的问题是它对异常值很敏感,也就是说,这些异常值对模型系数有很大影响。为了降低这种敏感性,可以用绝对误差值的总和来代替误差的平方总和,这就导致了最小模数法(LMM)或稳健回归。这种方法没有模型系数的分析解,与线性回归不同。通常情况下,模块被平滑/微分的近似函数所取代,解决方案是数值化的,而且时间很长。我试过这两种方法(线性回归和LNM),没有发现LNM有什么特别的优势。我没有采用DOM,而是采用了迂回的方式。在通过微分获得静止数据的第二步,我增加了一个非线性归一化操作。也就是说,原来的系列x[1],x[2],...。x[i-1], x[i] ...首先转换为差分序列x[2]-x[1] ...x[i]-x[i-1] ...然后将每个差值归一化,用sign(x[i]-x[i-1])*abs(x[i]-x[i-1])^u替换,其中0 < u < 1。当u=1时,我们得到经典的RMS方法,它对异常值很敏感。在u=0时,所有的输入序列值都被二进制的+/-1值取代,几乎没有离群值。在u=0.5时,我们得到的东西接近于RMS。u的最佳值是在0.5和1之间。

请注意,将数据转换为静止形式的流行方法之一是用这些数值的对数之差代替序列的数值,即log(x[i])-log(x[i-1])或log(x[i]/x[i-1])。在我的例子中,选择这种转换是很危险的,因为在10k输入的字典中,有许多行是零和负值。对数还有一个好处是降低了RMS方法对异常值的敏感性。 从本质上讲,我的sign(x)*|x|^u转换函数与log(x)的目的相同,但没有与零和负值相关的问题。

第6步: 我们通过拟合新的输入数据来计算模型预测,并使用与前面历史部分的线性回归所发现的相同的模型系数来计算模型输出。重要的是要记住,季度经济指标和标准普尔500指数的数值几乎同时出现(在3个月内)。因此,为了预测下一季度的标准普尔500指数,应该在标准普尔500指数的当前季度值和至少延迟一个季度的条目之间建立模型(Lag>=1)。为了提前一个季度预测标准普尔500指数,该模型应在当前季度的标准普尔500指数值和至少延迟两个季度的输入之间进行绘制(Lag>=2)。以此类推。预测的准确性随着延迟时间超过2而明显下降。

第7步: 检查对以前历史的预测的准确性。上面描述的第一种方法(将每个输入写入以前的历史,挑选具有最低有效值的输入,并使用该输入的最新值来生成预测)给出的结果甚至比随机或空预测更差。我想知道这一点:为什么一个在过去很适合的输入要对未来有很好的预测能力?根据其先前的预测误差来选择模型输入是有意义的,而不是根据已知数据的最小回归误差。

毕竟,我的模型可以这样一步一步地描述。

  1. 我们从stlouisfed下载经济数据(大约10k个指标)。
  2. 将数据转化为静止的形式,并将其规范化。
  3. 选择一个标普500指数的线性模型,通过RMS方法(线性回归)进行分析求解。
  4. 我们选择历史的长度(1960-2015年第二季度),并将其划分为训练期(1960-1999年第四季度)和测试期(2000年第一季度-2015年第二季度)。
  5. 我们从1960年+N+1年开始预测,其中N*4是标普500指数已知季度值的初始数量。
  6. 从第一个N个数据中,为每个经济指标构建一个线性模型y_mod=a+b*x,其中y_mod是标普500模型,x是其中一个经济指标。
  7. 我们用每个模型预测N+1条。
  8. 计算每个模型对N+1条的预测误差。记住这些错误。
  9. 我们将标准普尔500指数的已知值增加1,即N+1,并重复步骤6-9,直到我们达到训练期的终点(1999年第四季度)。在这一步,我们已经记住了从1960+N+1年到1999年第四季度每个经济指标的预测误差。
  10. 我们开始在第二个历史区间(2000年第一季度至2015年第二季度)测试该模型。
  11. 对于一万个输入中的每一个,我们计算了1960-1999年第四季度的预测的均方根误差。
  12. 从一万个输入中,选择1960-1999年第四季度有效值预测误差最小的一个。
  13. 我们为1960-1999年第四季度的每个经济指标构建一个线性模型y_mod=a+b*x。
  14. 我们通过每个模型预测2000年第一季度。
  15. 我们选择前一时间段(1960年-1999年第四季度)预测中有效值最低的选定输入的预测作为我们对2000年第一季度的主要预测。
  16. 计算2000年第一季度所有输入的预测误差,并将其与前一个时间区间(1960-1999年第四季度)相同输入的有效值相加。
  17. 我们转到2000年第二季度,重复步骤12-17,直到我们到达测试部分的终点(2015年第二季度),标普500指数的未知值,其预测是我们的主要目标。
  18. 我们将2000年第一季度至2014年第四季度的预测误差累积起来,由前几段预测的均方根值最低的输入进行预测。这个误差(err2)是我们的样本外预测误差模型。

简而言之,预测器的选择取决于它对以前标普500指数值的预测有效值。不存在对未来的展望。预测器可以随着时间的推移而变化,但在测试段结束时,它基本上停止变化。我的模型选择了滞后两个季度的PPICRM作为预测2015年第二季度的第一个输入。1960-2014年第四季度,标普500指数由选定的PPICRM(2)输入的线性回归结果如下。黑色圆圈是线性回归的结果。多色圆圈是1960-2014年第四季度的历史数据。圆圈的颜色表示时间。


对标准普尔500指数的预测,以静止的形式(红线)。

标普500指数预测的原始形式(红线)。

图中显示,该模型预测标普500指数在2015年第二季度会有所上升。增加第二个输入会增加预测误差。

1 err1=0.900298err2=0.938355 PPICRM (2)

2 err1=0.881910err2=0.978233 PERMIT1 (4)

其中err1为回归误差。很明显,增加第二个输入会使它减少。err2是均方根预测误差除以随机预测误差。所以err2>=1意味着我的模型的预测不比随机预测好。err2<1意味着我的模型的预测比随机预测好。

PPICRM = 生产者价格指数:用于深加工的粗制材料

PERMIT1 = 建筑许可证批准的新的私人住房单位 - 在有1个单位的结构中

上面描述的模式可以这样改写。我们把一万名经济学家召集起来,请他们预测未来一个季度的市场。每位经济学家都通过他或她的预测。但我们不是根据他们过去写过的教科书或获得的诺贝尔奖的数量来选择一些预测,而是等待几年,收集他们的预测。经过相当数量的预测后,我们看到哪个经济学家更准确,我们就开始相信他们的预测,直到其他经济学家在准确性上超过他们。

答案很简单--在年度时间框架上交易....
 
IvanIvanov:
答案很简单--在年度时间框架上交易....
这是个玩笑吗?
 
gpwr:
这是个玩笑吗?

:-) 我不知道....如果分析是在.....,我不知道该怎么交易......在M5上,它不太可能有任何实际效果......

作为一种选择,尝试将你的分析应用于H4...

 

gpwr:

...经过大量的预测后,我们会发现哪个经济学家更准确,并开始相信他的预测,直到其他经济学家在准确性上超过他...


嗯,这与塔勒布的黑天鹅有点矛盾。在一个环境中预测良好的经济学家如何能预测崩溃?

我的意思不是如何,而是为什么会发生?因为他们非常确定自己是对的,为什么要修改这个权利,所以我们得到了旅鼠热情地冲向深渊。

 

这里是基恩关于他的模型的文章。

http://keenomics.s3.amazonaws.com/debtdeflation_media/papers/PaperPrePublicationProof.pdf

虽然我一开始就说,我不喜欢他的模式。其目的是解释经济周期和崩溃,而不是像GDP那样准确地预测市场或经济表现。例如,他的模型预测,家庭债务上升将导致经济崩溃。但他的模型究竟是什么时候预测的。它也没有能力预测崩溃后会发生什么。尽管美国的市场和经济在2009年有所恢复,但他所有的理论曲线都走向了无限大,并无限期地坐在那里。这一定是为什么他继续对这次复苏非常消极,不相信它,并声称一个比日本长达20年的大萧条更糟糕的大萧条即将到来。我认为这是所有动态经济模型的问题:它们很难稳定,如果它们变得不稳定,就会锁定,不再能预测未来。尽管一家著名的对冲基金已经聘请基恩为经济顾问。