基于宏观经济指标的市场预测 - 页 8

 
用两条线代替单线回归,一条用于正向输入,一条用于负向输入,没有显示出特别的优势。试图预测GDP而不是S&P500的结果是预测的RMS较低,但最佳输入数仍为1。因此,增加第二个和第三个预测器总是导致预先预测的RMS增加。我不喜欢这样。我希望看到一个有更多变量的模型。因此,对模型、数据及其转换的搜索仍在继续。我不想通过在所有历史的基础上对预测者进行抽样,并通过选定的预测者从同一历史中进行预测来欺骗自己。现在真正的挑战是如何选择只有到预测日期为止的历史的预测器。也许现实真的将选择限制在只有一个预测者。
 
gpwr:
用两条直线代替一条直线的回归,一条是正输入值,一条是负输入值,没有显示出特别的优势。试图预测GDP而不是S&P500的结果是预测的RMS较低,但最佳输入数仍为1。因此,增加第二个和第三个预测器总是会导致预测RMS的增加。我不喜欢这样。我希望看到一个有更多变量的模型。因此,对模型、数据及其转换的搜索仍在继续。

增加变量的数量,自然会增加整体的变异性

预测器的最佳数量从5个到8个(我认为)。

 

道琼斯指数和美元的三个月LIBOR利率。奇怪的是,教科书上说,当利率上升时,市场就会下降,但事实恰恰相反。

然而,并没有看到强烈的相关性。

P.S. 谁能告诉我在哪里可以找到1986年以前的利率和2007年以前的Tregers价格(不是收益率)的数据?

 
forexman77:

道琼斯指数和美元的三个月LIBOR利率。奇怪的是,教科书上说,当利率上升时,市场就会下降,但事实恰恰相反。

然而,并没有看到强烈的相关性。

P.S. 谁能告诉我在哪里可以找到1986年以前的利率和2007年以前的国债价格(不是收益率)的数据?

http://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/Historic-LongTerm-Rate-Data-Visualization.aspx

但真的很不方便(((。

 
 
gpwr:
用两个直线回归代替单一的直线回归,一个是正的输入值,一个是负的输入值,并没有显示出太大的好处。试图预测GDP而不是S&P500的结果是预测的RMS较低,但最佳输入数仍为1。因此,增加第二个和第三个预测器总是会导致预先预测的RMS增加。我不喜欢这样。我希望看到一个有更多变量的模型。因此,对模型、数据及其转换的搜索仍在继续。我不想通过在所有历史的基础上对预测者进行抽样,并通过选定的预测者从同一历史中进行预测来欺骗自己。现在真正的挑战是如何选择只有到预测日期为止的历史的预测器。也许现实真的将选择限制在只有一个预测者。

我不明白你为什么不做RAttle--你用了一些俗气的,更重要的是,有限的模型。

我有一个建议。

把带有列名的tsv.文件发给我。指定哪个(哪些)列应被用作目标变量。当然,表行应该指的是一个时间点。

我将在Rattle中运行它,如果你允许,我将在这里发布6个非常体面的模型的结果。

PS。

对金融系列的线性回归.....,更值得怀疑。

 
transcendreamer:

对不起,这只是费率问题。
价格在这里,但只按月计算。
http://www.investing.com/rates-bonds/us-10-yr-t-note-historical-data

谢谢你!根据网站上的图表判断,每天的数据来自2013年。

 
faa1947:


对金融系列的线性回归.....,更值得怀疑。

为什么,作为简单的模型,它是相当合适的
当然没有神经网络那么多的功能,但仍然是
我经常观察到,如果一个回归不能提供高质量的模型,那么其他优化器就不能提供

 
transcendreamer:

为什么不呢,因为简单的模型是相当合适的
,当然不像神经网络那样通用,但还是
,经常观察到,如果回归不能给出一个高质量的模型,那么其他优化器也不能给出

是的,嗯...

回归模型 几乎不可能应用于金融数据。你得到了数字,你相信它们,而事实上你看到的数字根本不存在,你缺乏了解它的知识--一个数字游戏。

但我的业务是建议...在那里,由你决定......

PS。

神经网络并没有给出最好的结果。还有其他的模型,而且结果更好,内部结构也可以解释。

 
faa1947:

是的,好吧...

回归模型实际上不适用于金融数据。你得到了数字,你相信它们,而事实上你看到的数字根本不存在,你缺乏了解它的知识--一个数字游戏。

但我的业务是建议...在那里,由你决定......

PS。

神经网络并没有给出最好的结果。还有其他的模型,而且结果更好,内部结构也可以解释。


我仍然不同意--回归在任何数据上都能正常工作,不一定比其他方法更好,但仍然足够好,特别是当你考虑到计算资源 的极端不要求性时。

通常建议在回归前先进行对数或取三角洲--但那会扼杀趋势信息!- 也许这就是你对回归持怀疑态度的原因?

预规范化会破坏数据,需要非常谨慎地进行。

我同意,一个模型必须有 "物理 "意义......一个模型越复杂,它就越脱离 "物理 "解释,在任何复杂的模型中,系数都是抽象的(除非它对应于很多或观察数字/球,计算波动率的乘数或类似的东西),神经网络是抽象的,随机森林也是抽象的,还有什么? 遗传学?也是一个抽象的模型

在回归中,系数通常被解释为一个因素的相关/影响的强度,计算系数的模数之和,并计算一个系数在总和中的份额--这将是变量影响的显著性水平,这是符合逻辑的。

当然,这不能总是用经济术语来表达(在这种情况下,你需要建立一个坚实的模型,你可以相信这些数字,但这是一个不同的层次),例如,如果你分析股票指数和宏观经济统计之间的关系,你会看到类似 "指数增长%对指数增长%"的东西,或者例如中央银行的账户余额和汇率之间没有直接关系,但模型可能显示有一种关系,不一定是客观关系(余额以某种方式影响汇率或反之),但模型显示同步变化,所以

如果模型只包含交易的工具,我们可以按手数重新计算系数--比物理解释更有意义