贝叶斯回归 - 有没有人用这种算法做了一个EA? - 页 35

 

什么,又不够????

嗯,为了更多。

因果关系:澳元新西兰元 多重R = .83469441 F = 3845.556

R?=.69671476 df=1.1674

病例数:1676 调整后的R=.69653358 p=.0000

估计数的标准误差:.053321255

截距:6.047516031 标准误差:0.0782142 t( 1674) = 77.320 p = 0.0000


 

控制到头部。

因果关系:NZDCAD多重R=.87619213 F=5532.591

R?=.76771265 df =1.1674

病例数:1676 调整后的R=.76757389 p=.0000

估计数的标准误差:0.032035522

截距:-2.664033151 标准误差:.0469913 t( 1674) = -56.69 p = 0.0000


 
Дмитрий:

R^2已经 "非常低 "了吗?

是否有关联性?

相关性是无法察觉的。R是弱的。我碰巧非常积极地使用R2来评估我的策略的股票质量,相信我,我已经看到了数百张R2与这里所展示的类似的图表。这个人完全是尖锐的,与SB没有区别。

 
Vasiliy Sokolov:

这种关系是无法察觉的。R是弱的。碰巧的是,我自己非常积极地使用R2来评估我的策略的股票质量,相信我,我已经看到了数百张图表,其R2大致是这里所介绍的那样。这个人完全是尖锐的,与SB没有区别。

))))))))))))))))))))))))))0
 

我记得我在R-project中做了以下事情:生成一千个随机的市场轨迹,每个人有一千个测量值。然后我对它们中的每一个进行了线性回归,得到了其R^2。结果,得到的R^2值向量变成了从零到0.99的均匀分布值......以约0.5的平均数。我建议大家重复我的结果,并思考我们所计算的本质。

s.w.太糟糕了,我手头没有R或这些代码,否则一张照片就能胜过千言万语......

 
Vasiliy Sokolov:
我记得在R-project中做过这样一件事:我生成了一千条随机的市场轨迹,每条都有一千次测量。然后我对它们中的每一个进行了线性回归,得到了其R^2。结果,得到的R^2值向量变成了从零到0.99的均匀分布值......以约0.5的平均数。我请大家重复我的结果,并思考我们所计算的本质。

И?

所写的内容有什么意义呢?那个回归分析不应该被使用,理由是第n个生成的PRNG系列中的一个可以显示出很大的R^2?

所以有必要抛开所有的数学统计和预测方法。

 
Vasiliy Sokolov:

我对小组成员对数学方法的高度掌握和对其适用原则的完全不理解感到惊讶。任何回归分析的相关数据。如果没有相关性,回归就不适用。如果所研究的量的分布不同于正态,参数统计方法也不适用。市场不具有规范性的属性。另外,市场作为一个过程并不取决于时间。这两个人都划掉了回归分析的想法,不管它的根源是什么。

问题是许多参与者,包括你,不理解回归,并使用晦涩的定义。在回归分析的正确定义中,误差的分布是没有限制的。最主要的是,这些误差在统计上必须是相互独立的,以使总的回归误差能够被表示为各个误差的函数之和。其他都是回归的特例。例如,误差正态性要求只适用于RMS回归,即当总的回归误差被表示为单个误差的平方之和时。这是最简单的回归方法,所以它导致解决一个线性方程组。如果你不想假设误差的正态性,可以使用任何其他分布。总误差将由其他一些单独误差的函数之和来表示,而不是平方之和。

让我试着这样解释。假设我们有测量值y和输入数据x。让我们在x上绘制y。y(x)的各点形成一些云。如果这个云是圆形的,各个方向上的点密度都很均匀,那么无论如何扭曲和拧动误差分布,模型y(x)都不存在,因为y和x是独立的。如果这个云层向某个方向延伸,那么我们就可以建立一个模型。在这种情况下,我们有几种模式选择。

1.构建线性y_mod(x)=a+b*x或非线性y_mod(x)=F(x)=例=a0+a1*x+a2*x^2+。模型。

2.假设测量误差e[i]=y[i]-y_mod[i]的独立性,我们假设它们的正态性err_sum = SUM e[i]^2,或者非正态性err_sum = SUM G(e[i]) 其中G()是任何 "非正态 "函数,例如G(e)=|e|,或者在一般情况下G(e)=|e|^p。我们可以变得扭曲,做一个误差函数,例如,对y[i]的负值给予更多权重。无论我们选择哪种G(e)都不会影响y作为x的函数的可预测性。它只影响我们如何画一条通过云的直线y(x)。例如,如果G(e)=e^10,那么这条直线将更接近于y的大值。

选择线性y_mod(x)=a+b*x或多项式y_mod(x)=a0+a1*x+a2*x^2+。模型取决于我们拉长的云的形状。在这两种情况下,我们都可以使用均方回归,这将导致一个线性方程组的快速解决。

现在我们来谈谈时间问题。如果y(t)和x(t)取决于时间,这几乎发生在所有的回归案例中,因为测量是在不同的时间点上进行的,这并不改变事情。我们仍然可以谈论回归y(t)=F(x(t))。如果函数y(t)=F(x(t))与时间有关,即y(t)=F(x(t),t),那么整个时间区间的静态回归y=F(x)就不适用。应该使用一个动态模型y=F(x,t)。

 
Vladimir:
根据一位数学家(我不记得他的姓,他在FINAM工作)的研究,分布接近于正态,尾部拉长(但可以理解为什么)。因此,线性回归,我认为,是今天的主宰。
 
Yuriy Asaulenko:
根据一位数学家(我不记得他的姓,他在FINAM工作)的研究,分布接近于正态,尾部拉长(但可以理解为什么)。因此,线性回归,我认为是相当好的。
我已经尝试了很多不同的错误分布。我没有注意到结果有什么特别的不同,但计算时间明显增加。这就是为什么我使用RMS回归。我不敢说它是线性的,因为函数y(x)在x变量中可能是非线性的,但在模型系数中是线性的,在这种情况下,平均平方回归仍然能明显加快计算速度。与其在正态性和回归的适用性理论上花这么多时间,不如谈谈准备输入数据,以便我可以画出这个云y(x),或者通过输入x和测量y的简单转换使其成为圆形。我们如何通过这块云画出一条直线或抛物线,并计算出建模误差(平方或绝对值)是次要的。
 

我向怀疑论者发出呼吁。

女士们,先生们,女士们,先生们,同志们!在你的酒精循环系统中,有太多的血液。

如果你还没有决定贝叶斯公式的概念性问题,你可以在R上建立什么数学模型:零条右边的市场是什么。那它是一个市场吗?或者是一个有适当算法的好的游戏模拟器?采取什么分布和似然函数?

世界并没有因为正态分布而走到一个幸福的终点。高斯出生时,贝叶斯已经死了。我建议采取正态分布,因为你们这些怀疑论者已经令人信服地展示了它。如果你们这些怀疑论者说它不适合,不适用,那么请提出一些适合的东西,而不是已经提出的东西。你的似然函数和分布规律 可以应用于贝叶斯公式,例如我在3月8日的帖子中第31页的花束下描述的那样。并看看会发生什么。