伯努利、莫布-拉普拉斯定理;科尔莫戈罗夫准则;伯努利方案;贝叶斯公式;切比雪夫不等式;泊松分布规律;费雪、皮尔逊、学生、斯米尔诺夫等定理、模型,语言简单,没有公式。 - 页 7

 
sever31: 什么是分布中的 "尾巴"?它们是明显被淘汰出分布的一般模式的异常值吗?

嗯,大致如此,但不尽然。是的,我们谈论的是一个随机变量的值与它的平均值有很大差别。

通常情况下,尾巴有粗有细。这里有一个非常宽松的尾巴定义:它是指一个异常点超过给定的概率。

尾巴的厚度不是由离群点本身的大小,即与平均值的偏差决定的,而是由这种强烈偏差的概率决定的。它越高,尾巴就越粗。

一般认为正态分布的尾巴很细。我不知道有什么实际分布的尾部比正态分布的尾部更细。

现在是对尾巴更精确的定义。但首先是一张照片和一个小小的介绍。

这就是众所周知的钟形图,也就是高斯分布。这里画的曲线是分布(这里是正态分布)的密度函数。底部画的是sigmas--标准偏差。西格玛是衡量一个分布(任何)有多窄或多宽的标准。

任何分布密度函数(f.p.r.,英文文献中的pdf,概率分布 函数)下的面积总是1。

任何pdf都是非负的。这实际上反映了一个事实:概率总是非负的。

如果我们想找到一个随机变量在西格玛和两个西格玛之间的概率(在平均值的右边),只需找到由垂直线 "+西格玛 "和 "+2*西格玛 "限定的曲线下的面积即可。让我们把它表示为:P( sigma <= X < 2*sigma)。请记住,即使在+1000*sigma时,这个函数仍然不等于零。是的,它下降得非常快(如mathExp(-x^2)),但它并没有变成零。

现在回到尾巴上。右尾是函数 right_tail( X; X0 ) = P( X0 <= X < infinity )。请再次注意,尾巴正好是X0的函数。X0越大(向右),函数通常越小。也就是说,通常(不总是,但渐进地总是)这个函数是一个从X0开始的递减函数,并趋向于零。

对于正态分布,right_tail_normal( X; X0 ) ~ mathExp(-X0^2) 或类似的东西(记不清了,是个非元素函数)。

但对于拉普拉斯分布(见我上一篇文章的图片)。


right_tail_laplace( X; X0 ) ~ mathExp(-a*X0)。注意:这已经是另一个趋于零的函数,比正态分布的尾部快得多!

这里还有一个--Cauchy分布。


对于它来说,right_tail_cauchy( X; X0 ) ~ 1 / X0。随着x的增加,这个函数的速度甚至慢到了零。

我们已经看到了三种不同的right_tail( X; X0 ) 函数。不同pdf的尾部的真正区别是不同pdf的这个函数的下降率不同。对于正态分布来说,函数的下降速度非常快(细尾),对于拉普拉斯分布来说,它的下降速度相当快,但无限快于第一个分布(已经是粗尾),对于考奇分布来说,它无限快于前两个分布(令人毛骨悚然的肥尾)。

 
Mathemat:

说明正态分布不是一个好主意。我不确定在比如说10,000的时候停止这个过程会在横截面上完全得到一个正态分布。另外,这种分布的参数是不断变化的。

如果可能的话,请详细说明这一点。坦率地说,我不明白为什么出现的铃声是不正常的。重点是,每条线都是一个粒子的游走轨迹,所有的粒子都有相同的二项式增量过程和有限的、相等的步数,因此任何聚合过程都有相同的聚合属性。参数如何变化?
 
C-4:
从这一点来说,如果你能详细说明。说实话,我不明白为什么抽到的铃声不正常?重点是,每条线都是粒子的游走轨迹,所有粒子都有相同的二项式增量过程和有限的、相等的步数, 。参数如何变化?

当然,这就是我想从你那里得到的细节。

1."所有粒子都有相同的二项式增殖过程"--解释这意味着什么。这是我第一次听到这样的过程。增量的分布函数是什么?

2."因此,任何聚合过程都有相同的聚合属性"--好吧,这也是完全不可理解的,根本不是数学问题。

如果你把这一整组轨迹的 "横截面 "放在标点上,比如说10000,那么每条轨迹都会在那里标记一个点。你怎么能确定所有这些点都是完全按照正常规律分布的?

 
Mathemat:

如果你把所有这组轨迹 "横切 "在标线上,比如说10000,那么每条轨迹都会在那里标记一个点。你怎么能确定所有这些点都是完全按照正常规律分布的?


中心极限定理。有关的随机变量是大量(10000)独立随机变量的总和,这意味着其分布接近于正态分布。
 

1. "все частицы обладают одним и тем же биноминальным процесоом приращения" - поясните, что это означает. Я впервые слышу о таком процессе. Какова функция распределения приращений?

也许我说得不准确。我的意思是, 又来自于离散随机变量的积累。-1 и +1.

如果你把所有这些累积的轨迹 "横切 "在标点上,比如说10000,那么每条轨迹都会在那里标记一个点。你怎么能确定所有这些点都是完全按照正常规律分布的?

现在我完全不明白,如果每个点都有相同的有效值和相同的10000步数,为什么这些点可以非正态分布?我们需要建立一个实验,并绘制概率命中率,我打赌它将是正常的,钟的顶部为零。

 

你说服了我,阿瓦尔斯

我是在挑衅你, C-4。我仍然不理解"二项式 递增过程"。好吧,让我们假设你的意思是按照某种规律分布的增量,具有有限的m.o.和方差。

 
在我的研究框架中,我需要生成一个OHLC类型的随机股票图。当涉及到回报时,一切都很简单:我们在MO和方差的指定范围内生成随机数(Excel允许这样做),但如何从这些回报中创建OHLC类型的图表,这就是问题。困难在于如何定义与开盘和收盘有关的高点和低点的正常范围。这就是为什么我请专家建议如何正确地从回归者身上赚取OHLC。当然,人们当然可以随机生成每个刻度,并从OHLC蜡烛图的刻度历史 中 "收集",但这是一个非常缓慢和毫无意义的方法。
 
C-4: 当然,也可以随机生成每个tick,并从tick历史中 "组装 "OHLC蜡烛,但这是一个非常缓慢和无意义的方法。
但它是非常准确的,因为它不需要引入几个任意的参数。但这并不能避免了解勾股过程的统计特征的必要性:)。而且它在某些方面与维纳不相上下。例如,它比标准的维纳工艺有更多的可返回性。
 

是的,确实非常准确。但问题出在速度上。我只是在用C#+WealthLab写作--而且是相当麻烦的一群。我试着生成100个条形图,每个条形图有3000个刻度,最后花了8-10秒。我需要生成至少50万条,最好是3-4百万条(大约10年的一分钟历史)。

似乎公式的输入应该是方差、MO、点数,输出应该有一个OHLC条。它看起来像这样。

让我们简化第一个近似值的任务:让我们生成完全 "正常 "的OHLC。让它成为一个经典的正态分布。另一件事是,之后我们想根据这个公式生成一个近似于真实市场的分布--比如说,采取工具的真实波动率,并根据它生成一个随机的OHLC。

 
随心所欲。我不能给你建议,因为我不知道勾兑过程的特点。