伯努利、莫布-拉普拉斯定理；科尔莫戈罗夫准则；伯努利方案；贝叶斯公式；切比雪夫不等式；泊松分布规律；费雪、皮尔逊、学生、斯米尔诺夫等定理、模型，语言简单，没有公式。

Sceptic Philozoff 2011.12.13 19:44 #61

sever31: 什么是分布中的 "尾巴"？它们是明显被淘汰出分布的一般模式的异常值吗？

嗯，大致如此，但不尽然。是的，我们谈论的是一个随机变量的值与它的平均值有很大差别。

通常情况下，尾巴有粗有细。这里有一个非常宽松的尾巴定义：它是指一个异常点超过给定的概率。

尾巴的厚度不是由离群点本身的大小，即与平均值的偏差决定的，而是由这种强烈偏差的概率决定的。它越高，尾巴就越粗。

一般认为正态分布的尾巴很细。我不知道有什么实际分布的尾部比正态分布的尾部更细。

现在是对尾巴更精确的定义。但首先是一张照片和一个小小的介绍。

这就是众所周知的钟形图，也就是高斯分布。这里画的曲线是分布（这里是正态分布）的密度函数。底部画的是sigmas--标准偏差。西格玛是衡量一个分布（任何）有多窄或多宽的标准。

任何分布密度函数（f.p.r.，英文文献中的pdf，概率分布函数）下的面积总是1。

任何pdf都是非负的。这实际上反映了一个事实：概率总是非负的。

如果我们想找到一个随机变量在西格玛和两个西格玛之间的概率（在平均值的右边），只需找到由垂直线 "+西格玛 "和 "+2*西格玛 "限定的曲线下的面积即可。让我们把它表示为：P( sigma <= X < 2*sigma)。请记住，即使在+1000*sigma时，这个函数仍然不等于零。是的，它下降得非常快（如mathExp(-x^2)），但它并没有变成零。

现在回到尾巴上。右尾是函数 right_tail( X; X0 ) = P( X0 <= X < infinity )。请再次注意，尾巴正好是X0的函数。X0越大（向右），函数通常越小。也就是说，通常（不总是，但渐进地总是）这个函数是一个从X0开始的递减函数，并趋向于零。

对于正态分布，right_tail_normal( X; X0 ) ~ mathExp(-X0^2) 或类似的东西（记不清了，是个非元素函数）。

但对于拉普拉斯分布（见我上一篇文章的图片）。

right_tail_laplace( X; X0 ) ~ mathExp(-a*X0)。注意：这已经是另一个趋于零的函数，比正态分布的尾部快得多!

这里还有一个--Cauchy分布。

对于它来说，right_tail_cauchy( X; X0 ) ~ 1 / X0。随着x的增加，这个函数的速度甚至慢到了零。

我们已经看到了三种不同的right_tail( X; X0 ) 函数。不同pdf的尾部的真正区别是不同pdf的这个函数的下降率不同。对于正态分布来说，函数的下降速度非常快（细尾），对于拉普拉斯分布来说，它的下降速度相当快，但无限快于第一个分布（已经是粗尾），对于考奇分布来说，它无限快于前两个分布（令人毛骨悚然的肥尾）。

Bernoulli, Moab-Laplace theorem; Kolmogorov

Vasiliy Sokolov 2011.12.15 05:49 #62

Mathemat:

说明正态分布不是一个好主意。我不确定在比如说10,000的时候停止这个过程会在横截面上完全得到一个正态分布。另外，这种分布的参数是不断变化的。

如果可能的话，请详细说明这一点。坦率地说，我不明白为什么出现的铃声是不正常的。重点是，每条线都是一个粒子的游走轨迹，所有的粒子都有相同的二项式增量过程和有限的、相等的步数，因此任何聚合过程都有相同的聚合属性。参数如何变化？

Sceptic Philozoff 2011.12.15 06:13 #63

C-4:
从这一点来说，如果你能详细说明。说实话，我不明白为什么抽到的铃声不正常？重点是，每条线都是粒子的游走轨迹，所有粒子都有相同的二项式增量过程和有限的、相等的步数，。参数如何变化？

当然，这就是我想从你那里得到的细节。

1."所有粒子都有相同的二项式增殖过程"--解释这意味着什么。这是我第一次听到这样的过程。增量的分布函数是什么？

2."因此，任何聚合过程都有相同的聚合属性"--好吧，这也是完全不可理解的，根本不是数学问题。

如果你把这一整组轨迹的 "横截面 "放在标点上，比如说10000，那么每条轨迹都会在那里标记一个点。你怎么能确定所有这些点都是完全按照正常规律分布的？

Avals 2011.12.15 06:35 #64

Mathemat:

如果你把所有这组轨迹 "横切 "在标线上，比如说10000，那么每条轨迹都会在那里标记一个点。你怎么能确定所有这些点都是完全按照正常规律分布的？

中心极限定理。有关的随机变量是大量（10000）独立随机变量的总和，这意味着其分布接近于正态分布。

Vasiliy Sokolov 2011.12.15 06:45 #65

1. "все частицы обладают одним и тем же биноминальным процесоом приращения" - поясните, что это означает. Я впервые слышу о таком процессе. Какова функция распределения приращений?

也许我说得不准确。我的意思是，这又来自于离散随机变量的积累。-1 и +1.

如果你把所有这些累积的轨迹 "横切 "在标点上，比如说10000，那么每条轨迹都会在那里标记一个点。你怎么能确定所有这些点都是完全按照正常规律分布的？

现在我完全不明白，如果每个点都有相同的有效值和相同的10000步数，为什么这些点可以非正态分布？我们需要建立一个实验，并绘制概率命中率，我打赌它将是正常的，钟的顶部为零。

Sceptic Philozoff 2011.12.15 06:50 #66

你说服了我，阿瓦尔斯。

我是在挑衅你， C-4。我仍然不理解"二项式递增过程"。好吧，让我们假设你的意思是按照某种规律分布的增量，具有有限的m.o.和方差。

Vasiliy Sokolov 2012.04.12 05:54 #67

在我的研究框架中，我需要生成一个OHLC类型的随机股票图。当涉及到回报时，一切都很简单：我们在MO和方差的指定范围内生成随机数（Excel允许这样做），但如何从这些回报中创建OHLC类型的图表，这就是问题。困难在于如何定义与开盘和收盘有关的高点和低点的正常范围。这就是为什么我请专家建议如何正确地从回归者身上赚取OHLC。当然，人们当然可以随机生成每个刻度，并从OHLC蜡烛图的刻度历史中 "收集"，但这是一个非常缓慢和毫无意义的方法。

Sceptic Philozoff 2012.04.12 06:01 #68

C-4: 当然，也可以随机生成每个tick，并从tick历史中 "组装 "OHLC蜡烛，但这是一个非常缓慢和无意义的方法。

但它是非常准确的，因为它不需要引入几个任意的参数。但这并不能避免了解勾股过程的统计特征的必要性:)。而且它在某些方面与维纳不相上下。例如，它比标准的维纳工艺有更多的可返回性。

Vasiliy Sokolov 2012.04.12 06:07 #69

是的，确实非常准确。但问题出在速度上。我只是在用C#+WealthLab写作--而且是相当麻烦的一群。我试着生成100个条形图，每个条形图有3000个刻度，最后花了8-10秒。我需要生成至少50万条，最好是3-4百万条（大约10年的一分钟历史）。

似乎公式的输入应该是方差、MO、点数，输出应该有一个OHLC条。它看起来像这样。

让我们简化第一个近似值的任务：让我们生成完全 "正常 "的OHLC。让它成为一个经典的正态分布。另一件事是，之后我们想根据这个公式生成一个近似于真实市场的分布--比如说，采取工具的真实波动率，并根据它生成一个随机的OHLC。

Sceptic Philozoff 2012.04.12 06:08 #70

随心所欲。我不能给你建议，因为我不知道勾兑过程的特点。

伯努利、莫布-拉普拉斯定理；科尔莫戈罗夫准则；伯努利方案；贝叶斯公式；切比雪夫不等式；泊松分布规律；费雪、皮尔逊、学生、斯米尔诺夫等定理、模型，语言简单，没有公式。 - 页 7