伯努利、莫布-拉普拉斯定理;科尔莫戈罗夫准则;伯努利方案;贝叶斯公式;切比雪夫不等式;泊松分布规律;费雪、皮尔逊、学生、斯米尔诺夫等定理、模型,语言简单,没有公式。 - 页 6

 
sergeyas:

让我们先听听阿列克谢的演讲,因为他是第一个这样做的人。

优素福和其他所有人,请不要把它看作是对你在这个问题上的知识的贬低。

与其说是一致性,不如说是你开始堆砌额外的术语,并超越了自己。



这是一个商人的疾病。害怕无法按下按钮。我自己也是这样。
 

正态分布的概念来自《布林格》第九章关于布林线的内容

 
 

这条线有望成为一个很好的知识宝库。

很久以前,我决定在实践中得到正态分布,为此我做了一个数字实验。我参加了500个累积系列的10000个独立测试。我们得到500个随机的无连接图。我们把它们作为同一参考点,看看它们将如何随着时间的推移而出现分歧,或者更确切地说,随着测试次数的增加而出现分歧。因此,他们的分歧将服从正态分布规律,在总体上,他们将形成一个正态分布的钟。

有趣的是,平均分歧将等于试验次数的平方根。因此,在1,000次试验之后,我们有权预期任何一个系列,都会离它原来的零点位置有32点的距离,而在1万次试验之后,它将只有100点距离。你可以通过铃铛的形状看到这一点。起初,它向两侧发散得足够猛烈,然后发散的 "速度 "开始下降。

一个有趣的事实是,所有500个系列的总和,无论其中有多少次试验,都将近似于零。这在图片中得到了完美的说明:在10000次试验后,50%的系列高于零,而50%的系列高于零。因此,所有系统的平均状态或数学期望值将趋于零。

因此,我有一个问题要问行家们: 如何计算实际的数学期望值与理论上的零MO的偏差?当然,毕竟没有什么可以期望所有测试的总和会明显等于0,它可能等于+3或-20左右。第二个问题:这个误差值是否会随着试验的增加而崩溃为零,还是会 "冻结 "在一个与试验次数的平方根成正比的水平?

 
C-4:

如何计算实际的数学期望值与理论上的偏离,即零MO?当然,毕竟没有什么可以期望所有测试的总和会明显为0,可能是+3或-20左右。第二个问题:这个误差值是否会随着试验的增加而崩溃为零,还是会 "冻结 "在一个与试验次数的平方根成正比的水平?


sb是独立随机变量的总和。让增量为正态分布,mo=0,sko=X。那么N个增量的总和也是NR,mo=0,sko=SQRT(N)*X,也就是你图中的情况(那里的N是10000)。

如果我们取M个这样独立的sbs之和,它也将是正态分布,mo=0,sko=SQRT(M*N)*X

因此,当试验次数增加时,总和不会冻结或趋于零,而是与试验次数的根成正比增加。 但是,由于已经考虑过的伯努利定理,当试验次数增加时,算术平均数(也是除以试验次数)将收敛到零。

 
什么是分布中的 "尾巴"?它们是与整体分布明显不相称的离群值吗?
 

Если взять сумму M таких независимых сб, то она так же буден распределена нормально с мо=0, ско=SQRT(M*N)*X

好吧,让我试着解决这个问题:给出10个累积系列,每个系列有10,000个测试。该系列的最终结果如下。

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
共计
40

M个独立兄弟姐妹的总和是+40。将结果代入公式。sqrt(40*10,000) * 100 = 63,245。不够用的东西结果就出来了。我一定是误解了 "M之和 "的意思。

还是说应该将所有的实验逐一排查,分析最终结果与M.O.的偏差?

 
C-4: 很久以前,我决定在实践中得到一个正态分布,为此我进行了一个数字实验。我参加了500个累积系列的10000个独立测试。我们得到500个随机不相关的图。我们把它们作为同一参考点,看看它们将如何随着时间的推移而出现分歧,或者更确切地说,随着测试次数的增加而出现分歧。因此,它们的分歧将服从正态分布规律,在总体上它们将形成正态分布的钟形。

说明正态分布不是一个好主意。我不确定在比如说10,000的时候停止这个过程会在横截面上完全得到一个正态分布。此外,这种分布的参数是不断变化的。

如果我错了--给我一个链接,其中声称 "截面"(即从零开始的发散)的分布至少是渐进正常的。

SProgrammer: 理解这一点是理解该定理中90%的关键。

没有配方,你就不会对肝脏有感觉。你自己也知道。但你不能在这里使用公式。

yosuf:这表明物料平衡方程的解法和定理法是一致的,它们在解释现象分析的结果时是相互补充的。

你没听说过伽马函数在科学和工程的各种领域都有吗?

我没有看到它在解决二叉戟时有什么超自然的表现。而你之所以提出伽马分布,是因为你看到了这个函数在Excel中的名称。好吧,你和一个德国人有什么联系,优素福

SProgrammer 正确地指出,在terver/matstat中实际使用的分布非常少--尽管你可以随心所欲地编造它们。所以对你来说,如果你仍然如此着迷(18岁),我建议你试着思考一下Erlang和你从哪里得到它。只是尽量把你的思考不是像上面引用的那种精辟的结论,而是以更完整的形式表达出来。

我查了Feller, vol. 2.有关于gamma-distribution的内容,但它有可怕的公式,只有几个关于Erlang的字。所以这里没有。

但是指数分布有一些有趣的地方(Feller, vol. 2, p. 69)。


这一点特别有意思,因为价格回报的分布很好地被拉普拉斯分布所近似。
 
C-4:

好吧,让我试着解决这个问题:给出10个累积系列,每个系列有10,000个测试。该系列的最终结果如下。

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
共计
40

M个独立兄弟姐妹的总和是+40。将结果代入公式。sqrt(40*10,000) * 100 = 63,245。结果是有些不充分。我一定是误解了 "M之和 "的意思。

还是说必须将所有的实验逐一排成一串,并分析最终结果与M.O.的偏差?


巴西尔,让我们从头开始。你是否将随机行走建模为硬币型增量的累积总和?两个结果+1和-1,概率相等,分别为0.5/0.5。这个随机变量本身不是正态分布--它是一个有2个值的离散分布。其MO=0,RMS=SQRT(0.5*0.5)=0.5

那么我们已经将随机行走视为这些增量的总和。假设我们像你一样采取10000的增量。它将等同于什么?很明显,它是一个随机变量(第二个)。如果增量是独立的,这个分布将随着试验次数的增加而收敛为正态,MO=0,RMS=SQRT(10000)*0.5=50。从这一点和3x西格玛法则为例,可以推断出,这个SV的99%以上的实现将落在-150...+150的区间。也就是说,在这个区间之外,不到10000*0.01=100个CB的实现。

那么你已经考虑了这些CB的总和。你在这一栏里有这个CB的10个实现的总和。它将是新的(已经是第三个)SA,它也是正态分布,MO=0,RMS=50*SQRT(10)=158。你所拥有的总数+40只是这第三个SV的一个实现。但它的差异相当大。同样,99%的数据将位于-474...+474的范围内。

 
鲸鱼理论家们已经忘记了我的小问题(