手机浏览器扫描二维码访问
第20讲在抛硬币或天体观测时观察到的“正态分布”
20-1统计学的主角——“正态分布”
在统计学中,最常用的是被称为“正态分布”的连续型概率分布。在标准统计学(内曼-皮尔逊统计学)中如此,在贝叶斯统计学中亦是如此。
正态分布之所以应用如此广泛的原因,主要有两个:
第一,正态分布有着十分便利的数学操作性,这一点在后面将会涉及。第二,正态分布是一种在自然界和社会中频繁出现的概率分布。本节将对第二点进行简要说明。
最初发现正态分布的实验是这样的:投掷N枚硬币时,把出现正面的x枚硬币的概率记为p(x),当N足够大的时候,p(x)的分布图会呈现出特殊的形状(吊钟型)。亚伯拉罕-棣莫弗和拉普拉斯等数学家发现了该图表中对应的函数,即图表20-1的公式。
此后,数学家高斯在担任天文台主任时,通过分析天体观测时的误差所呈现出来的概率分布,也推导出了同样的分布图。
图表20-1标准正态分布
在高斯的研究之后,随着概率理论和统计学的进步,人们发现,在很多场合都能够观察到这样的正态分布。例如,通过观察包括人类在内的各种各样的生物种群,可以发现了同一种群的体长遵循正态分布的规律。此外,在体内的构成物(血液等)的分布,也呈正态分布趋势;在收到电波时出现的噪音中,也观察到了正态分布的现象。而最近的股票收益率也呈正态分布,这是个强有力的证明。总之,正态分布出现在我们身边的很多现象中。
20-2呈现吊钟型的正态分布
正态分布是指,分布图呈现特殊形状的一类分布。为了让大家了解具体的形状,首先,我们来看被称为“标准正态分布”代表性图表——图表20-1。横轴x表示类别的数值,纵轴y表示的是出现的概率密度,该图表具有如下特征:
·以y轴(x=0)为轴,左右对称。
·图像呈为吊钟型(铃型),最高点在x=0的位置。
·无论x取何值,y也不会等于0(图表向左右两侧无限延伸)。
·在x≥2的部分,图像急剧下降;同样,在x≤-2的部分,图像也急剧下降。
图表20-2标准正态分布的概率
图表20-1右上方横向写的,是表示概率密度的函数的公式,公式本身非常复杂,估计大多数读者看了会眼花吧。系数的分母是以圆周率π的平方根的形式出现的,不过,这并不重要(只是为了满足标准化条件),而重要的是:无理数e(纳皮尔常数)的取幂,以及二次函数的指数部分为负的系数。这正是图像呈之前所述的形状和特征的原因所在。但后面的内容中不会再出现这个函数,因此简单了解即可,即使后面忘记了也没关系。
这个一是连续型的概率分布。由于高度y表示的并非概率,而是概率密度,因此,“有宽度的部分的面积才是概率”这一点,与贝塔分布是一样的。例如,在满足-1≤x≤1时观察到x的概率,表示为图表20-2中涂有颜色部分的面积,其概率约为0.6826。
20-3正态分布由“μ”和“σ”决定
一般的正态分布,可以从标准正态分布中轻而易举地获得,只要把图表按照以下步骤进行变形即可。
步骤1:以y轴为中心,向左右两侧延伸σ倍(σ希腊字母,读作“西格马”)。为了满足标准化条件(面积之和为1),各部分的高度需为σ分之1。
步骤2:横向平行移动,直到对应函数顶点的x坐标为μ(希腊字母,读作“缪”)为止。
现在,针对μ和σ的作用进行说明。
μ是概率分布的平均值。换言之,即为“挑担人偶的平衡支点”。由于其左右对称的,因此位于函数图像的顶点位置。而σ是被称为标准偏差的指标,表示分布中的“分散”“扩大”的程度。
接下来,用形象的方式来说明“分散”“扩大”的概念。由于平均值μ位于概率分布图顶点的位置,因此,最容易观察到数值。因而,如果被问到“你能预言可以观察到什么吗”的时候,回答“我可以预言在‘μ附近’”,是比较稳妥的。但是,若说这个预言的准确度如何,则要依存于“分散”“扩大”的程度。如果是分布的状态为山顶高、山脚低,那么由于μ附近的数值容易被观察到,则预言的准确度相对较高。但如果分布的状态为山顶低、山脚高,那么反而会观察到,远离μ的数值出现的频率高。因此,偏离预言的可能性就会增高,导致准确度降低。
也就是说,我们可以想象为,标准偏差σ表示的是“从观察值的平均值中,误差偏差的程度”的指标。本书后面不对标准偏差进行更深入的探讨,如果想了解更多内容,可以参考相关书目《完全自学统计学入门》(详见参考文献⑨)。
那么,只要确定μ和σ,就能决定一个一般的正态分布。尤其是标准正态分布,它对应μ=0、σ=1。
用σ=2、μ=3来举例说明上述内容,则如图表20-3所示。
图表20-3一般的正态分布
上方部分为标准正态分布的分布图,顶点在x=0的位置,扩大宽度为1。下方左侧的图像为,将该标准正态分布向左右两侧扩大2倍之后得到的图像。此时,函数图像的倾斜度稍微平缓了一些。为了保证总面积为1,其对应的x位置的高度同样需要变为12。通过这个操作,可以得出标准偏差σ=2的正态分布(平均值μ保持为0不变)。下方右侧的图为,将该图像向右平行移动+3后得到的图像。那么顶点自然变为了x=3所对应的位置。通过这个操作,可以得出平均值μ=3的正态分布。按照这样的方式,可以得到μ=3、σ=2的正态分布的概率分布图。
综上,可以得出以下结论:
一般正态分布的性质
?只要赋予平均值μ和标准偏差σ,就能确定一个正态分布。
?μ的含义为分布的平均值。表示为图表的顶点位置,因此也是挑担人偶的平衡支点。
导演!不应该如此草率,带你见证做牛导演的诞生。...
踏上这片绿茵,我就是足坛第一狂徒!本书又名踢球,从断腿开始。跟我走吧,带你体验足球世界的疯狂与残酷!...
前世被人陷害,满门抄斩。重生归来,她势要披荆斩棘,杀出一条血路!...
...
◆晚九点日更◆疯度翩翩x美艳色批◆强取豪夺x强取豪夺◆接档僧妻外室今天喀血了吗求收,文案最下—本文文案—一裴三郎君颜如清风玉雪,晕然动人,是京城闺秀们心目中的檀郎。关瑶,也觊觎了他好几年。一朝再遇,她多番撩拔,得手和失败间来来回回数次后,关瑶决定既然追不到,那就…抢吧!发榜之日,关瑶趁乱把人抢回府,硬是摁着头和自己拜了堂。夫君霎阴霎晴,高冷冻人,偏她口味特殊,还就喜欢这人傲得跟孔雀似的。只某日,她一如既往去缠他,边抱着小臂晃了晃,边拉着长音撒娇夫君呀裴和渊与她对视几息,忽然凑过来吧唧亲了她一口,当场给关瑶亲蒙了。狗血淋头,这厮…居然失忆了?失忆后的裴和渊,犹如云中仙人摔进麦芽糖堆,学了一身黏人的本领,恨不得天天在后头给她提裙。清冷谪仙劲儿化了灰,关瑶受不了没脸没皮这货,干脆留了和离书。二醒自一场漫长的梦,裴和渊发现自己多了个娘子。娘子秾丽绝艳,柳骨葳蕤,简直就是他梦中神女!像是走路凭空捡到宝,裴和渊自此转了性,天天就想和娘子恩爱不离,就差把宠妻如命四个字刻在脑门儿上。正当他暗自得意于自己眼光好,寻了这么个美艳可人的妻时,突然天降和离书与一大笔钱,还留了话让他去瞧瞧脑子???好极,这刺激可大发了,他不仅恢复全部记忆,还有了新目标。抢怎么了?她不也抢过他?待之以人,还之彼身罢了。三数月后,关瑶正美滋滋吃着冰,前夫突然出现在跟前,平静问她娘子,跟我回去,还是我绑你回去,你且选一个。声音低凉清润,可那双清和剔透的眸子,这会黑寂如潭,神鬼莫挨。六月的天,关瑶瞬间打了个冷颤。救命啊你怎么还有第三幅面孔呢?媳妇儿你看我骚得可爱否?和离后我被迫破镜重圆了排雷◆1v1双洁双处,重生文◆男主又冷又疯莫得底线,女主有钱有颜冇得脑子◆男女主都不是正经人,极扯,剧情狗血味儿重,熏人且冲鼻◆男女主人设不完美,完美的人设你绑架我壁咚我强吻我,我也写不粗来(摊手jpg)◆朝代架空◆全员猛女—★外室今天喀血了吗文案★一某次执行任务时,沃檀救了个容色澄彻的美郎君。她见色起意,想着男人都爱养外室,决定自己也养个玩玩。可救人后沃檀发现,她那外室是个爱吐血的病秧子。推他一把,他立马倒地。亲他一口,他当场闭气。跟他开句黄腔,他能咳到撅过去好在病秧子除了不能睡,人还是蛮勤快,煮饭浆洗样样习得,起码她执行完任务回到家,能喝到口热乎粥了。而且病秧子脾气顶好,很是温怜可亲。在宅子里,她操刀舞剑,他抚琴赋诗,两人看起来九不搭八,十分般配。直到后来,她得知这人就是她大主子的对家,当朝九王爷。且武功,不一定在她之下。知晓真相那日,沃檀提着剑往家赶,咬着牙在想是先杀了他,再上了他,还是先上了他,再杀了他?二九王爷景昭恭俭仁恕,行之有纲,是先帝最为宠爱的儿子。若非身有不足之症,早便入主东宫当了太子。某日他意外遭刺,亲卫悉数被杀,人也不知所踪。后来,卫从们找到人时,他们王爷正被个女流氓抱着腰舔脸。王爷耳根通红,无奈地偏了偏脸,温声哄那女流氓先用膳吧。卫从们涕泪横流这太作孽了!他们得以死谢罪啊!直到后来,值守的卫士看到他们不愿意回王府的爷,故意把袍子扯得松松垮垮,敞着颈下锁骨,勾引人家小姑娘过来摸卫从们纷纷以手掩面瞎了算了。...