《大数定律及中心极限定理PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《大数定律及中心极限定理PPT讲稿.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数定律及中心极限定理第1页,共59页,编辑于2022年,星期六1 在数学中大家都注意到在数学中大家都注意到这样这样的的现现象:有象:有时时候一个有限候一个有限的和很的和很难难求求,但一但一经经取极限由有限取极限由有限过过渡到无限渡到无限,则问题则问题反反而好而好办办.例如例如,若若对对某一某一x,要要计计算和算和 而一而一经经取极限,取极限,则则有有简单简单的的结结果果 第2页,共59页,编辑于2022年,星期六2 事事实证实证明明这这是可能的,而且在一般情况下和的极限分布是可能的,而且在一般情况下和的极限分布就是就是正态分布正态分布,由此可,由此可见见正正态态分布的重要性。分布的重要性。对
2、对和的分布收和的分布收敛敛于正于正态态分布的分布的这这一一类类极限定理的研究,在极限定理的研究,在长长达两个世达两个世纪纪的的时时期内成了概率期内成了概率论论研究的中心研究的中心课题课题,因此得到了,因此得到了“中心极限中心极限定理定理”的名称。本章将列述的名称。本章将列述这类这类定理中最定理中最简单简单,然而也,然而也是最重要的情况。是最重要的情况。第3页,共59页,编辑于2022年,星期六3 在概率在概率论论中,另一中,另一类类重要的极限定理是所重要的极限定理是所谓谓“大数大数定律定律”。在第一章中我在第一章中我们们已已经讨论经讨论了了“频率的稳定性频率的稳定性”。大量的重复大量的重复试验
3、试验中,事件中,事件A发发生的生的频频率接近某个常数,率接近某个常数,这这个常数个常数实际实际上就是事件上就是事件发发生的概率。生的概率。“大数大数”的意思,就的意思,就是指是指试验试验数目是大量的。数目是大量的。第4页,共59页,编辑于2022年,星期六41 1 大数定律大数定律 随机随机变变量的方差是刻画它量的方差是刻画它围绕围绕其期望其期望值值的离散程的离散程度的,因此我度的,因此我们们希望用方差来估希望用方差来估计计随机随机变变量与其期望量与其期望值值之之间间的偏差大于某一的偏差大于某一给给定正数的概率的上界。定正数的概率的上界。定理定理成立成立.一、切比雪夫不等式一、切比雪夫不等式第
4、5页,共59页,编辑于2022年,星期六5证证设设X是是连续连续型随机型随机变变量,其概率密度量,其概率密度为为f(x),则则 定理定理成立成立.第6页,共59页,编辑于2022年,星期六6上式可改写为上式可改写为 切切比雪夫不等式具体地估算了随机变量比雪夫不等式具体地估算了随机变量X取值时,取值时,以数学期望以数学期望E(X)为中心的分散程度。不难看出,方差为中心的分散程度。不难看出,方差D(X)越小,则随机变量越小,则随机变量X的取值越集中在数学期望的取值越集中在数学期望E(X)的附近,由此可以进一步体会到方差的概率意义,的附近,由此可以进一步体会到方差的概率意义,它刻划了随机变量的分散程
5、度。它刻划了随机变量的分散程度。如取如取第7页,共59页,编辑于2022年,星期六7例例1 1 已知正常男性成人血液中,每一毫升白细胞数平均已知正常男性成人血液中,每一毫升白细胞数平均是是7300,均方差是,均方差是700.利用切比雪夫不等式估计每毫升利用切比雪夫不等式估计每毫升白细胞数在白细胞数在52009400之间的概率之间的概率.设每毫升白细胞数为设每毫升白细胞数为X,依题意,依题意,E(X)=7300,D(X)=7002,解解由切比雪夫不等式,由切比雪夫不等式,第8页,共59页,编辑于2022年,星期六8例例2 2 根据过去统计资料,某产品的次品率为根据过去统计资料,某产品的次品率为p
6、=0.05,试用试用切比雪夫不等式估计切比雪夫不等式估计1000件产品中,次品数在件产品中,次品数在4060之间之间的概率的概率.解解设设X表示表示1000件产品中的次品数,则件产品中的次品数,则 由切比雪夫不等式,由切比雪夫不等式,第9页,共59页,编辑于2022年,星期六9 该该数数值值是非常保守的估是非常保守的估计计,事,事实实上,由中心极限定理可上,由中心极限定理可知,概率知,概率约为约为 注注:第10页,共59页,编辑于2022年,星期六10记作记作第11页,共59页,编辑于2022年,星期六11几个常见的大数定律几个常见的大数定律定理定理1 1(切比雪夫大数定律)切比雪夫大数定律)
7、设设 X1,X2,是相互独立的随机变是相互独立的随机变量序列,它们都有有限的方差,并且量序列,它们都有有限的方差,并且方差有共同的上界,即方差有共同的上界,即 D(Xi)C,i=1,2,,则对任意的则对任意的 有有或或依概率收敛依概率收敛第12页,共59页,编辑于2022年,星期六12证证两两边夹边夹,即得结论即得结论.第13页,共59页,编辑于2022年,星期六13解释:解释:取值接近于其数学期望的概率接近于取值接近于其数学期望的概率接近于1.当当n充分大时,充分大时,差不多不再是随机的了差不多不再是随机的了,第14页,共59页,编辑于2022年,星期六14定理定理2 2(贝努里(贝努里大数
8、定律大数定律)或或 下面给出的贝努里大数定律下面给出的贝努里大数定律,是是定理定理1的一种特例的一种特例.设设nA是是n重贝努里试验中事件重贝努里试验中事件A发生发生的次数,的次数,p是事件是事件A发生的概率,则对任发生的概率,则对任给的给的 ,有有第15页,共59页,编辑于2022年,星期六15引入引入i=1,2,n则则 而而 由由切比雪夫大数定律,切比雪夫大数定律,第16页,共59页,编辑于2022年,星期六16是事件是事件A发生的频率,发生的频率,伯努里大数定律表明,当重复试验次数伯努里大数定律表明,当重复试验次数n充分大时,充分大时,事件事件A发生的频率发生的频率nA/n与事件与事件A
9、的概率的概率p有较大偏差的概有较大偏差的概率很小率很小.这这就是就是频率稳定性频率稳定性的理的理论论解解释释。历历史上,史上,贝努里贝努里第一个研究了第一个研究了这这种种类类型的极限定理,型的极限定理,在在1713年年发发表的表的论论文中文中(这这是概率是概率论论的第一篇的第一篇论论文文!),他他建立了以上定理。所以有人建立了以上定理。所以有人认为认为,概率,概率论论的真正的真正历历史史应应从出从出现现贝努里贝努里大数定律的大数定律的时时刻算起。刻算起。第17页,共59页,编辑于2022年,星期六17 下面给出的独立同分布下的大数定律,下面给出的独立同分布下的大数定律,不要求随机变量的方差存在
10、不要求随机变量的方差存在.设随机变量序列设随机变量序列X1,X2,独立同分布,独立同分布,具有有限的数学期望具有有限的数学期望 E(Xi)=,i=1,2,,定理定理3 3(辛钦大数定律辛钦大数定律)辛钦辛钦 辛钦大数定律为寻找随机变量的期望值提供了一辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径条实际可行的途径.第18页,共59页,编辑于2022年,星期六18 例如要估计某地区的平均亩产量,要收割某些有例如要估计某地区的平均亩产量,要收割某些有代表性的地块,例如代表性的地块,例如n 块块.计算其平均亩产量,则计算其平均亩产量,则当当n 较大时,可用它作为整个地区平均亩产量的一较大时
11、,可用它作为整个地区平均亩产量的一个估计个估计.第19页,共59页,编辑于2022年,星期六19例例3 3解解切比雪夫大数定理条件有两条:切比雪夫大数定理条件有两条:1、随机随机变变量序列要相互独立量序列要相互独立;2、各个随机各个随机变变量的方差均存在且有界量的方差均存在且有界.四个四个选项选项中,独立性条件均中,独立性条件均满满足,但惟独足,但惟独(D)中,中,故选故选(D).第20页,共59页,编辑于2022年,星期六20 将一枚均匀对称的骰子重复掷将一枚均匀对称的骰子重复掷n次,则当次,则当n 时,时,求求n次掷出点数的算术平均值依概率收敛的极限次掷出点数的算术平均值依概率收敛的极限
12、例例4 4解解其共同的数学期望为其共同的数学期望为 第21页,共59页,编辑于2022年,星期六21练习:练习:P104 习题习题 5-1 1.第22页,共59页,编辑于2022年,星期六222 2 中心极限定理中心极限定理 中心极限定理从理中心极限定理从理论论上上证证明,明,对对于大量的独立随于大量的独立随机机变变量来量来说说,只要每个随机,只要每个随机变变量在量在总总和中所占比重很和中所占比重很小,那么不小,那么不论论其中各个随机其中各个随机变变量的分布函数是什么形量的分布函数是什么形状,也不状,也不论论它它们们是已知是已知还还是未知,而它是未知,而它们们的和的分布的和的分布函数必然和正函
13、数必然和正态态分布函数很近似。分布函数很近似。这这就是就是为为什么什么实际实际中遇到的随机中遇到的随机变变量很多都服从正量很多都服从正态态分布的原因,也正分布的原因,也正因如此,正因如此,正态态分布在概率分布在概率论论和数理和数理统计统计中占有极其重中占有极其重要的地位。要的地位。第23页,共59页,编辑于2022年,星期六23下面介下面介绍绍几个常用的中心极限定理。几个常用的中心极限定理。在概率论中,习惯于把和的分布收敛于正态分在概率论中,习惯于把和的分布收敛于正态分布这一类定理都叫做布这一类定理都叫做中心极限定理中心极限定理.第24页,共59页,编辑于2022年,星期六24 由于无穷个随机
14、变量之和可能趋于由于无穷个随机变量之和可能趋于,故我们,故我们不直接研究不直接研究n个随机变量之和,本身而考虑它的个随机变量之和,本身而考虑它的标准标准化化的随机变量的随机变量的分布函数的极限的分布函数的极限.第25页,共59页,编辑于2022年,星期六25列维一林德伯格中心极限定理列维一林德伯格中心极限定理第26页,共59页,编辑于2022年,星期六26(证证略)略)第27页,共59页,编辑于2022年,星期六27此定理此定理说说明明,当当n充分充分大大时时,有有 或或第28页,共59页,编辑于2022年,星期六28 将将n个观测数据相加时,首先对小数部分按个观测数据相加时,首先对小数部分按
15、“四舍五入四舍五入”舍去小数位后化为整数试利用中心极限定理估计,舍去小数位后化为整数试利用中心极限定理估计,例例1 1解解(1)(1)当当n=1500时时,舍入误差之和的绝对值大于舍入误差之和的绝对值大于15的概率;的概率;(2)(2)n满足何条件时,能以不小于满足何条件时,能以不小于0.90的概率使舍入误差的概率使舍入误差 之和的绝对值小于之和的绝对值小于10 根据列维根据列维-林德伯格中心极限定理,当林德伯格中心极限定理,当n充分大时充分大时 第29页,共59页,编辑于2022年,星期六29(1)(1)第30页,共59页,编辑于2022年,星期六30(2)(2)数据个数数据个数n应满足条件
16、:应满足条件:即当即当 时,才能使误差之和的绝对值小于时,才能使误差之和的绝对值小于10的的概率不小于概率不小于0.90 第31页,共59页,编辑于2022年,星期六31 一生产线生产的产品成箱包装,每箱的重量是随机的一生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱的平均重假设每箱的平均重50千克千克,标准差标准差5千克千克.若用最大载重量为若用最大载重量为5吨的汽车承运吨的汽车承运,试利用中心极限定理说明每辆车最多可以装试利用中心极限定理说明每辆车最多可以装多少箱多少箱,才能才能保证保证不超载的概率大于不超载的概率大于0.977.例例2 2解解由列由列维维-林德伯格中心极限定理林德伯
17、格中心极限定理,有有 总重量总重量第32页,共59页,编辑于2022年,星期六32所以所以n必须满足必须满足即最多可以装即最多可以装98箱箱.第33页,共59页,编辑于2022年,星期六33下面下面给给出上述定理的一个重要特例。出上述定理的一个重要特例。棣莫弗棣莫弗-拉普拉斯拉普拉斯(De Moivre-Laplace)中心极限定理中心极限定理证证由列由列维维一林德伯格定理可知,一林德伯格定理可知,第34页,共59页,编辑于2022年,星期六34由列由列维维一林德伯格定理可知,一林德伯格定理可知,第35页,共59页,编辑于2022年,星期六35由列由列维维一林德伯格定理可知,一林德伯格定理可知
18、,第36页,共59页,编辑于2022年,星期六36或或即有近似即有近似计计算公式算公式 第37页,共59页,编辑于2022年,星期六37例例3 3 设设在某保在某保险险公司有公司有1万万个人参加投保个人参加投保,每人每年付每人每年付120元保元保险费险费.在一年内一个人死亡的概率在一年内一个人死亡的概率为为0.006,死亡死亡时时其家属可向保其家属可向保险险公司公司领领得得1万万元元,问问:(1)该该保保险险公司公司亏亏本本的概率的概率为为多少多少?(2)该该保保险险公司一年的利公司一年的利润润不少于不少于40,60,80万万元的概率各是多少元的概率各是多少?解解设设一年内死亡的人数一年内死亡
19、的人数为为X,则则 由由D-L中心极限定理中心极限定理,即即该该保保险险公司公司亏亏本的概率本的概率几乎几乎为为0.第38页,共59页,编辑于2022年,星期六38第39页,共59页,编辑于2022年,星期六39 (供电问题供电问题)某车间有某车间有200台车床台车床,在生产期间由于在生产期间由于需要检修、调换刀具、变换位置及调换零件等常需停车需要检修、调换刀具、变换位置及调换零件等常需停车.设开工率为设开工率为0.6,并设每台车床的工作是独立的,且在开并设每台车床的工作是独立的,且在开工时需电力工时需电力1千瓦千瓦.问应供应多少瓦电力就能以问应供应多少瓦电力就能以99.9%的概率保证该车间不
20、会因供电不足而影响生产的概率保证该车间不会因供电不足而影响生产?例例4 4解解某一时刻开动的车床数某一时刻开动的车床数 要求最小的要求最小的k,使使 由由D-L中心极限中心极限定理定理,第40页,共59页,编辑于2022年,星期六40查表得查表得 所以若供所以若供电电141.5千瓦,那么由于供千瓦,那么由于供电电不足而影响不足而影响生生产产的可能性不到的可能性不到0.001,相当于,相当于8小小时时内内约约有半分有半分钟钟受影受影响,响,这这一般是允一般是允许许的。的。第41页,共59页,编辑于2022年,星期六41例例5 5 某产品次品率某产品次品率 p=0.05,试估计在试估计在1000件
21、产品中次品数件产品中次品数在在 4060 之间的概率之间的概率.解解次品数次品数由由D-L中心极限中心极限定理定理,第42页,共59页,编辑于2022年,星期六42次品数次品数注注由切比雪夫不等式由切比雪夫不等式,显然这是过于显然这是过于保守的估保守的估计计.第43页,共59页,编辑于2022年,星期六43解解例例6 6 已知生男孩的概率已知生男孩的概率为为0.515,试试用中心极限定理求在用中心极限定理求在10000个新生个新生婴婴儿中儿中女孩不少于女孩不少于男孩男孩的的概率。概率。设设X为为10000个新生个新生婴婴儿中男孩的个数儿中男孩的个数,由由D-L中心极限定理中心极限定理,所以所以
22、第44页,共59页,编辑于2022年,星期六44练习:练习:P107 习题习题 5-2 1.第45页,共59页,编辑于2022年,星期六45补充题:补充题:3.3.某某射射手手打打靶靶,得得1010分分、9 9分分、8 8分分、7 7分分、6 6分分的的概概率率分分别别为为0.5,0.3,0.1,0.05,0.05.0.5,0.3,0.1,0.05,0.05.现现独独立立射射击击100100次次,求求总总分分在在900900分与分与930930分之间的概率分之间的概率.第46页,共59页,编辑于2022年,星期六46解解由中心极限定理知由中心极限定理知,第47页,共59页,编辑于2022年,星
23、期六47解解由中心极限定理知由中心极限定理知,第48页,共59页,编辑于2022年,星期六48解解由中心极限定理,由中心极限定理,3.3.某某射射手手打打靶靶,得得1010分分、9 9分分、8 8分分、7 7分分、6 6分分的的概概率率分分别别为为0.5,0.3,0.1,0.05,0.05.0.5,0.3,0.1,0.05,0.05.现现独独立立射射击击100100次次,求求总总分分在在900900分分与与930930分之间的概率分之间的概率.第49页,共59页,编辑于2022年,星期六49习题课习题课第50页,共59页,编辑于2022年,星期六501、将一枚硬币抛掷将一枚硬币抛掷10000次
24、,出现正面次,出现正面5800次,是否有理由认次,是否有理由认为这枚硬币不均匀为这枚硬币不均匀?解解:设设X为为10000次试验中出现正面的次数,次试验中出现正面的次数,若硬币是均匀的若硬币是均匀的,则则XB(10000,0.5),由由D-LD-L定理定理,此概率接近于此概率接近于0,故认为这枚硬币不均匀是合理的,故认为这枚硬币不均匀是合理的.第51页,共59页,编辑于2022年,星期六512、假假设设生生产线组产线组装每件成品的装每件成品的时间时间服从指数分布服从指数分布,统计资统计资料表明每件成品的料表明每件成品的组组装装时间时间平均平均为为1010分分钟钟.设设各件各件产产品的品的组组装
25、装时间时间相互独立相互独立.(1)(1)试试求求组组装装100100件成品需要件成品需要1515到到2020小小时时的概率;的概率;(2)(2)以以95%95%的概率在的概率在1616小小时时内最多可以内最多可以组组装多少件成品装多少件成品?解解设设第第i件件组组装的装的时间为时间为Xi分分钟钟,i=1,100.=1,100.利用独立同分布中心极限定理利用独立同分布中心极限定理.(1)(1)第52页,共59页,编辑于2022年,星期六52(2)(2)查表得查表得 解得解得故故最多可最多可组组装装8181件成品。件成品。第53页,共59页,编辑于2022年,星期六53 诸诸Xk 独立同分布,且期
26、望存在,故能使用大数独立同分布,且期望存在,故能使用大数定定律律,解解k=1,2,E(Xk)=0.1,在一个罐子中在一个罐子中,装有装有10个编号为个编号为0-9的同样的球的同样的球,从罐从罐中有放回地抽取若干次,每次抽一个,并记下号码中有放回地抽取若干次,每次抽一个,并记下号码.3.问对序列问对序列Xk,能否应用大数定律?能否应用大数定律?(1)(1)设设k=1,2,第54页,共59页,编辑于2022年,星期六54(2)至少应取球多少次才能使至少应取球多少次才能使“0”出现的频率在出现的频率在0.09-0.11之间的概率至少是之间的概率至少是0.95?设应取球设应取球n次,次,0出现频率为出
27、现频率为由中心极限由中心极限定理定理,解解第55页,共59页,编辑于2022年,星期六55查表得查表得第56页,共59页,编辑于2022年,星期六56(3)用中心极限定理计算在用中心极限定理计算在100次抽取中次抽取中,数码数码“0”出现次数在出现次数在7和和13之间的概率之间的概率.在在100次抽取中次抽取中,数码数码“0”出现次数为出现次数为由中心极限定理由中心极限定理,即即E(Xk)=0.1,D(Xk)=0.09,解解第57页,共59页,编辑于2022年,星期六57即在即在100次抽取中,数码次抽取中,数码“0”出现次数在出现次数在7和和13之之间的概率为间的概率为0.6826.第58页,共59页,编辑于2022年,星期六58END第59页,共59页,编辑于2022年,星期六59