《三版)第4章 大数定律与中心极限定理ppt课件.ppt》由会员分享,可在线阅读,更多相关《三版)第4章 大数定律与中心极限定理ppt课件.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率(第三版)第4章 大数定律与中心极限定理电子课件第五章第五章2 在数学中大家都注意到在数学中大家都注意到这样这样的的现现象:有象:有时时候一个候一个有限的和很有限的和很难难求求,但一但一经经取极限由有限取极限由有限过过渡到无限渡到无限,则问题则问题反而好反而好办办.例如例如,若若对对某一某一x,要要计计算和算和 而一而一经经取极限,取极限,则则有有简单简单的的结结果果 3 事事实证实证明明这这是可能的,而且在一般情况下和的是可能的,而且在一般情况下和的极限分布就是极限分布就是正态分布正态分布,由此可,由此可见见正正态态分布的重要分布的重要性。性。对对和的分布收和的分布收敛敛于正于正态态分布
2、的分布的这这一一类类极限定理极限定理的研究,在的研究,在长长达两个世达两个世纪纪的的时时期内成了概率期内成了概率论论研究研究的中心的中心课题课题,因此得到了,因此得到了“中心极限定理中心极限定理”的名称。的名称。本章将列述本章将列述这类这类定理中最定理中最简单简单,然而也是最重要的,然而也是最重要的情况。情况。4 在概率在概率论论中,另一中,另一类类重要的极限定理是所重要的极限定理是所谓谓“大大数定律数定律”。在第一章中我在第一章中我们们已已经讨论经讨论了了“频率的稳定性频率的稳定性”。大量的重复大量的重复试验试验中,事件中,事件A发发生的生的频频率接近某个常数,率接近某个常数,这这个常数个常
3、数实际实际上就是事件上就是事件发发生的概率。生的概率。“大数大数”的意思,的意思,就是指就是指试验试验数目是大量的。数目是大量的。51 1 切比雪夫不等式切比雪夫不等式 随机随机变变量的方差是刻画它量的方差是刻画它围绕围绕其期望其期望值值的离散的离散程度的,因此我程度的,因此我们们希望用方差来估希望用方差来估计计随机随机变变量与其量与其期望期望值值之之间间的偏差大于某一的偏差大于某一给给定正数的概率的上界。定正数的概率的上界。定理定理67证证设设X是是连续连续型随机型随机变变量,其概率密度量,其概率密度为为f(x),则则 定理定理8上式可改写为上式可改写为 切切比雪夫不等式具体地估算了随机变量
4、比雪夫不等式具体地估算了随机变量X取值时,取值时,以数学期望以数学期望E(X)为中心的分散程度。不难看出,方为中心的分散程度。不难看出,方差差D(X)越小,则随机变量越小,则随机变量X的取值越集中在数学期望的取值越集中在数学期望E(X)的附近,由此可以进一步体会到方差的概率意的附近,由此可以进一步体会到方差的概率意义,它刻划了随机变量的分散程度。义,它刻划了随机变量的分散程度。如取如取9例例 已知正常男性成人血液中,每一毫升白细胞数平已知正常男性成人血液中,每一毫升白细胞数平均是均是7300,均方差是,均方差是700.利用切比雪夫不等式估计利用切比雪夫不等式估计每毫升白细胞数在每毫升白细胞数在
5、5200 9400之间的概率之间的概率.设每毫升白细胞数为设每毫升白细胞数为X,依题意,依题意,E(X)=7300,D(X)=7002,解解由切比雪夫不等式,由切比雪夫不等式,10例例 根据过去统计资料,某产品的次品率为根据过去统计资料,某产品的次品率为p=0.05,试试用切比雪夫不等式估计用切比雪夫不等式估计1000件产品中,次品数在件产品中,次品数在4060之间的概率之间的概率.解解 设设X表示表示1000件产品中的次品数,则件产品中的次品数,则 由切比雪夫不等式,由切比雪夫不等式,11 该该数数值值是非常保守的估是非常保守的估计计,事,事实实上,由中心极上,由中心极限定理可知,概率限定理
6、可知,概率约为约为 注注:12例例解解132 2 大数定律大数定律记作记作14几个常见的大数定律几个常见的大数定律定理定理1 1(切比雪夫大数定律)切比雪夫大数定律)设设 X1,X2,是相互独立的随机是相互独立的随机变量序列,它们都有有限的方差,并变量序列,它们都有有限的方差,并且方差有共同的上界,即且方差有共同的上界,即 D(Xi)C,i=1,2,,则对任意的则对任意的 有有或或依概率收敛依概率收敛15证证两两边夹边夹,即得结论即得结论.16解释:解释:取值接近于其数学期望的概率接近于取值接近于其数学期望的概率接近于1.当当n充分大时,充分大时,差不多不再是随机的了差不多不再是随机的了,17
7、定理定理2 2(伯(伯努努利利大数定律大数定律)或或下面给出的伯努利大数定律,是定理下面给出的伯努利大数定律,是定理1的一种特例。的一种特例。设设nA是是n重伯努利试验中事件重伯努利试验中事件A发生发生的次数,的次数,p是事件是事件A发生的概率,则对任发生的概率,则对任给的给的 ,有有18引入引入i=1,2,n则则 而而 由由切比雪夫大数定律,切比雪夫大数定律,19是事件是事件A发生的频率,发生的频率,伯努里大数定律表明,当重复试验次数伯努里大数定律表明,当重复试验次数n充分大时,充分大时,事件事件A发生的频率发生的频率nA/n与事件与事件A的概率的概率p有较大偏差有较大偏差的概率很小。的概率
8、很小。这这就是就是频率稳定性频率稳定性的理的理论论解解释释。历历史上,史上,伯伯努利第一个研究了努利第一个研究了这这种种类类型的极限定理,型的极限定理,在在1713年年发发表的表的论论文中文中(这这是概率是概率论论的第一篇的第一篇论论文文!),他建立了以上定理。所以有人他建立了以上定理。所以有人认为认为,概率,概率论论的真正的真正历历史史应应从出从出现现伯伯努利大数定律的努利大数定律的时时刻算起。刻算起。20下面给出的独立同分布下的大数定律,下面给出的独立同分布下的大数定律,不要求随机变量的方差存在。不要求随机变量的方差存在。设随机变量序列设随机变量序列X1,X2,独立同分布,独立同分布,具有
9、有限的数学期望具有有限的数学期望 E(Xi)=,i=1,2,,定理定理3 3(辛钦大数定律辛钦大数定律)辛钦辛钦辛钦大数定律为寻找随机变量的期望值提供了一条辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径实际可行的途径.21 例如要估计某地区的平均亩产量,要收割例如要估计某地区的平均亩产量,要收割某些有代表性的地块,例如某些有代表性的地块,例如n 块块.计算其平均亩计算其平均亩产量,则当产量,则当n 较大时,可用它作为整个地区平均较大时,可用它作为整个地区平均亩产量的一个估计亩产量的一个估计.22例例解解其共同的数学期望为其共同的数学期望为 将一枚均匀对称的骰子重复掷将一枚均匀对称的
10、骰子重复掷n次,则当次,则当n 时,时,求求n次掷出点数的算术平均值依概率收敛的极限次掷出点数的算术平均值依概率收敛的极限 233 3 中心极限定理中心极限定理 中心极限定理从理中心极限定理从理论论上上证证明,明,对对于大量的独立随于大量的独立随机机变变量来量来说说,只要每个随机,只要每个随机变变量在量在总总和中所占比重和中所占比重很小,那么不很小,那么不论论其中各个随机其中各个随机变变量的分布函数是什量的分布函数是什么形状,也不么形状,也不论论它它们们是已知是已知还还是未知,而它是未知,而它们们的和的和的分布函数必然和正的分布函数必然和正态态分布函数很近似。分布函数很近似。这这就是就是为为什
11、么什么实际实际中遇到的随机中遇到的随机变变量很多都服从正量很多都服从正态态分布的分布的原因,也正因如此,正原因,也正因如此,正态态分布在概率分布在概率论论和数理和数理统计统计中占有极其重要的地位。中占有极其重要的地位。下面介下面介绍绍两两个常用的中心极限定理。个常用的中心极限定理。24 由于无穷个随机变量之和可能趋于由于无穷个随机变量之和可能趋于,故我们,故我们不直接研究不直接研究n个随机变量之和,本身而考虑它的个随机变量之和,本身而考虑它的标准化标准化的随机变量的随机变量的分布函数的极限的分布函数的极限.25列维一林德伯格中心极限定理列维一林德伯格中心极限定理2627(证证略)略)28此定理
12、此定理说说明明,当当n充分充分大大时时,有有 或或29例例 一生产线生产的产品成箱包装,每箱的重量是随一生产线生产的产品成箱包装,每箱的重量是随机的机的,假设每箱的平均重假设每箱的平均重50千克千克,标准差标准差5千克千克.若用若用最大载重量为最大载重量为5吨的汽车承运吨的汽车承运,试利用中心极限定理试利用中心极限定理说明每辆车最多可以装多少箱说明每辆车最多可以装多少箱,才能才能保证保证不超载的概不超载的概率大于率大于 0.977.解解由列由列维维-林德伯格中心极限定理林德伯格中心极限定理,有有 总重量总重量30所以所以n必须满足必须满足即最多可以装即最多可以装98箱箱.31例例 将将n个观测
13、数据相加时,首先对小数部分按个观测数据相加时,首先对小数部分按“四舍五四舍五入入”舍去小数位后化为整数试利用中心极限定理估计,舍去小数位后化为整数试利用中心极限定理估计,解解(1)当当n=1500时时,舍入误差之和的绝对值大于舍入误差之和的绝对值大于15的概率;的概率;(2)n满足何条件时,能以不小于满足何条件时,能以不小于0.90的概率使舍入误差的概率使舍入误差 之和的绝对值小于之和的绝对值小于10 根据列维根据列维-林德伯格中心极限定理,当林德伯格中心极限定理,当 n 充分大时充分大时 32(1)33(2)数据个数数据个数 n 应满足条件:应满足条件:即当即当 时,才能使误差之和的绝对值小
14、于时,才能使误差之和的绝对值小于10的的概率不小于概率不小于0.90 34下面下面给给出上述定理的一个重要特例。出上述定理的一个重要特例。35棣莫弗棣莫弗-拉普拉斯中心极限定理拉普拉斯中心极限定理证证由列由列维维一林德伯格定理可知,一林德伯格定理可知,3637由列由列维维一林德伯格定理可知,一林德伯格定理可知,38或或即有近似即有近似计计算公式算公式 39例例 设设在某保在某保险险公司有公司有1万万个人参加投保个人参加投保,每人每年付每人每年付120元保元保险费险费。在一年内一个人死亡的概率在一年内一个人死亡的概率为为0.006,死亡死亡时时其家属可向保其家属可向保险险公司公司领领得得1万万元
15、元,问问:(1)该该保保险险公司公司亏亏本的概率本的概率为为多少多少?(2)该该保保险险公司一年的利公司一年的利润润不少于不少于40,60,80万元的概率各是多少万元的概率各是多少?解解 设设一年内死亡的人数一年内死亡的人数为为X,则则 由由D-L中心极限定理中心极限定理,即即该该保保险险公司公司亏亏本的概率本的概率几乎几乎为为 0。4041例例 (供电问题供电问题)某车间有某车间有200台车床,在生产期间由台车床,在生产期间由于需要检修、调换刀具、变换位置及调换零件等常于需要检修、调换刀具、变换位置及调换零件等常需停车。设开工率为需停车。设开工率为0.6,并设每台车床的工作是独,并设每台车床
16、的工作是独立的,且在开工时需电力立的,且在开工时需电力1千瓦千瓦。问应供应多少瓦问应供应多少瓦电力就能以电力就能以99.9%的概率保证该车间不会因供电不的概率保证该车间不会因供电不足而影响生产足而影响生产?解解 某一时刻开动的车床数某一时刻开动的车床数 要求最小的要求最小的 k,使使 由由D-L定理定理,42查表得查表得 所以若供所以若供电电141.5千瓦,那么由于供千瓦,那么由于供电电不足而影响生不足而影响生产产的可能性不到的可能性不到0.001,相当于,相当于8小小时时内内约约有半分有半分钟钟受受影响,影响,这这一般是允一般是允许许的。的。由由D-L定理定理,43练习:练习:P96 习题四
17、习题四 1.2.3.44End45补充题:补充题:3.某某射射手手打打靶靶,得得10分分、9分分、8分分、7分分、6分分的的概概率率分分别别为为0.5,0.3,0.1,0.05,0.05.现现独独立立射射击击100次次,求求总总分分在在900分与分与930分之间的概率分之间的概率.46解解由中心极限定理知由中心极限定理知,设设 X 为为100台彩台彩电电中出故障的台数,中出故障的台数,则则47解解 由中心极限定理知由中心极限定理知,48解解由中心极限定理,由中心极限定理,3.某某射射手手打打靶靶,得得10分分、9分分、8分分、7分分、6分分的的概概率率分分别别为为0.5,0.3,0.1,0.0
18、5,0.05.现现独独立立射射击击100次次,求求总总分分在在900分与分与930分之间的概率分之间的概率.49习题课习题课501、将一枚硬币抛掷将一枚硬币抛掷10000次,出现正面次,出现正面5800次,是否次,是否有理由认为这枚硬币不均匀有理由认为这枚硬币不均匀?解解:设设X为为10000次试验中出现正面的次数,次试验中出现正面的次数,若硬币是均匀的若硬币是均匀的,则则 XB(10000,0.5),由由D-LD-L定理定理,此概率接近于此概率接近于0,故认为这枚硬币不均匀是合理的,故认为这枚硬币不均匀是合理的.512、假假设设生生产线组产线组装每件成品的装每件成品的时间时间服从指数分布服从
19、指数分布,统计资统计资料表明每件成品的料表明每件成品的组组装装时间时间平均平均为为10分分钟钟.设设各件各件产产品的品的组组装装时间时间相互独立相互独立.(1)试试求求组组装装100件成品需要件成品需要15到到20小小时时的概率;的概率;(2)以以95%的概率在的概率在16小小时时内最多可以内最多可以组组装多少件成品装多少件成品?解解 设设第第i件件组组装的装的时间为时间为Xi分分钟钟,i=1,100.利用独立同分布中心极限定理利用独立同分布中心极限定理.(1)52(2(2)查表得查表得 解得解得故故最多可最多可组组装装81件成品件成品。53 诸诸Xk 独立同分布,且期望存在,故能使用大独立同
20、分布,且期望存在,故能使用大数数定律定律,解解k=1,2,E(Xk)=0.1,在一个罐子中在一个罐子中,装有装有10个编号为个编号为0-9的同样的球的同样的球,从罐中有放回地抽取若干次,每次抽一个,并记下从罐中有放回地抽取若干次,每次抽一个,并记下号码号码.3.问对序列问对序列Xk,能否应用大数定律?能否应用大数定律?(1)(1)设设k=1,2,54(2)至少应取球多少次才能使至少应取球多少次才能使“0”出现的频率出现的频率在在0.09-0.11之间的概率至少是之间的概率至少是0.95?设应取球设应取球n次,次,0出现频率为出现频率为由中心极限由中心极限定理定理,解解55查表得查表得56(3)
21、用中心极限定理计算在用中心极限定理计算在100次抽取中次抽取中,数码数码“0”出现次数在出现次数在7和和13之间的概率之间的概率.在在100次抽取中次抽取中,数码数码“0”出现次数为出现次数为由中心极限定理由中心极限定理,即即E(Xk)=0.1,D(Xk)=0.09,解解57即在即在100次抽取中,数码次抽取中,数码“0”出现次数在出现次数在7和和13之之间的概率为间的概率为0.6826.58END59习题选解习题选解60解解8.某某保保险险公公司司多多年年的的统统计计资资料料表表明明,在在索索赔赔户户中中被被盗盗户户占占20%,设设X表表示示在在随随机机抽抽查查的的100个个索索赔赔户户中中
22、因因被被盗向保险公司索赔的户数。盗向保险公司索赔的户数。(1)写出)写出X的分布;的分布;(2)利用棣莫弗)利用棣莫弗拉普拉斯定理,求被盗索赔户不拉普拉斯定理,求被盗索赔户不少于少于14户且不多于户且不多于30户的概率的近似值。户的概率的近似值。61由由棣莫弗棣莫弗拉普拉斯定理拉普拉斯定理,62解解所以所以选选(D).).6310.将将n个观测数据相加时,首先对小数部分按个观测数据相加时,首先对小数部分按“四舍五四舍五入入”舍去小数位后化为整数试利用中心极限定理估计,舍去小数位后化为整数试利用中心极限定理估计,当当n=1500时时,舍入误差之和的绝对值大于舍入误差之和的绝对值大于15的概率。的概率。解解根据列维根据列维-林德伯格中心极限定理,当林德伯格中心极限定理,当 n 充分大时充分大时 6465本章常用公式本章常用公式当当n充分充分大大时时,有有 66