《第六章(二) 常用离散型随机变量的理论分布.ppt》由会员分享,可在线阅读,更多相关《第六章(二) 常用离散型随机变量的理论分布.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二节 常用离散变量的理论分布一、二项分布(一)贝努里试验及其概率函数:指只有两种可能结果的随机试验,我们将其中比较关注的结果称为“成功”,另一个结果称为“失败”。将某随机试验重复进行n 次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称n 次试验是独立的。对于n 次独立的试验 如果每次试验结果出现且只出现对立事件A 与 之一,在每次试验中出现A 的概率是常数p(0p1),因而出现对立事件 的概率是1-p=q,则称这一串重复的独立试验为n 重贝努里试验,简称贝努里试验(Bernoulli trials)。在n 重贝努里试验中,事件 A 可能发生0,1,2,n
2、 次,来求事件 A 恰好发生k(0kn)次的概率Pn(k)。例:抛掷4 次硬币,正面朝上(A)出现2 次的概率。先取n=4,k=2。在4次试验中,事件A 发生2 次的方式有以下C42种:其中Ak(k=1,2,3,4)表示事件A 在第k 次试验发生;(k=1,2,3,4)表示事件A 在第k 次试验不发生。由于试验是独立的,按概率的乘法法则,于是有 又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,事件A 恰好发生2 次的概率为 一般,在n 重贝努里试验中,事件A 恰好发生k(0kn)次的概率为 k=0,1,2,n(二)二项分布的定义及性质1、二项分布的定义:设随机变量 x 所有
3、可能取的值为零和正整数:0,1,2,,n,且有:k=0,1,2,n 其中p 0,q 0,p+q=1,则称随机变量x 服从参数为n 和p 的二项分布,记为:B(x;n,p)。二项分布是一种离散型随机变量的概率分布。参数n 称为正整数离散参数;p 是连续参数,它能取0 与1 之间的任何数值(q=1 p)。例 某类灯泡使用时数在1000小时以上的概率是0.2,求三个灯泡在使用1000小时以后最多只有一个坏了的概率.解:设X为三个灯泡在使用1000小时已坏的灯泡数.B(x;3,0.8),把观察一个灯泡的使用时数看作一次试验,“使用到1000小时已坏”视为“成功”.每次试验,“成功”的概率为0.8 P(
4、X 1)=P(X=0)+P(X=1)=(0.2)3+3(0.8)(0.2)2=0.1042、二项分布的性质:容易验证,二项分布具有概率分布的一切性质,即:(1)P(x=k)=Pn(k)(k=0,1,,n)(2)二项分布的概率之和等于1,即 复习中学数学知识(牛顿二项展开式):(3)(4)(5)(m1m2)3、二项分布的图形特征:二项分布的图形由n 和p 两个参数决定:(1)当p 值较小且n 不大时,分布是偏斜的。但随着n 增大,分布逐渐趋于对称;(2)当p 值趋于0.5 时,分布趋于对称;(3)对于固定n及p,当k增加时,概率P(X=k)先是随之增加直至 达到最大值,随后单调减少。当(n+1)
5、p不为整数时,二项概率P(X=k)在k=(n+1)p达到最大值;(x 表示不超过 x 的最大整数)n=10,p=0.7nPk(n+1)p=7.7那么.n=7为最大当(n+1)p为整数时,二项概率P(X=k)在k=(n+1)p和k=(n+1)p-1处达到最大值。n=13,p=0.5Pkn0(n+1)p=7那么.n=7或n=6最大二项分布图 当n=20 时,不同p 值的曲线。此外,在n 较大,np、nq 较接近时,二项分布接近于正态分布;当n 时,二项分布的极限分布是正态分布。(n30,np5,nq5(n30,np5,nq5时,近似正态分布。时,近似正态分布。)(三)二项分布概率计算及应用条件【例
6、】某车间里共有9台车床,每台车床使用电力是间歇的,平均每小时约有12分钟使用电力。假定车工们使用电力与否是相互独立的,试问:在同一时刻有7台或7台以上的车床使用电力的概率为多少?解:设同一时刻使用电力的车床数为X,则服从二项分布。例例22 滨海市保险公司发现索赔要求中有15%是因为被盗而提出的。现在知道1999年中,公司共收到20个索赔要求,试求其中包含7个或7个以上被盗索赔的概率。解:二项分布的应用条件有三:1.各观察单位只具有互相对立 的一种结果,属于二项分类资料;2.已知发生某一结果的概率为p,其对立结果的概率则为1 p=q,要求p是从大量观察中获得的稳定数值;3.n 个观察单位的观察结
7、果互相独立,即每个观察单位的结果不会影响到其它观察单位的观察结果。(四)二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变量之平均数、标准差 与参数n、p 有如下关系:当试验结果以事件A 发生次数k 表示时=np=证:B(x;n,p),若设则 X=X1+X2+Xn=npi=1,2,n所以 E(X)=X表示n重试验中的“成功”次数。E(Xi)=pXi0 1P 1-p p又:Xi的分布律为:二、两点分布二、两点分布(Two-point distribution)当当n=1n=1,二项分布中,二项分布中“成功次数成功次数”只能取值只能取值00或或11设设 的分布列为的分布列为 称
8、称 服从两点分布或服从两点分布或0101分布或贝努里分布。分布或贝努里分布。不难发现两点分布就是二项分布不难发现两点分布就是二项分布N=1N=1的特殊情的特殊情形。形。1 0 1 0 p q p q 三.几何分布(Geometry distribution)在贝努里试验中,每次试验成功的概率为p,失败的概率为q=1-p,设试验进行到第 次才出现成功。(xi)的分布列为 P k=1.2(k=1.2)是几何级数的 一般项。因此称它为几何分布记为 g(k;p)。四、超几何分布(Super geometry distribution)对于抽样调查,只有在大群体(即总体比样本相对于抽样调查,只有在大群体
9、(即总体比样本相对大很多)的情况下,二项分布的独立试验要求对大很多)的情况下,二项分布的独立试验要求才能够近似得到满足(重复抽样)。但如果研究才能够近似得到满足(重复抽样)。但如果研究对象是小群体,这时总体单位不多,一般只有几对象是小群体,这时总体单位不多,一般只有几十个。假定总体只有两类,其中十个。假定总体只有两类,其中KK个成功类,个成功类,(N-KN-K)个为失败类,这时如果从总体中抽取一)个为失败类,这时如果从总体中抽取一容量为容量为nn的样本,那么成功的概率将不再恒定,也的样本,那么成功的概率将不再恒定,也就是二相分布所要求的独立试验的条件不再被满就是二相分布所要求的独立试验的条件不
10、再被满足,而超几何分布将适合于这种小群体的研究。足,而超几何分布将适合于这种小群体的研究。形式形式:P(X=k)=:P(X=k)=,K=0,1,K=0,1,min(n,Mmin(n,M)超超几几何何概概型型,例例:产产品品检检验验。有有NN个个产产品品(其其中中有有KK个个合合格格品品)从从NN个个产产品品中中取取nn个个检检验验,求求nn中有中有XX个合格品的概率。个合格品的概率。(即(即XX合格品个数)合格品个数)不回置抽样!不回置抽样!期望:期望:EE(XX)=nK/N=np=nK/N=np方差:方差:D(X)=npq(N-n)/(N-1)D(X)=npq(N-n)/(N-1)当研究对象
11、是小群体,并且采用不回置抽样时,成功的概率将不再恒定,也就是二项分布所要求的独立试验的条件不再被满足,而超几何分布将适合于这种情况的研究。当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,可用二项分布来近似超几何分布。一般当n/N0.1时,这种近似就是可以采用的。五、泊松分布(PoissonDistribution)泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量 n 必须很大。例:盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000在100次抽样中,抽中1,2,10个白棋子的概率分别是 我们把在每次试验中出现概率很小的事件称作稀有事件
12、。如地震、火山爆发、特大洪水、意外事故等等。在现实生活中,服从泊松分布的随机变量是常见的。如每页文稿的错字数,某地区末予预报的暴风次数,一天中交通事故发生的件数等,都是服从泊松分布的。(一)泊松分布的定义与特征1、定义:若随机变量x(x=k)只取零和正整数值0,1,2,且其概率分布为 x=0,1,(稀有事件出现的次数)其中0;e 是自然对数的底数(e=2.71828),则称 x 服从参数为的泊松分布(Poissons distribution),记为P(x;)。(2)不难验证:(1)这是因为:复习:2、泊松分布重要的特征:平均数和方差相等,都等于常数,即=2=np 证明:泊松(Poisson)
13、分布的数学期望与方差。3、泊松分布的图形特征:是泊松分布所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分布趋于对称。当=20 时分布接近于正态分布;当=50 时,可以认为波松分布呈正态分布。在实际工作中,当20 时就可以用正态分布来近似地处理泊松分布的问题。泊松分布若用m 表示时的曲线(二)泊松分布的概率计算 泊松分布的概率计算依赖于参数,只要参数确定了,把k=0,1,2,代入公式即可求得各项的概率。但是在大多数服从泊松分布的实例中,分布参数往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为的估计值,将其代替公式中的,计算出k=0,1,2,时的各项概率。例:一个合订本共100页
14、,假定每页上印刷错误的数目X服从泊松分布(=1),计算该合订本中各页的印刷错误都不超过4个的概率。解:由题目P(x;1).P(X4)=P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4).查表求值=?+?+?+?+?所求概率为(?)100=0.0045。【例】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400 个记录如下:试分析饮用水中细菌数的分布是否服从泊松分布。若服从,按泊松分布计算:细菌数/ml(水)的概率及理论次数,并将頻率分布与泊松分布直观比较。经计算得每毫升水中平均细菌数=0.500,方差S2=0.496。两者很接近,故可认为细菌数/ml(水)服从
15、泊松分布。以=0.500 代替公式中的,得(k=0,1,2)计算结果如下表。细菌数的泊松分布 可见细菌数的频率分布与=0.5 的波松分布是相当吻合的,进一步说明用波松分布描述单位容积(或面积)中细菌数的分布是适宜的。注意:泊松分布的应用条件与二项分布相似。历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的。近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一。在实际中,许多随机现象服从或近似服从泊松分布。(三)泊松分布与二项分布n 100,np 10 时近似效果就很好。由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布。例见:P133,例8
16、.2.3实际计算中,n10,p0.1,近似效果就较好,而 当 n很大时,p 很小。有以下近似式:其中 泊松定理:设随机变量B(x;n,p)。(四)Piosson分布与正态分布的关系当较小时,Piosson分布呈偏态分布,随着增大,迅速接近正态分布,当 20时,可以认为近似正态分布。例一:某单位有4辆车,假设每辆车在一年至多只发生一次损失,且损失概率为0.1,求在一年内该单位:1、没有汽车发生损失的概率。2、有一辆汽车发生损失概率。3、发生损失汽车不超过2辆的概率。例二:设某种报刊的每版上错别字个数服从=3的波松分布,现随机翻看一版。试求:1、没有错别字的概率。2、至多5个错别字的概率。例三:共产有某种设备80台,配备了3个维修工,假设每台设备维修只需一个维修工,设备发生故障是相互独立的且每台设备发生故障概率均为0.01,求设备发生故障而不能及时维修的概率是多少?