《二项分布与分布讲稿.ppt》由会员分享,可在线阅读,更多相关《二项分布与分布讲稿.ppt(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、二项分布与分布1第一页,讲稿共六十七页哦目的及要求目的及要求了解二项分布(了解二项分布(binomialdistribution)与)与Poisson分布(分布(Poissondistribution)的概念)的概念掌握二项分布的特点、均数与标准差的计算,掌握二项分布的特点、均数与标准差的计算,Poisson分布与二项分布和正态分布的关系;总分布与二项分布和正态分布的关系;总体均数可信区间的估计、假设检验及适用条件体均数可信区间的估计、假设检验及适用条件重点是二项分布的应用,难点是三种分布的区重点是二项分布的应用,难点是三种分布的区别与联系别与联系2第二页,讲稿共六十七页哦一一.概念:概念:为
2、率的抽样分布,各种情况的概率等于二项式展开为率的抽样分布,各种情况的概率等于二项式展开后的各项。后的各项。X=0.1.2X=0.1.2.n.nn例:设小鼠接受某种毒物一定剂量时,其死亡率为例:设小鼠接受某种毒物一定剂量时,其死亡率为80%80%,若随机用三只小鼠作试验,问出现各种死亡情况,若随机用三只小鼠作试验,问出现各种死亡情况的概率?的概率?二项分布二项分布3第三页,讲稿共六十七页哦小鼠存亡的组合方式小鼠存亡的组合方式排列方式排列方式每种排列的概率每种排列的概率每种组每种组合的概合的概率率生存数生存数(X)死亡数死亡数(n-X)甲甲乙乙丙丙30生生生生生生0.20.20.2=0.0080.
3、00821生生生生死死0.20.20.8=0.0320.096生生死死生生0.20.80.2=0.032死死生生生生0.80.20.2=0.03212生生死死死死0.20.80.8=0.1280.384死死生生死死0.80.20.8=0.128死死死死生生0.80.80.2=0.12803死死死死死死0.80.80.8=0.5120.5124第四页,讲稿共六十七页哦(0.8+0.2)3=(0.2)3+3(0.8)(0.2)2+3(0.8)2(0.2)+(0.8)3三生三生二生一死二生一死一生二死一生二死三死三死二二.应用条件:应用条件:BernoulliBernoulli试验:试验:在只有两种
4、可能结果(成功与失败)的随机试在只有两种可能结果(成功与失败)的随机试验,每次试验时出现成功的概率验,每次试验时出现成功的概率是恒定的,而且各次试验相互是恒定的,而且各次试验相互独立。这种试验在统计学上称之为贝努里试验(独立。这种试验在统计学上称之为贝努里试验(Bernoulli Bernoulli trial)trial)。5第五页,讲稿共六十七页哦(1)二项分类资料:结果为)二项分类资料:结果为A或非或非A(成功与失败)(成功与失败)。(2)每次试验的条件不变:每次试验)每次试验的条件不变:每次试验A的发生概率均为的发生概率均为。(3)各次试验独立:每个观察单位的观察结果不会影响到其)各次
5、试验独立:每个观察单位的观察结果不会影响到其他观察单位的结果。他观察单位的结果。在在BernoulliBernoulli试验中,取得成功的次数试验中,取得成功的次数X X(X=0X=0,1 1,2 2,n n)的)的概率呈二项分布。其概率计算式:概率呈二项分布。其概率计算式:所以二项分布的应用条件就是所以二项分布的应用条件就是BernoulliBernoulli试验的条件,即:试验的条件,即:式中:式中:n、为二项分布的参数。为二项分布的参数。若随机变量若随机变量X服从以服从以n、为参数的二项分布记为为参数的二项分布记为XB(n.)。)。6第六页,讲稿共六十七页哦(2)至少有)至少有k例阳性的
6、概率:例阳性的概率:(3)至多有)至多有k例阳性的概率:例阳性的概率:X=0,1,2,kn三三.概率的计算:概率的计算:(1)恰有)恰有k例阳性的概率:例阳性的概率:从一个阳性率为从一个阳性率为的总体中,随机抽取含量为的总体中,随机抽取含量为n的样本,则样本中的样本,则样本中阳性数阳性数X或阳性率或阳性率p服从二项分布服从二项分布B(n、)。)。7第七页,讲稿共六十七页哦例例:已知某地玉米的黄曲霉污染率近年为已知某地玉米的黄曲霉污染率近年为20%,若抽取若抽取10个样品作检查,求个样品作检查,求污染样品数为污染样品数为3个的概率。个的概率。污染样品数不超过一个的概率。污染样品数不超过一个的概率
7、。污染样品数在污染样品数在9个以上的概率。个以上的概率。8第八页,讲稿共六十七页哦污染样品数为污染样品数为3个的概率:个的概率:污染样品数不超过一个的概率:污染样品数不超过一个的概率:污染样品数在污染样品数在9个以上的概率:个以上的概率:9第九页,讲稿共六十七页哦例例5.2经统计,某省用经统计,某省用“中药阑尾炎合剂中药阑尾炎合剂”治疗急性阑尾炎性腹治疗急性阑尾炎性腹膜炎的有效率为膜炎的有效率为86%,试分别估计:,试分别估计:治疗治疗10例中至少例中至少9例有例有效的概率;效的概率;治疗治疗10例中至多例中至多7例有效的概率。例有效的概率。本例有效例数本例有效例数XB(10.0.86),依题
8、意,),依题意,10例患者中,例患者中,因因此此,10例例患患者者中中至至少少9例例有有效效的的概概率率为为0.581,至至多多7例例有有效效的的概概率率为为0.155。10第十页,讲稿共六十七页哦四四.二项分布的图形二项分布的图形11第十一页,讲稿共六十七页哦(1)离散型离散型(2)当)当=1-=0.5时,两边对称时,两边对称(3)当当 0.5时,呈偏态分布。当时,呈偏态分布。当 0.5时,呈左偏态分时,呈左偏态分布;当布;当 0.5时,呈右偏态分布。时,呈右偏态分布。(4)当)当n增大,二项分布逐渐逼近正态分布增大,二项分布逐渐逼近正态分布二项分布的特点:二项分布的特点:成功率成功率P=X
9、/n的概率分布图形与成功次数的概率分布图形是完全一的概率分布图形与成功次数的概率分布图形是完全一样的,只需要把横轴上的样的,只需要把横轴上的X变换成变换成X/n就行了。就行了。一般认为,一般认为,n 和和n(1-)5时时,可近似看作正态分布。可近似看作正态分布。12第十二页,讲稿共六十七页哦13第十三页,讲稿共六十七页哦14第十四页,讲稿共六十七页哦五五.二项分布的二项分布的均数与标准差均数与标准差2.若用率表示,则:若用率表示,则:p为率的标准误为率的标准误表示率的抽样误差表示率的抽样误差当当未知时,常以样本率未知时,常以样本率P来估计:来估计:1.若若XB(n,),),则则X的均数和标准差
10、为:的均数和标准差为:15第十五页,讲稿共六十七页哦nX的均数在这里可以理解为n次试验中结果A期望出现的次数,而X的标准差则是衡量结果A出现次数的变异程度。n例5.3求例5.1中平均死亡鼠数及其标准差。n根据死亡鼠数XB(3,0.8)得到n平均死亡鼠数只n标准差若用率表示,则若用率表示,则16第十六页,讲稿共六十七页哦n二项分布的应用二项分布的应用n二二项项分分布布是是一一种种常常用用的的离离散散型型分分布布,具具有有广广泛泛的的应应用用价价值值。在在实实际际问问题题中中特特别别要要注注意意判判定定一一个个变变量量是是否否服服从从二二项项分分布布。凡凡具具有有贝贝努努利利试试验验序序列列3个个
11、特特点点的的变变量量,一一般般可可认认为服从二项分布。为服从二项分布。n1)总体率的区间估计)总体率的区间估计n总总体体率率估估计计包包括括点点估估计计和和区区间间估估计计。点点估估计计是是直直接接用用样样本本率率来来估估计计总总体体率率。区区间间估估计计是是根根据据样样本本提提供供的的信信息息按按一一定定的的概概率率(即可信度)来估计总体率的可能范围。(即可信度)来估计总体率的可能范围。n总体率的可信区间根据总体率的可信区间根据n和和P的大小一般有两种估计方法。的大小一般有两种估计方法。17第十七页,讲稿共六十七页哦n na正态近似法正态近似法n当当n足足够够大大,P和和1-P均均不不太太小
12、小时时(可可通通过过nP与与n(1-P)均大于判断)均大于判断),n样样本本率率P近近似似正正态态分分布布,这这时时可可以以利利用用正正态态分分布布理理论论来来估估计总体率的可信区间。计总体率的可信区间。n 可信度为可信度为1-1-的可信区间:的可信区间:n18第十八页,讲稿共六十七页哦n例例:n某某医医院院用用复复方方当当归归注注射射液液静静脉脉滴滴注注治治疗疗脑脑动动脉脉硬硬化化症症188例例,其其中中显显效效83例例,试试估估计计等等量量齐齐观方当归注射液显效率的观方当归注射液显效率的95%和和99%可信区间。可信区间。n复方当归注射液静复方当归注射液静95%可信区可信区n(0.4415
13、1.960.036,0.44151.960.036)n=(0.3709,0.5121)=(37.09%,51.21%)19第十九页,讲稿共六十七页哦nB查表法查表法n 如果如果n,pn,p不符合上述要求,当不符合上述要求,当n50n50,特别是,特别是P P很接很接近近0 0或或1 1时,样本资料呈二项分布,可用二项分布法时,样本资料呈二项分布,可用二项分布法估计总体率的可信区间。该法计算繁杂,附表估计总体率的可信区间。该法计算繁杂,附表3 3列列出了总体率的出了总体率的95%95%和和99%99%可信区间,可信区间,n例例5.5从从某某学学校校随随机机抽抽取取26名名学学生生,发发现现有有4
14、名名感感染染沙眼,试求该校沙眼感染率沙眼,试求该校沙眼感染率95%可信区间。可信区间。n本本例例n=26,X=4,查查附附表表3的的可可信信度度为为95%的的可可信信区区间间为(为(0.04,0.35),即(),即(4%,35%)。)。20第二十页,讲稿共六十七页哦n注意注意:n附表附表3 3中中X X值只列出值只列出 时,时,n可可以以用用n-Xn-X查查表表,然然后后以以100%100%减减去去查查的的区区间间即即为为所所求的可信区间求的可信区间n例例5.6 5.6 某某县县抽抽查查了了1010名名人人员员的的乙乙型型肝肝炎炎表表面面抗抗原原(HBsAgHBsAg)携携带带情情况况,阴阴性
15、性者者8 8人人,求求该该县县人人群群HbsAgHbsAg阴性率的阴性率的95%95%可信区间为可信区间为 若若x n/2,则按,则按n-x查表得?,然后查表得?,然后100-?例:上题若例:上题若X=8,则,则n-x=10-8=2查表得:查表得:3%56%然后然后100-?得:?得:44%97%21第二十一页,讲稿共六十七页哦(2)样本率与总体率比较)样本率与总体率比较1)直接计算概率法)直接计算概率法H0:1=0=0.01H1:1 0=0.01单侧单侧=0.05P,按,按=0.05水准,不拒绝水准,不拒绝H0,故不能认为该地新生儿染色体异常率,故不能认为该地新生儿染色体异常率低于一般新生儿
16、。低于一般新生儿。22第二十二页,讲稿共六十七页哦n例例如如5.7一一种种鸭鸭通通常常感感染染某某种种传传染染病病的的概概率率是是0.2,现现将将一一种种药药物物注注射射到到25只只鸭鸭后后发发现现有有1只只鸭鸭发发生生感感染染,试试推推断断这这种种药对预防感染是否有效药对预防感染是否有效nHo:此药物对预防感染无效此药物对预防感染无效即即=0.2nH1:此药物对预防感染有效此药物对预防感染有效即即 0=0.2单侧单侧=0.0524第二十四页,讲稿共六十七页哦(3)两样本率比较(近似正态法)两样本率比较(近似正态法)n1p1、n1(1-p1)和)和n2p2、n2(1-p2)5时时例:为研究某地
17、男女学生的肺吸虫感染率是否存在差别,某例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研究者随机抽取该地研究者随机抽取该地80名男生和名男生和85名女生,查得感染人数男名女生,查得感染人数男生生23人,女生人,女生13人。请作统计分析。人。请作统计分析。H0:1=2H1:1 2=0.0525第二十五页,讲稿共六十七页哦PoissonPoisson分布分布一一.概念:概念:是二项分布的特例。当是二项分布的特例。当很小,而很小,而n很大时,则二项分布逼近很大时,则二项分布逼近Poisson分布。分布。例如:例如:每毫升水中大肠杆菌数的分布。每毫升水中大肠杆菌数的分布。粉尘在单位容积内计数的分布
18、。粉尘在单位容积内计数的分布。放射性物质在单位时间内放射出质点数的分布。放射性物质在单位时间内放射出质点数的分布。单位空间中某些野生动物或昆虫数的分布。单位空间中某些野生动物或昆虫数的分布。一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布。一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布。一般用于研究单位容积(或面积、时间)内某事件发生数。(小概率事一般用于研究单位容积(或面积、时间)内某事件发生数。(小概率事件出现的规律性)件出现的规律性)26第二十六页,讲稿共六十七页哦二二.Poisson分布的概率:分布的概率:=n为为Poisson分布的总体均数;分布的总体均数;X=
19、0,1,2,式中:式中:X为单位时间(或面积、容积等)某事件发生数;为单位时间(或面积、容积等)某事件发生数;e为自然对数的底,为自然对数的底,e2.71828从式中可知,从式中可知,为为Poisson分布的唯一参数。分布的唯一参数。X服从以服从以为参数的为参数的Poisson分布,可记为分布,可记为XP()。)。递推公式:递推公式:27第二十七页,讲稿共六十七页哦例例:据据以以往往经经验验,新新生生儿儿染染色色体体异异常常率率一一般般为为1%,试试分分别别用用二二项项分分布布及及Poisson分分布布原原理理,求求100名名新新生生儿儿中中发发生生X例例(X=0,1,2,)染色体异常的概率。
20、)染色体异常的概率。1.按二项分布原理求按二项分布原理求P(X)同理,可求得同理,可求得P(2),),P(3)等。)等。28第二十八页,讲稿共六十七页哦(2)按)按Poisson分布原理求分布原理求P(X):=n=1000.01=1同理,可求得同理,可求得P(4),),P(5)等。)等。(1)递推公式:递推公式:29第二十九页,讲稿共六十七页哦(2)公式:公式:30第三十页,讲稿共六十七页哦由表可见,对由表可见,对很小,很小,n很大的同一资料用二项很大的同一资料用二项布法与布法与Poisson分布法计算结果是很接近的。但分布法计算结果是很接近的。但Poisson分布的分布的P(X)的计算较为简
21、便。的计算较为简便。31第三十一页,讲稿共六十七页哦三三.Poisson分布的图形:分布的图形:根根据据,按按式式可可计计算算出出的的所所有有可可能能取取值值时时的的概概率率(),以以其其为为纵纵轴轴,可可绘绘制制出出poisson分分布布概概率率分分布布列列的的图图形形,可可见见,poisson分分布布图图形形形形状状完完全全取取决决于于的的大大小小。当当时时图图形形基基本本对对称称,随随的的增增大大,图图形形渐渐近近于于正正态态分布。分布。32第三十二页,讲稿共六十七页哦四四.Poisson分布的特性和应用条件:分布的特性和应用条件:1.离散型分布离散型分布.Poisson分布只有一个参数
22、,即参数分布只有一个参数,即参数;2.Poisson分布可看成二项分布的特例,其应用条件也就是二项分布的应分布可看成二项分布的特例,其应用条件也就是二项分布的应用条件。用条件。3.方差等于均数:即方差等于均数:即2=。为为Poisson分布的重要特征。分布的重要特征。4.Poisson分布在分布在不大时呈左偏态分布,随着不大时呈左偏态分布,随着的增大而逐渐趋于对称。的增大而逐渐趋于对称。当当20时,可认为近似正态分布时,可认为近似正态分布问题:问题:(1)具有传染性的罕见疾病的发生率能否用)具有传染性的罕见疾病的发生率能否用Poisson分布来分分布来分 析?析?(2)细菌在牛奶中呈集落状存在
23、能否用)细菌在牛奶中呈集落状存在能否用Poisson分布来分析?分布来分析?5.Poisson分布的可加性分布的可加性。33第三十三页,讲稿共六十七页哦若若X1,X2,Xk相互独立,且它们分别服从以相互独立,且它们分别服从以1,2,k为参数的为参数的Poisson分布,则分布,则T=X1+X2+Xk也服从也服从Poisson分布,分布,其参数为其参数为1+2+k。Poisson分布的可加性:分布的可加性:n例如例如:某放射物质每某放射物质每.s放射粒子数服从均数为放射粒子数服从均数为.的的poisson分布,分布,现随机取次观测结果进行研究,这次观测结果分别为每现随机取次观测结果进行研究,这次
24、观测结果分别为每.s反反射,及个粒子数,问每射,及个粒子数,问每.s放射粒子数为多少?并指出其服从于放射粒子数为多少?并指出其服从于均值为多少的均值为多少的poisson分布。分布。n本例本例X1=2,X2=3,X3=4,利用利用poisson分布的可加性原理得到分布的可加性原理得到nX1X2X3=2349个个n均值为均值为2.2+2.2+2.2=6.6n每每.s放射粒子数为个,每放射粒子数为个,每.s放射粒子数服从于均值为放射粒子数服从于均值为.的的poisson分布分布34第三十四页,讲稿共六十七页哦poisson分布与二项分布分布与二项分布 及正态分布的关系及正态分布的关系vpoisso
25、n分分布布可可视视为为二二项项分分布布的的特特例例若若某某种种现现象象的的发发生生率率甚甚小小,而而样样本本例例数数甚甚多多时时,则则二二项项分分布布逼逼近近poisson分布分布.poisson分分布布的的正正态态近近似似一一般般在在实实际际应应用用中中,当当时时,poisson分分布布近近似似正正态态分分布布,资资料料可可根根据据正态分布原理处理,从而简化计算正态分布原理处理,从而简化计算35第三十五页,讲稿共六十七页哦poissonpoisson分布的应用分布的应用poisson分布的应用条件分布的应用条件凡凡具具有有贝贝努努利利实实验验序序列列个个特特点点且且很很小小n大大时时,其其相
26、应的变量一般认为服从相应的变量一般认为服从poisson分布分布.实实际际工工作作中中,往往往往是是未未知知的的,当当poisson分分布布的的观观察察单单位位为为n时时,常常用用样样本本计计数数(样样本本均均数数)作作为为的点估计值,相应的样本标准差的计算式为:的点估计值,相应的样本标准差的计算式为:标准误的计算式为:标准误的计算式为:36第三十六页,讲稿共六十七页哦n当当poisson分分布布的的观观察察单单位位为为n1时时,常常用用样样本本均均数数n作作为为的点估计值,相应的样本标准差的的点估计值,相应的样本标准差的计算公式计算公式:n标准误的计算公式为标准误的计算公式为:n例例.某某研
27、研究究者者取取m纯纯净净水水培培养养,得得细细菌菌数数个个,试试分分别别估估计计m和和m纯纯净净水水中中细细菌菌数数的的标标准准差和均值差和均值n本本例例以以每每m纯纯净净水水为为一一个个poisson分分布布观观察察单单位位,此时此时n1,利用式(,利用式(.6)得样本标准差,)得样本标准差,n样本均值x=6037第三十七页,讲稿共六十七页哦n以每1m纯净水为一个poisson分布观察单位此时n5,利用式(.)得样本标准差为,n样本均数为个mn个m38第三十八页,讲稿共六十七页哦1.总体均数可信区间估计总体均数可信区间估计1)查表法)查表法:X 50,尤其,尤其p0或或1时时例例7.13:将
28、一个面积为:将一个面积为100cm2的培养皿置于某病室中,的培养皿置于某病室中,1小时后取出,培小时后取出,培养养24小时,查得小时,查得8个菌落,求该病室平均个菌落,求该病室平均1小时小时100cm2细菌数的细菌数的95%可信区可信区间。间。查查附表附表7,x=8得:得:3.415.8故该病室平均故该病室平均1小时小时100cm2细菌数的细菌数的95%可信区间为(可信区间为(3.4,15.8)例例5.15对某地居民饮用水进行卫生学检测中,随机抽查对某地居民饮用水进行卫生学检测中,随机抽查1mL水样,培养大肠水样,培养大肠杆菌杆菌2个,试估计该地区水中每毫升所含大肠杆菌的个,试估计该地区水中每
29、毫升所含大肠杆菌的95%和和99%可信区可信区间。本例间。本例x=295%可信区间得可信区间得(0.2,7.2)问题:问题:若求若求该病室平均该病室平均1小时小时50cm2细菌数的细菌数的95%可信区间?可信区间?将上述的上下限各除以将上述的上下限各除以2即可。即可。39第三十九页,讲稿共六十七页哦40第四十页,讲稿共六十七页哦2)正态近似法)正态近似法:当当X 50时时例例7.14:用计数器测得某放射性物质半小时内发出的脉冲数为:用计数器测得某放射性物质半小时内发出的脉冲数为360个。试估计该放射性物质每个。试估计该放射性物质每30分钟平均脉冲数的分钟平均脉冲数的95%可信区间。可信区间。X
30、样本计数样本计数即该放射性物质每即该放射性物质每30分钟平均脉冲数的分钟平均脉冲数的95%可信区间为可信区间为322.8397.2个。个。41第四十一页,讲稿共六十七页哦n当Poisson分布的观察单位为n1时,其总体均数1-的可信区间计算公式为n若若欲欲求求该该放放射射物物质质每每分分钟钟平平均均脉脉冲冲数数的的95%可可信信区区间间,因因该该放放射射物物质质每每分分钟钟总总平平均均脉脉冲冲数数为为每每30min总总体体平平均均数数的的1/30,故故只只需需将将每每30min总总体体平平均均脉脉冲冲数数的的95%可可信信区区间间的的下下、上上限限322.8和和397.2分分别别除除以以30,
31、即即可可求求得得该该放放射射物物质质每每分分钟钟平平均脉冲数的均脉冲数的95%可信区间为(可信区间为(10.76,13.24)42第四十二页,讲稿共六十七页哦2.样本均数与总体均数比较样本均数与总体均数比较1)直接计算概率法)直接计算概率法例例7.15:据以往大量观察但某溶液中平均每毫升有细菌据以往大量观察但某溶液中平均每毫升有细菌3个。某研个。某研究者想了解该溶液放在究者想了解该溶液放在5冰箱中冰箱中3天,溶液中细菌是否会增长。天,溶液中细菌是否会增长。现采取已放在现采取已放在5冰箱中冰箱中3天的该溶液天的该溶液1毫升,测得细菌毫升,测得细菌5个。请作统个。请作统计推断。计推断。H0:=3H
32、1:3单侧单侧=0.05P(X5),不拒绝,不拒绝H0,尚不能认为放在尚不能认为放在5冰箱中冰箱中3天该溶液中细天该溶液中细菌会增长。菌会增长。43第四十三页,讲稿共六十七页哦直接计算概率法直接计算概率法直接计算概率法直接计算概率法根根据据Poisson分分布布的的概概率率分分布布计计算算概概率率或或积积累累概概率率,并并依依据据小小概概率率事事件件原原理理作出统计推断作出统计推断n某某罕罕见见非非传传染染性性疾疾病病的的患患病病率率一一般般为为15/10万万,现现在在某某地地区区调调查查1000人,发现阳性者人,发现阳性者2人问此地区患病率是否高于一般。人问此地区患病率是否高于一般。n单侧单
33、侧=0.05n本本例例,n=1000,0=15/10万万,0=n0=0.15,则则在在Ho成成立立的的前前提提下,所调查的下,所调查的1000人中发现的阳性数人中发现的阳性数XP(0.15),则有),则有n在在=0.05=0.05的检验水平上的检验水平上n接受接受H1,认为此地区患病率高于一般,认为此地区患病率高于一般2.样本均数与总体均数比较样本均数与总体均数比较44第四十四页,讲稿共六十七页哦2)近似正态法)近似正态法:20时时例例7.16:某溶液原来平均每毫升有细菌某溶液原来平均每毫升有细菌80个,现欲研究某低剂量辐个,现欲研究某低剂量辐射能否杀菌。研究者以此低剂量辐射该溶液后取射能否杀
34、菌。研究者以此低剂量辐射该溶液后取1毫升,培养细菌毫升,培养细菌40个。请作统计推断。个。请作统计推断。H0:=80H1:80单侧单侧=0.05P0.01,拒绝拒绝H0,接受,接受H1。可认为此。可认为此低剂量辐射能杀菌。低剂量辐射能杀菌。45第四十五页,讲稿共六十七页哦3.两样本均数比较两样本均数比较(近似正态法,(近似正态法,20时)时)1)两样本的观察单位数相等()两样本的观察单位数相等(n1=n2)例例7.17:为研究两个水源被污染的情况是否相同,在每个水源各:为研究两个水源被污染的情况是否相同,在每个水源各取取10ml水作细菌培养,甲水源共生长水作细菌培养,甲水源共生长890个菌落,
35、乙水源共生长个菌落,乙水源共生长785个菌落,请作统计推断。个菌落,请作统计推断。H0:1=2H1:12=0.05P0.01,拒绝拒绝H0,接受,接受H1。可认为。可认为两个水源被污染的情况不同,甲两个水源被污染的情况不同,甲水源污染较重。水源污染较重。46第四十六页,讲稿共六十七页哦2)两样本的观察单位数不相等()两样本的观察单位数不相等(n1n2)例例7.18:某车间在生产工艺改革前测三次粉尘浓度,每次测一升空:某车间在生产工艺改革前测三次粉尘浓度,每次测一升空气,分别测得气,分别测得38,29和和36颗粉尘;改革后测取两次,分别有颗粉尘;改革后测取两次,分别有25,18颗粉尘。请据此推断
36、改革前后粉尘浓度是否相同。颗粉尘。请据此推断改革前后粉尘浓度是否相同。n1=3,X1=38+29+36=103;n2=2,X2=25+18=43。47第四十七页,讲稿共六十七页哦例例某城市在连续某城市在连续5年中因交通事故而伤亡的总人数为年中因交通事故而伤亡的总人数为152人。经采取人。经采取安全措施后的两年中因交通事故而伤亡的总人数为安全措施后的两年中因交通事故而伤亡的总人数为44人,这个城市在人,这个城市在这两个时期的人口数基本不变。试评价安全措施的效果(单侧)?这两个时期的人口数基本不变。试评价安全措施的效果(单侧)?H0:1=2H1:12单侧单侧=0.05n1=5,X1=152;n2=
37、2,X2=4448第四十八页,讲稿共六十七页哦小小结结二项分布常用于描述二项分类变量两种观察结果的出现率,二项分布常用于描述二项分类变量两种观察结果的出现率,Poisson分布是二项分布的特例,常用于分析小概率事件的发生规律。分布是二项分布的特例,常用于分析小概率事件的发生规律。1.二项分布的概念:二项分布的概念:二项分布(二项分布(Binomialdistribution)贝努里试验贝努里试验(j.Bernoulli.1713j.Bernoulli.1713)分布分布.是一种最重要的离散型分布是一种最重要的离散型分布.它是用于说明它是用于说明结果只能出现结果只能出现两种情况的两种情况的n次实
38、验中发生次实验中发生某某种结果为种结果为x次的概率分布次的概率分布.理论上说理论上说:若离散型随机变量若离散型随机变量X的概率分布满足于下式的概率分布满足于下式:x=0,1,2,.n49第四十九页,讲稿共六十七页哦2、二项分布的特点、二项分布的特点:(1)二二项项分分布布是是离离散散型型的的,因因而而具具有有离离散散型型的的共共同同特特点点:图图形形为为独独立立的的一一些些线段,线段的高度代表概率的大小线段,线段的高度代表概率的大小;(2)二项分布由两个参数决定,即)二项分布由两个参数决定,即n和和;(3)二项分布的均数恰为两个参数的乘积,而)二项分布的均数恰为两个参数的乘积,而n方差为均数的
39、(方差为均数的(1)倍,即有)倍,即有,n,n率表示则有率表示则有;(4)当当p=q=0.5时分布对称时分布对称,pq q时为左偏态时为左偏态,p,pq时为右偏态时为右偏态(5)当当n足够大,且足够大,且不太靠近不太靠近0或或1时,二项分布时,二项分布趋于正态分布;趋于正态分布;(6)当)当n.0(如(如5,n(1-p)5)时才能采用。)时才能采用。n4)无无论论是是样样本本率率与与总总体体率率的的比比较较还还是是两两样样本本率率比比较较的的u检检验验,均均可可用用2检检验验来来完完成成,二二者者是是等等价价的的(u2=2)一一般般来来说说,如如给给出出的的是是四四格格表表的的观观察察数数资资
40、料料,用用2检检验验方方便便一些;而给出的是率的资料,则用一些;而给出的是率的资料,则用u检验方便一些检验方便一些n54第五十四页,讲稿共六十七页哦nPoisson分布的概念及应用条件n n1.Poisson1.Poisson分布的概念分布的概念:nPoisson分分布布也也是是一一种种重重要要的的离离散散型型分分布布。它它是是二二项项分分布布在在n很很大大而而很很小小时时的的特特殊殊情情况况,同同样样两两分分类类资资料料在在n次次实实验验中中发发生生X次次某某种种结结果果的的概概率率分分布布。其其准准确确的的定定义义为为,若若离离散散型型随随机机变变量量X的的概率分布满组下式概率分布满组下式
41、nn.nn则称则称X服从服从Poisson分布分布n55第五十五页,讲稿共六十七页哦n2、Poisson分布的特点分布的特点n(1)Poisson分布是离散型的,因而同样具有上述离散型分布是离散型的,因而同样具有上述离散型n的共同特点;的共同特点;n(2)Poisson分布只有一个参数,即参数分布只有一个参数,即参数;n(3)Poisson分布的均数正巧等于其方差;分布的均数正巧等于其方差;n(4)当)当较大时,较大时,Poisson分布趋于正态分布;分布趋于正态分布;n(5)Poisson分布分布具有可加性。分布分布具有可加性。n3、Poisson分布的累计概率分布的累计概率同二项分布,同样
42、可计算上同二项分布,同样可计算上n下两侧累计概率。下两侧累计概率。n4、Poisson分分布布的的应应用用条条件件因因为为Poisson分分布布是是二二项项分分布布的的特特殊殊情情况况,因因此此使使用用Poisson分分布布既既要要满满足足前前述述二二项项分分布布的的三三个个应应用用条件,还要求条件,还要求n很大而很大而很小。很小。56第五十六页,讲稿共六十七页哦n npoison分布的分布的应用应用npoisson分布的分布的 应用同样在于区间估计和假设检验两个方面(详见表应用同样在于区间估计和假设检验两个方面(详见表8.1)。这里强调两点)。这里强调两点n.总总体体率率区区间间估估计计的的
43、查查表表法法实实际际上上是是根根据据poison分分布布公公式式解解方方程程(8.),(8.)得得到到,因因此此是是一一种种精精确确计计算算,相相当当于于假假设设检检验(样本率与总体率比较)中的直接计算概率法。验(样本率与总体率比较)中的直接计算概率法。n求上限求上限求下限求下限57第五十七页,讲稿共六十七页哦n2.总体率可信区间估计中要计算双侧的上下限,而假设检总体率可信区间估计中要计算双侧的上下限,而假设检n验中一般只计算单侧,问是否高于总体(或一般)时计验中一般只计算单侧,问是否高于总体(或一般)时计n算上侧概率,而问是否低于总体(或一般)时计算下侧算上侧概率,而问是否低于总体(或一般)
44、时计算下侧n概率。概率。n3.Poisson分布中的分布中的x具有率的含义具有率的含义(视这视这n=1时的率时的率)n4.利用正态近似法来处理正态近似法来处理Poisson分布将资料较为简便分布将资料较为简便,但同样应但同样应满足满足正态近似的条件正态近似的条件(一般认证一般认证 20),若不满足可利用可加性将若不满足可利用可加性将若干观察若干观察位合并位合并n5.两均数比较时需两均数比较时需观察单位观察单位(时间时间.面积面积.人口人口.基数等基数等)相同相同,若不同需若不同需化为相同化为相同,而且只能大单位化小单位而且只能大单位化小单位(如如5万人化为万人化为n1万人万人)58第五十八页,
45、讲稿共六十七页哦二项分布二项分布Poisson分布分布基本符号基本符号:总体率:总体率n:样本例数:样本例数X:某类事件发生数:某类事件发生数p=X/n:样本率样本率=n:总体中一定计量单:总体中一定计量单位内某事件的总均数位内某事件的总均数X:样本均数或样本计数:样本均数或样本计数恰有恰有k例阳性的概率例阳性的概率概率函数意义概率函数意义决定参数决定参数累积概率累积概率至多有至多有k例阳性的概率:例阳性的概率:至少有至少有k例阳性的概率:例阳性的概率:n两种分布的关系两种分布的关系说明说明n个观察数中恰好发生个观察数中恰好发生X个个某事件的概率某事件的概率说明一定观察单位内发生某事件说明一定
46、观察单位内发生某事件数为数为X的概率的概率n.n.59第五十九页,讲稿共六十七页哦二项分布二项分布Poisson分布分布正态近似条件正态近似条件均数均数标准差标准差可加性可加性n与与n(1-)均)均5=n,=(以率表示)(以率表示)20=n=2可信区间计:可信区间计:n50正态近似正态近似查百分率可信区间查百分率可信区间P.263附表附表3PuSP查查Poisson分布可信区间分布可信区间P.266附附表表4样本与总体比样本与总体比较(单侧)较(单侧)直接概率法直接概率法直接概率法直接概率法二项分布二项分布直接概率法直接概率法直接概率法直接概率法Poisson分布分布直接概率法直接概率法直接概
47、率法直接概率法算出算出P(Xk)或或P(Xk)与与比较比较正态近似(单,正态近似(单,双侧)双侧)无无有有60第六十页,讲稿共六十七页哦二项分布二项分布Poisson分布分布两样本率(均数)两样本率(均数)比较(正态近似)比较(正态近似)61第六十一页,讲稿共六十七页哦二项分布与二项分布与Poisson分布的分布的SPSS演示演示二项分布的累积概率计算:二项分布的累积概率计算:SPSS提供了一簇专门计算分布概率的函数,均以提供了一簇专门计算分布概率的函数,均以CDF开头。开头。二项分布累计概率的函数:二项分布累计概率的函数:quant指实指实际发生数际发生数样本例数样本例数prob指已知的总指
48、已知的总体发生率体发生率求出的概率是指求出的概率是指P(Xq)。)。62第六十二页,讲稿共六十七页哦H0:1=0=0.01H1:1 0=0.01单侧单侧=0.05P,按,按=0.05水准,不拒绝水准,不拒绝H0,故不能认为该地新生儿染色体异常率,故不能认为该地新生儿染色体异常率低于一般新生儿。低于一般新生儿。63第六十三页,讲稿共六十七页哦例例已知某地玉米的黄曲霉污染率近年为已知某地玉米的黄曲霉污染率近年为20%,若抽取,若抽取10个样品作检个样品作检查,求查,求污染样品数为污染样品数为3个的概率。个的概率。污染样品数不超过一个的概率。污染样品数不超过一个的概率。污染样品数在污染样品数在9个以
49、上的概率。个以上的概率。污染样品数为污染样品数为3个的概率:个的概率:污染样品数不超过一个的概率:污染样品数不超过一个的概率:污染样品数在污染样品数在9个以上的概率:个以上的概率:64第六十四页,讲稿共六十七页哦试题分析试题分析n n一一.是非题:是非题:n n1.1.从一已知率的总体中随机抽取无数个样本,若样本的例数从一已知率的总体中随机抽取无数个样本,若样本的例数从一已知率的总体中随机抽取无数个样本,若样本的例数从一已知率的总体中随机抽取无数个样本,若样本的例数 n n 很大且固定,其样本率的分布属正态或近似正态。很大且固定,其样本率的分布属正态或近似正态。很大且固定,其样本率的分布属正态
50、或近似正态。很大且固定,其样本率的分布属正态或近似正态。n n2.2.总体率为总体率为总体率为总体率为,样本含量为,样本含量为,样本含量为,样本含量为n n时,二项分布的均数为时,二项分布的均数为时,二项分布的均数为时,二项分布的均数为nn。n n3 3、各种疾病在人群中的分布常属二项、各种疾病在人群中的分布常属二项、各种疾病在人群中的分布常属二项、各种疾病在人群中的分布常属二项分布分布分布分布。n n4.4.两样本率差别的显著性检验最好用二项分布法计算两样本率差别的显著性检验最好用二项分布法计算两样本率差别的显著性检验最好用二项分布法计算两样本率差别的显著性检验最好用二项分布法计算概率概率概