《二项分布与分布.ppt》由会员分享,可在线阅读,更多相关《二项分布与分布.ppt(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、二项分布与分布1现在学习的是第1页,共67页了解二项分布(了解二项分布(binomial distribution)与)与Poisson分布(分布( Poisson distribution)的概)的概念念掌握二项分布的特点、均数与标准差的计算,掌握二项分布的特点、均数与标准差的计算,Poisson分布与二项分布和正态分布的关系;分布与二项分布和正态分布的关系;总体均数可信区间的估计、假设检验及适用总体均数可信区间的估计、假设检验及适用条件条件重点是二项分布的应用,难点是三种分布的区别重点是二项分布的应用,难点是三种分布的区别与联系与联系2现在学习的是第2页,共67页一一. .概念:概念: 为
2、率的抽样分布,各种情况的概率等于二项式展开为率的抽样分布,各种情况的概率等于二项式展开后的各项。后的各项。 X=0.1.2X=0.1.2.n.nn例:设小鼠接受某种毒物一定剂量时,其死亡率为例:设小鼠接受某种毒物一定剂量时,其死亡率为80%80%,若随机用三只小鼠作试验,问出现各种死亡情况的概,若随机用三只小鼠作试验,问出现各种死亡情况的概率?率? xnxnxxp1二项分布二项分布3现在学习的是第3页,共67页小鼠存亡的组合方式小鼠存亡的组合方式排列方式排列方式每种排列的概率每种排列的概率每种组每种组合的概合的概率率生存数生存数(X)死亡数死亡数(n-X)甲甲乙乙丙丙30生生生生生生0.20.
3、20.2=0.0080.00821生生生生死死0.20.20.8=0.0320.096生生死死生生0.20.80.2=0.032死死生生生生0.80.20.2=0.03212生生死死死死0.20.80.8=0.1280.384死死生生死死0.80.20.8=0.128死死死死生生0.80.80.2=0.12803死死死死死死0.80.80.8=0.5120.512 xxnnxxp,14现在学习的是第4页,共67页(0.8 + 0.2)3=(0.2)3 + 3(0.8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3 三生三生 二生一死二生一死 一生二死一生二死 三死三死 nXnXn
4、Xnnnnnn 1)( 1)(1)(1122211二二. 应用条件:应用条件:BernoulliBernoulli试验:试验: 在只有两种可能结果(成功与失败)的随机试在只有两种可能结果(成功与失败)的随机试验,每次试验时出现成功的概率验,每次试验时出现成功的概率是恒定的,而且各次试验相互是恒定的,而且各次试验相互独立。这种试验在统计学上称之为贝努里试验(独立。这种试验在统计学上称之为贝努里试验( Bernoulli trial)Bernoulli trial)。5现在学习的是第5页,共67页(1)二项分类资料:结果为)二项分类资料:结果为A或非或非A (成功与失败)(成功与失败) 。(2)每
5、次试验的条件不变:每次试验)每次试验的条件不变:每次试验A的发生概率均为的发生概率均为。(3)各次试验独立:每个观察单位的观察结果不会影响到其)各次试验独立:每个观察单位的观察结果不会影响到其 他观察单位的结果。他观察单位的结果。在在BernoulliBernoulli试验中,取得成功的次数试验中,取得成功的次数X X(X=0X=0,1 1,2 2,n n)的概率)的概率呈二项分布。其概率计算式:呈二项分布。其概率计算式:所以二项分布的应用条件就是所以二项分布的应用条件就是BernoulliBernoulli试验的条件,即:试验的条件,即: knknkkXP 1)()(式中:式中:n、为二项分
6、布的参数。为二项分布的参数。若随机变量若随机变量X服从以服从以n、为参数的二项分布记为为参数的二项分布记为XB( n.)。)。6现在学习的是第6页,共67页(2)至少有)至少有k例阳性的概率:例阳性的概率:(3)至多有)至多有k例阳性的概率:例阳性的概率: nKXPnPKPKPKPKXP)()()2()1()()( kXPkPPPPKXP0)()()2()1()0()(X= 0, 1, 2, kn三三. 概率的计算:概率的计算: knknkkXP 1)()()!( !)(knknnk (1)恰有)恰有k例阳性的概率:例阳性的概率:从一个阳性率为从一个阳性率为的总体中,随机抽取含量为的总体中,随
7、机抽取含量为n的样本,则样本中阳的样本,则样本中阳性数性数X或阳性率或阳性率p服从二项分布服从二项分布B ( n、)。)。7现在学习的是第7页,共67页 例例: 已知某地玉米的黄曲霉污染率近年为已知某地玉米的黄曲霉污染率近年为20%, 若抽取若抽取10个样品作检查,求个样品作检查,求污染样品数为污染样品数为3个的概率。个的概率。污染样品数不超过一个的概率。污染样品数不超过一个的概率。 污染样品数在污染样品数在9个以上的概率。个以上的概率。8现在学习的是第8页,共67页污染样品数为污染样品数为3个的概率:个的概率:2097.0008.0120201.08.02.0)()3(3103103XP污染
8、样品数不超过一个的概率:污染样品数不超过一个的概率:376. 08 . 02 . 0)(8 . 0)1()0()1(110110110 PPXP 污染样品数在污染样品数在9个以上的概率:个以上的概率:00000420. 02 . 08 . 02 . 0)()10()9()9(109109 PPXP9现在学习的是第9页,共67页 例例5.2 经统计,某省用经统计,某省用“中药阑尾炎合剂中药阑尾炎合剂”治疗急性阑尾炎性腹治疗急性阑尾炎性腹 膜炎的有效率为膜炎的有效率为86%,试分别估计:,试分别估计: 治疗治疗10例中至少例中至少9例有例有 效的概率;效的概率; 治疗治疗10例中至多例中至多7例有
9、效的概率。例有效的概率。 本例有效例数本例有效例数XB(10. 0.86),依题意,),依题意,10例患者中,例患者中,581. 0221. 0360. 086. 014. 086. 01099109910Cxpxpxp155. 058. 014. 086. 019)8(181728810Cxxpxpxp因此,因此,10例患者中至少例患者中至少9例有效的概率为例有效的概率为0.581,至多,至多7例有效的概率为例有效的概率为0.155。10现在学习的是第10页,共67页四四. 二项分布的图形二项分布的图形 308n11现在学习的是第11页,共67页(1)离散型)离散型(2)当当 =1- =0.
10、5时,两边对称时,两边对称(3)当当 0.5时,呈偏态分布。当时,呈偏态分布。当 0.5时,呈左偏态分时,呈左偏态分布;当布;当 0.5时,呈右偏态分布。时,呈右偏态分布。(4)当当n增大,二项分布逐渐逼近正态分布增大,二项分布逐渐逼近正态分布二项分布的特点:二项分布的特点:成功率成功率P=X/n的概率分布图形与成功次数的概率分布图形是完全一样的的概率分布图形与成功次数的概率分布图形是完全一样的,只需要把横轴上的,只需要把横轴上的X变换成变换成X/n就行了。就行了。一般认为,一般认为,n 和和 n( 1- ) 5时时, 可近似看作正态分布。可近似看作正态分布。12现在学习的是第12页,共67页
11、13现在学习的是第13页,共67页14现在学习的是第14页,共67页五五. 二项分布的二项分布的均数与标准差均数与标准差2.若用率表示,则:若用率表示,则: 1nnXX nPP 1p为率的标准误为率的标准误表示率的抽样误差表示率的抽样误差当当未知时,常以样本率未知时,常以样本率P来估计:来估计:nPPSP)1( 1.若若XB(n , ),),则则X 的均数和标准差为:的均数和标准差为:15现在学习的是第15页,共67页n X的均数在这里可以理解为n次试验中结果A期望出现的次数,而X的标准差则是衡量结果A出现次数的变异程度。n 例5.3 求例5.1中平均死亡鼠数及其标准差。n 根据死亡鼠数XB(
12、3,0.8)得到n 平均死亡鼠数 只n 标准差 4 . 28 . 03x69. 08 . 018 . 03只x23. 038 . 018 . 01nPP若用率表示,则若用率表示,则16现在学习的是第16页,共67页n二项分布的应用二项分布的应用n二项分布是一种常用的离散型分布,具有广泛的应用价二项分布是一种常用的离散型分布,具有广泛的应用价值。在实际问题中特别要注意判定一个变量是否服从二值。在实际问题中特别要注意判定一个变量是否服从二项分布。凡具有贝努利试验序列项分布。凡具有贝努利试验序列3个特点的变量,一般可认个特点的变量,一般可认为服从二项分布。为服从二项分布。n1)总体率的区间估计)总体
13、率的区间估计n总体率估计包括点估计和区间估计。点估计是直接用样本率总体率估计包括点估计和区间估计。点估计是直接用样本率来估计总体率。区间估计是根据样本提供的信息按一定的概来估计总体率。区间估计是根据样本提供的信息按一定的概率(即可信度)来估计总体率的可能范围。率(即可信度)来估计总体率的可能范围。n总体率的可信区间根据总体率的可信区间根据n和和P的大小一般有两种估计方法。的大小一般有两种估计方法。17现在学习的是第17页,共67页n 当当n足够大,足够大,P和和1-P均不太小时(可通过均不太小时(可通过nP与与n(1-P)均大于判断)均大于判断),n 样本率样本率P近似正态分布,这时可以利用正
14、态分布理论来估计总近似正态分布,这时可以利用正态分布理论来估计总体率的可信区间。体率的可信区间。n 可信度为可信度为1-1-的可信区间:的可信区间: n ppsupsup,18现在学习的是第18页,共67页n例例:n 某医院用复方当归注射液静脉滴注治疗脑动脉某医院用复方当归注射液静脉滴注治疗脑动脉硬化症硬化症188例,其中显效例,其中显效83例,试估计等量齐观例,试估计等量齐观方当归注射液显效率的方当归注射液显效率的95%和和99%可信区间。可信区间。n复方当归注射液静复方当归注射液静95%可信区可信区n(0.44151.960.036,0.44151.960.036) n =(0.3709,
15、0.5121)=(37.09% ,51.21%)036. 01885585. 04415. 01nppSp19现在学习的是第19页,共67页nB查表法查表法 n 如果如果n,pn,p不符合上述要求,当不符合上述要求,当n50n50,特别是,特别是P P很接近很接近0 0或或1 1时,样本资料呈二项分布,可用二项分布法估计时,样本资料呈二项分布,可用二项分布法估计总体率的可信区间。该法计算繁杂,附表总体率的可信区间。该法计算繁杂,附表3 3列出了总列出了总体率的体率的95%95%和和99%99%可信区间,可信区间,n例例5.5 从某学校随机抽取从某学校随机抽取26名学生,发现有名学生,发现有4名
16、感染沙眼,名感染沙眼,试求该校沙眼感染率试求该校沙眼感染率95%可信区间。可信区间。n本例本例n=26,X=4,查附表,查附表3的可信度为的可信度为95%的可信区间的可信区间为(为(0.04,0.35),即(),即(4%,35%)。)。20现在学习的是第20页,共67页n注意注意:n附表附表3 3中中X X值只列出值只列出 时,时,n可以用可以用n-Xn-X查表,然后以查表,然后以100%100%减去查的区间即为减去查的区间即为所求的可信区间所求的可信区间n例例5.6 5.6 某县抽查了某县抽查了1010名人员的乙型肝炎表面抗原名人员的乙型肝炎表面抗原(HBsAgHBsAg)携带情况,阴性者)
17、携带情况,阴性者8 8人,求该县人群人,求该县人群HbsAgHbsAg阴性率的阴性率的95%95%可信区间为可信区间为 若若x n/2 ,则按,则按n-x 查表得?,然后查表得?,然后100-?例:上题若例:上题若 X=8,则,则 n-x=10-8=2查表得:查表得:3% 56%然后然后100-?得:?得:44% 97%2nX 2nX 21现在学习的是第21页,共67页(2)样本率与总体率比较)样本率与总体率比较1)直接计算概率法)直接计算概率法例例:据据以以往往经经验验,新新生生儿儿染染色色体体异异常常率率一一般般为为 1%,某某医医院院观观察察了了当当地地 400 名名新新生生儿儿,只只有
18、有 1 例例染染色色体体异异常常,问问该该地地新新生生儿儿染染色色体体异异常常率率是是否否低低于于一一般般。 H0: 1 = 0 =0.01H1: 1 0 =0.01 单侧单侧 = 0.050905. 0)01. 0()99. 0()!1400( ! 1!400(0.99) )1()0()1(1400400 PPXPP,按,按=0.05水准,不拒绝水准,不拒绝H0,故不能认为该地新生儿染色体异常率低,故不能认为该地新生儿染色体异常率低于一般新生儿。于一般新生儿。22现在学习的是第22页,共67页n 例如例如5.7 一种鸭通常感染某种传染病的概率是一种鸭通常感染某种传染病的概率是0.2,现将一种
19、,现将一种药物注射到药物注射到25只鸭后发现有只鸭后发现有1只鸭发生感染,试推断这种只鸭发生感染,试推断这种药对预防感染是否有效药对预防感染是否有效nHo: 此药物对预防感染无效此药物对预防感染无效 即即=0.2 nH1: 此药物对预防感染有效此药物对预防感染有效 即即 0 =0.2 单侧单侧 = 0.05nPu)1( 06. 5304)2 . 01(2 . 020. 0316. 0 u24现在学习的是第24页,共67页(3)两样本率比较(近似正态法)两样本率比较(近似正态法) n1 p1、n1( 1-p1)和)和n2 p2、n2( 1-p2) 5时时)11)(1(2121nnppppucc
20、例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研例:为研究某地男女学生的肺吸虫感染率是否存在差别,某研究者随机抽取该地究者随机抽取该地80名男生和名男生和85名女生,查得感染人数男生名女生,查得感染人数男生23人,女生人,女生13人。请作统计分析。人。请作统计分析。H0: 1 = 2H1: 1 2 = 0.0509. 2)851801)(2182. 01(2182. 01529. 02875. 02182. 0)8580/()1323(1529. 085/13P 2875. 080/2321 uPPC25现在学习的是第25页,共67页PoissonPoisson分布分布一一.概念:概念:
21、 是二项分布的特例。当是二项分布的特例。当很小,而很小,而n很大时,则二项分布逼近很大时,则二项分布逼近Poisson分布。分布。例如:例如:每毫升水中大肠杆菌数的分布。每毫升水中大肠杆菌数的分布。粉尘在单位容积内计数的分布。粉尘在单位容积内计数的分布。放射性物质在单位时间内放射出质点数的分布。放射性物质在单位时间内放射出质点数的分布。单位空间中某些野生动物或昆虫数的分布。单位空间中某些野生动物或昆虫数的分布。一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布一定人群中某种患病率很低的非传染性疾病患病数或死亡数的分布。一般用于研究单位容积(或面积、时间)内某事件发生数。(小概一般用于研
22、究单位容积(或面积、时间)内某事件发生数。(小概率事件出现的规律性)率事件出现的规律性)26现在学习的是第26页,共67页二二. Poisson分布的概率:分布的概率:= n为为Poisson分布的总体均数;分布的总体均数;!)(XeXPX X=0,1,2,式中:式中:X为单位时间(或面积、容积等)某事件发生数;为单位时间(或面积、容积等)某事件发生数;e为自然对数的底,为自然对数的底,e2.71828从式中可知,从式中可知,为为Poisson分布的唯一参数。分布的唯一参数。X服从以服从以为参数的为参数的Poisson分布,可记为分布,可记为XP()。)。递推公式:递推公式: eP)0(1)(
23、)1( XXpXP 27现在学习的是第27页,共67页例:据以往经验,新生儿染色体异常率一般为例:据以往经验,新生儿染色体异常率一般为1%,试分别用二项,试分别用二项分布及分布及Poisson分布原理,求分布原理,求100名新生儿中发生名新生儿中发生X例(例(X=0,1,2,)染色体异常的概率。)染色体异常的概率。 1.按二项分布原理求按二项分布原理求P(X) XXXXXP)01. 0()99. 0()!100( !100)(100 3660. 0)01. 0()99. 0(!100! 0!100)0(0100 P3697. 0)01. 0()99. 0()!1100( ! 1!100)1(1
24、1100 P同理,可求得同理,可求得P(2),),P(3)等。)等。28现在学习的是第28页,共67页(2)按)按Poisson分布原理求分布原理求P(X):=n=1000.01=1367880. 071828. 2)0(1 P 367880. 010/1367880. 010)1( PP同理,可求得同理,可求得P(4),),P(5)等。)等。18394.011/1367880.011)2( PP0613. 012/11839. 012)3( PP(1)递推公式:递推公式:29现在学习的是第29页,共67页!)(XeXPX 36788. 07183. 20.)0(1110eeXP36788.
25、07183. 21.1.) 1(1111eeXP18394. 036788. 05 . 07183. 2! 21! 2! 2.)2(121212eeXP0613. 07183. 21666. 0.! 3! 3.)3(11313eeXP(2)公式:公式:30现在学习的是第30页,共67页 由表可见,对由表可见,对很小,很小,n很大的同一资料用二项很大的同一资料用二项 布法与布法与Poisson分布法计算结果是很接近的。但分布法计算结果是很接近的。但 Poisson分布的分布的 P(X)的计算较为简便。的计算较为简便。二二项项分分布布及及 Poisson 分分布布概概率率计计算算结结果果 P(X)
26、 X 二二项项分分布布 Poisson 分分布布 0 0.3660 0.3679 1 0.3697 0.3679 2 0.1849 0.1839 3 0.0610 0.0613 4 0.0149 0.0153 5 0.0029 0.0031 6 0.0005 0.0005 7 0.0001 0.0001 8 0.0000 0.0000 _ 1.0000 1.0000 31现在学习的是第31页,共67页三三. Poisson分布的图形:分布的图形:根据根据,按式,按式 可计算出的所有可能取值时的概率(),以其为纵轴,可可计算出的所有可能取值时的概率(),以其为纵轴,可绘制出绘制出poisson分
27、布概率分布列的图形,可见,分布概率分布列的图形,可见,poisson分布图形形状完全取分布图形形状完全取决于决于的大小。当的大小。当时图形基本对称,随时图形基本对称,随的增大,图形渐近于正态分的增大,图形渐近于正态分布。布。32现在学习的是第32页,共67页四四. Poisson分布的特性和应用条件:分布的特性和应用条件:离散型分布离散型分布 .Poisson分布只有一个参数,即参数分布只有一个参数,即参数;Poisson分布可看成二项分布的特例,其应用条件也就是二项分分布可看成二项分布的特例,其应用条件也就是二项分布的应用条件。布的应用条件。 ) , ( N3. 方差等于均数:即方差等于均数
28、:即2= 。为为Poisson分布的重要特征。分布的重要特征。4. Poisson分布在分布在不大时呈左偏态分布,随着不大时呈左偏态分布,随着的增大而逐渐趋于对称。的增大而逐渐趋于对称。当当20时,可认为近似正态分布时,可认为近似正态分布问题:问题:(1)具有传染性的罕见疾病的发生率能否用)具有传染性的罕见疾病的发生率能否用Poisson分布来分分布来分 析?析?(2)细菌在牛奶中呈集落状存在能否用)细菌在牛奶中呈集落状存在能否用Poisson分布来分析?分布来分析?5. Poisson分布的可加性。分布的可加性。33现在学习的是第33页,共67页若若X1, X2, Xk相互独立,且它们分别服
29、从以相互独立,且它们分别服从以1,2, k为参为参数的数的Poisson分布,则分布,则T=X1+ X2+ +Xk也服从也服从Poisson分布,其参分布,其参数为数为1+2+ k。Poisson分布的可加性:分布的可加性:n例如例如:某放射物质每某放射物质每.s放射粒子数服从均数为放射粒子数服从均数为.的的poisson分布,分布,现随机取次观测结果进行研究,这次观测结果分别为每现随机取次观测结果进行研究,这次观测结果分别为每.s反射反射,及个粒子数,问每,及个粒子数,问每.s放射粒子数为多少?并指出其服从于放射粒子数为多少?并指出其服从于均值为多少的均值为多少的poisson分布。分布。n
30、本例本例X1=2,X2=3,X3=4,利用利用poisson分布的可加性原理得到分布的可加性原理得到n X1X2X3=2349个个n均值为均值为2.2+2.2+2.2=6.6n每每.s放射粒子数为个,每放射粒子数为个,每.s放射粒子数服从于均值为放射粒子数服从于均值为.的的poisson分布分布34现在学习的是第34页,共67页v poisson分布可视为二项分布的特例若某种现象的发生分布可视为二项分布的特例若某种现象的发生率率甚小,而样本例数甚多时,则二项分布逼近甚小,而样本例数甚多时,则二项分布逼近poisson分分布布. poisson分布的正态近似一般在实际应用中,当分布的正态近似一般
31、在实际应用中,当时,时,poisson分布近似正态分布,资料可根据正态分分布近似正态分布,资料可根据正态分布原理处理,从而简化计算布原理处理,从而简化计算35现在学习的是第35页,共67页 poisson分布的应用条件分布的应用条件凡具有贝努利实验序列个特点且凡具有贝努利实验序列个特点且很小很小n大时,其相应大时,其相应的变量一般认为服从的变量一般认为服从poisson分布分布.实际工作中,实际工作中,往往是未知的,当往往是未知的,当poisson分布的观察分布的观察单位为单位为n时,常用样本计数(样本均数)作为时,常用样本计数(样本均数)作为的点估计值,相应的样本标准差的计算式为:的点估计值
32、,相应的样本标准差的计算式为: 标准误的计算式为:标准误的计算式为: xSxxSx36现在学习的是第36页,共67页n当当poisson分布的观察单位为分布的观察单位为n1时,常用样本均数时,常用样本均数n作为作为的点估计值,相应的样本标准差的的点估计值,相应的样本标准差的计算公式计算公式:n标准误的计算公式为标准误的计算公式为:n例例.某研究者取某研究者取m纯净水培养,得细菌数个,纯净水培养,得细菌数个,试分别估计试分别估计m和和m纯净水中细菌数的标准差和纯净水中细菌数的标准差和均值均值n 本例以每本例以每m纯净水为一个纯净水为一个poisson分布观察单位,此分布观察单位,此时时n1,利用
33、式(,利用式(.6)得样本标准差,)得样本标准差,n nxSx2nxSx75.760 xSx样本均值x=6037现在学习的是第37页,共67页n以每1m纯净水为一个poisson分布观察单位此时n5,利用式(.)得样本标准差为,n样本均数为个mn个m46. 3560nxsx38现在学习的是第38页,共67页1. 总体均数可信区间估计总体均数可信区间估计 1)查表法)查表法:X 50,尤其,尤其p0 或或 1时时 例例7.13:将一个面积为:将一个面积为100cm2的培养皿置于某病室中,的培养皿置于某病室中,1小时后取出小时后取出,培养,培养24小时,查得小时,查得8个菌落,求该病室平均个菌落,
34、求该病室平均1小时小时100cm2细菌数的细菌数的95%可可信区间。信区间。 查附表查附表7,x=8 得:得:3.4 15.8故该病室平均故该病室平均1小时小时100cm2细菌数的细菌数的95%可信区间为(可信区间为(3.4, 15.8)例例5.15 对某地居民饮用水进行卫生学检测中,随机抽查对某地居民饮用水进行卫生学检测中,随机抽查1mL水样,培养大肠水样,培养大肠杆菌杆菌2个,试估计该地区水中每毫升所含大肠杆菌的个,试估计该地区水中每毫升所含大肠杆菌的95%和和99%可信区间。可信区间。本例本例 x=2 95%可信区间得可信区间得 (0.2,7.2)问题:问题:若求若求该病室平均该病室平均
35、1小时小时50cm2细菌数的细菌数的95%可信区间?可信区间?将上述的上下限各除以将上述的上下限各除以2即可。即可。39现在学习的是第39页,共67页 40现在学习的是第40页,共67页2)正态近似法)正态近似法: 当当 X 50 时时例例7.14:用计数器测得某放射性物质半小时内发出的脉冲数为:用计数器测得某放射性物质半小时内发出的脉冲数为360个。试估计该放射性物质每个。试估计该放射性物质每30分钟平均脉冲数的分钟平均脉冲数的95%可信区间。可信区间。XuX2/ X样本计数样本计数2 .3978 .32236096. 13602/ XuX 即该放射性物质每即该放射性物质每30分钟平均脉冲数
36、的分钟平均脉冲数的95%可信区间为可信区间为322.8397.2个。个。41现在学习的是第41页,共67页n当Poisson分布的观察单位为n1时,其总体均数1-的可信区间计算公式为n若欲求该放射物质每分钟平均脉冲数的若欲求该放射物质每分钟平均脉冲数的95%可信区可信区间,因该放射物质每分钟总平均脉冲数为每间,因该放射物质每分钟总平均脉冲数为每30min总总体平均数的体平均数的1/30,故只需将每,故只需将每30min总体平均脉冲数总体平均脉冲数的的95%可信区间的下、上限可信区间的下、上限322.8和和397.2分别除以分别除以30,即可求得该放射物质每分钟平均脉冲数的即可求得该放射物质每分
37、钟平均脉冲数的95%可信区可信区间为(间为(10.76,13.24)22,nxunxnxunx42现在学习的是第42页,共67页2. 样本均数与总体均数比较样本均数与总体均数比较 1)直接计算概率法)直接计算概率法 例例 7.15: 据以往大量观察但某溶液中平均每毫升有细菌据以往大量观察但某溶液中平均每毫升有细菌3个。某研个。某研究者想了解该溶液放在究者想了解该溶液放在5冰箱中冰箱中3天,溶液中细菌是否会增长。现采天,溶液中细菌是否会增长。现采取已放在取已放在5冰箱中冰箱中3天的该溶液天的该溶液1毫升,测得细菌毫升,测得细菌5个。请作统计推断。个。请作统计推断。H0: =3H1: 3 单侧单侧
38、 = 0.051847. 0! 43! 33! 23! 131)(1)5(4333233340 eeeeeXPXPXP(X5),不拒绝,不拒绝H0,尚不能认为放在尚不能认为放在5冰箱中冰箱中3天该溶液中细菌会增天该溶液中细菌会增长。长。43现在学习的是第43页,共67页 根据根据Poisson分布的概率分布计算概率或积累概率,并依据小概率事件原理作分布的概率分布计算概率或积累概率,并依据小概率事件原理作出统计推断出统计推断n某罕见非传染性疾病的患病率一般为某罕见非传染性疾病的患病率一般为15/10万,现在某地区调查万,现在某地区调查1000人,人,发现阳性者发现阳性者2人问此地区患病率是否高于
39、一般。人问此地区患病率是否高于一般。n 单侧单侧 =0.05n 本例本例 ,n=1000 , 0=15/10万,万,0=n0=0.15,则在,则在Ho成立的前提下,成立的前提下,所调查的所调查的1000人中发现的阳性数人中发现的阳性数XP(0.15),则有),则有n 在在=0.05=0.05的检验水平上的检验水平上 n接受接受H1,认为此地区患病率高于一般,认为此地区患病率高于一般0102. 01291. 08607. 01.1101215. 015. 0eexpxpxp2. 样本均数与总体均数比较样本均数与总体均数比较44现在学习的是第44页,共67页2)近似正态法)近似正态法: 20时时0
40、0 Xu例例 7.16: 某溶液原来平均每毫升有细菌某溶液原来平均每毫升有细菌80个,现欲研究某低剂量辐射能个,现欲研究某低剂量辐射能否杀菌。研究者以此低剂量辐射该溶液后取否杀菌。研究者以此低剂量辐射该溶液后取1毫升,培养细菌毫升,培养细菌40个。请作个。请作统计推断。统计推断。H0: =80H1: 80 单侧单侧 = 0.0547. 480804000 XuP 0.01, 拒绝拒绝H0,接受,接受H1。可认为此。可认为此低剂量辐射能杀菌。低剂量辐射能杀菌。45现在学习的是第45页,共67页3. 两样本均数比较两样本均数比较(近似正态法,(近似正态法, 20时)时) 1)两样本的观察单位数相等
41、()两样本的观察单位数相等(n1=n2)例例7.17:为研究两个水源被污染的情况是否相同,在每个水源各取:为研究两个水源被污染的情况是否相同,在每个水源各取10ml水作细菌培养,甲水源共生长水作细菌培养,甲水源共生长890个菌落,乙水源共生长个菌落,乙水源共生长785个菌落,个菌落,请作统计推断。请作统计推断。2121XXXXu 566. 2785890785890 uH0: 1=2H1: 12 = 0.05P 0.01, 拒绝拒绝H0,接受,接受H1。可认为。可认为两个水源被污染的情况不同,甲水两个水源被污染的情况不同,甲水源污染较重。源污染较重。46现在学习的是第46页,共67页 2)两样
42、本的观察单位数不相等()两样本的观察单位数不相等(n1n2)2222112211nXnXnXnXu 例例7.18:某车间在生产工艺改革前测三次粉尘浓度,每次测一:某车间在生产工艺改革前测三次粉尘浓度,每次测一升空气,分别测得升空气,分别测得38,29和和36颗粉尘;改革后测取两次,分别有颗粉尘;改革后测取两次,分别有25,18颗粉尘。请据此推断改革前后粉尘浓度是否相同。颗粉尘。请据此推断改革前后粉尘浓度是否相同。72. 22433103243310322 un1=3, X1=38+29+36=103; n2=2,X2=25+18=43。47现在学习的是第47页,共67页例例 某城市在连续某城市
43、在连续5年中因交通事故而伤亡的总人数为年中因交通事故而伤亡的总人数为152人。经采取人。经采取安全措施后的两年中因交通事故而伤亡的总人数为安全措施后的两年中因交通事故而伤亡的总人数为44人,这个城市人,这个城市在这两个时期的人口数基本不变。试评价安全措施的效果(单侧)?在这两个时期的人口数基本不变。试评价安全措施的效果(单侧)?H0: 1=2H1: 1 2单侧单侧 = 0.05n1=5, X1=152; n2=2,X2=44033. 22445152244515222 u48现在学习的是第48页,共67页小小 结结二项分布常用于描述二项分类变量两种观察结果的出现率,二项分布常用于描述二项分类变
44、量两种观察结果的出现率,Poisson分布是二项分布的特例,常用于分析小概率事件的发生规律。分布是二项分布的特例,常用于分析小概率事件的发生规律。1.二项分布的概念:二项分布的概念:二项分布(二项分布(Binomial distribution)贝努里贝努里试验(试验(j. Bernoulli.1713j. Bernoulli.1713)分布分布.是一种最重要的离散型分布是一种最重要的离散型分布.它是用它是用于说明结果只能出现于说明结果只能出现 两种情况的两种情况的n 次实验中发生次实验中发生某某种结果为种结果为 x 次的概次的概率分布率分布.理论上说理论上说:若离散型随机变量若离散型随机变量
45、X的概率分布满足于下式的概率分布满足于下式: x=0, 1, 2,.n nxnxxp149现在学习的是第49页,共67页2、二项分布的特点、二项分布的特点:(1)二项分布是离散型的,因而具有离散型的共同特点:图形为独立的一些二项分布是离散型的,因而具有离散型的共同特点:图形为独立的一些线段,线段的高度代表概率的大小线段,线段的高度代表概率的大小;(2)二项分布由两个参数决定,即)二项分布由两个参数决定,即n和和;(3)二项分布的均数恰为两个参数的乘积,而)二项分布的均数恰为两个参数的乘积,而 n 方差为均数的(方差为均数的(1)倍,即有)倍,即有 , n ,n率表示则有率表示则有 ; (4 )
46、当当p=q=0.5时分布对称时分布对称,pq q时为左偏态时为左偏态,p,pq时为右偏态时为右偏态 (5) 当当n足够大,且足够大,且不太靠近不太靠近0或或1时,二项分布时,二项分布 趋于正态分布;趋于正态分布; (6)当)当n.0(如(如5,n(1-p)5)时才能采用。)时才能采用。n4)无论是样本率与总体率的比较还是两样本率比较的)无论是样本率与总体率的比较还是两样本率比较的u检验,检验,均可用均可用2检验来完成,二者是等价的(检验来完成,二者是等价的(u2=2)一般来说,)一般来说,如给出的是四格表的观察数资料,用如给出的是四格表的观察数资料,用2检验方便一些;而给检验方便一些;而给出的
47、是率的资料,则用出的是率的资料,则用u 检验方便一些检验方便一些n 54现在学习的是第54页,共67页nPoisson分布的概念及应用条件:n Poisson分布也是一种重要的离散型分布。它是二项分布在分布也是一种重要的离散型分布。它是二项分布在n 很很大而大而很小时的特殊情况,同样两分类资料在很小时的特殊情况,同样两分类资料在n次实验中发生次实验中发生X次某种结果的概率分布。其准确的定义为,若离散型随机次某种结果的概率分布。其准确的定义为,若离散型随机变量变量X的概率分布满组下式的概率分布满组下式n n .nn则称则称X服从服从Poisson分布分布n !)(XeXPX 55现在学习的是第5
48、5页,共67页n2、Poisson分布的特点分布的特点n(1)Poisson分布是离散型的,因而同样具有上述离散型分布是离散型的,因而同样具有上述离散型 n 的共同特点;的共同特点;n(2)Poisson分布只有一个参数,即参数分布只有一个参数,即参数;n(3)Poisson分布的均数正巧等于其方差;分布的均数正巧等于其方差;n(4)当)当较大时,较大时,Poisson分布趋于正态分布;分布趋于正态分布;n(5)Poisson分布分布具有可加性。分布分布具有可加性。n3、Poisson分布的累计概率分布的累计概率 同二项分布,同样可计算上同二项分布,同样可计算上 n 下两侧累计概率。下两侧累计
49、概率。n4、Poisson分布的应用条件分布的应用条件 因为因为Poisson分布是二项分布的特殊情况,分布是二项分布的特殊情况,因此使用因此使用Poisson分布既要满足前述二项分布的三个应用条件,还要分布既要满足前述二项分布的三个应用条件,还要求求n很大而很大而很小。很小。56现在学习的是第56页,共67页npoisson分布的分布的 应用同样在于区间估计和假设检验两个方面(详应用同样在于区间估计和假设检验两个方面(详见表见表8.1)。这里强调两点)。这里强调两点n.总体率区间估计的查表法实际上是根据总体率区间估计的查表法实际上是根据 分布公式解方程分布公式解方程(8.),(),(8.)得
50、到,因此是一种精确计算,相当于假设检)得到,因此是一种精确计算,相当于假设检验(样本率与总体率比较)中的直接计算概率法。验(样本率与总体率比较)中的直接计算概率法。n 求上限求上限 求下限求下限2!0XeXkx2!XeXnkx57现在学习的是第57页,共67页n2.总体率可信区间估计中要计算双侧的上下限,而假设检总体率可信区间估计中要计算双侧的上下限,而假设检 n 验中一般只计算单侧,问是否高于总体(或一般)时计验中一般只计算单侧,问是否高于总体(或一般)时计n 算上侧概率,而问是否低于总体(或一般)时计算下侧算上侧概率,而问是否低于总体(或一般)时计算下侧n 概率。概率。n3. Poisso