《二项分布与泊松分布精选PPT.ppt》由会员分享,可在线阅读,更多相关《二项分布与泊松分布精选PPT.ppt(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、二项分布与泊松分布第1页,此课件共74页哦目 录q 第二节第二节 Poisson分布及其应用分布及其应用q 第一节第一节 二项分布及其应用二项分布及其应用第2页,此课件共74页哦第一节 二项分布及其应用 一、二项分布的概念及应用条件 w 二项分布(binominal distribution)是一种重要的离散型分布,在医学上常遇到属于两分类的资料,每一观察单位只具有相互独立的一种结果,如检查结果的阳性或阴性,动物试验的生存或死亡,对病人治疗的有效或无效等。第3页,此课件共74页哦二项分布 也称为贝努里分布(Bernoulli distribution)或贝努里模型,是由法国数学家J.Berno
2、ulli于1713年首先阐述的概率分布。第4页,此课件共74页哦 如果已知发生某一结果(如阳性)的概率为,其对立结果(阴性)的概率为(1-),且各观察单位的观察结果相互独立,互不影响,则从该总体中随机抽取n例,其中出现阳性数为X(X=0,1,2,3,,n)的概率服从二项分布。第5页,此课件共74页哦贝努里模型应具备下列三个基本条件贝努里模型应具备下列三个基本条件 试验结果只出现对立事件A或,两者只能出现其中之一。这种事件也称为互斥事件。试验结果是相互独立,互不影响的。例如,一个妇女生育男孩或女孩,并不影响另一个妇女生育男孩或女孩等。每次试验中,出现事件A的概率为,而出现对立事件的概率为-。则有
3、总概率 +(1-)=1。第6页,此课件共74页哦二、二项分布的概率函数 v 根据贝努里模型进行试验的三个基本条件,可以求出在n 次独立试验下,事件A出现的次数X的概率分布。X为离散型随机变量,其可以取值为0,1,2,n。则X的概率函数为:X X=0,1,2,=0,1,2,n n式中:式中:0101,为组合数,上述公式称随为组合数,上述公式称随机变量机变量X X服从参数为服从参数为n n,的二项分布,则记为的二项分布,则记为X XB(n,)B(n,)。第7页,此课件共74页哦三、二项分布的性质 1.二项分布的每种组合的概率符合二项展开式,其总概率等于1 第8页,此课件共74页哦二项展开式有以下特
4、点:(1)展开式的项数为n+1。(2)展开式每项和(1-)指数之和为n。(3)展开式每项的指数从0到n;(1-)的指数从n到0。2.二项分布的累积概率 设m1Xm2 (m1m2),则X在m1至m2区间的累积概率有:第9页,此课件共74页哦v 至多有x例阳性的概率为:v 至少有x例阳性的概率为:X=0,1,2,x (7.4)X=x,x+1,n分别为下侧累计概率,和上侧累计概率。分别为下侧累计概率,和上侧累计概率。第10页,此课件共74页哦3.3.二项分布的概率分布图形二项分布的概率分布图形v 以X为横坐标,P(X)为纵坐标,在坐标纸上可绘出二项分布的图形,由于X为离散型随机变量,二项分布图形由横
5、坐标上孤立点的垂直线条组成。v 二项分布的图形取决于与n的大小。当n充分大时,二项分布趋向对称,可以证明其趋向正态分布。v 一般地,如果n之积大于5时,分布接近正态分布;当n5时,图形呈偏态分布。当=0.5时,图形分布对称,近似正态。如果0.5或距0.5较远时,分布呈偏态。第11页,此课件共74页哦图图 二项分布示意图二项分布示意图 第12页,此课件共74页哦4.二项分布的数字特征 (这里的数字特征主要指总体均数、方差、标准差等参数)(1)随机变量X的数学期望E(X),即指总体均数:n (2)随机变量X的方差D(X)2 为:(3)随机变量X的标准差为:第13页,此课件共74页哦四、二项分布展开
6、式各项的系数四、二项分布展开式各项的系数 v 二项分布展开式的各项之前均有一个系数,用组合公式来表示。计算公式为:第14页,此课件共74页哦w 该系数也可用杨辉三角来表示,国外参考书习惯称之为巴斯噶三角。w 当试验次数n较小时,可直接利用杨辉三角将二项分布展开式各项的系数写出来,应用十分方便。第15页,此课件共74页哦图图 杨辉三角模式图杨辉三角模式图 第16页,此课件共74页哦杨辉三角的意义:杨辉三角的意义:w杨辉三角中每行有几个数字,表示展开式有几项。当试验次数为n 时,有n+1项。w杨辉三角中每行中的数字表示展开式中每项的系数大小。w杨辉三角中的各数字项及其数字的排列很有规律。可依照规律
7、继续写下去。第一行的第一、第二项均为数字,以后每下一行的首项及末项均为,中间各项为上一行相邻两项数字之和。第17页,此课件共74页哦五、二项分布的应用五、二项分布的应用 w二项分布在医学领域中,主要应用在下列几个方面:w总体率的可信区间估计,w率的u检验,w样本率与总体率比较的直接计算概率法。第18页,此课件共74页哦(一)应用二项分布计算概率(一)应用二项分布计算概率 w例 如出生男孩的概率=0.5,出生女孩的概率为(1-)=0.5。在一个妇产医院里有3名产妇分娩3名新生儿,其中男孩为X=0,1,2,3的概率按公式计算的结果列于表7-1的第(3)栏中。w分析:根据题意,已知生育男孩为事件A,
8、其概率P(A)=0.5(即=0.5);生育女孩为事件A-,其概率为P(A-)=1-P(A)=1-0.50.5(即1-=0.5)。第19页,此课件共74页哦第20页,此课件共74页哦v 三个妇女生育一个男孩,两个女孩的概率为:v 三个妇女生育均为女孩(即无男孩)的概率为:余类推余类推第21页,此课件共74页哦(二二)样本率与总体率的比较的直接概率法样本率与总体率的比较的直接概率法 v 此法适用此法适用n n和和n n(1-(1-)均小于均小于5 5的情形。的情形。v 应注意:应注意:v 当样本率大于总体率时,应计算大于等于阳性人当样本率大于总体率时,应计算大于等于阳性人数的累积概率。数的累积概率
9、。v 当样本率小于总体率时,应计算小于等于阳性人当样本率小于总体率时,应计算小于等于阳性人数的累积概率。数的累积概率。第22页,此课件共74页哦 例 A药治疗某病的有效率为80。对A药进行改进后,用改进型A药继续治疗病人,观察疗效。如果用改进型A药治疗20例病人,19例有效。如果用改进型A药治疗30例病人,29例有效。试分析上述二种情形下,改进型A药是否疗效更好。分析:A药有效率为80,可以作为总体率,即00.8。治疗20例病人的样本有效率为(1920)10095;治疗30例病人的样本有效率为(2930)10096.67。两个样本率均大于总体率80,故应计算大于等于有效例数的单侧累积概率。第2
10、3页,此课件共74页哦情形一:治疗20例病人的疗效分析 w(1)建立检验假设wH0:改进型A药的疗效与原A药相同,00.80H1:改进型A药的疗效高于原A药,0 0.80w单侧 0.05w(2)计算概率值 根据二项分布有:=0.0548+0.0115=0.0663=0.0548+0.0115=0.0663 第24页,此课件共74页哦情形二:治疗30例病人的疗效分析(1)检验假设同情形一。(2)计算单侧累积概率有:(3)推断结论 本例P0.06630.05,在0.05检验水准上,不拒绝H0。尚不能认为改进型A药的疗效优于原A药。=0.008975+0.001238=0.01020.008975+
11、0.001238=0.0102 第25页,此课件共74页哦(3)推断结论 本例P0.0102,在0.05水准上,拒绝H0,接受H1。可以认为改进型A药的疗效优于原A药。v 注意:治疗20例病人的有效率为95,治疗30例病人的有效率为96.67,两个样本有效率很接近。但最终得出的结论却不相同。一般地,临床上观察疗效,样本含量不能太小。随着观察例数的增加,疗效的稳定性及可靠性也相应增加,受到偶然因素影响的机会也变得较小。第26页,此课件共74页哦分析:本例总体率1。调查人群样本反应率为(1300)1000.33。由于样本率小于总体率,故应计算小于等于阳性人数的累积概率。w例 一般人群对B药的副作用
12、反应率为1。调查使用B药者300人,其中只有1人出现副作用。问该调查人群对B药的副作用反应率是否低于一般人群。第27页,此课件共74页哦w(1)建立检验假设wH0:调 查 人 群 反 应 率 与 一 般 人 群 相 同,0 0.01H1:调查人群反应率低于一般人群,0 0.01w单侧 0.05w(2)计算单侧累积概率:(3)推断结论 本例 P0.1976,在0.05水准上,不拒绝H0。尚不能认为调查人群的B药副作用反应率低于一般人群。第28页,此课件共74页哦第二节 Poisson分布及其应用w一、Poisson分布的概念及应用条件 w(一)Poisson分布的概念wPoisson分布由法国数
13、学家S.D.Poisson在1837年提出。该分布也称为稀有事件模型,或空间散布点子模型。在生物学及医学领域中,某些现象或事件出现的机会或概率很小,这种事件称为稀有事件或罕见事件。稀有事件出现的概率分布服从Poisson分布。第29页,此课件共74页哦vPoisson分布的直观描述:如果稀有事件如果稀有事件A在每个单元(设想在每个单元(设想为为n次试验)内平均出现次试验)内平均出现次,那么在一个单元(次,那么在一个单元(n次)的试次)的试验中,稀有事件验中,稀有事件A出现次数出现次数X的概率分布服从的概率分布服从Poisson分布。分布。vPoisson分布属于离散型分布。在Poisson分布
14、中,一个单元可以定义为是单位时间,单位面积,单位体积或单位容积等。如每天8小时的工作时间,一个足球场的面积,一个立方米的空气体积,1升或1毫升的液体体积,培养细菌的一个平皿,一瓶矿泉水等都可以认为是一个单元。一个单元的大小往往是根据实际情况或经验而确定的。若干个小单元亦可以合并为一个大单元。第30页,此课件共74页哦(二)常见Poisson分布的资料在实际工作及科研中,判定一个变量是否服从Poisson分布仍然主要依靠经验以及以往累积的资料。以下是常见的Poisson分布的资料:1.产品抽样中极坏品出现的次数;2.枪打飞机击中的次数;3.患病率较低的非传染性疾病在人群中的分布;4.奶中或饮料中
15、的病菌个数;5.自来水中的细菌个数;6.空气中的细菌个数及真菌饱子数;7.自然环境下放射的粒子个数;第31页,此课件共74页哦8.布朗颗粒数;9.三胞胎出生次数;10.正式印刷品中错误符号的个数;11.通讯中错误符号的个数;12.人的自然死亡数;13.环境污染中畸形生物的出现情况;14.连体婴儿的出现次数;15.野外单位面积某些昆虫的随机分布;16.单位容积内细胞的个数;17.单位空气中的灰尘个数;18.平皿中培养的细菌菌落数等。第32页,此课件共74页哦二、Poison分布的概率函数及性质 w 定义 其中其中0 0,则称,则称X X服从参数服从参数为的为的PoissonPoisson分布。分
16、布。记为记为X XP P()()。式中:。式中:为总体均数,为总体均数,n n或或=np=np;X X为稀有为稀有事件发生次数;事件发生次数;e e为自然底数,即为自然底数,即e e=2.71828=2.71828 。(X=0,1,2,)v如果稀有事件如果稀有事件A A在每个单元(设想为在每个单元(设想为n n次试验)内平均出现次试验)内平均出现次,那么在一个单元(次,那么在一个单元(n n次)的试验中,稀有事件次)的试验中,稀有事件A A出现次数出现次数X X的概率分布服从的概率分布服从PoissonPoisson分布。分布。第33页,此课件共74页哦亦可用下列公式计算 P(0)=e 第34
17、页,此课件共74页哦(二)性质1.所有概率函数值(无穷多个)之和等于所有概率函数值(无穷多个)之和等于1,即,即2.2.分布函数分布函数 (X X=0,1,2,=0,1,2,x x)第35页,此课件共74页哦(0 x1x2)3.累积概率累积概率 4.4.其它性质其它性质总体均数总体均数:方差:方差:标准差:标准差:n(或或np)2第36页,此课件共74页哦(三)Poisson分布的图形w一般地,Poisson分布的图形取决于值的大小。值愈小,分布愈偏;值愈大,分布愈趋于对称。当20时,分布接近正态分布。此时可按正态分布处理资料。当50时,分布呈正态分布。这里通过计算一个具体实例来观察Poiss
18、on分布的概率分布趋势。第37页,此课件共74页哦图 Poisson分布的概率分布图 第38页,此课件共74页哦例 计算Poisson分布XP(3.5)的概率。第39页,此课件共74页哦余类推。经计算得到一系列数据,见表。表表 X XP P(3.53.5)的)的 PoissonPoisson分布分布 第40页,此课件共74页哦(四)Poisson分布的可加性w 从同一个服从Poisson分布的总体中抽取若干个样本或观察单元,分别取得样本计数值X1,X2,X3,Xn,则Xi 仍然服从Poisson分布。根据此性质,若抽样时的样本计数X值较小时,可以多抽取几个观察单元,取得计数Xi,将其合并以增大
19、X计数值。第41页,此课件共74页哦三、Poisson分布与二项分布的比较 v Poisson分布也是以贝努里模型为基础的。实际上,Poisson分布是二项分布的一种特殊情形,即稀有事例A出现的概率很小,而试验次数n很大,也可将试验次数n看作是一个单元。此时,n或np=为一个常数,二项分布就非常近似Poisson分布。p愈小,n愈大,近似程度愈好。v 设1。当n=100,=0.01时,及n=1000,=0.001时,按照二项分布及Poisson分布计算概率P(X)。第42页,此课件共74页哦表表 二项分布与二项分布与PoissonPoisson分布计算的概率值比较分布计算的概率值比较 第43页
20、,此课件共74页哦余类推。1.按二项分布计算已知:n=100,=0.01,1=0.99,代入公式有:第44页,此课件共74页哦2.按Poisson分布计算 代入公式有:余类推。第45页,此课件共74页哦(四)(四)PoissonPoisson分布的应用分布的应用 wPoisson分布有多种用途。主要包括总体均数可信区间的估计,样本均数与总体均数的比较,两样本均数的比较等。应用Poisson分布处理医学资料时,一定要注意所处理资料的特点和性质,资料是否服从Poisson分布。第46页,此课件共74页哦(一)总体均数的估计(一)总体均数的估计 总体均数的估计包括点估计和区间估计。点估计是指由样本获
21、得的稀有事件A出现的次数X值,作为总体均数的估计值。该法的优点是计算简便,但缺点是无法得知样本代表总体均数的可信程度。区间估计可以确切获知总体均数落入一个区域的可信度,一般可信度取95或99。第47页,此课件共74页哦 估计总体均数可信区间一般分为小样本法和大样本法。1.小样本法 当样本均数或样本计数值X50时,可直接查“Poisson分布的可信区间”表,得到可信区间(略)。第48页,此课件共74页哦2.正态近似法 当样本均数或计数X50时,可按正态分布法处理。w总体均数95的可信区间为 w总体均数总体均数99的可信区间为的可信区间为 第49页,此课件共74页哦例 某防疫站检测某天然水库中的细
22、菌总数。平均每毫升288个细菌菌落。求该水体每毫升95和99的可信区间。w应用公式有:95的可信区间=(255.74,320.26)99的可信区间的可信区间=(244.22,331.78)第50页,此课件共74页哦(1)发病人数的95可信区间为:w例 调查1985年某市某区30万人,流行性出血热发病人数为204人。求该市发病人数及发病率(110万)95的可信区间。w分析:已知样本均数X为204人,观察单元n30万人。先计算出发病人数的可信区间,再按照发病率的要求以10万人作为观察单元,计算发病率可信区间的上下限值。=(176176,232232)第51页,此课件共74页哦(2)发病率的95可信
23、区间为:w上限值:w下限值:下限值:第52页,此课件共74页哦(二)样本均数与总体均数的比较v 常用的方法有两种。v 直接计算概率法:与二项分布的计算思路基本相同。即当20时,按Poisson分布直接计算概率值。v 正态近似法:当20时,Poisson分布接近正态分布。按正态分布使用u检验处理资料。第53页,此课件共74页哦1.1.直接计算概率法直接计算概率法 q 例 某地区以往胃癌发病率为1万。现在调查10万人,发现3例胃癌病人。试分析该地区现在的胃癌发病率是否低于以往的发病率。H0:现在胃癌发病率与以往相同,0=0.0001H1:现在胃癌发病率低于以往,0单侧 0.05第54页,此课件共7
24、4页哦(2)计算概率值 q 已 知:n=100000,=0.0001,n =1000000.0001=10。q根据题意,应计算小于等于3人发病的概率P(X3),即:P(X3)P(0)P(1)+P(2)+P(3)q 第55页,此课件共74页哦(3)推断结论 本例P0.0103,小于P0.05。在0.05水准上拒绝H0,接受H1。可以认为现在该地区胃癌发病率低于以往发病率。第56页,此课件共74页哦2正态近似法 当20时,用u检验法 例 根据医院消毒卫生标准,细菌总数按每立方米菌落形成单位(CFUm3)表示。无菌间的卫生标准为细菌菌落数应不大于200(CFUm3)。某医院引进三氧消毒机,每天自动对
25、无菌间进行2小时消毒。对无菌间抽样调查显示,细菌总数为121CFUm3。试问该医院无菌间的细菌总数是否低于国家卫生标准。第57页,此课件共74页哦q (1)建立检验假设H0:无菌间的细菌总数符合国家卫生标准,=0=200H1:无菌间的细菌总数低于国家卫生标准,u0.05,故P0.05。推断结论 因P u0.001,故P0.001。推断结论 因P0.001,拒绝H0,接受H1,差异有统计学意义。可以认为该风景区两个不同地点的空气负离子状况有差异。第64页,此课件共74页哦例 调查某地区人群死亡状况。结果显示,男性及女性的意外死亡率分别为62人10万人和72人10万人。试分析男女意外死亡率有无差异
26、。分析:该资料服从Poisson分布,每10万人可以作为一个观察单元。(1)建立检验假设 H0:男女意外死亡率相等,H1:男女意外死亡率不相等,=0.05第65页,此课件共74页哦(3)确定P值,推断结论 本例u=0.86,小于u0.05=1.96,则P0.05。在 0.05水准上,不拒绝H0,无统计学意义。可以认为男女性意外死亡率无差异。(2 2)计算)计算u u值:值:第66页,此课件共74页哦例 某医院使用一定方法对住院病房进行消毒,并检测某一病房消毒前后的细菌菌落数(CFUm3)。消毒前后均检测9次。消毒前的菌落数为18,10,9,15,5,2,6,5,2。消毒后的菌落数为5,4,5,
27、6,7,2,3,2,1。试分析该病房消毒前后的卫生状况有无差异。分析:该资料服从Poisson分布。根据Poisson分布的可加性,将9次取样的菌落数相加为一个观察单元。消毒前为X172;消毒后为X235。第67页,此课件共74页哦(1)建立检验假设 H0:消毒前后菌落数相等,1=2 H1:消毒前后菌落数不等,1 2 =0.01(2)计算u值:(3)确定P值,推断结论 本例u=3.58,大于u0.01=2.58,则P0.01。在0.01水准上拒绝H0,接受H1。可以认为该病房消毒前后的卫生状况不同。第68页,此课件共74页哦2两样本观察单元不同 当两样本观察单元不同时,不可直接比较或直接相加后
28、进行比较。一般可计算两样本均数和,再按下式计算u值。第69页,此课件共74页哦例 某防疫站检验某商场的两种品牌的矿泉水。检测每ml的细菌总数(CFUml)。品牌A抽查4瓶,结果为132,156,182,143;品牌B抽查6瓶,结果为313,298,356,384,348,306。试分析A、B两种品牌矿泉水的细菌总数有无差异。分析:本例观察单元不相同,可以先求出均数。品牌品牌A的均数的均数品牌品牌B的均数的均数第70页,此课件共74页哦(1)建立检验假设 H0:两种品牌矿泉水菌落数相等,1=2 H1:两种品牌矿泉水菌落数不等,1 2=0.05(2)计算u值:(3 3)确定)确定P P值值,推断结
29、论,推断结论 本例本例u u=18.66,=18.66,大于大于u u0.010.01=2.58=2.58,则,则P P0.010.01。可以认为。可以认为A A、B B两种品牌矿泉水受细菌污染程度不同。两种品牌矿泉水受细菌污染程度不同。第71页,此课件共74页哦(五)应用Poisson分布的注意事项w1.Poisson分布的观察单元具有可加性。当样本均数X或样本计数值20时,可通过增加或合并观察单元以增大样本均数或样本计数值。当X20时,Poisson分布近似正态分布,可按正态分布进行Poisson分布均数比较的u检验。第72页,此课件共74页哦2.Poisson分布的观察单元可以由大缩小,而不可以由小扩大。例如,实际观察1个平皿中的细菌菌落数为34个,不能据此将其扩大而认为10个平皿的菌落数为340个。如果实际观察了10个平皿的菌落数为340个,可以将其缩小而认为2个平皿有68个菌落数。3判断一组数据或一个资料是否服从Poisson分布,主要是依靠以往积累的经验或专业知识。必要时也可进行拟合优度检验以确定资料分布类型。第73页,此课件共74页哦Thank You for Listening第74页,此课件共74页哦