《卫生统计学 卡方检验.ppt》由会员分享,可在线阅读,更多相关《卫生统计学 卡方检验.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、率或构成比的比较及率或构成比的比较及分类变量资料的关联性分析分类变量资料的关联性分析 第第 九九 章章Dec 1,2009第一节 样本率和总体率的比较一、直接计算概率法一、直接计算概率法例例91 根据以往经验,新生儿染色体异根据以往经验,新生儿染色体异常率一般为常率一般为1,某医院观察了当地,某医院观察了当地400名名新生儿,只有新生儿,只有l例染色体异常,问该地新例染色体异常,问该地新生儿染色体异常率是否低于一般生儿染色体异常率是否低于一般?Dec 1,2009H0:=0.01H1:0.05,按,按=0.05水准尚不水准尚不能拒绝能拒绝H0,尚不能认为该地新生儿染,尚不能认为该地新生儿染色体
2、异常率低于一般。色体异常率低于一般。Dec 1,2009二、正态近似法二、正态近似法 当当n较大,总体率较大,总体率 既不接近既不接近0也不也不接近接近1,n 和和n(1)均大于均大于5,二,二 项分布近似正态分布,利用正态分项分布近似正态分布,利用正态分布的原理,计算检验统计量布的原理,计算检验统计量u值作假值作假设检验。设检验。Dec 1,2009例例92 已知一般人群中慢性支气已知一般人群中慢性支气管炎患病率为管炎患病率为9.7%,现调查了,现调查了500名吸烟者,其中有名吸烟者,其中有95人患慢性支气人患慢性支气管炎,试推断吸烟人群中慢性支气管炎,试推断吸烟人群中慢性支气管炎患病率是否
3、比一般人群高?管炎患病率是否比一般人群高?Dec 1,2009H0:=0H1:0 单侧单侧=0.05本例本例n=500,X=95,p=0.19,0=0.097,得:得:因单因单u0.05=1.64,uu0.05,pu0.05/2,P0.05,所以拒绝所以拒绝H0。Dec 1,2009第三节第三节 完全随机设计两样本率完全随机设计两样本率 比较的比较的 2检验检验满足正态性满足正态性条件条件无正态无正态性要求性要求Dec 1,2009例例94 叙述见例叙述见例93,将上述资料整理,将上述资料整理成表格如下:成表格如下:表表91 某市某市2000年城乡居民的两周患病率年城乡居民的两周患病率Dec
4、1,2009 2检验的基本思想检验的基本思想 一、四格表资料的一、四格表资料的 2检验检验组别组别阳性数阳性数阴性数阴性数合计合计I组组aba+b=n1.II组组cdc+d=n2.合计合计a+c=n.1b+d=n.2a+b+c+d=nDec 1,2009 基本步骤基本步骤H0:城乡居民的两周总体患病率相同:城乡居民的两周总体患病率相同即即 1 1 2 2 H1:城乡居民的两周总体患病率不同城乡居民的两周总体患病率不同即即 1 1 2 2,0.050.051、建立假设、建立假设Dec 1,2009 2、实际频数与理论频数的差值服从、实际频数与理论频数的差值服从 2分布:分布:计算计算 2值的基本
5、公式:值的基本公式:(R1)()(C1)3、查表,判断结果,下结论。查表,判断结果,下结论。Dec 1,2009A:actual value 实际数实际数T:theoretical value 理论数理论数Dec 1,2009如何求各个格子的理论数T?H0:1 2 理论数理论数T为假设的总合计率已知的条件下,为假设的总合计率已知的条件下,所估计的理论频数,在目前的情况下,将所估计的理论频数,在目前的情况下,将样本现有的合计患病率作为总合计率样本现有的合计患病率作为总合计率 的最的最佳估计,即佳估计,即17.69%Dec 1,2009城区理论两周患病频数为 17.69%660=230 660/1
6、300=116.77城区理论两周非患病频数为82.31%660=1070 660/1300=543.33农村理论两周患病频数为 17.69%640=230 640/1300=113.23农村理论两周非患病频数为82.31%640=1070 640/1300=526.77理论频数理论频数TRC的计算公式为:的计算公式为:TRCnRnC/nDec 1,2009 H0:该市城乡居民的两周总体患病率相同,:该市城乡居民的两周总体患病率相同,1=2H1:该市城乡居民的两周总体患病率率不同,:该市城乡居民的两周总体患病率率不同,12 =0.05查附表查附表12可知,可知,=1时,时,本例,本例 ,按照,按
7、照=0.05的检验水准,拒绝的检验水准,拒绝H0假假设,接受设,接受H1假设。即该市城乡居民的总体两周患病假设。即该市城乡居民的总体两周患病率不同。根据现有资料看出,农村的患病率高于城率不同。根据现有资料看出,农村的患病率高于城区。区。Dec 1,2009基本思想当当H0为真时,一般情况下,两样本率不会为真时,一般情况下,两样本率不会相差太大,相应的理论频数相差太大,相应的理论频数(T)和实际频数和实际频数(A)相差也不会太大,当相差也不会太大,当T和和A相差较大时,相差较大时,超出了实际误差范围,就有理由怀疑超出了实际误差范围,就有理由怀疑H0的的成立。成立。Dec 1,2009Dec 1,
8、2009 2 2分布曲线图的特点分布曲线图的特点1 1 与与u u、t t、F F分布一样,分布一样,2 2 分布是一分布是一个连续型的分布,只有一个参数个连续型的分布,只有一个参数 决决定它的形状;定它的形状;2 2 越大,曲线趋于对称,越大,曲线趋于对称,2 2 分布趋向正态分布;分布趋向正态分布;3 3 卡方图形的面积分布有规律性,卡方图形的面积分布有规律性,记为自由度为记为自由度为 时,时,2 2 分布曲线分布曲线下右侧尾部面积为下右侧尾部面积为时时 2 2 的界值;的界值;4 4 2 值反映了理论频数和实际频数值反映了理论频数和实际频数的吻合程度;的吻合程度;Dec 1,2009二、
9、四格表的专用公式二、四格表的专用公式对于四格表资料,通过推导可将式对于四格表资料,通过推导可将式94转换转换成四格表的专用公式:成四格表的专用公式:组别组别阳性数阳性数阴性数阴性数合计合计I组组aba+b=n1.II组组cdc+d=n2.合计合计a+c=n.1b+d=n.2a+b+c+d=nDec 1,2009表表92 某市某市2000年城乡居民的两周患病率年城乡居民的两周患病率分组两周患病合计有无城区90(a)570(b)660(a+b)农村140(c)500(d)640(a+c)合并230(a+c)1070(b+d)1300(n)Dec 1,2009 分分类类资资料料为为间间断断的的,不不
10、连连续续分分布布。故故计计算算的的 2值值不不连连续续,对对于于四四格格表表资资料料来来说说,当当n40,且且有有1T5T5时,求求出出的的概概率率可可能能偏偏小小,因因此此需需进进行连续性校正:行连续性校正:三、三、四格表资料校正四格表资料校正 1.2值的校正值的校正x1、x2xkN(,2 2)Dec 1,2009 2、四格表、四格表 2检验的条件检验的条件(1)当)当n40,且每个格子的理论频且每个格子的理论频数数T5 时,可用基本公式:时,可用基本公式:Dec 1,2009注注:对对于于两两个个率率的的比比较较,2检检验验和和检检验验是是等价的,等价的,22。(3)T1或或n40时,需用
11、确切概率法。时,需用确切概率法。(2)当总合计数)当总合计数n40,而有而有1T40且有一个格子的且有一个格子的1T5,需要用校正,需要用校正公式。公式。3、得出、得出P值,作出统计推断值,作出统计推断本例本例 20.05,尚不能拒绝,尚不能拒绝H0,还不能,还不能认为两种药物的疗效有差别。认为两种药物的疗效有差别。Dec 1,2009四、确切概率法四、确切概率法有理论频数有理论频数T1或总例数或总例数n40,或者或者 2检验所得到的检验所得到的P值接值接近检验水准近检验水准 时,则应采用直接计算概率法时,则应采用直接计算概率法(exact probability/Fishers exact
12、method)进行检验。进行检验。确切概率法的基本思想是:在周边合计数不变的条件下,表中的实际频数有多种组合,利用公式计算各种组合的概率,然后计算单侧或双侧概率,与检验水准做比较,作出统计推断。n!Dec 1,2009双侧检验:双侧检验:将现有样本概率记为将现有样本概率记为Pr,则所有,则所有概率小于等于概率小于等于Pr的四格表的概率和即为确切的四格表的概率和即为确切概率法的结果。概率法的结果。单侧检验:单侧检验:则将相应方向上所有概率小于则将相应方向上所有概率小于等于等于Pr的四格表的概率相加即可,如果的四格表的概率相加即可,如果 1 2,将,将Pr上方所上方所有概率小于等于有概率小于等于P
13、r的四格表的概率相加。的四格表的概率相加。Dec 1,2009例题Dec 1,2009确切概率法解题示意Dec 1,2009配对四格表资料示意配对四格表资料示意甲法甲法乙法乙法合计合计aba+bcdc+d合计合计a+cb+da+b+c+d 第四节第四节 配对四格表资料配对四格表资料Dec 1,2009例例97 120份痰液标本,每份分别份痰液标本,每份分别接种在甲乙两种培养基中,观察结接种在甲乙两种培养基中,观察结核杆菌的生长情况,结果为甲培养核杆菌的生长情况,结果为甲培养基阳性率为基阳性率为70%,乙培养基阳性率,乙培养基阳性率为为60%,共同阳性率为,共同阳性率为45%。试比。试比较两种培
14、养基的效果有无差别?较两种培养基的效果有无差别?Dec 1,2009表表96 甲乙两种培养基的培养结果甲乙两种培养基的培养结果 Dec 1,20091、建立检验假设、建立检验假设H0:两种方法检验的阳性率相同,即总体:两种方法检验的阳性率相同,即总体B=CH1:两种方法检验的阳性率不同,即总体:两种方法检验的阳性率不同,即总体BC =0.052、计算检验统计量、计算检验统计量在在H0成立的条件下,成立的条件下,b、c的理论频数的理论频数 ,代入公式,代入公式95有有 Dec 1,2009当当b+c40时时 当当b+c40时时 本例本例b+c40,代入上式得代入上式得 2=3.00查界值表得:查
15、界值表得:20.05,1=3.84,2=3.00 0.05,不拒绝,不拒绝H0假设,尚不能认为两种方法检出假设,尚不能认为两种方法检出细菌的阳性率不同。细菌的阳性率不同。3、得出、得出P值和结论值和结论Dec 1,2009 第五节第五节 行行列表资料的列表资料的 2检验检验 (多组率或构成比比较)(多组率或构成比比较)基本公式基本公式:专用公式:专用公式:Dec 1,2009一、多组率的比较一、多组率的比较例例98 某医生用三种方案治疗老年慢性支气管某医生用三种方案治疗老年慢性支气管炎,结果见表炎,结果见表97,问三种方案的总体疗效是否,问三种方案的总体疗效是否相同?(假设三组影响慢性支气管炎
16、的其它因素相同?(假设三组影响慢性支气管炎的其它因素齐同)齐同)表表97 三种不同方案治疗慢性支气管炎的疗效三种不同方案治疗慢性支气管炎的疗效Dec 1,20091、建立检验假设、建立检验假设H0:三种方法的有效率相等:三种方法的有效率相等H1:三种方法的有效率不等或不全相等:三种方法的有效率不等或不全相等=0.052、计算理论值和检验统计量、计算理论值和检验统计量=(3-1)(2-1)=2 3、确定、确定P值,作出统计推断值,作出统计推断 查查 2界值表,得界值表,得P0.05,拒绝拒绝H0,可以认为三种方法有效率不等,可以认为三种方法有效率不等或不全相等。或不全相等。Dec 1,2009二
17、、多个构成比比较二、多个构成比比较例例99 某医院研究胃溃疡和十二指肠溃疡患者与某医院研究胃溃疡和十二指肠溃疡患者与健康输血员血型构成有无不同,资料见表健康输血员血型构成有无不同,资料见表98,问其血型分布是否相同?问其血型分布是否相同?表表98 胃、十二指肠溃疡患者与健康输血员血型构成胃、十二指肠溃疡患者与健康输血员血型构成Dec 1,20091、建立检验假设、建立检验假设H0:胃、十二指肠溃疡患者与健康输血员的血型总:胃、十二指肠溃疡患者与健康输血员的血型总体构成相同体构成相同H1:胃、十二指肠溃疡患者与健康输血员的血型总:胃、十二指肠溃疡患者与健康输血员的血型总体构成不相同体构成不相同=
18、0.052、计算检验统计量、计算检验统计量3、确定、确定P值,作出统计推断值,作出统计推断Dec 1,2009注意事项注意事项适用条件适用条件:不能有:不能有0.05。按。按=0.05的水准,尚不能拒绝的水准,尚不能拒绝H0,因此,因此不能认为两种方法培养结核杆菌的结果有关不能认为两种方法培养结核杆菌的结果有关Dec 1,2009KAPPA值计算公式 pa为观察一致率,公式:为观察一致率,公式:pe为期望一致率,公式:为期望一致率,公式:其中其中k为等级数,为等级数,Aii为表格中从左上角到右下角为表格中从左上角到右下角的对角线上的实际数,的对角线上的实际数,ni+和和n+i分别是第分别是第i
19、行和第行和第i列的合计,列的合计,N为总合计。为总合计。Dec 1,2009k值是总体K值的点估计0K 1Kappa值的判定:nk0.75,一致性好n0.4 k0.75,中度一致nK0.4,一致性差Dec 1,2009(二)(二)Kappa值的统计推断值的统计推断1.Kappa标准误:标准误:2.总体总体Kappa的可信区间:的可信区间:3.样本样本Kappa值与总体值与总体Kappa值等于值等于0的统计学检验:的统计学检验:Dec 1,2009两种检验结果一致性(相关性)检验两种检验结果一致性(相关性)检验为了检验为了检验CT与核磁共振对胆囊癌在诊断上的一致性,某医生与核磁共振对胆囊癌在诊断
20、上的一致性,某医生用两种方法共检测了用两种方法共检测了100例胆囊癌患者(后经病理诊断证实)例胆囊癌患者(后经病理诊断证实),诊断结果如下,问,诊断结果如下,问CT与核磁共振对胆囊癌诊断上的一致性与核磁共振对胆囊癌诊断上的一致性(相关性)如何?(相关性)如何?Dec 1,2009Dec 1,2009Dec 1,2009二、二、R C列联表资料的关联性分析列联表资料的关联性分析例例912 某研究者按两种血型系统统计某地某研究者按两种血型系统统计某地6094人的血型分布,结果见下表,问两种血型的分人的血型分布,结果见下表,问两种血型的分布有无关系?布有无关系?(一)双向无序列联表表表911 609
21、4人人MN血型和血型和ABO血型的分布血型的分布Dec 1,2009(二)双向有序且属性不同的列联表(二)双向有序且属性不同的列联表例例913 某医生观察依沙酰胺治疗皮肤真菌感染某医生观察依沙酰胺治疗皮肤真菌感染的临床试验,结果见表的临床试验,结果见表912。试分析该病的。试分析该病的疗效是否与病程有关?疗效是否与病程有关?Dec 1,2009(三)双向有序且属性相同的列联表(三)双向有序且属性相同的列联表 例例914 某研究者收集了某研究者收集了147例冠心病病人,分别例冠心病病人,分别用对比法和核素法检查病人的室壁收缩运动情况,用对比法和核素法检查病人的室壁收缩运动情况,结果见下表。问两种方法的检查结果是否一致?结果见下表。问两种方法的检查结果是否一致?Dec 1,2009