《卡方检验研优秀课件.ppt》由会员分享,可在线阅读,更多相关《卡方检验研优秀课件.ppt(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、卡方检验研第1页,本讲稿共74页2022/10/2322检验是英国统计学家Pearson于1900年提出的一种应用范围很广的统计方法.Karl PearsonKarl Pearson第2页,本讲稿共74页2022/10/233卡方检验的用途卡方检验的用途推断两个或多个总体率或构成比之间有无差别两个分类变量间有无相关关系多个率的趋势检验频数分布的拟合优度检验第3页,本讲稿共74页2022/10/234 2 2 检验的基本思想检验的基本思想【例10-1】为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合研究标准的110例慢性支气管炎患者随机分为两组,西药组86例,中药组24例。服药一个疗程后,观
2、察患者的疗效,问两种药有效率是否有差别?第4页,本讲稿共74页2022/10/235分析思想分析思想:假设两疗法相同,则两疗法的平均显效率平均显效率=53/110=48.18理论上西药组西药组 显效人数8648.18%=41.44 无效人数8641.44=44.56;中药组中药组 显效人数2448.18=11.56 无效人数2411.56=12.44。41.44 44.5611.56 12.44第5页,本讲稿共74页2022/10/236实际频数实际频数与理论频数理论频数存在差异,如该差异如果为抽样误差的许可范围,则两治疗组的显效率一致,否则,则两组的显效率不是来自同一总体,即两治疗组有效率不
3、同。41.44 44.5611.56 12.4441.44 44.5611.56 12.4441.44 44.5611.56 12.44第6页,本讲稿共74页2022/10/237实际数与理论数相差的程度(或者说吻合的程度)又如何衡量呢?第7页,本讲稿共74页2022/10/238实际频数实际频数与与理论频数理论频数的差异可以表示为的差异可以表示为 值反映了实际频数与理论频数吻合的程度反映了实际频数与理论频数吻合的程度(差别的程度)。第8页,本讲稿共74页2022/10/239值服从自由度为的卡方分布第9页,本讲稿共74页2022/10/2310第10页,本讲稿共74页2022/10/2311
4、如果检验假设H0成立,则实际数与理论数之差一般不会很大,2值应很小,2值对应的的概率P则比较大,反之亦然。因此若P,就怀疑假设H0,因而拒绝它;若P,则尚无理由拒绝它第11页,本讲稿共74页2022/10/2312第一节 22表的卡方检验基本数据的行数和列数均为2者,称为22表资料或四格表资料;基本数据的行数或列数大于2者,称为RC列联表资料或行列表资料。第12页,本讲稿共74页2022/10/2313 2 检验(检验(Pearson 卡方检验卡方检验)基本公式:)基本公式:上式中A 为实际频数,T 为理论频数TRC 为第R 行C 列的理论频数为相应的行合计为相应的列合计 一、完全随机设计 检
5、验 第13页,本讲稿共74页2022/10/2314由计算公式由计算公式代入理论数代入理论数 四格表的专用计算公式:四格表的专用计算公式:第14页,本讲稿共74页2022/10/2315第15页,本讲稿共74页2022/10/2316【检验步骤】1.建立检验假设,确定检验水准H0:西药和中药的显效率相同,即1=2H1:西药和中药的显效率不同,即12 =0.05第16页,本讲稿共74页2022/10/23172.计算检验统计量2 值,第17页,本讲稿共74页2022/10/2318 查2界值表,得2 0.05,1=3.84,2 2 0.05,1,P 40 且所有 T5 时,用普通的2检验当 n4
6、0 但有 1T5 时,用校正的2检验当n40或有T 2 0.05,1,P 0.05,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为两药的有效率不等 确定P值,作出统计推断 第24页,本讲稿共74页2022/10/2325表表10-3 不同药物治疗急性脑梗病人有效率比较不同药物治疗急性脑梗病人有效率比较 药物有效无效合计有效率(%)红花+丹参1414 2850.0丹参 210 1216.7合计16244040.0第25页,本讲稿共74页2022/10/2326配对设计2检验【例10-3】某疾控中心采用IgM-PA法和ELISA法对125份可疑病例血清测定麻疹IgM抗体,IgM-
7、PA法阳性率为64,ELISA法阳性率为60,两种方法一致阳性率为57.6。为比较两方法的测定阳性率是否有差异,将资料整理为表10-4,并用四格表2检验进行分析第26页,本讲稿共74页2022/10/2327标本号123456.124125ELISA+IgM-PA+第27页,本讲稿共74页2022/10/2328第28页,本讲稿共74页2022/10/2329甲法的检出率乙法的检出率两检出率之差比较两种方法的检出率是否有差别,只需考察检查结果不一致的两个格子第29页,本讲稿共74页2022/10/2330若H0成立,两种方法不一致的两个格子理论频数都应该是 由2检验基本公式化简,2统计量为:第
8、30页,本讲稿共74页2022/10/2331若b+c40,校正公式为:第31页,本讲稿共74页2022/10/2332【检验步骤】1.建立检验假设,确定检验水准H0:两种方法检测的阳性率相同,即B=CH1:两种方法检测的阳性率不同,即BC =0.05配对四格表资料的配对四格表资料的2检验也称检验也称McNemar检验检验第32页,本讲稿共74页2022/10/23332.计算检验统计量2 值,第33页,本讲稿共74页2022/10/2334 查2界值表,得20.05,1=3.84,2 0.05,按=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两种方法的检测结果有差别 3.确定P值,
9、作出统计推断 第34页,本讲稿共74页2022/10/2335表表10-6 三种药物治疗糖尿病的疗效比较三种药物治疗糖尿病的疗效比较组别有效无效合计有效率(%)降糖号35215662.50玉泉丸17133056.67割裂本脲29 13096.67合计813511669.82 行列(RC)表资料的 2 检验第35页,本讲稿共74页2022/10/2336RC表2 检验的通用式RC表资料的卡方检验可用于:表资料的卡方检验可用于:多个样本率的比较两组构成比的比较多组构成比的比较第36页,本讲稿共74页2022/10/2337表表10-6 三种药物治疗糖尿病的疗效比较三种药物治疗糖尿病的疗效比较组别有
10、效无效合计有效率(%)降糖号35(39.10)21(16.90)5662.50玉泉丸17(20.95)13(9.05)3056.67割裂本脲29(20.95)1(9.05)3096.67合计813511669.82第37页,本讲稿共74页2022/10/2338【检验步骤】1.建立检验假设,确定检验水准H0:三种药物治疗糖尿病的疗效相同,即1=2=3 H1:1、2、3不同或不全相同=0.05第38页,本讲稿共74页2022/10/23392.计算检验统计量2 值,第39页,本讲稿共74页2022/10/2340 查2界值表,得2 0.05,2=5.99,2 2 0.05,2,P 0.05,按=
11、0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为3种药物治疗气阴两虚型老年型糖尿病的有效率不同或不全相同3.确定P值,作出统计推断 第40页,本讲稿共74页2022/10/2341 表的 检验的两两比较常用的方法:将多个样本率(或构成比)拆分为若干个22(或2C)表进行检验。为减小犯I类错误的概率,需要调整检验水准a。计算方法:式中,k为比较的样本组数。或第41页,本讲稿共74页2022/10/23423种中药治疗气阴两虚型老年型糖尿病有效率之间的两两比较结果见表10-7 第42页,本讲稿共74页2022/10/2343【例10-5】某医师研究蒙族与汉族血型的分布情况,随机抽取蒙族1
12、50人,汉族200人,分别检测其血型,数据整理见表10-8,问两民族血型分布有无差异?第43页,本讲稿共74页2022/10/2344表表10-8 蒙族与汉族的血型分布蒙族与汉族的血型分布血型ABOAB汉族63516422200蒙族58314813150合计1218211235350民族民族合计合计第44页,本讲稿共74页2022/10/2345【检验步骤】1.建立检验假设,确定检验水准H0:蒙族与汉族血型分布的构成相同 H1:蒙族与汉族血型分布的构成不同=0.05第45页,本讲稿共74页2022/10/23462.计算检验统计量2 值,第46页,本讲稿共74页2022/10/2347 查2界
13、值表,得2 0.05,3=7.81,2 0.05,按=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为蒙族与汉族血型分布的构成不同 3.确定P值,作出统计推断 第47页,本讲稿共74页2022/10/2348RC表2 检验的注意事项1.计算时采用绝对数2.T不能太小,不能有1/5以上格子的T5,或有1格子的T1增加样本含量,使理论频数增大删去T太小格子所对应的行或列将T太小的行或列与性质的相近邻行或邻列合并第48页,本讲稿共74页2022/10/23493.关于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit检验4.多个样本率(或构成比)比较的2检验,若结论为拒
14、绝H0,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明各组之间都有差别,如需知道各组之间是否不同,还要进行进一步两两比较两两比较 第49页,本讲稿共74页2022/10/2350单向有序分类资料的比较对于单向有序的多分类资料,表的 检验仅比较各组的构成比构成比是否相同,没有利用等级信息没有利用等级信息,因此,在对等级资料进行统计比较时,常用秩和检验秩和检验或Ridit分析分析。第50页,本讲稿共74页2022/10/2351条件:理论依据:超几何分布 (非 检验 的范畴)第五节 Fisher确切概率法第51页,本讲稿共74页2022/10/2352原理:原理:在四格表周边合计数不变
15、的条件下,依次增减在四格表周边合计数不变的条件下,依次增减样本四格表中某一格的值可得各种组合的四格表,直样本四格表中某一格的值可得各种组合的四格表,直接计算各种事件发生的概率。接计算各种事件发生的概率。计算公式为:计算公式为:第52页,本讲稿共74页2022/10/2353【例【例10-9】某医师为观察中西药结合治疗慢性寻麻疹的疗某医师为观察中西药结合治疗慢性寻麻疹的疗效,将效,将27例慢性寻麻疹患者随机分成两组,分别给予中例慢性寻麻疹患者随机分成两组,分别给予中西药结合治疗和西药治疗,结果见下表西药结合治疗和西药治疗,结果见下表第53页,本讲稿共74页2022/10/23541.建立检验假设
16、,确定检验水准建立检验假设,确定检验水准H0:中西药结合和西药的有效率相等,H1:中西药结合和西药的有效率不等,第54页,本讲稿共74页2022/10/23552.计算概率计算概率 计算样本 ,本例样本 85.7%46.2%39.5%计算在四格表的周边合计不变的条件下,变动计算在四格表的周边合计不变的条件下,变动四个基本数据四个基本数据a、b、c、d,列出所有各种组合,列出所有各种组合的四格表的四格表(所列出的四格表个数等于最小周边合计数加1个)的 及相应的概率P 第55页,本讲稿共74页2022/10/2356选用行合计与列合计均为最小的那个格子,从从0开始,依次增加开始,依次增加1,直到该
17、格子的观测频数等于,直到该格子的观测频数等于最小周边合计数。最小周边合计数。直接计算表内四个数据的各种组合之概率,再计算等于及大于等于及大于样本的 各四格表的累计概率,双侧检验取两侧累计概率,单侧检验只取一侧累计概率。第56页,本讲稿共74页2022/10/2357第57页,本讲稿共74页2022/10/23580.046第58页,本讲稿共74页2022/10/23590.037第59页,本讲稿共74页2022/10/23603.确定确定P值,作出统计推断值,作出统计推断按 水准,拒绝H0,接受H1,差异有统计学意义,可认为中西药结合组与西药组的有效率不同,中西药结合组疗效较高。第60页,本讲
18、稿共74页2022/10/2361第四节第四节 线性趋势检验线性趋势检验【例【例10-8】某医师在对某工厂职工冠心病调查中,欲研究冠心病与眼底动脉硬化之间的关系,共调查593人,资料整理为表10-11。第61页,本讲稿共74页2022/10/2362第62页,本讲稿共74页2022/10/2363【分析分析】若研究目的是分析不同眼底动脉硬化分级与冠心病诊断结果有无差别时,可将它视为单向有序表,选用秩和检验;若研究目的是分析两个有序分类变量间是否存在相关关系,适合用等级相关分析或积差相关分析,详见第十二章;若研究目的是分析两个有序分类变量间是否存在线性若研究目的是分析两个有序分类变量间是否存在线
19、性变化趋势,就要用到下面所介绍的有序分组资料的线性变化趋势,就要用到下面所介绍的有序分组资料的线性趋势检验趋势检验(test for linear trend)。第63页,本讲稿共74页2022/10/2364 对双向有序属性不同的RC表资料,通过 分解推断其相关是否为线性相关。其基本思想基本思想是:首先计算RC表 的值,然后将总的 值分解成线性回归分量线性回归分量与偏离线性回归分量偏离线性回归分量。若两分量均有统计学意义,表明两分类变量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,表明两分类变量不仅存在相关关系,而且是线性关系。第64页,
20、本讲稿共74页2022/10/2365第65页,本讲稿共74页2022/10/2366第66页,本讲稿共74页2022/10/2367第67页,本讲稿共74页2022/10/2368【检验步骤检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准H0:眼底动脉硬化分级与冠心病诊断结果之间无线性关系H1:眼底动脉硬化分级与冠心病诊断结果之间有线性关系第68页,本讲稿共74页2022/10/2369第69页,本讲稿共74页2022/10/2370lyy第70页,本讲稿共74页2022/10/2371第71页,本讲稿共74页2022/10/2372第72页,本讲稿共74页2022/10/23733.确定确定P值,作出统计推断值,作出统计推断 由上表看出,线性回归分量与偏离线性回归分量均有统计学意义,说明眼底动脉硬化分级与冠心病诊断结果之间存在相关关系,但关系不是简单的线性关系。第73页,本讲稿共74页2022/10/2374本节要求本节要求 (1)四格表资料的)四格表资料的 2 检验检验(2)配对四格表的)配对四格表的 2 检验检验(3)行)行列(列(RC)表资料的)表资料的 2 检验检验(4)四格表的确切概率法)四格表的确切概率法第74页,本讲稿共74页