《医学统计学列联表检验.ppt》由会员分享,可在线阅读,更多相关《医学统计学列联表检验.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 列联表分析列联表分析4.1 列联表原理列联表原理4.2 Crosstabs 过程过程 4.1 列联表原理列联表原理疗法疗法 疗效疗效合计合计治愈治愈未愈未愈不加牛黄不加牛黄324678加牛黄加牛黄7650126合计合计10896204列联表列联表列联表列联表:观测数据按两个或更多属性(定性变量)分类观测数据按两个或更多属性(定性变量)分类观测数据按两个或更多属性(定性变量)分类观测数据按两个或更多属性(定性变量)分类 时所列出的频数表。时所列出的频数表。时所列出的频数表。时所列出的频数表。RCRC列联表列联表列联表列联表:分类频数排成:分类频数排成:分类频数排成:分类频数排成R
2、R行行行行C C列的列联表。列的列联表。列的列联表。列的列联表。2222表表表表:二行二列的列联表,又称:二行二列的列联表,又称:二行二列的列联表,又称:二行二列的列联表,又称四格表四格表四格表四格表 。列联表分析:使用列联表进行分类资料的检验。列联表分析:使用列联表进行分类资料的检验。列联表分析:使用列联表进行分类资料的检验。列联表分析:使用列联表进行分类资料的检验。双向无序双向无序双向无序双向无序单向有序单向有序单向有序单向有序双向有序且属性不同双向有序且属性不同双向有序且属性不同双向有序且属性不同列联表列联表列联表列联表双向有序且属性相同双向有序且属性相同双向有序且属性相同双向有序且属性
3、相同设不加牛黄组治愈总体率为设不加牛黄组治愈总体率为设不加牛黄组治愈总体率为设不加牛黄组治愈总体率为 ,加牛黄组治愈总体率为,加牛黄组治愈总体率为,加牛黄组治愈总体率为,加牛黄组治愈总体率为检验检验检验检验即即即即“疗法疗法疗法疗法”与与与与“疗效疗效疗效疗效”独立独立独立独立 1.双向无序表独立性检验双向无序表独立性检验双向无序列联表:双向无序列联表:两个分类变量分类标志无数值大小两个分类变量分类标志无数值大小两个分类变量分类标志无数值大小两个分类变量分类标志无数值大小 与先后顺序之分。与先后顺序之分。与先后顺序之分。与先后顺序之分。疗法疗法 疗效疗效合计合计治愈治愈未愈未愈不加牛黄不加牛黄
4、324678加牛黄加牛黄7650126合计合计10896204若拒绝H0:X与Y独立(即两组总体率相同)实际频数Oij与理论频数Eij的差异是随机误差,用Pearson卡方统计量 反映实际Oij与理论Eij吻合程度注意:上述注意:上述注意:上述注意:上述 检验适用于双向无序的检验适用于双向无序的检验适用于双向无序的检验适用于双向无序的 表表表表(df(df1)1)1)1)分组标志无数量大小和先后顺序之分。分组标志无数量大小和先后顺序之分。分组标志无数量大小和先后顺序之分。分组标志无数量大小和先后顺序之分。分析的目的是考察两个属性之间是否独立。分析的目的是考察两个属性之间是否独立。分析的目的是考
5、察两个属性之间是否独立。分析的目的是考察两个属性之间是否独立。疗效疗效疗法疗法 中中 医医 西西 医医痊愈痊愈显效显效合计合计687372638835好转好转无效无效15251121155注:注:2.若若RC列联表中理论频数出现小于列联表中理论频数出现小于1,或理论频数,或理论频数 出现小于出现小于5的格数超过总格数的格数超过总格数1/5时,必须增大样本例数时,必须增大样本例数;或把理论频数太小的行或把理论频数太小的行,列与性质相近的邻行列与性质相近的邻行,列合并列合并;或删去理论频数太小的行或删去理论频数太小的行,列。列。最小理论频数最小理论频数=最小行合计频数最小行合计频数最小列合计频数最
6、小列合计频数/总频数总频数1.双向无序列联表计算卡方统计量常用单侧检验。双向无序列联表计算卡方统计量常用单侧检验。3.多个总体率比较的卡方检验,若结论为拒绝原假设,多个总体率比较的卡方检验,若结论为拒绝原假设,只能认为总体率之间只能认为总体率之间不全等不全等,不能说明任意两个总体率,不能说明任意两个总体率 有无差别,需做多重比较。有无差别,需做多重比较。例:例:判断患鼻咽癌与血型有无关系判断患鼻咽癌与血型有无关系 分类分类A A型血型血B B型血型血O O型血型血ABAB型血型血合计合计患癌者患癌者648613020300健康人健康人12513821026499合计合计189224340467
7、99第一行合计数第一行合计数,第四列合计数最小第四列合计数最小,最小理论频数最小理论频数 H H0 0:“:“患癌患癌”与与“血型血型”独立独立,H H1 1:“:“患癌患癌”与与“血型血型”不独立不独立 dfdf(2(21)(41)(41)1)3 3,单侧概率,单侧概率P P0.050.05,不能以不能以0.050.05水准的单侧检验拒绝水准的单侧检验拒绝H H0 0,总体率的差异无统计意义总体率的差异无统计意义,不能认为患不能认为患鼻咽鼻咽癌与血型不独立。癌与血型不独立。2.四格表独立性检验四格表独立性检验 疗法疗法 疗效疗效合计合计治愈治愈未愈未愈不加牛黄不加牛黄324678加牛黄加牛黄
8、7650126合计合计10896204双向无序四格表(1)N N4040,理论频数,理论频数55(2)N N4040,理论频数小于,理论频数小于5(5(但但1)1),用校正卡方统计量,用校正卡方统计量(3)N40N40统计结论:“疗法”与“疗效”不独立(即两组治愈率不同)专业结论:加人工牛黄组疗效高于不加人工牛黄组的疗效。4.2 Crosstabs 过程过程 例:例:调查调查339名名50岁以上的人的吸烟习惯与患慢性气管岁以上的人的吸烟习惯与患慢性气管炎病的数据而建立如下列联表,试探讨吸烟与患慢性气炎病的数据而建立如下列联表,试探讨吸烟与患慢性气管炎之间的关系。管炎之间的关系。组别组别吸烟吸烟
9、不吸烟不吸烟患病组患病组43431313健康组健康组162162121121目的目的:检验:检验变量变量X与与Y是独立的是独立的输入数据输入数据个案加权个案加权列联表分析列联表分析(weightbycases过程)过程)结果分析结果分析(Crosstabs过程)过程)实现步骤:实现步骤:(1).将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量 输入数据输入数据保存保存smoke:吸烟情况吸烟情况;result:结果结果;count:频数频数;保存为:保存为:“吸烟与慢性支气管炎的关系吸烟与慢性支气管炎的关系.sav”(2).个案加权个案加权在SPSS系统中,列联表的输入多采用频
10、数表格的方式,如果要对此类数据进行卡方分析等,必须采用个案加权(weightbycases)进行数据处理后才能使用相关的统计方法。菜单“Data”|“WeightCases”命令点击“WeightCasesby单选框”,选中“Freqency”:选入“频数count”。单击OK钮菜单“Analyze”|“DescriptiveStatistics”|“Crosstabs”命令(3)列联表分析)列联表分析将将“结果结果result”点入点入“Row(s)”框,将框,将“吸烟情吸烟情况况smoke”点点入入“Cloumn(s)”框。框。点击点击“Statistics”钮。钮。【Statistics
11、钮】用于定义所需计算的统计量。点击“Chi-square复选框”,计算值;选择“Nominal”里的“ContingencyCoefficient”计算Pearson列联相关系数。点击“continue”钮回到上一对话框点击”Cells”按钮【Cells按钮】:用于定义列联表单元格中需要计算的指标。勾选“Counts复选框组”中的输出实际观察数“Observed”和理论数“Expected”选择“Percentages”里的“column”计算列百分比。点击“Continue”按钮返回上一层对话框。点击”OK”按钮 结果输出和讨论:结果输出和讨论:分析分析:处理记录缺失值情况报告,可见所有数据
12、均是有效值。:处理记录缺失值情况报告,可见所有数据均是有效值。分析:分析:给出了给出了22列联表,其中表中给出了实际观测值和理论值。列联表,其中表中给出了实际观测值和理论值。不吸烟者的患癌率不吸烟者的患癌率9.7%吸烟者的患癌率吸烟者的患癌率21.0%给出了给出了4 4种检验方法的结论。其中种检验方法的结论。其中,1)PearsonChi-Square 即常用的卡方检验即常用的卡方检验 2)ContinuityCorrection 连续性校正的卡方值连续性校正的卡方值 3)LikelihoodRatio 似然比卡方检验似然比卡方检验4)FishersExactTest:Fishers确切概率法
13、确切概率法(N40(N40,理论频数,理论频数5)5)(N40(N40,理论频数小于,理论频数小于5(5(但但1)1)(N40,所以选用普通的卡方所以选用普通的卡方 检验。检验。所以有理由拒绝吸烟与患病是独立的原假设,即认为所以有理由拒绝吸烟与患病是独立的原假设,即认为吸烟与患支气管炎是有关的。吸烟与患支气管炎是有关的。计算计算Pearson列联相关系数列联相关系数 r=0.147例:例:甲乙两种疗法治疗某病甲乙两种疗法治疗某病,问两法疗效有无差别问两法疗效有无差别 组别组别有效有效无效无效合计合计甲法甲法14115乙法乙法7310合计合计21425N N25402540,FishersExa
14、ctTest:Fishers确切概率法确切概率法H H0 0:“:“方方法法”与与“疗疗效效”独独立立,H H1 1:“:“方方法法”与与“疗疗效效”不独立不独立 双向有序表的检验双向有序表的检验 例例:用用甲甲乙乙两两种种方方法法检检查查鼻鼻咽咽癌癌患患者者9393例例,两两法法都都是是阳阳性性的的4545例例,都都是是阴阴性性的的2020例例,甲甲法法阳阳性性但但乙乙法法阴阴性的性的2222例例,甲法阴性但乙法阳性的甲法阴性但乙法阳性的6 6例。例。组别组别乙乙乙乙合计合计甲甲452267甲甲62026合计合计5142931.双向有序且属性相同表(配对四格表)的检验双向有序且属性相同表(配
15、对四格表)的检验 两个分类变量的标志完全一样且有序排列相同,是相两个分类变量的标志完全一样且有序排列相同,是相关样本数据构成的列联表。关样本数据构成的列联表。O O1212O O21214040用吻合卡方统计量用吻合卡方统计量,df1 1 O O1212O O21214040用校正卡方统计量用校正卡方统计量,df1 1 吻合性检验或吻合性检验或McNemar检验检验:H H0 0:“:“方方法法”与与“阳阳率率”独独立立,H H1 1:“:“方方法法”与与“阳阳率率”不独立不独立 dfdf1 1,查查统统计计用用表表,2 26.63496.63492 20.01(1)0.01(1),单单侧侧概
16、概率率P P0.010.01,以以 0.010.01水水准准的的单单侧侧检检验验拒拒绝绝H H0 0,只能认为只能认为“方法方法”与与“阳性率阳性率”不独立不独立 差异有统计意义差异有统计意义,认为甲法的阳性检出率高于乙法认为甲法的阳性检出率高于乙法 O O1212O O212122226 628402840,使用校正卡方检验,使用校正卡方检验 一致性检验一致性检验(Kappa检验检验):观察一致率:观察一致率:两种分类结果一致的观察频数两种分类结果一致的观察频数理论一致率:理论一致率:两种分类结果一致的理论频数两种分类结果一致的理论频数K=1K=1,说明两种分类结果完全一致,说明两种分类结果
17、完全一致,说明两种分类结果完全一致,说明两种分类结果完全一致K 0.75K 0.75,说明一致程度相当满意。,说明一致程度相当满意。,说明一致程度相当满意。,说明一致程度相当满意。K 0.4K 0.4,说明一致程度尚可。,说明一致程度尚可。,说明一致程度尚可。,说明一致程度尚可。K=0K=0,说明两次判断的结果是机遇造成的。,说明两次判断的结果是机遇造成的。,说明两次判断的结果是机遇造成的。,说明两次判断的结果是机遇造成的。菜单“Analyze”|“DescriptiveStatistics”|“Crosstabs”命令例例:用用脑脑神神经经生生成成素素方方案案治治疗疗急急性性脑脑出出血血所所
18、致致脑脑神经功能障碍,判断三种方案的疗效有无差异。神经功能障碍,判断三种方案的疗效有无差异。2.双向有序且属性不同表的检验双向有序且属性不同表的检验 用药用药用药用药基本基本基本基本痊愈痊愈痊愈痊愈显著显著显著显著好转好转好转好转无效无效无效无效合计合计A(5-7)A(5-7)57108B(10-12)B(10-12)91074C(21-30)C(21-30)161031好转好转好转好转单向有序单向有序R RC C表,两个分类变量一个无序,另一个有序。表,两个分类变量一个无序,另一个有序。双向有序且属性不同的双向有序且属性不同的R RC C表,两个分类变量均有表,两个分类变量均有序但属性不同,
19、不宜用卡方检验,应选用与有序性序但属性不同,不宜用卡方检验,应选用与有序性有联系的有联系的对应分析或线性趋势检验(或后面学习的对应分析或线性趋势检验(或后面学习的非参数检验)。非参数检验)。分组变量有序(如年龄),指标变量无序(如传染分组变量有序(如年龄),指标变量无序(如传染病类型),病类型),用卡方检验分析不同年龄组用卡方检验分析不同年龄组传染病的构成传染病的构成。分组变量无序(如疗法),指标变量有序(如疗效)分组变量无序(如疗法),指标变量有序(如疗效)用用Ridit分析或非参数秩和检验分析或非参数秩和检验分析不同疗法的疗效。分析不同疗法的疗效。处处 理理愈愈 合合未愈合未愈合合计合计呋喃硝胺呋喃硝胺54862甲氰咪胍甲氰咪胍442064合合 计计9828126作业:某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲作业:某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别?氰咪胍作对照组,问两种方法治疗效果有无差别?要求:定义变量要求:定义变量medicine(药物:呋喃、甲氰)、(药物:呋喃、甲氰)、result(效果:愈合、未愈合(效果:愈合、未愈合)count(频数)频数)给出列联表检验结果、给出列联表检验结果、Pearson列联相关系数。列联相关系数。