《SPSS列联表分析教案.pptx》由会员分享,可在线阅读,更多相关《SPSS列联表分析教案.pptx(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1SPSS列联表分析列联表分析列联表是指对一组观察对象,分别观察其两种分类变量的表现,归纳成双向交叉排列的统计表,这类统计表用的描述行变量和列变量之间的关系称列联表,或交叉表。第1页/共53页第2页/共53页第3页/共53页一、一、四格表四格表资料的料的 2检验二、二、配配对四格表四格表资料的料的 2检验三三、四格表四格表资料的料的Fisher确切概率法确切概率法四、四、RC列表列表资料的料的 2检验五、五、多个多个样本率本率间的多重比的多重比较 率的比率的比较一致性一致性检验拟合度合度检验第4页/共53页1.四格表卡方检验第5页/共53页目的:推断两个样本率(构成比)是否有差别(两样本
2、率来自总体率相同的总体)要求:两样本的两分类个体数排列成四格表资料H0:两样本的率相同;H1:两样本的率不同 Pearson卡方值:卡方值:自由度:自由度:第6页/共53页两组人群流感发病率的比较两组人群流感发病率的比较分组发病人数未发病人数合计发病率%服药组40(50.49)190(179.51)230(nR)17.39对照组50(39.51)130(140.49)18027.78合计90(nC)320410(n)21.95TRC=nRnC/nTRC:第:第R行、第行、第C列格子的理论频数;列格子的理论频数;nR:第:第R行的合计数;行的合计数;nc:第:第C行的合计数;行的合计数;n:总计
3、数:总计数假设两组发病率相同,均等于合计的发病率21.95(90/410),组服药组的理论发病人数T11=230*(90/410)=50.49,对照组的理论发病人数T21=180*(90/410)=39.51,同理可以算出两组未发病的理论频数分别为179.51,140.49带入上述公式2=(40-50.49)2/50.49+(190-179.51)2/179.51+(50-39.51)2/39.51+(130-140.49)2/140.49=6.36,=(2-1)*(2-1)=1,查表得,0.25P0.01第7页/共53页2检验实际上是将两样本率的比较转换成实际频数与理论频数的比较,2值的大小
4、反应了各格子的实际频数与理论频数T的接近程度。若检验假设H0成立,实际频数与理论频数相差就不应该很大,因此得到的2值可能就比较小,P,可认为两样本率来自同一总体的可能性比较大。反之,若实际频数与理论频数相差很大,则得到的2也相应的很大,P,可认为两样本率来自同一总体的可能性比较小。第8页/共53页例例1.1:案例解析:案例解析:某种中药治疗胃溃疡的复发率与常规西药比较是否相同?疗效疗效分组治愈复发中药4313西药483操作流程:数据:加权个案-频率变量:权重-确定分析-统计描述-交叉表行:分组列:疗效统计量:卡方-确定单元格:计数-观察值、期望值 百分比:行-继续确定第9页/共53页数据录入个
5、案加权第10页/共53页第11页/共53页四格表与各组率卡方检验结果第12页/共53页四核表卡方的选用条件:四核表卡方的选用条件:1、总例数40,且所有理论频数5,看Pearson卡方结果;2、总例数40,有1个理论频数1且5,2检验需进行连续性校正,这时以连续性校正结果为准;(连续性校正卡方只在四格表中才计算)3、总例数40,至少2个理论频数1且5,看Fisher精确检验 结果;4、总例数40或者出现理论频数1,看Fisher精确检验结果;5、总例数40,且所有理论频数5,似然比2检验与Pearson卡方一致第13页/共53页结论:结论:两种药物治疗胃溃疡的复发率并不相同,中药组复发率为23
6、.2%,高于西药组(5.9%),差异有统计学意义(2=6.305,P=0.0120.05)。第17页/共53页例例1.3:案例解析:案例解析(Fisher精确检验)精确检验)用两种药物治疗某种疾病的结果如下,问两药的疗效有误差别?用两种药物治疗某种疾病的结果如下,问两药的疗效有误差别?组别治愈未治愈合计治愈率%A药2141612.5B药381127.3合计5222718.5第18页/共53页Fisher精确检验比较稳健,国外有统计学专家认为样本数1000就应该用Fisher精确检验,也有些人认为所有的卡方检验都可以使用Fisher精确检验。第19页/共53页2.配对四格表卡方检验第20页/共5
7、3页例2:有两种方法可用于诊断某种癌症,A方法简单易行,成本低,患者更容易接受,B方法结果可靠,但操作繁琐,患者配合困难。某研究选择了53例待诊断的门诊患者,每个患者分别用A和B两种方法进行诊断,判断两种方法诊断癌症有无差别,A方法是否可以代替B方法。问题1:两种方法诊断癌症有无差别?问题2:A方法是否可以代替B方法(两者的一致性如何)?第21页/共53页前面介绍过列联表,它的行变量和列变量代表的是一个事物的两个不同属性,以我们举过的A药和B药治疗急性心肌梗死患者疗效比较为例,例子中行变量“药物”和列变量“转归”是患者的两个不同特征。本例为配对设计的列联表,它的行变量和列变量代表的是一个事物的
8、同一属性,只是对这个属性的判断方法不同而已。如上表所示,行和列均指的是患者是否患有癌症,所不同的是一个是A方法,另一个是B方法。这种列联表最大的特点是行和列数目永远都是一样的,且属性相同。此时,再用成组计数资料的2检验就不合适了。这里我们就要用到Kappa一致性检验和配对一致性检验和配对2检验检验(McNemar检验检验)。第22页/共53页Kappa一致性检验一致性检验1、Kappa检验旨在评价两种方法是否存在一致性,或者是同一个研究者先后两次的诊断结果2、Kappa检验会利用列联表的全部数据3、Kappa检验可计算Kappa值用于评价一致性大小配对配对2检验检验(McNemar检验检验)1
9、、配对2检验主要确定两种方法诊断结果是否有差别2、配对2检验只利用“不一致“数据,如表中b和c3、配对2检验只能给出两种方法差别是否具有统计学意义的判断第23页/共53页操作流程:数据:加权个案-频率变量:人数确定分析-统计描述-交叉表行:A药列:B药(值:1为阳性,2为阴性)统计量:McNemar、Kappa继续单元格:计数-观察值、期望值 百分比:行、列继续确定第24页/共53页Kappa值判断标准:值判断标准:Kappa0.75,两种方法诊断结果一致性较好;0.4Kappa0.75,两种方法诊断结果一致性一般;Kappa0.4,两种方法诊断结果一致性较差。表 2给 出 了 McNemer
10、检 验 的 结 果,P=0.0220.05,提示两种方法诊断情况并不一致;表3中Kappa=0.506,P0.001,提示两种方法诊断结果存在一致性,但是Kappa在0.40.75范围内,一致性一般。结论:结论:A方 法 和 B方 法 诊 断 结 果 一 致 性 一 般(Kappa=0.506,P0.001);B诊断阳性率为67.9%,明显高于A诊断(50.9%),且差别具有统计学意义(P=0.022)。第25页/共53页有时可能出现Kappa值与McNemer检验结果不一致的情况,如Kappa0.75,说明两者的一致性较好,但是McNemer检验结果p0.05,说明两者的检验结果有差别。出现
11、这样的矛盾石油两种方法对信息的利用不一致导致的。Kappa检验会利用列联表中的所有信息,McNemer检验只会利用对角线上不一致单元格的信息,即只关心两者不一致的信息,因此在出现矛盾时,主要参考Kappa检验的结果。在甲乙两种方法的配对检验中,若其中甲法为金标准,研究乙法与甲法的一致性情况,并研究乙法能否取代甲法时,就会出现假阳性和假阴性的概念。u假阳性:又称误诊率或第I类错误,指实际无病,但被认为有病的百分比。u假阴性:又称漏诊率或第II类错误,指实际有病,但被认为无病的百分比。结合本例,如以B法为金标准,36个病人中,A法将11人诊断为无病,假阴性率为11/36=30.6%;17个非病人中
12、,A法将2人诊断为有病,假阳性率为2/17=11.8%,说明A法假阴性率较高,容易造成漏诊。第26页/共53页3.双向无序列的列联表分析第27页/共53页双向无序列联表是指行变量和列变量均为无序分类变量,统计方法和一般四核表卡方检验一致,是对四格表2检验的拓展,由两个分组增加到多个分组,需要注意的是,这里我们不光想知道多个分组间有无差异,如果差异存在统计学意义,那么具体到组间两两比较是否均存在差异。多个独立样本列联表多个独立样本列联表2检验的结果选择:检验的结果选择:1、所有理论频数5,看Pearson卡方检验卡方检验的结果;2、超过1/5的理论频数5或至少1个理论频数1,看Fisher精确检
13、验精确检验结果(也可以考虑增加样本量或者依据专业判断适当合并行或列,再进行2检验)。但不同于四格表2检验,SPSS对于R*C列联表2检验不会自动输出Fisher确切概率检验结果,如果样本例数较少,建议在“精确”设置中勾选“精确”。第28页/共53页例例3:以下是胃癌真菌病因研究中3种食物样品的真菌检出率,比较3种食物真菌检出率有无差异。第29页/共53页本例中SPSS提示没有理论频数小于5,且最小的理论频数为8.00,故直接选择Pearson 卡卡方方结果,即2=22.841,P0.001,提示三种食物中真菌检出率不同。此时还需要进一步考虑三种食物真菌检出率到底谁与谁之间的差异存在统计学意义,
14、这里就需要用到“卡方分割”,通俗讲就是把R*C列联表拆分成若干个四个表分别进行2检验,进而判断不同组两两比较差异是否用统计学意义,但是因为多组比较可能会增加犯I类错误概率,所以还需要对2检验的P值进行校正。常用Bonferroni法进行校正,本例中需要进行3次两两比较,校正的检验水准=0.05/比较次数=0.05/3=0.0167,即当两两比较P0.0167才能认为差异有统计学意义。第30页/共53页操作流程:操作流程:数据:选择个案如果条件满足-如果(I)食物种类:食物种类=1|食物种类=2第31页/共53页按照上面介绍的技巧,进行任意两组的四格表2检验。第32页/共53页按照校正的检验水准
15、=0.0167,大米和地瓜粉,大米和豆酱之间的真菌检出率差异具有统计学意义,而地瓜粉和豆酱之间差异无统计学意义。结论:结论:大米、地瓜粉和豆酱的真菌检出率不相同(2=22.841,P0.001),其中地瓜粉最高为96.7%,其次为豆酱为80.0%,大米最低为43.3%。大米的真菌检出率分别与地瓜粉和豆酱相比差异均有统计学意义(Bonferroni校正,P0.0167)。第33页/共53页卡方检验两两比较的自动实现,只能给出子集,相当于SNK法,但不能给出具体P指第34页/共53页4.单向有序列的列联表分析第35页/共53页单向有序列联表指分组变量或结局变量为有序变量,例如比较35-、45-、5
16、5-、65-岁组血脂异常的患病率有无差别,或者比较A和B两种药物对于疾病预后(痊愈、显著改善、进步、无效)有无差异,常见于疗效分析。但常被误用为普通卡方检验,时间上由于列变量为等级资料,应采用多组独立样本的秩和检验,属于非参数检验的一种。例4.1(结局变量为有序资料)某医院用3种方法治疗慢性喉炎,结果如下表,问3种方法的疗效是否有差别?无效无效(疗效(疗效=1)好转好转(疗效(疗效=2)显效显效(疗效(疗效=3)治愈治愈(疗效(疗效=4)合计合计有效率有效率%甲法24267218630892.2乙法201624329278.3丙法202214227874.4合计646411024047886.
17、6第36页/共53页操作流程:数据-加权个案 频率变量:人数-确定分析-非参数检验-独立样本目标:自动比较不同组间的分布字段:检验字段:疗效 组:分组设置:自定义检验 比较不同组间分布 Kruskal-Wallis单因素ANOVA(K样本)运行第37页/共53页第38页/共53页第39页/共53页从旧窗口进入也可以得出统计结果(如左图)。结论:结论:经Kruskal-Wallis检验,3种方法治疗慢性喉炎的疗效差别有统计学意义(H=51.388,P0.001)。经过两两比较,甲法与乙法、丙法疗效比较差异均有统计学意义(调整后P0.001),三种方法的平均秩次分别为270.07,196.41,1
18、69.60,甲法疗效由于乙法和丙法。乙法与丙法疗效比较差异无统计学意义(调整后P=0.5190.05)。第40页/共53页例4.2(分组变量为有序资料)某研究利用某项调查,想研究一下年龄与血脂异常之间的关系,是否血脂异常的患病率随着年龄增加而增加?年龄年龄无无有有合计合计异常率异常率%4555914570420.6%45-2246929323.555-884313132.865-35195435.2第41页/共53页经独立样本卡方检验只能说明不同年龄组之间血脂异常患病率有统计学差异。趋势性卡方性卡方检验主要用来检验结局变量是否随着分组变量(X)呈现一定的线性或者倾向性的改变,比如这里的“血脂异
19、常的患病率随着年龄增加而增加”。趋势性卡方检验最常用的方法是Cochran-Armitage trend test,但SPSS并没有提供这种方法(SAS软件中有),而是另一种方法Linear-by-Linear Association,两个结果相近。结论:经趋势性卡方检验,血脂异常的患病率随着年龄增加而增加(P0.001)。第42页/共53页5.双向有序且属性不同的列联表分析第43页/共53页当列联表分组变量、结局变量均为有序变量,但属性不同时,称为双向有序列联表,一般根据研究目的主要进行一下两种检验,一种采用独立样本秩和检验,分析组间的差异性,另一种采用相关性检验,研究分组变量和结局变量之间
20、的关系。患者年龄患者年龄疗效疗效无效(0)有效(1)治愈(3)合计18(1)532205718-(2)3038107850-(3)15101035合计508040170例5.1 现有一份170例某病患者的治疗效果资料,按年龄和疗效两种属性交叉分类,结果如下,请进行分析。(卫生统计学第六版)第44页/共53页研究方向1:组间疗效有误差别(转换为多样本的秩和检验)操作流程:分析-非参数检验-独立样本目标:自动比较不同组间分布字段:检验字段:疗效 组:年龄设置:自定义检验 比较不同组间分布 Kruskal-Wallis单因素ANOVA(K样本)运行(分组变量在变量设置中需设置为有序变量)第45页/共
21、53页第46页/共53页研究方向2:疗效和年龄之间是否相关(Gamma法与法与Spearman秩相关秩相关)操作步骤:分析-描述统计-交叉表 行:年龄列:疗效统计量:卡方,相关性,Gamma(G)第47页/共53页(1)G=-0.355,P=0.0010.05,年龄与疗效互相关联,即随着年龄增达,疗效越差,关联系数为-0.355。(2)Spearman秩相关系数rs=-0.255,P=0.0010.05,年龄与疗效成负相关。本例用Gamma法的相关系数为0.355大于Spearman秩相关的系数0.255,Gamma法优于Spearman秩相关法。对于等级资料相关分析,在做Spearman秩相
22、关时,需要对原始数据进行编秩次,因为是等级资料,所以会产生大量秩次相等的平均秩次,进而低估了变量之间的关联系数。Gamma:主要用于两个有序变量之间的对称相关性分析,行变量等级高的列变量等级也高称为正相关,如果行变量等级高而列变量等级低,则称为负相关。它的范围从-1到1,绝对值越接近1表示两个变量之间的存在关系越紧密,接近0表示关系较弱或者没有关系。本例也可以进行趋势性卡方检验,P=0.002,也说明年龄与疗效存在相关性,但不能给出具体的相关系数。第48页/共53页6.双向有序且属性相同的列联表分析第49页/共53页例6:对150名冠心病患者用两种方法检查室壁收缩运动情况,检测情况如下.研究问
23、题:两种方法一致性如何?甲法测定结果甲法测定结果乙法测定结果乙法测定结果正常减弱异常合计正常603265减弱042951异常891734合计685428150第50页/共53页Kappa检验又称一致性检验,研究两种方法检验的一致性,希望所有的频数都出现在主对角线上,这样一致性最好。Kappa0.75,两种方法诊断结果一致性较好;0.4Kappa0.75,两种方法诊断结果一致性一般;Kappa0.4,两种方法诊断结果一致性较差。MaNemar检验即配对卡方检验,研究两者在哪些地方不一致,计算时只利用不在对角线上数据,因此检验效能上不如Kappa。本例Kappa值=0.676,说明两者的一致性一般
24、,P0.001,与0比较差异具有统计学意义,,同时可以计算出Kappa值95%的可信区间为(0.578,0.774)。第51页/共53页(1)Mc Nemar检验:仅用于22列联表。本检验与Pearson卡方检验具有同一性,使用条件必须满足Pearson卡方检验的条件。如果条件不能满足,需要进行Yate校正。(2)Bowker检验:是Mc Nemar检验的扩展,用于分类数目大于2的配对列联表分析。SPSS中依然选择的是Mcnemar,结果输出的是Mcnemar-Bowker结果。(3)Kappa 系数的计算方法有两种:1、简单Kappa系数系数(Simple Kappa Coefficient),两种诊断结果的分级数目相同时使用;2、加、加权Kappa系数系数(Weighted Kappa Coefficient),在两种诊断结果的分级数目不一样时使用。(4)连续性资料的一致性检验需用组内相关系数(ICC)进行分析。第52页/共53页