《【源版】第八章-卡方检验.ppt》由会员分享,可在线阅读,更多相关《【源版】第八章-卡方检验.ppt(70页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章第八章 2检验检验n作业:作业:P77 二、二、1,2,4,62023/2/102第八章第八章 2检验检验n第一节第一节 四格表资料的四格表资料的 2检验;检验;n第二节第二节 配对四格表资料的配对四格表资料的 2检验;检验;n第三节第三节 行行列表资料的列表资料的 2检验。检验。2023/2/103目的要求目的要求n掌握掌握q四格表资料的四格表资料的 2 检验方法检验方法q配对四格表资料的配对四格表资料的 2 检验方法检验方法q行行列表资料的列表资料的 2 检验方法检验方法n熟悉熟悉q多个样本率间多重比较。多个样本率间多重比较。q 2 检验应注意的问题。检验应注意的问题。2023/2/
2、104重点重点n四格表资料的四格表资料的 2 检验方法检验方法n配对四格表资料的配对四格表资料的 2 检验方法检验方法n行行列表资料的列表资料的 2 检验方法检验方法n 2 检验应注意的问题检验应注意的问题2023/2/105难点难点n 2 检验应注意的问题检验应注意的问题2023/2/106补充:补充:卡方检验概述卡方检验概述n 2 检验是检验是1989年统计学家年统计学家Pearson K提出的,目的是检验提出的,目的是检验qH0:样本资料服从某个已知的概率分布。:样本资料服从某个已知的概率分布。qH1:样本资料不服从某个已知的概率分布。:样本资料不服从某个已知的概率分布。n用用 2统计量
3、来度量实际观察频数与统计量来度量实际观察频数与H0为真条件下的理论频数为真条件下的理论频数之间的偏差之间的偏差 v=k-1-s 2023/2/107设计类型不同,设计类型不同,Ti 的计算方法不同,从而有不同的的计算方法不同,从而有不同的 2 检验检验2023/2/108第一节第一节 四格表资料的四格表资料的 2检验检验n 2检验检验n 2检验的连续性校正检验的连续性校正nFisher确切概率法确切概率法2023/2/109一、四格表资料的一、四格表资料的 2检验检验n例例1 某医生欲比较万拉发新与氟西汀治疗老年期抑郁症某医生欲比较万拉发新与氟西汀治疗老年期抑郁症的疗效,将病情相近的的疗效,将
4、病情相近的60名患者随机分成两组,分别用名患者随机分成两组,分别用两种药物进行治疗,结果见表两种药物进行治疗,结果见表1。分分 组组疗效疗效合计合计有效例数有效例数无效例数无效例数万拉发新组万拉发新组191130氟西汀组氟西汀组151530 合合 计计342760表表1 万拉发新与氟西汀治疗老年期抑郁症的疗效比较万拉发新与氟西汀治疗老年期抑郁症的疗效比较2023/2/1010n解析:解析:q设计类型:完全随机设计设计类型:完全随机设计q资料类型:二分类资料类型:二分类q表中最基本的数据有表中最基本的数据有4个,我们将这样的数据形式称个,我们将这样的数据形式称为为22列联表,也称为四格表。列联表
5、,也称为四格表。处理处理属性属性合计合计阳性阳性阴性阴性Aabn1=a+bBcdn2=c+d 合计合计m1=a+cm2=b+dn=a+b+c+d表表2 两组频数分布的四格表一般形式两组频数分布的四格表一般形式2023/2/1011n建立假设,确定检验水准:建立假设,确定检验水准:qH0:两组的总体分布相同,即:两组的总体分布相同,即12qH1:两组的总体分布不相同,即:两组的总体分布不相同,即12q0.05n 2检验检验2023/2/1012n计算检验统计量:计算检验统计量:q在在H0:成立时,即:成立时,即12处理处理属性属性合计合计阳性阳性阴性阴性Aabn1=a+bBcdn2=c+d 合合
6、 计计m1=a+cm2=b+dn=a+b+c+d表表2 两组频数分布的四格表一般形式两组频数分布的四格表一般形式m1/n2023/2/1013(行数(行数-1)(列数(列数-1)2023/2/1014分分 组组疗效疗效合计合计有效例数有效例数无效例数无效例数万拉发新组万拉发新组191130氟西汀组氟西汀组151530 合合 计计342760表表1 万拉发新与氟西汀治疗老年期抑郁症的疗效比较万拉发新与氟西汀治疗老年期抑郁症的疗效比较n建立假设:建立假设:qH0:12,即两药的总体有效率相同;,即两药的总体有效率相同;qH1:12,即两药的总体有效率不同;,即两药的总体有效率不同;q0.05202
7、3/2/1015n计算检验统计量:计算检验统计量:自由度自由度n确定确定P值,作出推断结论:值,作出推断结论:q查查 2分布分布界值表界值表 ,P0.05,差别无统计学意义。,差别无统计学意义。因此,尚不能认为万拉法新与氟西汀治疗老年期抑郁症的有效因此,尚不能认为万拉法新与氟西汀治疗老年期抑郁症的有效率不同。率不同。2023/2/1016四格表专用公式四格表专用公式 本例本例 四格表四格表 2检验的应用条件检验的应用条件总例数总例数n40,所有理论频数,所有理论频数Tij52023/2/1017二、二、2检验检验的连续性校正的连续性校正当当n40时,如果有某个格子出现时,如果有某个格子出现 1
8、 T5;本例;本例n52,但,但T22=1318/52=4.55,T12=1334/52=8.5,可应用连续性校正,可应用连续性校正的的 2检验。检验。n确定确定P值,作出推断结论:查值,作出推断结论:查 2分布分布界值表,得界值表,得P0.05,差别有,差别有统计学意义。可以认为两药对实验室指标的改善情况不同,统计学意义。可以认为两药对实验室指标的改善情况不同,A药药好于好于B药。药。2023/2/1021三、三、Fisher确切概率法确切概率法qR.A.Fisher(1934年年)确切概率法确切概率法(exact probability)是由是由Fisher借助超几何分布提出的直接计算概率
9、的方法;借助超几何分布提出的直接计算概率的方法;q不属于不属于 2检验的范畴,但可以作为四格表检验的范畴,但可以作为四格表 2检验的补充;检验的补充;2023/2/1022三、三、Fisher确切概率法确切概率法q四格表资料,若遇以下情况需用确切概率法。四格表资料,若遇以下情况需用确切概率法。n 若有理论频数小于若有理论频数小于1,n或或n 40,n或作或作 2检验后所得概率检验后所得概率P 接近检验水准接近检验水准。2023/2/1023qFisher确切概率法基本思想确切概率法基本思想:四格表边缘合计固定:四格表边缘合计固定不变的条件下,直接计算表内四个格子数据各种组合不变的条件下,直接计
10、算表内四个格子数据各种组合的概率。的概率。x(a)n1x(b)n1m1x(c)n2m1x(d)n2m1m22023/2/1024分组分组康复良好康复良好恢复较差恢复较差合计合计参加康复治疗组参加康复治疗组 9110未参加康复治疗组未参加康复治疗组 5712 合合 计计14822表表4 脑卒中患者是否参加康复治疗效果比较(例数)脑卒中患者是否参加康复治疗效果比较(例数)n例例3 研究脑卒中患者康复治疗效果,观察了病情近似的研究脑卒中患者康复治疗效果,观察了病情近似的22例患者,结果见表例患者,结果见表4。问脑卒中患者参加康复治疗与。问脑卒中患者参加康复治疗与否是否影响其身体恢复?否是否影响其身体
11、恢复?2023/2/1025分组分组康复良好康复良好恢复较差恢复较差合计合计参加康复治疗组参加康复治疗组 9110未参加康复治疗组未参加康复治疗组 5712 合合 计计14822表表4 脑卒中患者是否参加康复治疗效果比较(例数)脑卒中患者是否参加康复治疗效果比较(例数)n建立假设:建立假设:H0:12,即脑卒中患者参加康复治疗与否其身体恢复的概率即脑卒中患者参加康复治疗与否其身体恢复的概率相等;相等;H1:12,即脑卒中患者参加康复治疗与否其身体恢复的概率,即脑卒中患者参加康复治疗与否其身体恢复的概率不等;不等;0.052023/2/1026n选择检验方法,计算检验统计量选择检验方法,计算检验
12、统计量本例本例n222,PP1P2=0.00155+0.02477=0.026322023/2/1041第二节第二节 配对四格表资料的配对四格表资料的 2检验检验n例例4 分别采末梢血与静脉血检查乙型肝炎抗原,结果见分别采末梢血与静脉血检查乙型肝炎抗原,结果见表表6。静脉血静脉血末梢血末梢血合计合计阳性阳性阴性阴性阳性阳性47 3 50阴性阴性 7243250 合合 计计54246300表表6 末梢血与静脉血检查乙型肝炎抗原结果(例数)末梢血与静脉血检查乙型肝炎抗原结果(例数)2023/2/1043静脉血静脉血末梢血末梢血合计合计阳性阳性阴性阴性阳性阳性acn1阴性阴性 bdn2 合合 计计m
13、1m2n静脉血的阳性率静脉血的阳性率 末梢血的阳性率末梢血的阳性率 末梢血的阳性率静脉血的阳性率末梢血的阳性率静脉血的阳性率 比较两检测样本的阳性概率是否有差别,只需考察检验结果不一致比较两检测样本的阳性概率是否有差别,只需考察检验结果不一致的两个格子的两个格子!2023/2/1044n建立假设,确定检验水准建立假设,确定检验水准qH0:两总体:两总体B=C,即末梢血与静脉血检查的阳性概率相同;即末梢血与静脉血检查的阳性概率相同;qH1:两总体:两总体BC,即末梢血与静脉血检查的阳性概率不同;即末梢血与静脉血检查的阳性概率不同;q0.05。n计算检验统计量计算检验统计量2023/2/1045若
14、若H0为为真真,末末梢梢血血与与静静脉脉血血检检验验结结果果不不一一致致的的两两个个格格子子即即b,c两两个个位位置的理论频数都应该是置的理论频数都应该是由由 2检验基本公式检验基本公式,有有 自由度自由度 =1 该检验又称该检验又称McNemar检验。检验。2023/2/1046若若 b+c 40,应用连续性校正公式应用连续性校正公式自由度自由度 =1 2023/2/1047本例本例bc3+7100.05,差别无统计学意义。尚不能认,差别无统计学意义。尚不能认为静脉血与末梢血的检验结果不同。为静脉血与末梢血的检验结果不同。2023/2/1049第三节第三节 行行列表资料的列表资料的 2检验检
15、验n例例8.5 某医院用三种方案治疗急性无黄疸型病毒肝炎某医院用三种方案治疗急性无黄疸型病毒肝炎254例,观察结果见表例,观察结果见表8-6。问。问3种疗法的有效率是否不种疗法的有效率是否不同。同。表表8-6 3种方案治疗肝炎的疗效种方案治疗肝炎的疗效2023/2/1051n解析:这类问题通常应用解析:这类问题通常应用 2 检验进行各组间的比较,在检验进行各组间的比较,在有差异的情况下再根据具体情况进行适当的两两比较。有差异的情况下再根据具体情况进行适当的两两比较。n建立假设,确定检验水准建立假设,确定检验水准 H0:12 3,即三种治疗方案的总体有效率相同;即三种治疗方案的总体有效率相同;H
16、1:三种治疗方案的总体有效率不全相同;:三种治疗方案的总体有效率不全相同;0.052023/2/1052n计算检验统计量计算检验统计量 在在H0为真时,理论频数为真时,理论频数统计量统计量 或或自由度自由度 =(行数行数1)(列数列数1)等价形式等价形式2023/2/1053nR2表表 2检验的应用条件检验的应用条件 样本量较大,样本量较大,Tij5的格子数不超过的格子数不超过1/5。2023/2/1054本例本例2023/2/1055n确定确定P值,作出推断结论值,作出推断结论 查查 2分布分布界值表,界值表,20.005,210.6022.81,P0.005,差,差别有统计学意义。可以认为
17、三种制剂的总体痊愈率有差别有统计学意义。可以认为三种制剂的总体痊愈率有差异。异。n注:注:R2表表 2检验的应用条件检验的应用条件 样本量较大,样本量较大,Tij5的格子数不超过的格子数不超过1/5。2023/2/1056两两比较两两比较根据比较的次数修正检验水准根据比较的次数修正检验水准 =需需比较的次数比较的次数本例本例,=0.05 3=0.01672023/2/1057n例例5 用磷霉素的三种制剂治疗皮肤软组织感染,其疗效用磷霉素的三种制剂治疗皮肤软组织感染,其疗效结果见表结果见表5。制剂制剂痊愈痊愈未愈未愈合计合计痊愈率痊愈率(%)软膏软膏 4719 6671.21油膏油膏 24 1
18、2596.00粉剂粉剂1594420378.33表表7 磷霉素不同制剂对皮肤软组织感染的疗效(例数)磷霉素不同制剂对皮肤软组织感染的疗效(例数)2023/2/1058n建立假设,确定检验水准建立假设,确定检验水准 H0:12 3,即三种制剂的总体痊愈率相同;即三种制剂的总体痊愈率相同;H1:三种制剂的总体痊愈率不全相同;:三种制剂的总体痊愈率不全相同;0.052023/2/1059本例本例制剂制剂痊愈痊愈未愈未愈合计合计软膏软膏 4719 66油膏油膏 24 1 25粉剂粉剂15944203合计合计230642942023/2/1060n确定确定P值,作出推断结论值,作出推断结论 查查 2分布
19、分布界值表,界值表,20.05,25.9916.545,P0.05,差,差别有统计学意义。可以认为三种制剂的总体痊愈率有别有统计学意义。可以认为三种制剂的总体痊愈率有差异。差异。2023/2/1061两两比较两两比较 =0.05 3=0.01672023/2/1062n例例8.6 某研究人员收集了亚洲、欧洲和北美洲人的某研究人员收集了亚洲、欧洲和北美洲人的ABO血型资料,结果见表血型资料,结果见表8-7,问不同地区人群的血型分布有,问不同地区人群的血型分布有无差别?无差别?2023/2/1063n1建立检验假设,确定检验水准建立检验假设,确定检验水准qH0:不同地区的血型分布相同:不同地区的血
20、型分布相同qH1:不同地区不同地区的血型分布不全相同的血型分布不全相同q=0.05n2计算统计量计算统计量n3.确定确定P值,做出推断值,做出推断n自由度自由度 =(3-1)(4-1)=6,查附表,查附表,20.005,6=18.55,可知可知P0.75。在。在=0.05水平上不拒绝水平上不拒绝H0,所以尚不能认为儿童急性白血病患者与,所以尚不能认为儿童急性白血病患者与成年人急性白血病患者的血型分布不同。成年人急性白血病患者的血型分布不同。2023/2/1066行行列表资料列表资料 2检验的注意事项检验的注意事项nRC表表 2检验的应用条件检验的应用条件 样本量较大,样本量较大,Tij5的格子
21、数不超过的格子数不超过1/5。否则应先对列联表进行处理,处理的方法有:否则应先对列联表进行处理,处理的方法有:n根据不同设计类型有选择的将相邻的行或列合并;根据不同设计类型有选择的将相邻的行或列合并;n采用确切概率法;采用确切概率法;n最好的方法是增加样本例数。最好的方法是增加样本例数。2023/2/1067行行列表资料列表资料 2检验的注意事项检验的注意事项n多个率的比较。多个率的比较。n在实际应用中,对于在实际应用中,对于RC表资料要根据其分类类型和研表资料要根据其分类类型和研究目的选用恰当的检验方法。究目的选用恰当的检验方法。q行行列表资料列表资料 2检验与分类变量的顺序无关,对于有序的检验与分类变量的顺序无关,对于有序的行行列表资料不宜用列表资料不宜用 2检验。检验。2023/2/1068小结小结n定性资料按设计类型和资料性质可分为:定性资料按设计类型和资料性质可分为:q完全随机的二分类资料:包括二组和多组的完全随机的二分类资料:包括二组和多组的q配对配对(或配伍或配伍)的二分类资料;的二分类资料;q完全随机的无序多分类资料;完全随机的无序多分类资料;q完全随机的有序多分类资料(单向有序列联表);完全随机的有序多分类资料(单向有序列联表);q配对的有序多分类资料(双向有序列联表);配对的有序多分类资料(双向有序列联表);2023/2/10692023/2/1070