《chisquare [兼容模式].pdf》由会员分享,可在线阅读,更多相关《chisquare [兼容模式].pdf(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、检验2学习要求 理解理解2检验的统计思想检验的统计思想 掌握四格表掌握四格表2检验和适用条件检验和适用条件 配对四格表资料的配对四格表资料的2检验和适用条件检验和适用条件 行列(行列(RC)表资料的)表资料的2检验和适用条件检验和适用条件2 检验2检验检验(Chi-square test)是现代统计学的创始人之一,英国统计学家是现代统计学的创始人之一,英国统计学家K.Pearson于于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率、比间的比较,计数资料的关联度分析,拟合优度检验等。本章仅限于介绍两个和多个率或构成比比较的年提出的一种具有广泛用途的统计方法,可用于两个或多个率、比
2、间的比较,计数资料的关联度分析,拟合优度检验等。本章仅限于介绍两个和多个率或构成比比较的2检验。检验。Karl Pearson(1857-1936)England 一般四格表的检验一般四格表的检验2例 题为研究肿瘤标志物癌胚抗原(CEA)对肺癌的诊断价值,随机抽取72例确诊为肺癌的患者为肺癌组,114例接受健康体检的非肺癌患者为对照组。用CEA对其进行检测,结果呈阳性反应者病例组中33例,对照组中10例。问两组人群的CEA阳性率有无差异?CEA对两组人群的诊断结果对两组人群的诊断结果分 组阳性阴性合计阳性率(分 组阳性阴性合计阳性率(%)肺癌组)肺癌组33(16.6)39(55.4)7245.
3、8对照组对照组10(26.4)104(87.6)1148.8合 计合 计4314318623.1四格表资料的一般形式22 表或四格表表或四格表(fourfold table)处理组阳性事件数阴性事件数合计甲处理组阳性事件数阴性事件数合计甲aba+b乙乙cdc+d合计合计a+cb+dn实际频数实际频数A(actual frequency)(a、b、c、d)2 检验的统计思想H0:1=2=H1:12 =0.05理论频数理论频数T(theoretical frequency):nnncolumnrowTCR总例数合计列合计行)()(分 组阳性阴性合计阳性率(分 组阳性阴性合计阳性率(%)肺癌组)肺癌
4、组33(16.6)39(55.4)7245.8对照组对照组10(26.4)104(87.6)1148.8合 计合 计4314318623.12 检验的基本思想2 2值(chi-square value)表示理论频数与实际频数差别之和,它近似服从自由度为值(chi-square value)表示理论频数与实际频数差别之和,它近似服从自由度为的的2 2分布。分布。222()1()ATATTT(1)(1)RCPearson 2 2统计量:统计量:2/)12/(2222)2/(21)(ef2分布(chi-square distribution)不同自由度的分布密度曲线图不同自由度的分布密度曲线图2()
5、f200.10.20.30.4051015=1=6=102,12 分布界值 2分布界值示意图分布界值示意图2 检验的基本思想根据检验假设H根据检验假设H0 0:1 1=2 2,即两样本来自同一总体,或两总体率相同,若H,即两样本来自同一总体,或两总体率相同,若H0 0成立,则四个格子的实际频数A与理论频数T相差不应该很大,即成立,则四个格子的实际频数A与理论频数T相差不应该很大,即2统计量不应该很大。若统计量不应该很大。若2值很大,即相对应的P值很小,当值很大,即相对应的P值很小,当P P,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑的H,则反过来推断A与T相差太大,超出了抽
6、样误差允许的范围,从而怀疑的H0 0正确性,继而拒绝H正确性,继而拒绝H0 0,接受其对立假设H,接受其对立假设H1 1,即,即1 12 2。2 检验的基本思想它近似服从自由度为1的它近似服从自由度为1的2 2分布。分布。22222(33 16.6)(3955.4)(1026.4)(10487.6)16.655.426.487.611112()34.3216.416.655.426.487.620.05,13.8423.840.05P 按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,肺癌患者癌胚抗原的阳性率显著高于健康人,肺癌患者癌胚抗原的阳性率显著高于健康人,四格表专用公式在四格表的在
7、四格表的2检验中,为了避免计算理论频数检验中,为了避免计算理论频数T,可由可由基本公式基本公式推导出,直接由各格子的实际频数(推导出,直接由各格子的实际频数(a、b、c、d)计算)计算2值的公式:值的公式:22222()()()()()()()()()()()()()ATTab acab bdcdbdabdabcdabcdabcdab acab bdcdbdabcdabcdabcd基本公式:22(),1;()()()()adbcnab cdac bd四格表专用公式:四格表专用公式:四格表专用公式220.05,12186(33 1041039)234.10 ,17243 143 1143.84;
8、0.05P2(1)u22.194924.82(n40,所有T5时)四格表四格表2 检验的适用条件检验的适用条件2分布是一连续型分布,而四格表资料的分布是一连续型分布,而四格表资料的2检验统计量近似服从检验统计量近似服从2分布,其适用条件为:分布,其适用条件为:n40,且,且T5时,用非连续性校正时,用非连续性校正2检验。当检验。当n40,而,而1T5时,用连续性校正公式 当时,用连续性校正公式 当n40或或T1时,用时,用Fisher精确检验精确检验(Fisherexact test)连续性校正公式2分布是一连续型分布,而四格表资料属离散型分布,对 其 进 行 校 正 称 为 连 续 性 校
9、正(correctionforcontinuity),又称Yates校正(Yates correction)。分布是一连续型分布,而四格表资料属离散型分布,对 其 进 行 校 正 称 为 连 续 性 校 正(correctionforcontinuity),又称Yates校正(Yates correction)。校正公式:校正公式:22(0.5)cA TT)()()()2/(22dbcadcbannbcadc例题 将将 116 例癫痫患者随机分为两组,一组例癫痫患者随机分为两组,一组 70 例接受常规加高压氧治疗(高压例接受常规加高压氧治疗(高压氧氧组),另一组组),另一组 46 例接受常规治
10、疗(常规组),治疗结果见表。问两种疗法的有效例接受常规治疗(常规组),治疗结果见表。问两种疗法的有效率率有无差别?有无差别?治疗结果治疗结果 治疗方法有效治疗方法有效 无效无效 合计合计 有效率(有效率(%)高压氧组高压氧组66 4 70 94.3 常规组常规组 38 8 46 82.6 合合 计计 104 12 116 89.7 解:解:建立检验假设,确定显著性水平。建立检验假设,确定显著性水平。H0:12;H1:12;=0.05。求检验统计量求检验统计量2值。值。22(66 84 38)1164.0870 46 104 12 求求 P 值,下结论。值,下结论。查附表查附表20.05,13.
11、84,P0.05,结论为高压氧组的有效率显著高于对照组。,结论为高压氧组的有效率显著高于对照组。例题 将将 116 例癫痫患者随机分为两组,一组例癫痫患者随机分为两组,一组 70 例接受常规加高压氧治疗(高压例接受常规加高压氧治疗(高压氧氧组),另一组组),另一组 46 例接受常规治疗(常规组),治疗结果见表。问两种疗法的有效例接受常规治疗(常规组),治疗结果见表。问两种疗法的有效率率有无差别?有无差别?治疗结果治疗结果 治疗方法有效治疗方法有效 无效无效 合计合计 有效率(有效率(%)高压氧组高压氧组66 4 70 94.3 常规组常规组 38 8 46 82.6 合合 计计 104 12
12、116 89.7 解:解:建立检验假设,确定显著性水平。建立检验假设,确定显著性水平。H0:12;H1:12;=0.05。求检验统计量求检验统计量2值。值。选择连续性校正:选择连续性校正:求求 P 值,下结论。值,下结论。查附表查附表20.05,13.84,P0.05,结论为两组的有效率无显著性差异。,结论为两组的有效率无显著性差异。222246 12=4.8 112n nTn2(66 84 38116 2)11622.9270 46 104 12c 配对四格表的检验配对四格表的检验2配对四格表资料的2检验配对设计配对设计 两种剂量的毒理实验结果 两种剂量的毒理实验结果 乙剂量 乙剂量 甲剂量
13、 死亡(+)生存(-)合计甲剂量 死亡(+)生存(-)合计死亡(+)6(a)12(b)18死亡(+)6(a)12(b)18生存(-)3(c)18(d)21合计 9 30 39生存(-)3(c)18(d)21合计 9 30 39 成组设计成组设计 某抗癌新药两种剂量的毒理实验结果某抗癌新药两种剂量的毒理实验结果 结果 结果 分组 死亡(+)生存(-)合计分组 死亡(+)生存(-)合计甲剂量(a)(b)甲剂量(a)(b)乙剂量(c)(d)合计 78乙剂量(c)(d)合计 78 对子号对子号 甲剂量乙剂量甲剂量乙剂量 1 死亡死亡 死亡死亡 2 死亡死亡 生存生存 39 生存生存 生存生存 编号编号
14、 剂量组结果剂量组结果 1 甲甲 死亡死亡 2 乙乙 生存生存 78 甲甲 生存生存 配对四格表2检验公式推导(+,)和(,+)两个格子中的理论频数均为 2cb40 cb时 2)2(2)2()(2222cbcbccbcbbTTA cbcb2)(2分布 同理可得40cb时 校正公式:cbcbTTA222)1|(|)5.0|(|四格表资料的2检验解题思路是否为配对资料是否为配对资料是否需要校正是否需要校正非校正公式非校正公式校正公式校正公式是是否是是否是否需要校正是否需要校正非校正公式非校正公式校正公式校正公式是否是否否否行列表的检验行列表的检验2行列(RC)表的2检验因为其基本数据有因为其基本数
15、据有 R 行行 C 列,故通称行列表或列,故通称行列表或 RC 列联表(列联表(contingency table),简称),简称 RC 表。表。RC 表的资料比较有:表的资料比较有:1.多个样本率的比较多个样本率的比较 2.两组构成比的比较两组构成比的比较 3.多组构成比的比较多组构成比的比较 RC 表的2检验通用公式nnnTCR总例数列合计行合计理论频数代入基本公式 可推导出:基本公式 通用公式)1()(2222CRnnAnTTA 自由度=(行数1)(列数1)RC 表的检验假设H01.多个样本率的比较多个样本率的比较 H H0 0:1 1=2 2=3 3=4 4(四种总体率相等)(四种总体
16、率相等)H H1 1:1 1,2 2,3 3,4 4不全相等(四种总体率不全相等)2.多组构成比的比较不全相等(四种总体率不全相等)2.多组构成比的比较 H H0 0:总体构成相同:总体构成相同 H H1 1:总体构成不全相同:总体构成不全相同 RC表2检验的应用注意事项 对RC表,若较多格子(1/5以上)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?对RC表,若较多格子(1/5以上)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?增大样本含量增大样本含量(最好!)(最好!)删去删去该格所
17、在的行或列(损失信息及损害样本的随机性!)该格所在的行或列(损失信息及损害样本的随机性!)根据根据专业知识专业知识合理的合理的将该格所在行或列与相邻的行或列将该格所在行或列与相邻的行或列合并合并。(损失信息及损害样本的随机性!)。(损失信息及损害样本的随机性!)RC表2检验的应用注意事项 多组比较时,若效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。多组比较时,若效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。2 2检验只能反映其构成比有无差异,不能比较效应的平均水平。检验只能反映其构成比有无差异,不能比较效应的平均水平。行列两种属性皆有序时,可考虑趋势检验或等级相关分析。行列两种属性皆有序时,可考虑趋势检验或等级相关分析。表 6-2 某药对两种不同病情的支气管炎疗效 表 6-2 某药对两种不同病情的支气管炎疗效 疗效 疗效 单纯型(1)单纯型合并肺气肿(2)单纯型(1)单纯型合并肺气肿(2)控制 控制 65 42 65 42 显效 显效 18 6 18 6 有效 有效 30 23 30 23 近控 近控 13 11 13 11 合计 合计 126 82 126 82