《7第七章卡方检验.ppt》由会员分享,可在线阅读,更多相关《7第七章卡方检验.ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 检验检验 第一节第一节 四格表资料的四格表资料的 检验检验一、一、检验的基本思想检验的基本思想1.分布分布(1)分布的定义:分布的定义:n个个u值的平方总和为值的平方总和为 值,值,值的分布称为值的分布称为 分布。分布。(2)分布的图形:分布的图形:当自由度当自由度 时,曲线呈时,曲线呈L型;型;随着自由度增加,曲线趋向对称;随着自由度增加,曲线趋向对称;当自由度当自由度 时,时,分布接近正分布接近正态分布。态分布。自由度为自由度为1的的 2分布界值分布界值0.00.10.20.30.40.53.840.05自由度为自由度为2的的 2分布界值分布界值0.00.10.20.30.4
2、0.55.99 0.050.00.10.20.30.40.52分布与自由度有关分布与自由度有关3.840.050.0250.0251.96-1.962分布与正态分布的关系(3)分布的可加性:分布的可加性:如果两个独立的随机变量如果两个独立的随机变量 分别服从自由度分别服从自由度 的的 分布,那么它们的和分布,那么它们的和 服从自由度服从自由度为为 的的 分布。分布。(4)分布的分位数:分布的分位数:界值表,附表界值表,附表8,823页。页。2.检验的基本思想检验的基本思想 例例7-1 某医院欲比较异梨醇口服液(试验组)某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪和氢氯噻嗪+地塞米松(对照组)降
3、低颅内压的疗地塞米松(对照组)降低颅内压的疗效。将效。将200例颅内压增高症患者随机分为两组,结例颅内压增高症患者随机分为两组,结果见表果见表7-1。问两组降低颅内压的总体有效率有无。问两组降低颅内压的总体有效率有无差别?差别?表表7-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 组别组别 有效有效 无效无效 合计合计 有效率有效率(%)试验组试验组 99(90.48)5(13.52)104 95.20 对照组对照组 75(83.52)21(12.48)96 78.13 合计合计 174 26 200 87.00 四格表资料的模式四格表资料的模式 四格表资料的模式四格表资料的模式分
4、组分组 A+A-合计合计甲组甲组 a b a+b乙组乙组 c d c+d合计合计 a+c b+d n式中式中A为实际频数,为实际频数,T为理论频数。为理论频数。检验的检验的基本思想基本思想:值反映了实际频数和理论频数的吻合程度。值反映了实际频数和理论频数的吻合程度。如果检验假设成立,如果检验假设成立,A和和T的相差会小,即的相差会小,即 值值不应该过大,如果不应该过大,如果 值大于理论值,则有理由值大于理论值,则有理由拒绝检验假设。拒绝检验假设。值的大小还取决于格子数的多少,即自值的大小还取决于格子数的多少,即自由度的大小。由度的大小。3.四格表资料的分析四格表资料的分析基本公式法:基本公式法
5、:适用于适用于n 40,理论数(,理论数(T)5。1.H0:1 1=2 2;H1:1 12 2,=0.05。2.计算理论数:计算理论数:3.计算计算 值:值:4.确定确定P值:值:自由度自由度=(2 1)(21)=1 查查 值表,值表,本例本例12.867.88,PT1。基本公式校正为:基本公式校正为:专用公式校正为:专用公式校正为:表表7-2 两种药物治疗脑血管疾病有效率的比较两种药物治疗脑血管疾病有效率的比较 组别组别 有效数有效数 无效数无效数 合计合计 有效率()有效率()胞磷胆碱胞磷胆碱 46 6 52 88.46神经节苷酯神经节苷酯 18 8(4.67)26 69.23 合计合计
6、64 14 78 82.05 第二节第二节 配对四格表资料的配对四格表资料的 检验检验 配对四格表模式配对四格表模式 乙法乙法 a b a+b c d c+d 合计合计 a+c b+d n甲法甲法合计合计 a为两种方法均为阳性;为两种方法均为阳性;d为两种方法均为阴性;为两种方法均为阴性;b为甲法阳性而乙法阴性;为甲法阳性而乙法阴性;c为乙法阳性而甲法阴性。为乙法阳性而甲法阴性。a、d为结果相同部分,为结果相同部分,b、c为结果不同部分。为结果不同部分。注意:当注意:当 n 较大而较大而 b、c 较小时,结较小时,结果的判断应考虑差别的实际意义。果的判断应考虑差别的实际意义。例例7-3 某实验
7、室分别用乳胶凝集法和免疫荧某实验室分别用乳胶凝集法和免疫荧光法对光法对58名可疑系统红斑狼疮患者血清中抗核抗名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表体进行测定,结果见表7-3。问两种方法的检测结。问两种方法的检测结果有无差别?果有无差别?表表7-3 两种方法的检测结果两种方法的检测结果 乳胶凝集法乳胶凝集法 11(a)12(b)23 2(c)33(d)35 合计合计 13 45 58合计合计免疫荧光法免疫荧光法 H0:B=C;H1:BC,=0.05。5.793.84,P0.05,拒绝,拒绝H0,接受,接受H1,说明,说明免疫荧光法阳性率高于乳胶凝集法。免疫荧光法阳性率高于乳胶凝集
8、法。免疫荧光法阳性率免疫荧光法阳性率:23/58 39.7,乳胶凝集法阳性率乳胶凝集法阳性率:13/5822.4。第三节第三节 四格表资料的四格表资料的Fisher确切概率法确切概率法 四格表资料如果四格表资料如果n40,或有,或有T,不拒绝不拒绝H0,还不能认为两组新,还不能认为两组新生儿的生儿的HBV总体感染率有差别。总体感染率有差别。例例7-5 某单位研究胆囊腺癌、腺瘤的某单位研究胆囊腺癌、腺瘤的P53基因表基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测份,用免疫组化法检测P53基因,资料见表基因,资料见表7-6。问。问胆囊
9、腺癌和胆囊腺瘤的胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差基因表达阳性率有无差 别?别?表表7-6 胆囊腺癌与胆囊腺瘤胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较基因表达阳性率的比较 病种病种 阳性阳性 阴性阴性 合计合计 胆囊腺癌胆囊腺癌 6 4 10 胆囊腺瘤胆囊腺瘤 1 9 10 合计合计 7 13 20 本例分析方法如下:本例分析方法如下:(1)H0:1 =2;H1:2,=0.05,双侧检验。双侧检验。(2)计算实际四格表的概率:)计算实际四格表的概率:(3)计算累计概率:)计算累计概率:一侧比实际组合更外侧的仅有一种,即一侧比实际组合更外侧的仅有一种,即a、b、c、d为为7、3、
10、0、10的组合,其概率为:的组合,其概率为:本例两组例数相等,故累计概率为:本例两组例数相等,故累计概率为:(4)判别结论:)判别结论:P,不拒绝不拒绝H0,还不能认为,还不能认为两组两组P53基因表达阳性率有差别。基因表达阳性率有差别。本例如可采用单侧检验则:本例如可采用单侧检验则:P 5.99,P 5.99,P18.55,P0.005,拒绝,拒绝H0,接受,接受H1,两两种血型系统之间有关联。种血型系统之间有关联。关联系数:关联系数:关联系数较小,可认为关系不太密切。关联系数较小,可认为关系不太密切。表表7-10 某地某地5801人的血型人的血型 MN血型血型 M N MN O 131 1
11、90 1502 1823 A 688 410 500 1598 B 495 887 650 2032 AB 137 179 32 348 合计合计 1451 1666 2684 5801ABO血型血型合计合计 A B C 合计合计 甲甲 165 0 0 165 乙乙 0 185 0 185 丙丙 0 0 166 166 合计合计 165 185 166 516模拟数据的关联性分析模拟数据的关联性分析四、行四、行列表资料列表资料 检验的注意事项:检验的注意事项:1.注意对注意对T值大小的要求:值大小的要求:要求要求T 5的个数不能超过的个数不能超过1/5,且不能有且不能有T1。如果不符可选用以下
12、方法处理:如果不符可选用以下方法处理:(1)增加样本例数;增加样本例数;(2)相邻行列例数进行合理地合并;相邻行列例数进行合理地合并;(3)删去理论数小的行或列;删去理论数小的行或列;(4)确切概率法。确切概率法。2.注意多组比较结果如为差别有显著性,并不代表注意多组比较结果如为差别有显著性,并不代表每两组差别有显著性,如需分析可进一步作两两每两组差别有显著性,如需分析可进一步作两两比较。比较。3.注意有序行注意有序行列表资料不宜采用列表资料不宜采用 检验,因为检验,因为 检验与分类变量的顺序无关。检验与分类变量的顺序无关。第五节第五节 多个样本率间的多重比较多个样本率间的多重比较一一.分割法
13、基本思想分割法基本思想 先将原先将原R2的行列表分割为若干四格表,按四格表检的行列表分割为若干四格表,按四格表检验方法计算验方法计算 值;再将原检验水准进行适当调整,保证值;再将原检验水准进行适当调整,保证型错误的概率不变型错误的概率不变;最后用求得的最后用求得的 值与表值与表7-11理论值比理论值比较得较得 P 值,再与调整后的值,再与调整后的比较并作出相应的判比较并作出相应的判断。断。表表7-11=1时时 界值表(多个样本率间的多重比较用)界值表(多个样本率间的多重比较用)P P P 6.23 0.01250 7.48 0.00625 8.21 0.00417 6.96 0.00833 7
14、.88 0.00500 8.49 0.00358 7.24 0.00714 8.05 0.00455 8.73 0.00313二、多个实验组间的两两比较二、多个实验组间的两两比较 例例7-9 对例对例7-6中表中表7-8的资料进行两两比较,的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?效率均有差别?物理疗法组与药物治疗组:物理疗法组与药物治疗组:物理疗法组与外用膏药组:物理疗法组与外用膏药组:药物治疗组与外用膏药组药物治疗组与外用膏药组:k为组数为组数二、各实验组与同一个对照组的比较二、各实验组与同一个对照组的比较 例
15、例 7-10 以表以表7-8资料中的药物治疗组为对照资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?两试验组与对照组的总体有效率有无差别?物理疗法组与药物治疗组:物理疗法组与药物治疗组:外用膏药组与药物治疗组外用膏药组与药物治疗组:k为组数为组数 第六节第六节 有序分组资料的线形趋势性检验有序分组资料的线形趋势性检验一、行一、行列表资料的分类及其检验方法的选择列表资料的分类及其检验方法的选择1.双向无序行双向无序行列表资料:列表资料:检验或关联性检验。检验或关联性检验。2.单向有序行单向有序行列表
16、资料:列表资料:分组为有序用分组为有序用 检验;效应为有序用秩和检验检验;效应为有序用秩和检验。3.双向有序属性相同行双向有序属性相同行列表资料:列表资料:一致性检验(一致性检验(Kappa检验)。检验)。4.双向有序属性不同行双向有序属性不同行列表资料列表资料 秩和检验秩和检验 等级相关等级相关 线形趋势性检验。线形趋势性检验。二、双向有序属性不同行二、双向有序属性不同行列表资料的线形趋势性检列表资料的线形趋势性检验验 基本思想基本思想:先计算:先计算 值,再将值,再将 值分解成值分解成线性回归分量和偏离线性回归分量。若两者均有统线性回归分量和偏离线性回归分量。若两者均有统计学意义,则说明两
17、个变量存在相关关系,但不是计学意义,则说明两个变量存在相关关系,但不是直线关系,如前者有意义而后者无意义则说明有直直线关系,如前者有意义而后者无意义则说明有直线关系存在。线关系存在。例例7-11 某研究者欲研究年龄与冠状动脉粥样某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将硬化等级之间的关系,将278例尸解资料整理成表例尸解资料整理成表7-13,问年龄与冠状动脉粥样硬化等级之间是否存,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势?在线性变化趋势?表表7-13 年龄与冠状动脉硬化的关系年龄与冠状动脉硬化的关系 冠状动脉硬化等级冠状动脉硬化等级(Y)+20 70 22 4 2 98
18、 30 27 24 9 3 63 40 16 23 13 7 59 50 9 20 15 14(5.42)58 合计合计 122 89 41 26 278合计合计 年龄年龄(岁岁)(X)年龄与冠状动脉粥样硬化等级之间无线性关系;年龄与冠状动脉粥样硬化等级之间无线性关系;1.按按RC表公式计算表公式计算 值值,并检验:并检验:年龄与冠状动脉粥样硬化等级之间有线性关系。年龄与冠状动脉粥样硬化等级之间有线性关系。2.计算线性回归分量计算线性回归分量 并检验:并检验:3.计算偏离线性回归分量计算偏离线性回归分量 并检验:并检验:结论:由于线性回归分量有统计学意义,偏结论:由于线性回归分量有统计学意义,
19、偏离线性回归分量无统计学意义,说明年龄与冠状离线性回归分量无统计学意义,说明年龄与冠状动脉粥样硬化等级之间存在线性变化关系。动脉粥样硬化等级之间存在线性变化关系。第七节第七节 Poisson资料的频数分布拟合优度检验资料的频数分布拟合优度检验 例例7-12 观察某克山病区克山病患者的空间分观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为布情况,调查者将该地区划分为279个取样单位,个取样单位,统计各取样单位历年累计病例数,资料见表统计各取样单位历年累计病例数,资料见表7-15的的第(第(1)、()、(2)栏,问此资料是否服从)栏,问此资料是否服从Poisson分分布?布?表表7-1
20、5 Poisson分布的拟合与检验分布的拟合与检验取样单位内取样单位内 观察频数观察频数 概率概率 理论频数理论频数 病例数病例数(X)A P(X)(1)(2)(3)(4)=(3n)(5)0 26 0.0854 23.8 0.20 1 51 0.2102 58.6 0.99 2 75 0.2585 72.1 0.12 3 63 0.2120 59.1 0.26 4 38 0.1304 36.4 0.07 5 17 0.0641 17.9 0.05 6 5 0.0263 7.3 7 3 9 0.0092 2.6 11 0.36 8 1 0.0039*1.1 合计合计 279(n)1.0000 279.0 2.05()*8的概率:的概率:10.9961=0.0039 结束