《第八章 χ2检验.ppt》由会员分享,可在线阅读,更多相关《第八章 χ2检验.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、要求:要求:掌握:掌握:四格表资料的四格表资料的2检验,配对四格表检验,配对四格表资料的资料的2检验,行检验,行列表资料的列表资料的2检验。检验。熟悉:熟悉:2检验的基本思想。检验的基本思想。第八章第八章 2 2检验检验(Chi Square Test Chi Square Test)v 目的:目的:推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别v 检验统计量检验统计量:2 2v 应用:应用:计数资料计数资料第一节第一节 四格表资料的四格表资料的2 2 检验检验 例例8.1 8.1 为为了了解解某某中中
2、药药治治疗疗原原发发性性高高血血压压的的疗疗效效,将将7070名名高高血血压压患患者者随随机机分分为为两两组组。试试验验组组用用该该药药加加辅辅助助治治疗疗,对对照照组组用用安安慰慰剂剂加加辅辅助助治治疗疗,观观察察结结果果如如表表8-18-1,问问该该药药治治疗疗原发性高血压是否有效?原发性高血压是否有效?一、基本公式和基本思想一、基本公式和基本思想组别组别有效有效无效无效合计合计有效率()有效率()对照组对照组20244445.45试验组试验组21 52680.77合计合计41297058.57两种疗法治疗原发性高血压的疗效两种疗法治疗原发性高血压的疗效 四格表资料的基本形式四格表资料的基
3、本形式 目的:推断两个总体率(构成比)是目的:推断两个总体率(构成比)是 否有差别否有差别要求:两样本的两分类个体数排列成四要求:两样本的两分类个体数排列成四 格表资料格表资料表表8-1 8-1 两种疗法治疗原发性高血压的疗效两种疗法治疗原发性高血压的疗效 理论频数表的构成比相同,各行各列构成比均相同;理论频数表的构成比相同,各行各列构成比均相同;各格子实际数与理论数的差别相同。各格子实际数与理论数的差别相同。检验统计量检验统计量2 值反映了实际频数值反映了实际频数与理论频数的吻合程度。与理论频数的吻合程度。v自自由由度度 愈愈大大,2 2 值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自
4、自由由度度 的的影影响响,2 2 值值才才能能正正确确地地反反映映实实际际频频数数A A和和理理论论频频数数T T 的吻合程度。的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不检验的自由度取决于可以自由取值的格子数目,而不是样本含量是样本含量n n。四格表资料只有两行两列四格表资料只有两行两列,=1=1,即在即在周边合计数固定的情况下,周边合计数固定的情况下,4 4个基本数据当中只有一个基本数据当中只有一个可以自由取值。个可以自由取值。(1 1)建立检验假设,确定检验水平。建立检验假设,确定检验水平。HH0 0:1 1=2 2 即试验组与对照组的总体有效率相等即试验组与对照组的总体有
5、效率相等 HH1 1:1 1 2 2 即试验组与对照组的总体有效率不等即试验组与对照组的总体有效率不等 =0.05=0.05。假设检验步骤假设检验步骤T T1111=44(41/70)=25.8=44(41/70)=25.8T T1212=44(29/70)=18.2=44(29/70)=18.2 T T2121=26(41/70)=15.2=26(41/70)=15.2 T T22 22=26(29/70)=10.826(29/70)=10.8(2)求检验统计量值)求检验统计量值(3)(3)确定确定P P 值,作出推断结论值,作出推断结论 P P 0.050.05,按按=0.05=0.05水
6、准,拒绝水准,拒绝H H0 0 ,接受接受HH1 1 ,可以认为两组治可以认为两组治疗原发性高血压的总体有效率不疗原发性高血压的总体有效率不等,即可认为该中药治疗原发性等,即可认为该中药治疗原发性高血压有效。高血压有效。二、四格表资料检验的专用公式二、四格表资料检验的专用公式三、四格表资料检验的校正公式三、四格表资料检验的校正公式 2 2分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的 2 2统统计计量量的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 2 2 统统计计量量分分布布的的连连续续性性,则则需需行行连连续续性
7、性校校正正(correction(correction for for continuity)continuity)。2 2 连续性校正仅用于连续性校正仅用于 =1 1 的四格表资料,当的四格表资料,当22 时,一般不作校正。时,一般不作校正。四格表资料四格表资料 2 2 检验公式的选择检验公式的选择:,专用公式;专用公式;,校正公式;,校正公式;,直接计算概率。,直接计算概率。例例8.2 8.2 某某医医学学院院抽抽样样调调查查大大学学四四年年级级和和五五年年级级学学生生近近视视眼眼患患病病情情况况,四四年年级级学学生生的的近近视视率率为为7.14%7.14%,五五年年级级学学生生的的近近视
8、视率率为为35.71%,35.71%,调调查查结结果果见见表表8-28-2。问问该该大大学学四四年年级级与与五五年年级级学学生生的近视眼患病率是否不同?的近视眼患病率是否不同?P P 0.050.05,按,按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0 ,还不还不能认为四年级与五年级学生近视眼患病率不等。能认为四年级与五年级学生近视眼患病率不等。本资料若不校正时,本资料若不校正时,结论与之相反。结论与之相反。与计量资料推断两总体均数是否有差别有成组与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体设计和配对设计一样,计数资料推断两个总体率(构成比)是否
9、有差别也有成组设计和配对率(构成比)是否有差别也有成组设计和配对设计,即设计,即四格表资料四格表资料和和配对四格表资料配对四格表资料。目目的的:通通过过样样本本数数据据推推断断两两种种处处理理的的结结果果有有无无差差别别。常常用用于于比比较较两两种种检检验验方方法法、两两种种培养方法等的比较。培养方法等的比较。第二节第二节 配对四格表资料的配对四格表资料的 2 2 检验检验 例例8.4 8.4 现现有有198198份份痰痰标标本本,每每份份标标本本分分别别用用A A、B B两两种种培培养养基基培培养养结结核核菌菌,结结果果见见表表8-58-5。问问A A、B B两两种种培培养养基基的的阳阳性性
10、培养率是否不等?培养率是否不等?检验统计量检验统计量(McNemarMcNemar test)test)检验步骤:检验步骤:P P 0.05.0.05.按按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0 ,无统计学意,无统计学意义。尚不能认为两种培养基的阳性培养率不同。义。尚不能认为两种培养基的阳性培养率不同。注意:注意:本本法法一一般般用用于于样样本本含含量量不不太太大大的的资资料料。因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b b,c c),而而未未考考虑虑样样本本含含量量n n和和两两法法结结果果一一致致的的两两种种情情况况(a a,d d)
11、。所所以以,当当 n n 很很大大且且 a a 与与 d d 的的数数值值很很大大(即即两两法法的的一一致致率率较较高高),b b 与与 c c 的的数数值值相相对对较较小小时时,即即便便是是检检验验结结果果有有统统计计学学意意义义,其其实实际际意意义义往往往往也也不大。不大。第三节第三节 行行列表资料的列表资料的 2 2检验检验 行行列表资料列表资料 多个样本率比较时,多个样本率比较时,有有 R R 行行 2 2 列,称为列,称为 R R 2 2表;表;两个样本的构成比比较时,两个样本的构成比比较时,有有 2 2 行行 C C 列,称列,称 2 2C C 表;表;多个样本的构成比比较,多个样
12、本的构成比比较,有有 R R 行行 C C 列,称为列,称为 R R C C 表。表。检验统计量检验统计量多个样本率的比较多个样本率的比较例例8.5 8.5 某医院用某医院用3 3种方案治疗急性无黄疸型种方案治疗急性无黄疸型病毒肝炎病毒肝炎254254例,观察结果见表例,观察结果见表8-68-6,问,问3 3种种疗法的有效率是否不同。疗法的有效率是否不同。检验步骤:检验步骤:HH0 0:3 3种治疗方案的有效率相等种治疗方案的有效率相等HH1 1:3 3种治疗方案的有效率不全相等种治疗方案的有效率不全相等 =0.05=0.05 P P 0.05 0.05,在,在=0.05=0.05的检验水准下
13、,的检验水准下,拒绝拒绝HH0 0,接受接受HH1 1,差异有统计学意义。,差异有统计学意义。可以认为三种疗法的有效率有差别。可以认为三种疗法的有效率有差别。样本构成比的比较样本构成比的比较例例8.6 8.6 某研究人员收集了亚洲、欧洲和北美洲某研究人员收集了亚洲、欧洲和北美洲人的人的A A、B B、ABAB、OO血型资料,结果见表血型资料,结果见表8-78-7,问不同地区人群问不同地区人群ABOABO血型分类构成比是否不同。血型分类构成比是否不同。检验步骤检验步骤HH0 0:不同地区人群血型分布总体构成比相同不同地区人群血型分布总体构成比相同HH1 1:不同地区人群血型分布总体构成比不全相同
14、不同地区人群血型分布总体构成比不全相同 =0.05=0.05 P P 0.05 0.05,在,在=0.05=0.05检验水准下,拒绝检验水准下,拒绝HH0 0,接受,接受H1H1,差异有统计学意义。认为三个不同地区的人群血型分布总差异有统计学意义。认为三个不同地区的人群血型分布总体构成比有差别。体构成比有差别。行行列表的分割列表的分割 重新规定检验水准:重新规定检验水准:I I型错误的概率不变。型错误的概率不变。检验水准的估计方法:检验水准的估计方法:根据分析目的、根据分析目的、k k个样本率两两个样本率两两比较的次数比较的次数多个样本率间的多重比较多个样本率间的多重比较1 1多个实验组间的两
15、两比较多个实验组间的两两比较 K K:为样本率的个数为样本率的个数 2 2实验组与同一个对照组的比较实验组与同一个对照组的比较 K K:为样本率的个数为样本率的个数 例例8.7 8.7 对例对例8.58.5中表中表8-68-6的资料进行两两比的资料进行两两比较,以推断是否任两种疗法治疗急性无黄较,以推断是否任两种疗法治疗急性无黄疸型病毒肝炎的有效率均有差别?疸型病毒肝炎的有效率均有差别?检验步骤检验步骤本例为本例为3 3个实验组间的两两比较个实验组间的两两比较 HH0 0:A A B B,即任两对比组的总体有效率相等即任两对比组的总体有效率相等HH1 1:A A B B,即任两对比组的总体有效
16、率不等即任两对比组的总体有效率不等 0.01670.01670.0167例例 8.8 8.8 以例以例8.58.5中表中表8-68-6资料中的中药治疗资料中的中药治疗组为对照组,西药治疗组与中西药结合为组为对照组,西药治疗组与中西药结合为试验组,试分析两试验组与对照组的总体试验组,试分析两试验组与对照组的总体有效率有无差别?有效率有无差别?本例为各实验组与同一对照组的比较本例为各实验组与同一对照组的比较各试验组与同一对照组比较的各试验组与同一对照组比较的P P值结果见表值结果见表8-8-9 90.0250.0251 1理论频数:行列表中的各格理论频数:行列表中的各格T T11,并并且且11T
17、T5 5的格子数不宜超过的格子数不宜超过1/51/5格子总格子总数,否则可能产生偏性。处理方法有三种:数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。样本含量,如同一批号试剂已用完等。三、行三、行列表资料列表资料 2 2 检验的注意事项检验的注意事项根据根据专业知识专业知识,删去理论频数太小的行或,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。例如:不同年龄组近的邻
18、行或邻列合并。例如:不同年龄组可以合并,但不同血型就不能合并。可以合并,但不同血型就不能合并。改用双向无序改用双向无序R RC C表的表的FisherFisher确切概率确切概率法(可用法(可用SASSAS软件实现)。软件实现)。2 2多个样本率比较:若所得统计推断为拒多个样本率比较:若所得统计推断为拒绝绝H H0 0,接受接受HH1 1时,只能认为各总体率之间时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重之间有差别,需进一步做多个样本率的多重比较。比较。3.3.实际应用中:对于行列表资料要根据其分实际应用中:对于行列表资料要根据其分类类型和研究目的选用恰当的检验方法。类类型和研究目的选用恰当的检验方法。行行列表资料的列表资料的 2 2 检验与分类变量的顺序检验与分类变量的顺序无关,对于有序的无关,对于有序的R RC C表资料不宜使用。表资料不宜使用。