《祝晓明医学统计学医统卡方检验.pptx》由会员分享,可在线阅读,更多相关《祝晓明医学统计学医统卡方检验.pptx(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、率率(rate):率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比,说明某现象出现的强度或频度,通常以百分率(%)、千分率()、万分率(/万)、或十万分率(10万)等来表示。你们班级的及格率,挂科率怎么算?计算公式如下:第1页/共57页构成比(proportion):表示某事物内部各组成部分在整体中所占的比重,常以百分数表示。调查下:你们当中多少人用国产手机?非国产手机?计算公式为二、构成比第2页/共57页检验(chi-squaretest):英国统计学家Pearson提出的一种主要用于分析分类变量数据的假设检验方法.目的:推断两个总体率或构成比之间有无差别推断多个总体率或构
2、成比之间有无差别检验统计量:2应用:计数资料 Karl Pearson 第3页/共57页第一节 四格表资料的2 检验目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料第4页/共57页要考查西安医学院临床专业01班和02班的系统解剖的及格率,从01班抽取20人(其中15人及格,5人挂科),从02班抽取30人(其中20人及格,10人挂科)。问这两个班级的及格率有无不同?哪个班级学习成绩更好?第5页/共57页四格表资料的基本形式 第6页/共57页例9-1吲达帕胺片治疗原发性高血压疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治
3、疗。试分析有效性。第7页/共57页通用公式:A 为实际频数,T 为理论频数,为自由度。=(行数-1)(列数-1)一、检验的通用公式理论频数计算公式 Tij 为第 i 行第 j 列的理论频数,n ni i 和n nj j 分别为相应行与列的周边合计数,n 为总例数。第8页/共57页v检验统计量2值反映了实际频数与理论频数的吻合程度。若检验假设H0:1=2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量2不应该很大。如果2值很大,即相对应的P 值很小,若P,则反过来推断A与T 相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12。第9
4、页/共57页v自由度愈大,2值也会愈大;所以只有考虑了自由度的影响,2值才能正确地反映实际频数A和理论频数T 的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。第10页/共57页检验步骤:1.建立检验假设并确定检验水准H0:1=2 即试验组与对照组的总体有效率相等H1:12 即试验组与对照组的总体有效率不等=0.05第11页/共57页2.计算检验统计量 第12页/共57页3.3.确定P P 值,作出推断结论当自由度确定后,2分布曲线下右侧尾部的面积为时,横轴上相应的2值记作2,
5、第13页/共57页查2界值表,得20.05,1=3.84,按=0.05水准,拒绝H0,接受H1,P0.05,可以认为两组治疗原发性高血压的总体有效率不同,即可认为吲达帕胺片治疗原发性高血压是有效的。第14页/共57页专用公式:二、四格表资料2检验的专用公式结论同前。第15页/共57页校正公式:Frank Yates 三、四格表资料2检验的校正公式2分布是一连续型分布,而四格表资料属离散型分布,由此计算得的2统计量的抽样分布亦呈离散性质。为改善2统计量分布的连续性,则需行连续性校正。2连续性校正仅用于=1的四格表资料,当2时,一般不作校正。第16页/共57页四格表资料2检验公式的选择:,基本公式
6、/专用公式;,校正公式;,直接计算概率。第17页/共57页例9-2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将58例脑血管疾病患者随机分为两组,结果见表。问两种药物治疗脑血管疾病的有效率是否相等?第18页/共57页即两种药物治疗脑血管疾病的有效率相等 即两种药物治疗脑血管疾病的有效率不相等2.计算检验统计量 3.确定P 值,作出推断结论不拒绝H0,尚不能认为两种药物治疗脑血管疾病的有效率不相等 1.建立假设,设定检验水准第19页/共57页四、四格表资料的Fisher确切概率法(自学)当四格表资料中出现n40 或T 40,用非校正公式计算得3.确定P值,作出推断结论P0.05,不拒绝
7、H0,尚不能认为两种培养基的阳性培养率不同第30页/共57页第三节 行列表资料的2检验第31页/共57页行列表资料多个样本率比较时,有R 行2列,称为R2表;两个样本的构成比比较时,有2行C 列,称2C 表;多个样本的构成比比较,有R 行C 列,称为RC 表。第32页/共57页检验统计量第33页/共57页例9 9-5 5 某医院用3 3种方案治疗急性肝炎254254例,观察结果如下,问3 3种方案治疗急性肝炎的有效率是否不同。组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西药结合组59157479.73合计14510925457.09表9-6 39-6
8、 3种方案治疗急性肝炎的效果 H0?H1?第34页/共57页例9-6 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表9-79-7,问不同地区人群ABO血型分类构成比是否不同。地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592表9-7 9-7 三个不同地区血型样本的频分布H0?H1?第35页/共57页1.理论频数:行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:1)增大样本含量以达到增大理论频数的目的,属首选方法,只是有些
9、研究无法增大样本含量,如同一批号试剂已用完等。行列表资料2检验的注意事项第36页/共57页2)根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。例如:不同年龄组可以合并,但不同血型就不能合并。3)改用双向无序RC表的Fisher确切概率法(可用SAS软件实现)。第37页/共57页2.多个样本率比较:若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。第38页/共57页3.行列表资料卡方检验与分类变量的顺序无关。有序的RC表资料两
10、组(或多组)疗效(痊愈、显效、有效、无效)的比较不宜用卡方检验。有序的RC表资料两组(或多组)构成比(痊愈、显效、有效、无效)的比较可用用卡方检验。单向有序表资料,宜选用秩转换的非参数检验;分析两个有序分类变量间是否存在相关关系,宜用等级相关分析。第39页/共57页小结 1.检验是用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。其基本公式为 2.针对不同的数据有 四格表专用公式、四个表校正公式和RC列联表通用公式,在应用过程中需要根据不同的数据形势选择合适的方法。第40页/共57页 3.当多个样本率比较的推断结论拒绝H0,只说明各总体率之间有差别,
11、但不能说明任两个总体率之间有差别。为此,需要采用多个样本率的多重比较方法。4.多个样本率间多重比较有分割法、可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I型错误的概率不变。第41页/共57页习题:某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率 为 7.14%,五 年 级 学 生 的 近 视 率 为35.71%,调查结果见表8-2。问该大学四年级与五年级学生的近视眼患病率是否不同?第42页/共57页 P0.005,按=0.05水准,不拒绝H0,还不能认为四年级与五年级学生近视眼患病率不等。第43页/共57页 本资料若不校正时,结论与之相反。第44页/共57页课后习题2-1第45页/共57页第46页/共57页课后习题2-2参考答案:由于有格子理论频数小于1,故采用精确概率法。第47页/共57页课后习题2-3第48页/共57页第49页/共57页课后习题2-4第50页/共57页第51页/共57页课后习题2-5第52页/共57页第53页/共57页课后习题2-6第54页/共57页第55页/共57页谢谢!第56页/共57页谢谢您的观看!第57页/共57页