第七章 卡方检验优秀PPT.ppt

上传人:石*** 文档编号:65721436 上传时间:2022-12-06 格式:PPT 页数:97 大小:3.92MB
返回 下载 相关 举报
第七章 卡方检验优秀PPT.ppt_第1页
第1页 / 共97页
第七章 卡方检验优秀PPT.ppt_第2页
第2页 / 共97页
点击查看更多>>
资源描述

《第七章 卡方检验优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第七章 卡方检验优秀PPT.ppt(97页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1051ContenttestoffourfolddatatestofpairedfourfolddataFisherprobabilitiesinfourfolddatatestofRCtableMultiplecomparisonofsampleratestestofgoodnessoffit现在学习的是第1页,共97页1052现在学习的是第2页,共97页 目的目的:推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率的多重比较多个样本率的多重比较 两个分类变量之间有无关联性两个分类变量之间有无关联性

2、 频数分布拟合优度的检验。频数分布拟合优度的检验。检验统计量检验统计量:应用应用:计数资料:计数资料现在学习的是第3页,共97页1054第一节第一节 四格表资料的四格表资料的 检验检验现在学习的是第4页,共97页1055目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料现在学习的是第5页,共97页1056 (1)分布是一种连续型分布:按分布的密度函数可给出自由度分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,的一簇分布曲线的一

3、簇分布曲线(图(图7-1)。)。(2)分布的一个基本性质是可加性:分布的一个基本性质是可加性:如果两个独立的随机变量如果两个独立的随机变量X1和和X2分别服从自由度分别服从自由度1和和2的分布,即的分布,即 ,那么,那么它们的和(它们的和(X1+X2)服从自由度()服从自由度(1+2)的)的 分布,即分布,即 。一、一、检验的基本思想检验的基本思想 1 分布分布现在学习的是第6页,共97页1057现在学习的是第7页,共97页10582 检验的基本思想检验的基本思想例例7-1 某某院院欲欲比比较较异异梨梨醇醇口口服服液液(试试验验组组)和和氢氢氯氯噻噻嗪嗪+地地塞塞米米松松(对对照照组组)降降低

4、低颅颅内内压压的的疗疗效效。将将200例例颅颅内内压压增增高高症症患患者者随随机机分分为为两两组组,结结果果见见表表7-1。问问两两组组降降低颅内压的总体有效率有无差别?低颅内压的总体有效率有无差别?现在学习的是第8页,共97页1059表表7-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 现在学习的是第9页,共97页10510 本例资料经整理成图本例资料经整理成图7-2形式,即有两形式,即有两个处理组,每个处理组的例数由发生数和个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有未发生数两部分组成。表内有 四个基四个基本数据,其余数据均由此四个数据推算出本数据,其余数据均

5、由此四个数据推算出来的,故称四格表资料。来的,故称四格表资料。现在学习的是第10页,共97页10511 图图7-2 四格表资料的基本形式四格表资料的基本形式现在学习的是第11页,共97页10512基本思想:可通过基本思想:可通过 检验的基本公式来检验的基本公式来理解。理解。式中,式中,A为实际频数(为实际频数(actual frequency),),T为理论频数(为理论频数(theoretical frequency)。)。现在学习的是第12页,共97页10513理论频数由下式求得:理论频数由下式求得:式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR 为相应的行合计为相应

6、的行合计 nC 为相应的列合计为相应的列合计现在学习的是第13页,共97页10514 理论频数理论频数 是根据检验假设是根据检验假设 ,且用合,且用合 并率来估计并率来估计 而定的。而定的。如上例,无效假设是试验组与对照组降低颅内压的总如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率体有效率相等,均等于合计的有效率87%。那么理论。那么理论上,试验组的上,试验组的104例颅内压增高症患者中有效者应为例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为,无效者为104(26/200)=13.52;同;同理,对照组的理,对照组的96例颅内压增高

7、症患者中有效者应为例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为,无效者为96(26/200)=12.48。现在学习的是第14页,共97页10515 检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论频数的吻合程度。论频数的吻合程度。若若检检验验假假设设H0:1=2成成立立,四四个个格格子子的的实实际际频频数数A 与与理理论论频频数数T 相相差差不不应应该该很很大大,即即统统计计量量 不不应应该该很很大大。如如果果 值值很很大大,即即相相对对应应的的P 值值很很小小,若若 ,则则反反过过来来推推断断A与与T相相差差太太大大,超超出出了了抽抽样样误误差差

8、允允许许的的范范围围,从从而而怀怀疑疑H0的的正正确确性性,继继而而拒拒绝绝H0,接接受受其其对对立立假假设设H1,即,即12。现在学习的是第15页,共97页10516 由公式(由公式(7-1)还可以看出:)还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自自由由度度的的影影响响,值值才才能能正正确确地地反反映映实实际际频频数数A和和理理论论频频数数T 的的吻吻合合程度。程度。检检验验的的自自由由度度取取决决于于可

9、可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格格表表资资料料只只有有两两行行两两列列,=1=1,即即在在周周边边合合计计数数固固定定的的情情况况下下,4 4个个基基本本数数据据当当中中只只有有一一个个可可以以自自由由取值。取值。现在学习的是第16页,共97页10517(1)建立检验假设,确定检验水平。建立检验假设,确定检验水平。H0:1=2 即试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体总体有效率相等有效率相等H1:12 即试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体总体有效率不相等有效率不相等=0.05。3.假设检验步骤假设

10、检验步骤现在学习的是第17页,共97页10518(2)求检验统计量值)求检验统计量值现在学习的是第18页,共97页10519现在学习的是第19页,共97页10520二、四格表资料检验的专用公式二、四格表资料检验的专用公式现在学习的是第20页,共97页10521 分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的统统计计量量 的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 统统计计量量 分布的连续性,则需行连续性校正。分布的连续性,则需行连续性校正。现在学习的是第21页,共97页10522三、四格表资料检验的校正公式三、四

11、格表资料检验的校正公式 现在学习的是第22页,共97页10523四格表资料 检验公式选择条件:,专用公式;,校正公式;,直接计算概率。连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一时,一般不作校正。般不作校正。现在学习的是第23页,共97页10524例例7-2 某某医医师师欲欲比比较较胞胞磷磷胆胆碱碱与与神神经经节节苷苷酯酯治治疗疗脑脑血血管管疾疾病病的的疗疗效效,将将78例例脑脑血血管管疾疾病病患患者者随随机机分分为为两两组组,结结果果见见表表7-2。问问两两种种药药物物治治疗疗脑脑血血管管疾疾病病的的有效率是否相等?有效率是否相等?现在学习的是第24页,共97页

12、10525表表7-2 两种药物治疗脑血管疾病有效率的比较两种药物治疗脑血管疾病有效率的比较现在学习的是第25页,共97页10526本例,故用四格表资料检验的校正公式,查界值表得。按 检验水准不拒绝,尚不能认为两种药物治疗脑血管疾病的有效率不等。现在学习的是第26页,共97页10527本资料若不校正时,本资料若不校正时,结论与之相反。结论与之相反。现在学习的是第27页,共97页10528第二节第二节配对四格表资料的配对四格表资料的 检验检验现在学习的是第28页,共97页10529与计量资料推断两总体均数是否与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计有差别有成组设计和配对设计一

13、样,计数资料推断两个总体率(构成比)是否数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即有差别也有成组设计和配对设计,即四四格表资料格表资料和和配对四格表资料配对四格表资料。现在学习的是第29页,共97页10530例例7-3 某某实实验验室室分分别别用用乳乳胶胶凝凝集集法法和和免免疫疫荧荧光光法法对对58名名可可疑疑系系统统红红斑斑狼狼疮疮患患者者血血清清中中抗抗核核抗抗体体进进行行测测定定,结结果果见见表表7-3。问两种方法的检测结果有无差别?问两种方法的检测结果有无差别?现在学习的是第30页,共97页10531表表7-3 两种方法的检测结果两种方法的检测结果 现在学习的是

14、第31页,共97页10532 上述配对设计实验中,就每个对子而言,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有两种处理的结果不外乎有四种可能四种可能:两种检测方法皆为阳性数两种检测方法皆为阳性数(a);两种检测方法皆为阴性数两种检测方法皆为阴性数(d);免疫荧光法为阳性,乳胶凝集法为免疫荧光法为阳性,乳胶凝集法为 阴性数阴性数(b);乳胶凝集法为阳性,免疫荧光法为乳胶凝集法为阳性,免疫荧光法为 阴性数阴性数(c)。现在学习的是第32页,共97页10533其中,其中,a,d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况为两法观察结

15、果不一致的两种情况。检验统计量为检验统计量为现在学习的是第33页,共97页10534注意:注意:本本法法一一般般用用于于样样本本含含量量不不太太大大的的资资料料。因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b,c),而而未未考考虑虑样样本本含含量量n和和两两法法结结果果一一致致的的两两种种情情况况(a,d)。所所以以,当当n很很大大且且a与与d的的数数值值很很大大(即即两两法法的的一一致致率率较较高高),b与与c的的数数值值相相对对较较小小时时,即即便便是是检检验验结结果果有有统统计计学学意意义义,其其实实际际意义往往也不大。意义往往也不大。现在学习的是第34

16、页,共97页10535检验步骤:检验步骤:现在学习的是第35页,共97页10536第三节第三节四格表资料的四格表资料的Fisher确切概率法确切概率法 现在学习的是第36页,共97页10537条件:条件:理论依据:理论依据:超几何分布超几何分布 (非(非 检验检验 的范畴的范畴)现在学习的是第37页,共97页10538例例7-4 某医师为研究乙肝免疫球蛋白某医师为研究乙肝免疫球蛋白预防胎儿宫内感染预防胎儿宫内感染HBV的效果,将的效果,将33例例HBsAg阳性孕妇随机分为预防注射组和非阳性孕妇随机分为预防注射组和非预防组,结果见表预防组,结果见表7-4。问两组新生儿的。问两组新生儿的HBV总体

17、感染率有无差别?总体感染率有无差别?现在学习的是第38页,共97页10539表7-4两组新生儿HBV感染率的比较现在学习的是第39页,共97页10540一、基本思想在四格表周边合计数固定不变的条件在四格表周边合计数固定不变的条件下,计算表内下,计算表内4个实际频数变动时的各种个实际频数变动时的各种组合之概率组合之概率 ;再按检验假设用单侧或;再按检验假设用单侧或双侧的累计概率双侧的累计概率 ,依据所取的检验水,依据所取的检验水准准 做出推断。做出推断。现在学习的是第40页,共97页105411各组合概率Pi的计算在四格表周边合计数不变的条件下,表内4个实际频数a,b,c,d 变动的组合数共有“

18、周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:现在学习的是第41页,共97页10542各组合的概率Pi服从超几何分布,其和为1。计算公式为!为阶乘符号 现在学习的是第42页,共97页10543 2累计概率的计算累计概率的计算(单、双侧单、双侧检验不同检验不同)现在学习的是第43页,共97页10544现在学习的是第44页,共97页10545现在学习的是第45页,共97页10546二、检验步骤(二、检验步骤()现在学习的是第46页,共97页10547现在学习的是第47页,共97页10548表7-5例7-4的Fisher确切概率法计算表现在学习的是第4

19、8页,共97页10549例7-5某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?现在学习的是第49页,共97页10550表表7-6 胆囊腺癌与胆囊腺瘤胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较基因表达阳性率的比较 现在学习的是第50页,共97页10551本例a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。表7-7例7-5的Fisher确切概率法计算表*为现有样本现在学习的是第51页,共97页10552(1)计算现

20、有样本的D*和P*及各组合下四格表的Di。本例D*=50,P*=0.02708978。(2)计算满足Di50条件的各组合下四格表的概率Pi。(3)计算同时满足Di50和PiP*条件的四格表的累计概率。本例为P7和P8,(4)计算双侧累计概率P。P0.05,按=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。现在学习的是第52页,共97页10553注意:注意:现在学习的是第53页,共97页10554第四节第四节行列表资料的 检验 现在学习的是第54页,共97页10555行行列表资料列表资料多个样本率比较时,有R行2列,称为R2表;两个样本的构成比比较时,有2行

21、C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为RC表。现在学习的是第55页,共97页10556检验统计量检验统计量现在学习的是第56页,共97页10557一、多个样本率的比较一、多个样本率的比较现在学习的是第57页,共97页10558例7-6某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?表7-8三种疗法有效率的比较现在学习的是第58页,共97页10559检验步骤:现在学习的是第59页,共97页10560二、样本构成比的比较现在学习的是第60页,共97页10561例7-7某医师在研究血管

22、紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?表7-9DN组与无DN组2型糖尿病患者ACE基因型分布的比较现在学习的是第61页,共97页10562检验步骤检验步骤现在学习的是第62页,共97页10563三、双向无序分类资料的关联性检验表中两个分类变量皆为无序分类变量的行列表资料,又称为双向无序表资料。现在学习的是第63页,共97页10564注意:双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。现在学习的是第

23、64页,共97页10565例7-8测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?表7-10某地5801人的血型(单样本,做关联性检验)现在学习的是第65页,共97页10566表7-10资料,可用行列表资料检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:列联系数C取值范围在01之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。现在学习的是第66页,共97页10567检验步骤现在学习的是第67页,共97页10568由于列联系数C=0.1883,数值较小,故

24、认为两种血型系统间虽然有关联性,但关系不太密切。现在学习的是第68页,共97页10569四、行列表资料检验的注意事项现在学习的是第69页,共97页105701行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。现在学习的是第70页,共97页10571根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的F

25、isher确切概率法(可用SAS软件实现)。现在学习的是第71页,共97页10572现在学习的是第72页,共97页10573现在学习的是第73页,共97页10574 第五节多个样本率间的多重比较现在学习的是第74页,共97页10575现在学习的是第75页,共97页10576分割法分割法 现在学习的是第76页,共97页10577一、基本思想因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:现在学习的是第77页,共97页10578现在学习的是第78页,共97页10579现在学习的是第79页,共97页10580现在学习的是第80页,共97页10581

26、二、多个实验组间的两两比较现在学习的是第81页,共97页10582例7-9对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?现在学习的是第82页,共97页10583检验步骤本例为3个实验组间的两两比较现在学习的是第83页,共97页10584表7-12三种疗法有效率的两两比较现在学习的是第84页,共97页10585现在学习的是第85页,共97页10586三、各实验组与同一个对照组的比较现在学习的是第86页,共97页10587例7-10以表7-8资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?本

27、例为各实验组与同一对照组的比较现在学习的是第87页,共97页10588现在学习的是第88页,共97页10589现在学习的是第89页,共97页10590第七节频数分布拟合优度的检验现在学习的是第90页,共97页10591医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法,但只适用于正态分布。Pearson值能反映实际频数和理论频数的吻合程度,故检验可用于推断频数分布的拟合优度,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等。现在学习的是第91页,共97页10592例7-12观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为279个取样单位,统计各取样单位历年累计病例数,资料见表7-15的第(1)、(2)栏,问此资料是否服从Poisson分布?现在学习的是第92页,共97页10593表7-15Poisson分布的拟合与检验*:X8的概率:现在学习的是第93页,共97页10594现在学习的是第94页,共97页10595现在学习的是第95页,共97页10596现在学习的是第96页,共97页现在学习的是第97页,共97页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁