《第十章 卡方检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《第十章 卡方检验精选PPT.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十章卡方检验第1页,此课件共44页哦 本章教学目的:本章教学目的:推断:推断:两个总体率或构成比之间有无差别两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验频数分布拟合优度的检验 第2页,此课件共44页哦 检验的基本思想检验的基本思想第3页,此课件共44页哦四格表资料的基本形式四格表资料的基本形式第4页,此课件共44页哦基本思想:可通过基本思想:可通过 检验的基本公式检验的基本公式来理解。来理解。式中,式中,A为实际频数(为实际频数(actual frequency),)
2、,T为理论频数(为理论频数(theoretical frequency)。)。第5页,此课件共44页哦 检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论论频频数数的的吻吻合合程程度。度。若若检检验验假假设设H0:1=2成成立立,四四个个格格子子的的实实际际频频数数A 与与理理论论频频数数T 相差不应该很大,即统计量相差不应该很大,即统计量 不应该很大。不应该很大。如如果果 值值很很大大,即即相相对对应应的的P 值值很很小小,若若 ,则则反反过过来来推推断断A与与T相相差差太太大大,超超出出了了抽抽样样误误差差允允许许的的范范围围,从从而而怀怀疑疑H0的的正正确确性性,继继而拒绝
3、而拒绝H0,接受其对立假设,接受其对立假设H1,即,即12。第6页,此课件共44页哦 由公式还可以看出:由公式还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自自由由度度的的影影响响,值值才才能能正正确确地地反反映映实实际际频频数数A和和理理论论频频数数T 的的吻吻合合程度。程度。检检验验的的自自由由度度取取决决于于可可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格格表表资资料
4、料只只有有两两行行两两列列,=1=1,即即在在周周边边合合计计数数固固定定的的情情况况下下,4 4个个基基本本数数据据当当中中只只有有一一个个可可以以自自由由取值。取值。第7页,此课件共44页哦样本率与总体率比较样本率与总体率比较例:全国高血压病调查结果:城市人口高血压病患病率19.6%;某调查获得有高血压病家族史者358人,其中高血压病者127人(P=35.47%)问:有高血压病家族史者患病率是否高于一般人群?第8页,此课件共44页哦+-合计实际(A)127231358理论(T)70.168287.832358Chi-Square=57.252第9页,此课件共44页哦第一节第一节 2 2表表
5、 检验检验第10页,此课件共44页哦目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)资料:资料:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料第11页,此课件共44页哦四格表资料检验的专用公式四格表资料检验的专用公式第12页,此课件共44页哦 分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的 统统计计量量的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 统统计计量量分分布布的的连连续续性性,则则进进行行连续性校正。连续性校正
6、。第13页,此课件共44页哦四格表资料 检验公式选择条件:,不校正的理论或专用公式;,校正公式 ,直接计算概率。连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一时,一般不作校正。般不作校正。第14页,此课件共44页哦四格表资料检验的校正公式四格表资料检验的校正公式 第15页,此课件共44页哦 P151:例:例10-1 第16页,此课件共44页哦第17页,此课件共44页哦第18页,此课件共44页哦P153:例:例10-2第19页,此课件共44页哦第20页,此课件共44页哦第21页,此课件共44页哦两相关样本率检验(两相关样本率检验(McNemar检验)检验)配对四格表资
7、料的配对四格表资料的 检验检验第22页,此课件共44页哦P155:例:例10-4:第23页,此课件共44页哦检验统计量为检验统计量为第24页,此课件共44页哦注意:注意:本本法法一一般般用用于于样样本本含含量量不不太太大大的的资资料料。因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b,c),而而未未考考虑虑样样本本含含量量n和和两两法法结结果果一一致致的的两两种种情情况况(a,d)。所所以以,当当n很很大大且且a与与d的的数数值值很很大大(即即两两法法的的一一致致率率较较高高),b与与c的的数数值值相相对对较较小小时时,即即便便是是检检验验结结果果有有统统计计学
8、学意意义义,其其实实际际意义往往也不大。意义往往也不大。第25页,此课件共44页哦第二节第二节RC表 检验 第26页,此课件共44页哦行行列表资料列表资料多个样本率比较时,有R行2列,称为R2表;两个样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为RC表。第27页,此课件共44页哦检验统计量检验统计量第28页,此课件共44页哦多个样本率的比较多个样本率的比较 P156:例10-6第29页,此课件共44页哦第30页,此课件共44页哦两组构成比的比较P157:例10-7第31页,此课件共44页哦多个样本率间的多重比较Bonferroni
9、法基本思想:为保证犯第I类错误的概率总和不超过ALPHA,调整每一两两比较的检验水准P159:例10-9第32页,此课件共44页哦RC表检验的条件第33页,此课件共44页哦1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量第34页,此课件共44页哦根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的Fisher确切概率法(可
10、用SAS软件实现)。第35页,此课件共44页哦关联性分析22表的关联P154:例10-3第36页,此课件共44页哦第37页,此课件共44页哦关联性分析配对四格配对四格表的关联P156:例10-5第38页,此课件共44页哦第39页,此课件共44页哦关联性分析行行列表的关联P157:例10-8第40页,此课件共44页哦第41页,此课件共44页哦R C表资料表资料Chi-Square检验检验应注意的问题应注意的问题应用条件;应用条件;多重比较问题多重比较问题关联性分析问题关联性分析问题等级资料分析问题等级资料分析问题双向无序单资料的分析双向无序单资料的分析单向有序资料的分析单向有序资料的分析双向有序、属性不同资料的分析双向有序、属性不同资料的分析双向有序、属性相同资料的分析双向有序、属性相同资料的分析第42页,此课件共44页哦四格表资料的确切概率法第43页,此课件共44页哦谢谢大家!谢谢大家!第44页,此课件共44页哦