《第十章 卡方检验优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第十章 卡方检验优秀PPT.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十章卡方检验第一页,本课件共有44页 本章教学目的:本章教学目的:推断:推断:两个总体率或构成比之间有无差别两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验频数分布拟合优度的检验 第二页,本课件共有44页 检验的基本思想检验的基本思想第三页,本课件共有44页四格表资料的基本形式四格表资料的基本形式第四页,本课件共有44页基本思想:可通过基本思想:可通过 检验的基本公式检验的基本公式来理解。来理解。式中,式中,A为实际频数(为实际频数(actual frequency),)
2、,T为理论频数(为理论频数(theoretical frequency)。)。第五页,本课件共有44页 检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论论频频数数的的吻吻合合程度。程度。若若检检验验假假设设H0:1=2成成立立,四四个个格格子子的的实实际际频频数数A 与与理理论论频数频数T 相差不应该很大,即统计量相差不应该很大,即统计量 不应该很大。不应该很大。如如果果 值值很很大大,即即相相对对应应的的P 值值很很小小,若若 ,则则反反过过来来推推断断A与与T相相差差太太大大,超超出出了了抽抽样样误误差差允允许许的的范范围围,从从而而怀怀疑疑H0的的正正确性,继而拒绝确性,
3、继而拒绝H0,接受其对立假设,接受其对立假设H1,即,即12。第六页,本课件共有44页 由公式还可以看出:由公式还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自自由由度度的的影影响响,值值才才能能正正确确地地反反映映实实际际频频数数A和和理理论论频频数数T 的吻合程度。的吻合程度。检检验验的的自自由由度度取取决决于于可可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格格表表资资
4、料料只只有有两两行行两两列列,=1=1,即即在在周周边边合合计计数数固固定定的的情情况况下下,4 4个个基基本本数数据据当当中中只只有有一一个个可可以以自自由由取值。取值。第七页,本课件共有44页样本率与总体率比较样本率与总体率比较例:全国高血压病调查结果:城市人口高血压病患病率19.6%;某调查获得有高血压病家族史者358人,其中高血压病者127人(P=35.47%)问:有高血压病家族史者患病率是否高于一般人群?第八页,本课件共有44页+-合计实际(A)127231358理论(T)70.168287.832358Chi-Square=57.252第九页,本课件共有44页第一节第一节 2 2表
5、表 检验检验第十页,本课件共有44页目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)资料:资料:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料第十一页,本课件共有44页四格表资料检验的专用公式四格表资料检验的专用公式第十二页,本课件共有44页 分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的 统统计计量量的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 统统计计量量分分布布的的连连续续性性,则则进进行行连续性校正。连续性校正
6、。第十三页,本课件共有44页四格表资料 检验公式选择条件:,不校正的理论或专用公式;,校正公式 ,直接计算概率。连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,时,一般不作校正。一般不作校正。第十四页,本课件共有44页四格表资料检验的校正公式四格表资料检验的校正公式 第十五页,本课件共有44页 P151:例:例10-1 第十六页,本课件共有44页第十七页,本课件共有44页第十八页,本课件共有44页P153:例:例10-2第十九页,本课件共有44页第二十页,本课件共有44页第二十一页,本课件共有44页两相关样本率检验(两相关样本率检验(McNemar检验)检验)配对四格表
7、资料的配对四格表资料的 检验检验第二十二页,本课件共有44页P155:例:例10-4:第二十三页,本课件共有44页检验统计量为检验统计量为第二十四页,本课件共有44页注意:注意:本本法法一一般般用用于于样样本本含含量量不不太太大大的的资资料料。因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b,c),而而未未考考虑虑样样本本含含量量n和和两两法法结结果果一一致致的的两两种种情情况况(a,d)。所所以以,当当n很很大大且且a与与d的的数数值值很很大大(即即两两法法的的一一致致率率较较高高),b与与c的的数数值值相相对对较较小小时时,即即便便是是检检验验结结果果有有统
8、统计计学学意意义义,其其实实际际意义往往也不大。意义往往也不大。第二十五页,本课件共有44页第二节第二节RC表 检验 第二十六页,本课件共有44页行行列表资料列表资料多个样本率比较时,有R行2列,称为R2表;两个样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为RC表。第二十七页,本课件共有44页检验统计量检验统计量第二十八页,本课件共有44页多个样本率的比较多个样本率的比较 P156:例10-6第二十九页,本课件共有44页第三十页,本课件共有44页两组构成比的比较P157:例10-7第三十一页,本课件共有44页多个样本率间的多重比较
9、Bonferroni法基本思想:为保证犯第I类错误的概率总和不超过ALPHA,调整每一两两比较的检验水准P159:例10-9第三十二页,本课件共有44页RC表检验的条件第三十三页,本课件共有44页1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量第三十四页,本课件共有44页根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的
10、Fisher确切概率法(可用SAS软件实现)。第三十五页,本课件共有44页关联性分析22表的关联P154:例10-3第三十六页,本课件共有44页第三十七页,本课件共有44页关联性分析配对四格配对四格表的关联P156:例10-5第三十八页,本课件共有44页第三十九页,本课件共有44页关联性分析行行列表的关联P157:例10-8第四十页,本课件共有44页第四十一页,本课件共有44页R C表资料表资料Chi-Square检验检验应注意的问题应注意的问题应用条件;应用条件;多重比较问题多重比较问题关联性分析问题关联性分析问题等级资料分析问题等级资料分析问题双向无序单资料的分析双向无序单资料的分析单向有序资料的分析单向有序资料的分析双向有序、属性不同资料的分析双向有序、属性不同资料的分析双向有序、属性相同资料的分析双向有序、属性相同资料的分析第四十二页,本课件共有44页四格表资料的确切概率法第四十三页,本课件共有44页谢谢大家!谢谢大家!第四十四页,本课件共有44页