《统计学-卡方检验课件.ppt》由会员分享,可在线阅读,更多相关《统计学-卡方检验课件.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第八章第八章 检验检验 可用于单个频数分布的拟合优度检验,两组定性资料(两率、两可用于单个频数分布的拟合优度检验,两组定性资料(两率、两构成比)的差异检验、关联性检验,多组定性资料(多个率、多个构成比)的差异检验、关联性检验,多组定性资料(多个率、多个构成比)的差异检验、配对设计定性资料的差异检验、列联表资料构成比)的差异检验、配对设计定性资料的差异检验、列联表资料的差异检验、关联性检验,多个方差的齐性检验等。的差异检验、关联性检验,多个方差的齐性检验等。第一节第一节 独立样本四格表资料的独立样本四格表资料的 检验检验 检验不仅可以用于推断单个样本的频率分布是否等于某种检验不仅可以用于推断单
2、个样本的频率分布是否等于某种给定的理论分布,给定的理论分布,还可以检验两个样本的总体分布是否相同还可以检验两个样本的总体分布是否相同。基本格子只有四个的列基本格子只有四个的列联联表称表称为为四格表四格表(four fould table),),或或 表。表。表8-1两种药物治疗消化道溃疡4周后疗效处理 愈合 未愈合 合计 愈合率()奥美拉唑雷尼替丁64(57.84)51(57.16)21(27.16)33(26.84)8584 75.29 60.68合计 115 54 169 68.05例例8-1(P150)。)。属 性(固定值)组 别合 计甲乙合计 表表8-2 独立样本资料的四格表独立样本资
3、料的四格表 一、一、列联表列联表 检验的基本思想检验的基本思想 为理论数,根据为理论数,根据 计算,即计算,即 为为 行行 列的理论数列的理论数 为为 行的合计数行的合计数 为为 列的合计数列的合计数 为总的合计数为总的合计数 R表示行数表示行数 C表示列数表示列数查查 界值表(附录三附表)得界值表(附录三附表)得 按按 检验水准,拒绝检验水准,拒绝 ,接受,接受 ,两样本频率的差异优统计学意义。,两样本频率的差异优统计学意义。因为奥美拉唑的愈合率为因为奥美拉唑的愈合率为75,雷尼替丁的愈合率为,雷尼替丁的愈合率为60.71,可以认为奥美,可以认为奥美拉唑的愈合率比雷尼替丁的愈合率高。拉唑的愈
4、合率比雷尼替丁的愈合率高。四格表专用公式:四格表专用公式:适用条件:适用条件:1.2.计算最小理论数即可确定。计算最小理论数即可确定。例例8-1按该式得:按该式得:当资料条件:当资料条件:1.2.或或 应选用应选用Fisher确切概率法。确切概率法。当资料条件:当资料条件:1.2.需校正:需校正:例例8-2(P153)。)。8-3查查 界值表(附录三附表界值表(附录三附表8)得)得 按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为,尚不能认为两种治疗方案的总体缓解概率不同。两种治疗方案的总体缓解概率不同。第第二节二节 独立样本独立样本RC列联表资料的列联表资料的 检验检验(一)(一)RC列
5、联表列联表 检验的基本思想和计算步骤检验的基本思想和计算步骤处 理合 计合计 属 性表表8-4 独立样本独立样本RC列联表列联表12R统计量公式:统计量公式:无 效 5 10 25 40组 别 A药 B药 C药合 计有 效 35 20 7 62合 计 40 30 32102有效率()87.50 66.67 21.88 60.78表表8-5三种不同治疗方法治疗慢性支气管炎的疗效三种不同治疗方法治疗慢性支气管炎的疗效(二)多个独立样本频率的比较(例(二)多个独立样本频率的比较(例8-3)查附录三附表查附录三附表8,即三种治疗方法的疗效相同即三种治疗方法的疗效相同不同或不全相同不同或不全相同32.7
6、4按按 检验水准,拒绝检验水准,拒绝 ,可以认为这三种药物的治疗效果不同或不全相同。,可以认为这三种药物的治疗效果不同或不全相同。(三)多个独立样本频率分布的比较(三)多个独立样本频率分布的比较 分 组 儿童 成人 合 计 A型 30 19 49合 计 112 77 189表表8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布儿童急性白血病患者与成年人急性白血病患者的血型分布B型383068O型321951AB型12921例例8-4试分析儿童急性白血病患者与成年人急性白血病患者的血型分布(表试分析儿童急性白血病患者与成年人急性白血病患者的血型分布(表8-6)有无差别?)有无差别?查附录
7、三附表查附录三附表8,按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为,尚不能认为儿童急性白血病患者与成年人急性白血病患者的血型分布不相同儿童急性白血病患者与成年人急性白血病患者的血型分布不相同儿童急性白血病患者与成年人急性白血病患者的血型分布相同儿童急性白血病患者与成年人急性白血病患者的血型分布相同儿童急性白血病患者与成年人急性白血病患者的血型分布不相同儿童急性白血病患者与成年人急性白血病患者的血型分布不相同0.695两两两两比较按四格表的比较按四格表的 检检验处理,只是验处理,只是 水准需按以下水准需按以下 公式公式进行调整。进行调整。表示检验水准修正值表示检验水准修正值 表示两两比较
8、需进行检验的次数表示两两比较需进行检验的次数 表示比较的组数表示比较的组数例例8-3的两两比较需把表的两两比较需把表8-5分解成分解成3个四格表个四格表 第三节第三节 配对设计资料的配对设计资料的 检验检验可用于配对设计定性资料的差异检验、关联性检验。可用于配对设计定性资料的差异检验、关联性检验。一、配对一、配对 列联表资料的列联表资料的 检验检验8-8例例8-5(P156)。)。表表8-7 两种检验方法检验结果比较两种检验方法检验结果比较甲 法 +-合 计 乙法+80()31()111 -10()11()21合计9042132总上所述,要比较两种检验方法阳性率有无差别,只要对其中的频数总上所
9、述,要比较两种检验方法阳性率有无差别,只要对其中的频数b b与与c c做做 检验即可。检验即可。适用条件:适用条件:适用条件适用条件:按按 检验水准,拒绝检验水准,拒绝 ,可以认为两种检验方法的阳性结果有差别。,可以认为两种检验方法的阳性结果有差别。鉴于甲法阳性率为鉴于甲法阳性率为90/132=68.20%,90/132=68.20%,乙法阳性率为乙法阳性率为111/132111/13284.0984.09,可以认为乙,可以认为乙法阳性率高于甲法阳性率。法阳性率高于甲法阳性率。即两种检验方法的阳性率相同即两种检验方法的阳性率相同即两种检验方法的阳性率不相同即两种检验方法的阳性率不相同二、配对二
10、、配对 列联表资料的列联表资料的 检验检验可用于可用于 列联表资料的差异检验、关联性检验。列联表资料的差异检验、关联性检验。8-9 例例8-6(P159)。)。8-10 为类别数为类别数 和和 分别为第行合计和第列合计分别为第行合计和第列合计查查 界值表得界值表得 按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为甲法测定,尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。结果的概率分布与乙法测定结果的概率分布不同。第四节第四节 四格表的确切概率法四格表的确切概率法 基本思想:在四格表四个周边合计不变的条件下,计基本思想:在四格表四个周边合计不变的条件下,计算获得现有数值以及更不
11、利于算获得现有数值以及更不利于 的数值的概率,再的数值的概率,再根据根据 水准对水准对 作出推断。作出推断。例例8-7(P160)。)。8-118-12按按 检验水准,不拒绝检验水准,不拒绝 ,尚不能认为甲药治疗,尚不能认为甲药治疗精神抑郁症的效果与乙药不同。精神抑郁症的效果与乙药不同。第五节第五节 卡方卡方检验用于拟合优度检验检验用于拟合优度检验1.原理原理 判断样本观察频数(判断样本观察频数(Observed frequency)与理论)与理论(期望期望)频频数(数(Expected frequency)之差是否由抽样误差所引起。)之差是否由抽样误差所引起。分布和拟合优度检验分布和拟合优度
12、检验 一、一、分布分布 分布是一种连续型随机变量的概率分布。分布是一种连续型随机变量的概率分布。3.847.8112.59P P0.050.05的临界值的临界值2分布分布(chi-square distribution)分布随自由度不同而变化。记为分布随自由度不同而变化。记为 。查附表查附表8:二、拟合优度检验二、拟合优度检验 拟合优度检验的应用是根据一个样本的频数分布检验其未知拟合优度检验的应用是根据一个样本的频数分布检验其未知总体分布是否等于某个给定的理论分布。总体分布是否等于某个给定的理论分布。:总体分布等于给定的理论分布:总体分布等于给定的理论分布 :总体分布不等于给定的理论分布:总体
13、分布不等于给定的理论分布 (通常用(通常用 )A为实际频数为实际频数T为理论频数为理论频数如果如果 成立,则成立,则 应该不大;应该不大;若若 太大,超出一定范围时,就有理由认为太大,超出一定范围时,就有理由认为 不成立,从而拒绝不成立,从而拒绝 ,接受接受 ,认为资料不服从所假定的分布。,认为资料不服从所假定的分布。例例8-8(P162)。)。:总体分布等于均数为总体分布等于均数为139.48,的正态分布的正态分布 :总体分布不等于均数为:总体分布不等于均数为139.48,的正态分布的正态分布 表8-13 120名男生身高(cm)的频数分布表及拟合优度检验统计量的计算 组段 观察频数(1)(
14、2)()(3)(4)(5)=(4)-(3)理论频数(6)(7)122.0126.0130.0134.0138.0142.0146.0150.0154.0 5 81022332011 6 50.008320.032400.097040.226420.419670.635030.8114110.925220.976650.024080.064630.129390.193250.215360.179080.111110.051430.01776 2.8900 7.755715.526323.189825.843321.489813.3331 6.1717 2.13090.032400.097040.226420.419670.635030.814110.925220.976650.994411.540530.007691.966980.061041.981880.103280.408270.004773.86289合计120 9.93733 按按 ,不能拒绝,不能拒绝 ,尚不能认为该地,尚不能认为该地12岁男孩身高不服从均数为岁男孩身高不服从均数为139.48,标准差为,标准差为7.30的正态分的正态分布。布。查附录三附表8,可知