《非参数统计总体分布的拟合优度检验精选文档.ppt》由会员分享,可在线阅读,更多相关《非参数统计总体分布的拟合优度检验精选文档.ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、非参数统计总体分布的拟合优度检验2022/9/22华中科技大学同济医学院 宇传华()制作本讲稿第一页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作为什么要知道总体分布?为什么要知道总体分布?1.参数统计学推断方法(如t检验、F检验)均以服从某一分布(如正态分布)为假定条件。2.实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数(Expected frequency,简记为E)相符。本讲稿第二页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作本章介绍的拟合优度检验方法本章介绍的拟合优度检验方法1.卡方检验卡
2、方检验2.正态性检验的W法(Shapiro-wilk法)、D法(Kolmogorov-Smirnov法)本讲稿第三页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作第一节第一节 卡方卡方拟合优度检验拟合优度检验的原理与计算步骤的原理与计算步骤1.原理原理 判断样本观察频数(判断样本观察频数(Observed frequency)与理)与理论论(期望期望)频数(频数(Expected frequency)之差是否由抽)之差是否由抽样误差所引起。样误差所引起。本讲稿第四页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作数据格式与计算公式注意:理论频数注意:理
3、论频数Ei不宜过小不宜过小(如不小于(如不小于5),否则需要合并),否则需要合并组段!组段!本讲稿第五页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作注意:理论频数不宜过小,否则需要合并注意:理论频数不宜过小,否则需要合并2.计算步骤计算步骤本讲稿第六页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作3.847.8112.59P P0.050.05的临界值的临界值2分布(分布(chi-square distribution)本讲稿第七页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作卡方分布下的检验水准及其临界值卡方分布下的检验水准
4、及其临界值本讲稿第八页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作第二节第二节 离散型随机变量分布的离散型随机变量分布的拟合优度检验拟合优度检验一、二项分布的拟合优度检验一、二项分布的拟合优度检验二、二、Poisson分布的拟合优度检验分布的拟合优度检验本讲稿第九页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作一、二项分布的拟合优度检验一、二项分布的拟合优度检验【例7.4】某研究人员在某地随机抽查了150户3口之家,结果全家无某疾病有112户,家庭中1人患病的有20户,2人患病的有11户,3人全患病有7户,问该病在该地是否有家族聚集性。解:如果家庭
5、成员之间的发病与否(解:如果家庭成员之间的发病与否(X)互)互不影响,则不影响,则X符合二项分布(符合二项分布(两种互斥结果、两种互斥结果、试验条件不变、各次试验独立试验条件不变、各次试验独立)。也就表明)。也就表明疾病不具有家族聚集性。疾病不具有家族聚集性。本讲稿第十页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作本讲稿第十一页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作二、二、Poisson分布的拟合优度检验分布的拟合优度检验【例7.3】将酵母细胞的稀释液置于某种计量仪器上,数出每一小方格内的酵母细胞数,共观察了413个小方格,结果见表7.3第
6、1、2列,试问该资料是否服从Poisson分布?本讲稿第十二页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作卡方分量卡方分量P(7)0.000556本讲稿第十三页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作其他离散型变量分布的拟合优度检验其他离散型变量分布的拟合优度检验1.二项分布2.Poisson分布3.超几何分布超几何分布4.负二项分布负二项分布 可仿照上述二项分布、可仿照上述二项分布、Poisson分分布的方法进行分布的拟合优度检验。布的方法进行分布的拟合优度检验。本讲稿第十四页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()
7、制作第三节第三节 连续型随机变量分布的连续型随机变量分布的拟合优度检验拟合优度检验一、采用一、采用卡方检验卡方检验进行正态性检验进行正态性检验二、采用二、采用Shapiro-Wilk法法进行正态性检验进行正态性检验三、采用三、采用Kolmogorov-Smirnov法法进行正进行正态性检验态性检验本讲稿第十五页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作一、采用一、采用卡方检验卡方检验进行正态性检验进行正态性检验本讲稿第十六页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作本讲稿第十七页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()
8、制作拟合优度卡方检验的问题拟合优度卡方检验的问题1.1.分组不同,拟合的结果可能不同。分组不同,拟合的结果可能不同。2.2.需要有足够的样本含量。需要有足够的样本含量。对于连续型变量的优度拟合,卡方检验并不是理想的方法。对于连续型变量的优度拟合,卡方检验并不是理想的方法。统计学家推荐的拟合检验方法是:统计学家推荐的拟合检验方法是:Shapiro-Wilk检验检验 Kolmogorov-Smirnov检验检验本讲稿第十八页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作二、采用二、采用Shapiro-Wilk法法进行正态性检验进行正态性检验由Shapiro和Wilk于1965
9、年提出。常简称为W法,软件可计算出W统计量。适用于小样本。计算时需要采用常数表(附表9)。大样本时计算很复杂。本讲稿第十九页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作【例7.6】用小鼠研究正常肝核糖核酸(RNA)对癌细胞的生物学作用,测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶(FDP)活性的结果如下,请分析FDP活性是否服从正态分布?本讲稿第二十页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作排序排序后的数据一分为二后的数据一分为二由附表9获得所有变量值的SS本讲稿第二十一页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作三、
10、采用三、采用Kolmogorov-Smirnov法法进行正态性检验进行正态性检验由Kolmogorov与Smirnov提出。原理:寻找最大距离(Distance),所以常简称为D法。适用于大样本。具体做法:具体做法:比较实际频数与理论频数的累积概率间的差距,找出最大距离D,根据D值来判断实际频数分布是否服从理论频数分布。本讲稿第二十二页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作本讲稿第二十三页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作 Kolmogorov-Smirnov拟合优度检验拟合优度检验 图示图示本讲稿第二十四页,共二十五页2022/9/22华中科技大学同济医学院 宇传华()制作P-P图表7-8的第4列表7-8的第5列本讲稿第二十五页,共二十五页