《中国人民大学--非参数统计第六章分类数据的关联分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《中国人民大学--非参数统计第六章分类数据的关联分析优秀PPT.ppt(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 分类数据的关联分析分类数据的关联分析中国人民大学统计学院本章内容本章内容中国人民大学统计学院列联表和列联表和 检验检验 中国人民大学统计学院独立性检验独立性检验 假设检验问题:当 取大值,或者p-值很小的时候,拒绝零假设。构造统计量:中国人民大学统计学院例例6.1中国人民大学统计学院齐性检验齐性检验 假设检验问题:构造统计量:在零假设下近似有:检验方法和独立性检验相同。中国人民大学统计学院例例6.2中国人民大学统计学院解答解答中国人民大学统计学院Fisher精确检验 n.n.1总和n2.n1.n12总和2*2列联表在A、B独立时:n22 n.2 n11n21中国人民大学统计学院检
2、验检验任何一个格子中的的数目都不会过大或者过小,假如过大过者过小就可以考虑拒绝零假设,因而我们考虑 就可以了。当大样本时,可以接受近似正态分布进行检验,即:中国人民大学统计学院例例6.3中国人民大学统计学院Ridit检验Ridit检验法的原理:取一个样本数较多的组或者将几组数检验法的原理:取一个样本数较多的组或者将几组数据汇总成为参照组,依据参照组的样本结构将原来各组响据汇总成为参照组,依据参照组的样本结构将原来各组响应数变换为参照得分:应数变换为参照得分:Ridit得分,利用变换以后的得分,利用变换以后的Ridit得得分进行个处理之间的强弱比较。分进行个处理之间的强弱比较。行向量A表示不同比
3、较组,列向量B为依次尺度变量,假设 ,表示对应格子的响应频数。假设检验问题:中国人民大学统计学院Ridit得分定义得分定义假设依次类别B中第j类的边缘分布是 ,j=1,s,那么第j类的依次强度(Ridit得分)定义如下:其中在实际计算中用样本估计 .中国人民大学统计学院计算步骤计算步骤中国人民大学统计学院检验检验中国人民大学统计学院检验检验依据计算的R构造检验统计量:当大样本时,T值接近于1,从而检验统计量简化为:在零假设状况下,W近似听从 分布,当W过大或者过小的时候,都考虑拒绝零假设。中国人民大学统计学院例例6.4中国人民大学统计学院解答解答中国人民大学统计学院对数线性模型对数线性模型 对
4、对数数线线性性模模型型是是把把列列联联分分析析和和线线性性模模型型统统一一起起来来的的探探讨讨方方法,它强调了模型拟合优度,交互效应和网格频数估计。法,它强调了模型拟合优度,交互效应和网格频数估计。中国人民大学统计学院二维饱和对数线性模型二维饱和对数线性模型二维饱和对数线性模型:其中:中国人民大学统计学院二维独立对数线性模型:二维独立对数线性模型:二维独立对数线性模型:其中中国人民大学统计学院例例6.5中国人民大学统计学院首先:计算年龄和对缺水看法的交互作用,如表所示:接着:计算年龄和对缺水看法对数作用,如下表所示:中国人民大学统计学院中国人民大学统计学院中国人民大学统计学院模型设计矩阵模型设
5、计矩阵表 达 为 矩 阵 形 式,可 以 便 利 进 行 参 数 估 计 和 检 验。4个参数 ,则饱和对数线性模型可表示为:其中:中国人民大学统计学院模型估计检验模型估计检验建立对数线性模型之后,对于模型需要进行检验,常见的统计量由两个,Pearson 和对数释然比统计量:在零假设下,两者近似服从 ,k是模型独立参数个数。中国人民大学统计学院高维对数线性模型高维对数线性模型高维列联表对数线性模型,用 三维表为例。A有r格水平,B有s个水平,C有l个水平,为观测频数,是概率真实值。则对数线性模型一般表示为:其中:中国人民大学统计学院例例6.6中国人民大学统计学院解答解答中国人民大学统计学院本章要求本章要求驾驭分类数据的独立性探讨方法;区分分类数据的独立性和齐性检验的异同;驾驭Fisher检验与卡方检验的应用条件的异同;了解Ridit方法和应用;了解对数线性模型和卡方检验的异同;娴熟应用S-Plus中的相关叮嘱学习如上方法。