《Z检验和卡方检验(共33页).doc》由会员分享,可在线阅读,更多相关《Z检验和卡方检验(共33页).doc(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上4.6 二项分布和Poisson分布大样本资料的Z检验1.二项分布总体概率的Z检验(大样本,n较大)设 ,当n相当大,以致和都较大(例如,大于5)时,前已学过,X近似地服从 ,P 近似地服从 (1) 单组样本例4.7 传染科人员中,乙肝化验阳性35名,问总体阳性率是否高于当地一般人群的阳性率17%?欲检验 (或 或 )成立时, 若Z的当前值所对应的P值很小,则拒绝,否则,不拒绝。例4.7的解:欲检验(单侧) 2.061.645,P0.05, 不能拒绝。尚不能认为总体均数超过50。 (2) 两个观察值 例4.10 两样品各测1分钟, 问相应的两个总体均数是否相等?欲检验
2、 成立时会如何?记近似地服从,近似地服从 近似地服从但 未知,只能用近似地代替 近似地服从即 近似地服从据Z的当前值查正态分布表,得双侧P值,若P值很小,则拒绝;否则,不拒绝 例4.10的解:欲检验 查正态分布表,得双侧 P0.05,不能拒绝。尚不能认为相应的两个总体均数的差异有统计学意义。(2) 两组观察值例4.11 A样品:测10分钟,B样品:测15分钟,问以1分钟为观察单位,A、B两样品总体均数是否相等?A组:独立重复观察个时间单位,记观察值为,平均值为 设每一个时间单位内, B组:独立重复观察个时间单位,记观察值为,平均值为 设每一个时间单位内, 欲检验 等都近似地服从 近似地服从等都
3、近似地服从 近似地服从 近似地服从 但均未知,用代替,用代替 近似地服从 据Z的当前值查正态分布表得双侧P值,若P值很小,则拒绝,否则,不拒绝例4.11的解:欲检验 查正态分布表得双侧P值很小很小,0.01故拒绝.可以认为AB两样品总体均数不相等。第六章 离散型分类计数资料的 检验6.1 分布和Pearson拟合优度检验1. 分布(1) 自由度为1的分布 若则的分布称为自由度为1的分布.(chi-square distribution),记为或. 图形:从纵轴某个点开始单调下降,先凸后凹.(2) 互相独立,均服从,则的分布称自由度为的分布,记为或,或简记为. * 图形:单峰,正偏峰; 自由度很
4、大时,近似地服从正态分布.* 界值:* 自由度时,查附表7. * 自由度较大时,利用 两种做法:(1)给定,先查正态分布的临界值;再代入右端,算出的临界值。或(2)给定的当前值,先算出的当前值;再由标准正态分布表查出值。例: 若查表,相差不远。* 性质:若互相独立,则 服从分布, 自由度 服从分布, 自由度2.关于拟合优度的检验(大样本)给定一张频数表:类别或组段观察频数理论频数 问题:试判断这份样本,是否来自该理论分布?检验:(1) :样本的总体与该理论分布无区别 :样本与该理论分布有区别(2) l Pearson 统计量 可以证明,成立时, * 似然比统计量自由度 (3) 将观察值代入得当
5、前值和相应的P值.若P值很小,则拒绝;否则,不拒绝.l “大样本”:等都不小于5.6.2 两二项分布总体概率的比较表6.1 反应变量按二项分类的两个独立样本资料(四格表类型之一)某事件观察总频数阳性频率阳性阴性样本1(给定)样本2(给定)合计 (给定) 表6.2 肺心病患者心律失常观察资料洋地黄用药史某事件观察总频数阳性频率阳性阴性曾用药组81(76.28)83(87.72)16449.39未用药组19(23.72)32(27.28)5137.25合计10011521546.51解法一:检验 其中,据当前值1.5175查标准正态分布表,P = 0.065 ,不能拒绝 。 解法二: (1)检验
6、(2) 成立时, ,用近似地代替,理论上应有: 一般地, (3) 统计量的当前值* Pearson 统计量 上述关于四格表统计量的计算公式等价于: 本例中,* 似然比统计量 由上可见, 实践中,可任用其中之一.(4) 自由度计算理论频数时,利用了行和、列和,两个行和中,只有一个是独立的,两个列和中也只有一个是独立的,故 利用样本资料来估计的参数个数 = 2 自由度 = 4 - 1 - 2 = 1 另一种算法 : 自由度 = ( 行数 - 1 )( 列数 - 1 )对于例6.1, 自由度 = ( 2 - 1 )( 2 - 1 ) = 1(5)决策: * 据统计量的当前值,查附表7,得P值,若P值
7、很小,则拒绝,否则,不拒绝 .或 * 给定,查附表7,得临界值,若统计量的当前值,则拒绝,否则,不拒绝 .本例中, 当前值为2.3028,查附表7,得 自由度 = 1时, ,故不拒绝.或 给定,查附表7,得自由度 = 1时,临界值,故不拒绝.讨论: 关于统计量 :l 解法一和解法二Pearson检验完全等价ll 统计量的连续性校正: 当(认为是大样本),若有,必须作连续性校正:或 它们等价于二项分布正态近似中的连续性校正: 若6.3 22交叉分类资料的检验22列联表: 将样本中个体按照两个二分类属性作交叉分类形成的双向表.表6.3 22交叉分类资料表( 四格表类型之二)按属性A分类按属性B分类
8、合计1212合计 (给定)1. 两种属性分布间独立性检验(或关联性检验)例6.2 260份血清样品,每份用两种免疫学方法检测风湿因子A法B法合计+-+1728180-126880合计18476260设计: 一份样本;给定;行和与列和事先是不定的;按两种属性交叉分类.问题:两种免疫测定结果是否有关联?(1) 检验的假设 属性A和B互相独立 , : 属性A和B互相关联表6.4 22交叉分类资料的概率表按属性A分类按属性B分类合计1212合计1(2) 成立时必有. 用样本资料估计,理论频数: 一般地, (3) 统计量的当前值 同前(4) 自由度 同前(5)决策 同前l 两种属性分布间独立性检验与两二项分布总体概率的比较虽资料分析的计算方法相同,但设计和解释不同 (1) 检验的假设 方法A和B互相独立 ,: 方法A和B互相关联(2) 成立时必有 (3) 统计量的当前值 利用(6.8a)或(6.7a),(4) 自由度 = (2-1)(2-1) = 1(5)决策据查附表7, 自由度 =1时,P 0.05( 更确切P0.001)故拒绝,或给定,查附表7, 自由度 =1时, , , P 0.05,故拒绝.(更确切,P0.05,不拒绝.可以认为,这两种测定方法的总体阳性率的差别无统计学意义。关于校正的条件:1) ,不需校正2),需校正3)或,确切概率法专心-专注-专业