《最新卫生统计学课件第六章假设检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《最新卫生统计学课件第六章假设检验幻灯片.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热怎么这么热”,于是三,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑五成群,聚在大树下,或站着
2、,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑强子,别跑了,快来我给你扇扇了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你你看热的,跑什么?看热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在我国
3、已有三千年多年的历史。取材的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过
4、了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅道,袅统计推断统计推断用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。包括:包括:参数估计参数估计: 运用统计学原理,用从样本计算出来的统计运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。指标量,对总体统计指标量进行估计。假设检验:假设检验:又称显著性检验,是指由样本间存在的差又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。别对样本所代表的总体间是否存在着差别做出判断。9第二节第二
5、节 t 检验检验 t 值表值表 横标目:自由度,横标目:自由度, 纵标目:概率,纵标目:概率, p, 即曲线下阴影部分的面积即曲线下阴影部分的面积; 表中的数字:相应的表中的数字:相应的 |t | 界值界值 t 值表规律:值表规律:(1) 自由度(自由度()一定时,一定时,p 越小,越小, t 越大越大;(2) 概率(概率(p) 一定时,一定时, 越大,越大, t 越小越小; 均数的均数的 t 检验检验n小样本均数与已知总体均数比较的小样本均数与已知总体均数比较的t 检验检验二二. 配对资料的配对资料的t 检验检验三三. 两个小样本均数比较的两个小样本均数比较的t 检验检验11一、一、 小样本
6、均数与已知总体均数比小样本均数与已知总体均数比较的较的t 检验(一组样本资料的检验(一组样本资料的t 检验)检验)目的:目的:比较一个小样本均数所代表的比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。未知总体均数与已知的总体均数有无差别。计算公式:计算公式: t 统计量:统计量: 自由度:自由度:n - 112 适用条件:适用条件:(1) 已知一个总体均数;已知一个总体均数;(2) 可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3) 样本量样本量小于小于100;(4) 样本来自正态或近似正态总体。样本来自正态或近似正态总体。 例:已知一般婴儿平均出生体重
7、为例:已知一般婴儿平均出生体重为3.20kg,某医生某医生调查了调查了25个难产婴儿出生体重,并计算其平均出生个难产婴儿出生体重,并计算其平均出生体重为体重为3.42kg ,标准差为标准差为0.42kg,试分析难产儿出试分析难产儿出生体重与一般婴儿出生体重有否差异?生体重与一般婴儿出生体重有否差异?已知:已知:难产婴儿出生体重难产婴儿出生体重(1) 一个总体均数:一个总体均数:3.20kg ;(2) 一个样本均数:一个样本均数:3.42kg ;(3) 可计算出样本标准误:可计算出样本标准误:0.42/ 5(4) n =25 t0.05(24) , p 0.05 做出推论做出推论: p 0.05
8、 , 小概率事件发生了,原假设不成立;拒小概率事件发生了,原假设不成立;拒绝绝H0 , 接受接受H1, 可认为:可认为:难产儿平均出生体重与一般婴儿平均出生体重不难产儿平均出生体重与一般婴儿平均出生体重不同;难产儿平均出生体重比一般婴儿平均出生体重大;同;难产儿平均出生体重比一般婴儿平均出生体重大;难产儿平均出生体重与一般婴儿平均出生体重差别显著。难产儿平均出生体重与一般婴儿平均出生体重差别显著。 16什么是配对资料?什么是配对资料? 治疗前后;不同检验方法;进行配对;治疗前后;不同检验方法;进行配对;一对观察对象之间除了处理因素一对观察对象之间除了处理因素/研究因素之研究因素之外,其它因素基
9、本齐同。外,其它因素基本齐同。目的:目的:判断不同的处理是否有差别判断不同的处理是否有差别 公式:公式:t 自由度:对子数自由度:对子数 - 1适用条件:适用条件:两组配对计量资料。两组配对计量资料。例题:例题:p. 34, 例例818目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。 计算公式及意义:计算公式及意义: t 统计量:统计量: 自由度:自由度:n1 + n2 2 19 适用条件:适用条件:(1)已知)已知/可计算两个样本均数及它们的标准差可计算两个样本均数及它们的标准差 ;(2)两个样本之一的例数少于
10、)两个样本之一的例数少于100;(3)样本来自正态或近似正态总体;样本来自正态或近似正态总体;(4)方差齐方差齐。20 例题:例题: p. 32, 例例7已知:已知:一个样本一个样本: 均数均数491.4, 标准差标准差138.5 (mg/100ml); 另一个样本另一个样本:均数均数672.3, 标准差标准差150.7 (mg/100ml);(2) n1=25; n2=23(3) 近似正态分布:近似正态分布:138.5 x 2 491.4; 150.7 x 2 672.3 (4) 方差齐:方差齐:25/23 t 0.05(46) , p 0.05; 23 做出推论做出推论: 因为因为 p 0
11、.05 , 拒绝拒绝H0 , 接受接受H1 :可认为心肌梗塞病人血清可认为心肌梗塞病人血清 脂旦白脂旦白与正常人血清与正常人血清 脂旦白均数不同;脂旦白均数不同; 两样两样本均数差别有显著性。本均数差别有显著性。24第三节第三节 均数的均数的 u 检验检验1. 大样本均数与已知总体均数比较的大样本均数与已知总体均数比较的u 检验检验2. 两个(大)样本均数比较的两个(大)样本均数比较的u 检验检验25目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。 计算公式及意义:计算公式及意义: u 统计量统计量 26 适用条
12、件:适用条件:(1) 已知已知/可计算两个样本均数及它们的标可计算两个样本均数及它们的标准差准差 ;(2) 两个样本例数都不少于两个样本例数都不少于100。27例题:例题: p. 30, 例例5已知:已知: 一个样本一个样本: 均数均数37.6, 标准差标准差22.5 (mg/100ml); 另一个样本另一个样本:均数均数38.8, 标准差标准差25.8 (mg/100ml);(2) n1=375; n2=36728 建立假设:建立假设:检验假设检验假设:正常男正常男/女新生儿血中甘油三女新生儿血中甘油三脂均数相同;脂均数相同; 备择假设备择假设 :正常男正常男/女新生儿血中甘油三脂女新生儿血
13、中甘油三脂均数不同;均数不同; 确定显著性水平(确定显著性水平( ):):0.0529 计算统计量:计算统计量:u 统计量:统计量: u = 0.67; 确定概率值:确定概率值: u 0.05; 做出推论做出推论: 因为因为 p 0.05 , 不能拒绝不能拒绝H0:不能认为不能认为正常男正常男/女新生儿血中甘油三脂均数不同。女新生儿血中甘油三脂均数不同。30第四节第四节 计数资料的计数资料的 u 检验检验n二项分布资料二项分布资料u 检验:检验:n1、一组样本资料的u 检验:n2、两组独立样本资料的u 检验:311、一组样本资料的u 检验:n2、两组独立样本资料的u 检验:Piosson 分布
14、资料分布资料u 检验:检验:32第五节第五节 假设检验与区间估计的关系假设检验与区间估计的关系n置信区间具有假设检验的主要功能;n置信区间可提供假设检验不能提供的信息 可提供差别有否实际意义n假设检验可报告确切的P值,从而较为精确地说明检验结论的概率保证 。置信区间只能在预先确定的置信度(1- )%水平上进行推断;n在不能拒绝H0的场合下,假设检验可以对检验的功效做出估计。 33第六节第六节 假设检验假设检验n一、假设检验一、假设检验如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的值落到了拒绝域,拒绝了原本正确的H0,导致推断错误。 称为 类错误( “弃真”的错误 ),其概率大小用 表
15、示。 II 类错误的概率类错误的概率 值的值的两个规律:两个规律: 1. 当样本量一定时当样本量一定时, 愈小愈小, 则则 愈大愈大,反之反之;2.2.当当 一定时一定时, 样本量增加样本量增加, 减少减少. . 如果实际情况与H0不一致,也仅是由于抽样的原因,使得统计量的值落到了接受域,不拒绝了原本错误的H0,也导致推断错误。 称为 II 类错误( “存伪”的错误), 其概率大小用 表示, 值一般不能确切的知道。35二、假设检验二、假设检验36在抽样研究中,每一种假设检验方法都是在抽样研究中,每一种假设检验方法都是与相应的研究设计相联系的。与相应的研究设计相联系的。n 严格按照设计方案,收集
16、客观数据;严格按照设计方案,收集客观数据;n 样本的获得必须遵循随机化的原则。样本的获得必须遵循随机化的原则。n2、选择假设检验方法要注意符合其应用条件;、选择假设检验方法要注意符合其应用条件;n 应用检验方法一定要考虑其适用条件应用检验方法一定要考虑其适用条件37 3、正确理解假设检验的结论(概率性)、正确理解假设检验的结论(概率性)假设检验的结论是根据概率推断的,所以不是绝对假设检验的结论是根据概率推断的,所以不是绝对正确的:正确的:当 p , 不能拒绝不能拒绝 H0, 不能接受不能接受H1,按不能按不能接受接受H1下结论,也可能犯错误;此时下结论,也可能犯错误;此时为为 II 类类错错误
17、误( ”存伪存伪”的错误的错误)38J(1) 当拒绝拒绝 H0 时时, 可能犯错误,可能可能犯错误,可能拒绝了实际拒绝了实际上成立的上成立的H0, 称为称为 类类错误错误( “弃真弃真”的错的错误误 ),),其概率大小用其概率大小用 表示表示。 J(2)当)当不能拒绝不能拒绝 H0 时,也可能犯错误,时,也可能犯错误,没有没有拒拒绝实际上不成立的绝实际上不成立的H0 , 这类称为这类称为 II 类类错误错误( “存伪存伪”的错误的错误), 其概率大小用其概率大小用 表示表示, , 值一般不能确切的知道值一般不能确切的知道。39 II 类错误的概率类错误的概率 值的值的两个规律:两个规律:1.
18、当样本量一定时当样本量一定时, 愈小愈小, 则则 愈大愈大,反之反之;2.2.当当 一定时一定时, 样本量增加样本量增加, 减少减少. .4. 正确理解正确理解P值的意义,值的意义, P值很小时值很小时“拒绝拒绝H0 ”,P值的值的大小不要误解为总体参数间差异的大小;大小不要误解为总体参数间差异的大小; 拒绝拒绝H0 只是说只是说差异不为零。差异不为零。统计学中的差异显著或不显著,和日常生活中所说的差统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同异大小概念不同. (不仅区别于均数差异的大小,还区别(不仅区别于均数差异的大小,还区别于均数变异的大小于均数变异的大小)当不能拒绝当不
19、能拒绝H0时,即差异无显著性时,应考虑时,即差异无显著性时,应考虑 的因素:的因素: 可能是样本例数不够;可能是样本例数不够; 单侧检验与双侧检验的问题单侧检验与双侧检验的问题41第一节第一节 假设检验假设检验第二节第二节 t 分布分布第三节第三节 均数的均数的 u 检验检验第四节第四节 计数资料的计数资料的 u 检验检验第五节第五节 假设检验与区间估计的关系假设检验与区间估计的关系第六节第六节 假设检验假设检验小小 结结42l是非判断:l( )1标准误是一种特殊的标准差,其表示抽样误差的大小。l( )2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。l( )3假设检验
20、的目的是要判断两个样本均数的差别有多大。431. 按=0.10水准做t检验,P0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为( )。 A大于0.10 B,而未知 C小于0.10 D1-,而未知2某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映( )A个体变异 B抽样误差 C总体均数不同 D均数间变异选择题:443.两个样本均数比较,经t检验,差异有显著 性,p越小,说明()A两样本均数差别越大 B两总体差别越大C越有理由认为两总体均数不同D越有理由认为两样本均数不同 45 思考题:1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3. 一类错误和二类错误的区别