《卫生统计学课件 第六章 假设检验.ppt》由会员分享,可在线阅读,更多相关《卫生统计学课件 第六章 假设检验.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1统计推断统计推断用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。包括:包括:参数估计参数估计:运用统计学原理,用从样本计算出来的统计运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。指标量,对总体统计指标量进行估计。假设检验:假设检验:又称显著性检验,是指由样本间存在的差别又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。对样本所代表的总体间是否存在着差别做出判断。2第一节第一节 假设检验假设检验显著性检验显著性检验;科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了:是由于碰巧?还是由于必然的原是由于碰巧?
2、还是由于必然的原因?统计学家运用显著性检验来因?统计学家运用显著性检验来处理这类问题。处理这类问题。3假设检验的主要内容假设检验的主要内容1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果41、假设检验的原因、假设检验的原因 由于个体差异的存在,即使从同一总体中严由于个体差异的存在,即使从同一总体中严格的随机抽样,格的随机抽样,X1、X2、X3、X4、,、,不同。不同。因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性造成了样本
3、均数的差别。差别无显著性。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。52、假设检验的目的、假设检验的目的 3、假设检验的原理、假设检验的原理/思想思想反证法:反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。概率论:概率论:事件的发生不是绝对的,只是可能性大小而已。l判断是由于何种原因造成的不同,以做出决策。64、假设检验的一般步骤、假设检验的一般步骤(1)建立假设:建立假设:原假设(无效假设,原假设(无效假设,H0):):两个总体均数相等;两个总体均数相等;备择假设备
4、择假设(H1):与与 H0 相反,即两个总体均数不等相反,即两个总体均数不等;(2)确定显著性水平()确定显著性水平():):区分大小概率事件的标准区分大小概率事件的标准(3)计算统计量:选择不同的统计方法:)计算统计量:选择不同的统计方法:u,t(4)确定概率值:)确定概率值:(5)做出推论)做出推论75、假设检验的结果、假设检验的结果n接受检验假设检验假设n拒绝拒绝检验假设检验假设正确理解结论的概率性(都隐含着犯错误的正确理解结论的概率性(都隐含着犯错误的可能性)。可能性)。8第二节第二节 t 检验检验 t 值表值表 横标目:自由度,横标目:自由度,纵标目:概率,纵标目:概率,p,即曲线下
5、阴影部分的面积即曲线下阴影部分的面积;表中的数字:相应的表中的数字:相应的|t|界值界值 t 值表规律:值表规律:(1)自由度(自由度()一定时,一定时,p 越小,越小,t 越大越大;(2)概率(概率(p)一定时,一定时,越大,越大,t 越小越小;9 均数的均数的 t 检验检验一一.小样本均数与已知总体均数比较的小样本均数与已知总体均数比较的t 检验检验二二.配对资料的配对资料的t 检验检验三三.两个小样本均数比较的两个小样本均数比较的t 检验检验10一、一、小样本均数与已知总体均数比小样本均数与已知总体均数比较的较的t 检验(一组样本资料的检验(一组样本资料的t 检验)检验)目的:目的:比较
6、一个小样本均数所代表的比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。未知总体均数与已知的总体均数有无差别。计算公式:计算公式:t 统计量:统计量:自由度:自由度:n-111 适用条件:适用条件:(1)已知一个总体均数;已知一个总体均数;(2)可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3)样本量样本量小于小于100;(4)样本来自正态或近似正态总体。样本来自正态或近似正态总体。12 例:已知例:已知一般婴儿平均出生体重为一般婴儿平均出生体重为3.20kg,某医生某医生调查了调查了25个个难产婴儿出生体重,并计算其平均出生难产婴儿出生体重,并计算其平均
7、出生体重为体重为3.42kg,标准差为标准差为0.42kg,试分析试分析难产儿出难产儿出生体重与一般婴儿出生体重有否差异?生体重与一般婴儿出生体重有否差异?已知:已知:难产婴儿出生体重难产婴儿出生体重(1)一个总体均数:一个总体均数:3.20kg;(2)一个样本均数:一个样本均数:3.42kg;(3)可计算出样本标准误:可计算出样本标准误:0.42/5(4)n=25 t0.05(24),p 0.05 做出推论做出推论:p 0.05 ,小概率事件发生了,原假设不成立;拒小概率事件发生了,原假设不成立;拒绝绝H0,接受接受H1,可认为:可认为:难产儿平均出生体重与一般婴儿平均出生体重不难产儿平均出
8、生体重与一般婴儿平均出生体重不同;难产儿平均出生体重比一般婴儿平均出生体重大;同;难产儿平均出生体重比一般婴儿平均出生体重大;难产儿平均出生体重与一般婴儿平均出生体重差别显著。难产儿平均出生体重与一般婴儿平均出生体重差别显著。15 二、配对资料的 t 检验什么是配对资料?什么是配对资料?治疗前后;不同检验方法;进行配对;治疗前后;不同检验方法;进行配对;一对观察对象之间除了处理因素一对观察对象之间除了处理因素/研究因素之研究因素之外,其它因素基本齐同。外,其它因素基本齐同。目的:目的:判断不同的处理是否有差别判断不同的处理是否有差别16 公式:公式:t 自由度:对子数自由度:对子数-1适用条件
9、:适用条件:两组配对计量资料。两组配对计量资料。例题:例题:p.34,例例817 三、两个小样本均数比较的三、两个小样本均数比较的 t 检验检验目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。计算公式及意义:计算公式及意义:t 统计量:统计量:自由度:自由度:n1+n2 2 18 适用条件:适用条件:(1)已知)已知/可计算两个样本均数及它们的标准差可计算两个样本均数及它们的标准差;(2)两个样本之一的例数少于)两个样本之一的例数少于100;(3)样本来自正态或近似正态总体;样本来自正态或近似正态总体;(4)方差
10、齐方差齐。19 例题:例题:p.32,例例7已知:已知:(1)一个样本一个样本:均数均数491.4,标准差标准差138.5(mg/100ml);(2)另一个样本另一个样本:均数均数672.3,标准差标准差150.7(mg/100ml);(2)n1=25;n2=23(3)近似正态分布:近似正态分布:138.5 x 2 491.4;150.7 x 2 672.3(4)方差齐:方差齐:25/23 t 0.05(46),p 0.05;22 做出推论做出推论:因为因为 p 0.05 ,拒绝拒绝H0,接受接受H1:可认为心肌梗塞病人血清可认为心肌梗塞病人血清 脂旦白脂旦白与正常人血清与正常人血清 脂旦白均
11、数不同;脂旦白均数不同;两样两样本均数差别有显著性。本均数差别有显著性。23第三节第三节 均数的均数的 u 检验检验1.大样本均数与已知总体均数比较的大样本均数与已知总体均数比较的u 检验检验2.两个(大)样本均数比较的两个(大)样本均数比较的u 检验检验24两个样本均数比较的两个样本均数比较的u 检验检验目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。计算公式及意义:计算公式及意义:u 统计量统计量 25 适用条件:适用条件:(1)已知已知/可计算两个样本均数及它们的标可计算两个样本均数及它们的标准差准差;(2
12、)两个样本例数都不少于两个样本例数都不少于100。26例题:例题:p.30,例例5已知:已知:(1)一个样本一个样本:均数均数37.6,标准差标准差22.5(mg/100ml);(2)另一个样本另一个样本:均数均数38.8,标准差标准差25.8(mg/100ml);(2)n1=375;n2=36727假设检验:假设检验:建立假设:建立假设:检验假设检验假设:正常男正常男/女新生儿血中甘油三女新生儿血中甘油三脂均数相同;脂均数相同;备择假设备择假设:正常男正常男/女新生儿血中甘油三女新生儿血中甘油三脂均数不同;脂均数不同;确定显著性水平(确定显著性水平():):0.0528 计算统计量:计算统计
13、量:u 统计量:统计量:u=0.67;确定概率值:确定概率值:u 0.05;做出推论做出推论:因为因为 p 0.05 ,不能拒绝不能拒绝H0:不能认为不能认为正常男正常男/女新生儿血中甘油三脂均数不同。女新生儿血中甘油三脂均数不同。29第四节第四节 计数资料的计数资料的 u 检验检验n二项分布资料二项分布资料u 检验:检验:n1、一组样本资料的u 检验:n2、两组独立样本资料的u 检验:301、一组样本资料的u 检验:n2、两组独立样本资料的u 检验:Piosson 分布资料分布资料u 检验:检验:31第五节第五节 假设检验与区间估计的关系假设检验与区间估计的关系1.置信区间具有假设检验的主要
14、功能;2.置信区间可提供假设检验不能提供的信息 可提供差别有否实际意义3.假设检验可报告确切的P值,从而较为精确地说明检验结论的概率保证。置信区间只能在预先确定的置信度(1-)%水平上进行推断;n在不能拒绝H0的场合下,假设检验可以对检验的功效做出估计。32第六节第六节 假设检验假设检验的功效的功效n一、假设检验一、假设检验的两类错误的两类错误第第 I 类错误:类错误:如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的值落到了拒绝域,拒绝了原本正确的H0,导致推断错误。称为 类错误(“弃真”的错误),其概率大小用 表示。33II 类错误的概率类错误的概率 值的值的两个规律:两个规律:1.
15、当样本量一定时当样本量一定时,愈小愈小,则则 愈大愈大,反之反之;2.2.当当 一定时一定时,样本量增加样本量增加,减少减少.n n第第 II 类错误:类错误:如果实际情况与H0不一致,也仅是由于抽样的原因,使得统计量的值落到了接受域,不拒绝了原本错误的H0,也导致推断错误。称为 II 类错误(“存伪”的错误),其概率大小用 表示,值一般不能确切的知道。34二、假设检验二、假设检验的功效的功效35第七节第七节 假设检验的注意事项假设检验的注意事项n n1 1、在抽样研究中,每一种假设检验方法都是在抽样研究中,每一种假设检验方法都是与相应的研究设计相联系的。与相应的研究设计相联系的。n 严格按照
16、设计方案,收集客观数据;严格按照设计方案,收集客观数据;n 样本的获得必须遵循随机化的原则。样本的获得必须遵循随机化的原则。n2、选择假设检验方法要注意符合其应用条件;选择假设检验方法要注意符合其应用条件;n 应用检验方法一定要考虑其适用条件应用检验方法一定要考虑其适用条件36 3、正确理解假设检验的结论(概率性)、正确理解假设检验的结论(概率性)假设检验的结论是根据概率推断的,所以不是绝对假设检验的结论是根据概率推断的,所以不是绝对正确的:正确的:(1)当 p ,不能拒绝不能拒绝 H0,不能接受不能接受H1,按不能按不能接受接受H1下结论,也可能犯错误;此时下结论,也可能犯错误;此时为为 I
17、I 类类错错误误(”存存伪伪”的的错误错误)37 第第第第 I I 类错误和第类错误和第类错误和第类错误和第 II II 类错误类错误类错误类错误假设检验的结果有两种。假设检验的结果有两种。假设检验的结果有两种。假设检验的结果有两种。J(1)当拒绝拒绝 H0 时时,可能犯错误,可能可能犯错误,可能拒绝了实际拒绝了实际上成立的上成立的H0,称为称为 类类错误错误(“弃真弃真”的错误的错误),),其概率大小用其概率大小用 表示表示。J(2)当)当不能拒绝不能拒绝 H0 时,也可能犯错误,时,也可能犯错误,没有没有拒拒绝实际绝实际上不成立的上不成立的H0,这类这类称称为为 II 类类错误错误(“存存
18、伪伪”的的错误错误),其概率大小用其概率大小用 表示表示,值值一般一般不能确切的知道不能确切的知道。38 II 类错误的概率类错误的概率 值的值的两个规律:两个规律:1.当样本量一定时当样本量一定时,愈小愈小,则则 愈大愈大,反之反之;2.2.当当 一定时一定时,样本量增加样本量增加,减少减少.394.正确理解正确理解P值的意义,值的意义,P值很小时值很小时“拒绝拒绝H0”,P值的值的大小不要误解为总体参数间差异的大小;大小不要误解为总体参数间差异的大小;拒绝拒绝H0 只是说只是说差异不为零。差异不为零。统计学中的差异显著或不显著,和日常生活中所说的差统计学中的差异显著或不显著,和日常生活中所
19、说的差异大小概念不同异大小概念不同.(不仅区别于均数差异的大小,还区别(不仅区别于均数差异的大小,还区别于均数变异的大小于均数变异的大小)5 5、其它注意事项、其它注意事项、其它注意事项、其它注意事项当不能拒绝当不能拒绝H0时,即差异无显著性时,应考虑时,即差异无显著性时,应考虑 的因素:的因素:可能是样本例数不够;可能是样本例数不够;单侧检验与双侧检验的问题单侧检验与双侧检验的问题40第一节第一节 假设检验假设检验第二节第二节 t 分布分布第三节第三节 均数的均数的 u 检验检验第四节第四节 计数资料的计数资料的 u 检验检验第五节第五节 假设检验与区间估计的关系假设检验与区间估计的关系第六
20、节第六节 假设检验假设检验的功效的功效的功效的功效第七节第七节第七节第七节 均数假设检验的注意事项均数假设检验的注意事项均数假设检验的注意事项均数假设检验的注意事项小小 结结41l是非判断:l()1标准误是一种特殊的标准差,其表示抽样误差的大小。l()2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。l()3假设检验的目的是要判断两个样本均数的差别有多大。421.按=0.10水准做t检验,P0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为()。A大于0.10 B,而未知 C小于0.10 D1-,而未知2某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映()A个体变异 B抽样误差 C总体均数不同 D均数间变异选择题:433.两个样本均数比较,经t检验,差异有显著 性,p越小,说明()A两样本均数差别越大 B两总体差别越大C越有理由认为两总体均数不同D越有理由认为两样本均数不同 44 思考题:1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3.一类错误和二类错误的区别45