《假设检验的基本概念.ppt》由会员分享,可在线阅读,更多相关《假设检验的基本概念.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、假设检验的基本概念假设检验的基本概念南方医科大学生物统计系南方医科大学生物统计系谭旭辉谭旭辉统计分析统计分析统计描述统计描述统计推断统计推断参数估计参数估计假设检验假设检验(hypothesis test)(significance test)例例8-1:通过以往大规模调查,某地新通过以往大规模调查,某地新生儿头围均数为,标准差为,为研究某生儿头围均数为,标准差为,为研究某矿区新生儿发育状况,现从该矿区随机矿区新生儿发育状况,现从该矿区随机抽取新生儿抽取新生儿55人,得头围均数为,问该人,得头围均数为,问该矿区新生儿总体均数与一般新生儿头围矿区新生儿总体均数与一般新生儿头围总体均数是否不同总体
2、均数是否不同。差异来源差异来源导致矿区新生儿头围均数与该地新生儿导致矿区新生儿头围均数与该地新生儿头围均数不等的原因头围均数不等的原因?由于抽样误差导致由于抽样误差导致?矿区的地理环境及生活条件等因素对新矿区的地理环境及生活条件等因素对新生儿头围的影响生儿头围的影响两种可能性都可能发生,如何抉择?两种可能性都可能发生,如何抉择?两个假设两个假设H0:该矿区新生儿总体均数该矿区新生儿总体均数()与一般与一般新生儿头围总体均数新生儿头围总体均数(0)相同相同H1:该矿区新生儿总体均数与一般新生该矿区新生儿总体均数与一般新生儿头围总体均数不同儿头围总体均数不同可考虑样本资料和哪一个假设有较大的可考虑
3、样本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察矛盾来决定拒绝哪一个假设。一般考察样本资料是否与样本资料是否与H0有较大的矛盾。有较大的矛盾。H0成立时会怎样?成立时会怎样?根据样本均数抽样根据样本均数抽样分布知识得分布知识得 N(0,02/n)。所得所得u值因样本而异,但其绝对值多数值因样本而异,但其绝对值多数情况下落在情况下落在0附近。附近。u的分布规律可由的分布规律可由u界值表查出。界值表查出。当前状况如何,发生的可能性(当前状况如何,发生的可能性(P值)值)有多大?有多大?本例本例n=55,=33.89,0=34.50 0=1.99,得得u P值值:指在:指在H0成立的假
4、设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率。前检验统计量以及更极端情况的概率。查查u界值表,当前界值表,当前u值以外的双侧尾部面值以外的双侧尾部面积介于积介于和和之间,即之间,即0.05P决策决策 决策者需要事先规定一个可以忽略决策者需要事先规定一个可以忽略的小概率值的小概率值。如取如取,那么上述,那么上述P值可认值可认为很小。即为很小。即H0成立时,几乎不可能出现成立时,几乎不可能出现当前的状况。当前的状况。于是,面临两种抉择,一是认为于是,面临两种抉择,一是认为H0是成是成立的,而当前的极端情况又恰好偶然发立的,而当前的极端情况又恰好偶然发生了;二是怀疑生了;
5、二是怀疑H0的正确性,从而接受的正确性,从而接受H1。根据小概率事件在一次抽样中不可根据小概率事件在一次抽样中不可能发生的原理我们通常选择后者。本例,能发生的原理我们通常选择后者。本例,可以认为该矿区新生儿总体均数与一般可以认为该矿区新生儿总体均数与一般新生儿头围总体均数不同新生儿头围总体均数不同。当然,此时决策者也可能错误地拒绝当然,此时决策者也可能错误地拒绝H0,其犯错的最大概率为其犯错的最大概率为。假设检验的基本步骤假设检验的基本步骤1.建立假设、确定检验水准建立假设、确定检验水准 H0:=0 (检(检验假设验假设 hypothesis to be tested)(无效(无效假设假设 n
6、ull hypothesis)H1:0 (备(备择假设择假设 alternative hypothesis)显著性水平:显著性水平:2.选用适当的检验方法并计算相应的选用适当的检验方法并计算相应的检验统计量检验统计量根据研究分析目的要求、设计方法根据研究分析目的要求、设计方法、资资料类型和各假设检验方法的应用条件料类型和各假设检验方法的应用条件 检验统计量属于样本指标,是检验统计量属于样本指标,是根据现有根据现有样本,在样本,在H0成立的假设前提下成立的假设前提下,选用不,选用不同公式计算出来的同公式计算出来的不同的检验方法要计算其相应的统计量,不同的检验方法要计算其相应的统计量,它们各自服从
7、特定的概率分布它们各自服从特定的概率分布3.确定确定P值并作出推断结论值并作出推断结论P值系指在值系指在H0成立的假设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率。前检验统计量以及更极端情况的概率。若检验结果是若检验结果是P ,下差别有统计意义,下差别有统计意义的结论。的结论。依据是依据是:在:在H0成立的条件下,成立的条件下,得到当前结果(遇到当前情形)的概率得到当前结果(遇到当前情形)的概率小于小于,而小概率事件一般不可能在一次,而小概率事件一般不可能在一次试验中发生,但现在却发生了,所以怀试验中发生,但现在却发生了,所以怀疑疑H0的正确性,于是决定拒绝的正确性,
8、于是决定拒绝H0,接受,接受H1。此时,我们犯错误的概率最大仅为此时,我们犯错误的概率最大仅为。相反如相反如P,即在即在H0成立时,发生当前成立时,发生当前事件的概率很大,或说现有样本信息支事件的概率很大,或说现有样本信息支持持H0,尚没有理由拒绝它(尽管尚没有理由拒绝它(尽管 0,)。)。不管是拒绝还是不拒绝不管是拒绝还是不拒绝H0,都有可能发都有可能发生错误。生错误。结论一般包含统计结论和专业结论。结论一般包含统计结论和专业结论。大样本均数的假设检验大样本均数的假设检验v单样本均数的单样本均数的u检验检验例例8-2:1995年,某地年,某地20岁应征男青年岁应征男青年平均身高为平均身高为。
9、2003年在当地年在当地20岁应征男岁应征男青年中随机抽取青年中随机抽取85人,平均身高为人,平均身高为,标标准差为准差为,问这两年身高是否不同。问这两年身高是否不同。解:解:总体方差一般未知,当样本含量足总体方差一般未知,当样本含量足够大时,用够大时,用S作为作为 的估计值。的估计值。1.建立假设,确定检验水准建立假设,确定检验水准 H0:,H1:2.计算统计量计算统计量u3.确定确定P值,下结论值,下结论 查查u界值表,界值表,4.70 u=3.2905,得得P u=3.2905,得得P 0.001,按按照照水准,拒绝水准,拒绝H0,接受接受H1,可认为试验组可认为试验组和对照组退热天数的
10、总体均数不等,疗效不和对照组退热天数的总体均数不等,疗效不同。试验组比对照组平均退热天数短。同。试验组比对照组平均退热天数短。1 1-2 2 的的95可信区间为可信区间为-3.3 -天天大样本率的假设检验大样本率的假设检验当当n足够大,且样本率足够大,且样本率p和和(1-p)均不太均不太小,如:小,如:np与与n(1-p)均大于均大于5时,样本率时,样本率逼近正态分布,此时率的假设检验可采逼近正态分布,此时率的假设检验可采用用u检验,其具体条件如下。检验,其具体条件如下。1.n较大,如每组例数大于较大,如每组例数大于60;2.样本率样本率p或或(1-p)均不接近均不接近100%和和0;3.np
11、与与n(1-p)均大于均大于5v单样本率的单样本率的u检验检验例例8-4:已知道某地已知道某地40岁以上成年男性岁以上成年男性高血压患病率为高血压患病率为8.5%(0),经健康教育经健康教育数年后,随机抽取该地成年男性数年后,随机抽取该地成年男性1000名,名,查出高血压患者查出高血压患者55例,患病率例,患病率(p)为为5.5%。问经健康教育后,该地成年男。问经健康教育后,该地成年男性高血压患病率是否有降低?性高血压患病率是否有降低?解:解:从专业上可以确认经健康教育后该从专业上可以确认经健康教育后该地成年男性高血压患病率不可能低于健地成年男性高血压患病率不可能低于健康教育前,故采用单侧检验
12、。康教育前,故采用单侧检验。1.建立假设,确定检验水准建立假设,确定检验水准 H0:=8.5%,H1:u,故,故P,按,按水准水准拒绝拒绝H0,接受接受H1,差异有统计学意义,差异有统计学意义,可以认为经健康教育后,该地成年男性可以认为经健康教育后,该地成年男性高血压患病率有多降低高血压患病率有多降低 单样本率比较,当不满足正态分布应用单样本率比较,当不满足正态分布应用条件时,可根据二项分布的原理直接计条件时,可根据二项分布的原理直接计算概率,算概率,无效假设成立时,阳性数为无效假设成立时,阳性数为X的概率:的概率:v两个率比较的两个率比较的u检验检验例例8-5:某医院用黄芪注射液和胎盘球蛋某
13、医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病白进行穴位注射治疗小儿支气管哮喘病人,黄芪注射液治疗人,黄芪注射液治疗117例,有效例,有效103例;例;胎盘球蛋白治疗胎盘球蛋白治疗55例,有效例,有效49例。试比例。试比较两种疗法有效率差异有无统计学意义。较两种疗法有效率差异有无统计学意义。解:解:基本原理与两样本均数基本原理与两样本均数u检验类同,检验类同,在在H0 成立和大样本条件下,两样本率差成立和大样本条件下,两样本率差值值(p1-p2)近似服从均数为近似服从均数为1-2=0,方差方差为为 的正态分布。的正态分布。1.建立假设,确定检验水准建立假设,确定检验水准 H0:1
14、=2,H1:1 2 2.计算统计量计算统计量u3.确定确定P值,做出结论值,做出结论 u,现现|u|0)类错误类错误把与常规药本无差别的药说成优于常规药。把与常规药本无差别的药说成优于常规药。类错误类错误把优于常规药的新药说成与常规药相当。把优于常规药的新药说成与常规药相当。当当n确定时,确定时,越大,越大,越小;越小;要同时减小要同时减小和和,可以增大可以增大n。检验效能检验效能(power of test,把握度把握度1-):即即两总体确有差别时,按两总体确有差别时,按水准能发现它水准能发现它们有差别的能力。们有差别的能力。一般未知,即不知道犯第二类错误的一般未知,即不知道犯第二类错误的概
15、率。概率。在估计样本容量时非常重要。在估计样本容量时非常重要。单双侧检验单双侧检验如例如例8-2,如果有理由认为,如果有理由认为(参考文献,专业背参考文献,专业背景)景)2003年应征男青年得平均身高不会小于年应征男青年得平均身高不会小于1995年,则可用单侧检验年,则可用单侧检验 H0:=0 168.5,H1:0 (单侧)单侧)u4.70 u,P 0.0005,按检验水准按检验水准,拒绝拒绝H0,接受接受H1,二者差别有统计学意义二者差别有统计学意义标准正态分布单双侧界值标准正态分布单双侧界值单侧检验更容易得出有差别的结论(容单侧检验更容易得出有差别的结论(容易犯易犯类错误),应用时要有过硬
16、的专类错误),应用时要有过硬的专业依据,发表论文时要特别注明。业依据,发表论文时要特别注明。假设检验应注意的问题假设检验应注意的问题实验设计方面实验设计方面 随机抽样、分组,资料具有均衡性和可比性随机抽样、分组,资料具有均衡性和可比性结论的正确性是以概率作为保证的,推断结论结论的正确性是以概率作为保证的,推断结论不能绝对化不能绝对化报告结论时应给出检验统计量,报告结论时应给出检验统计量,值,单侧检值,单侧检验应特别说明。拒绝验应特别说明。拒绝H0,接受接受H1时,要结合样时,要结合样本均数说明其大小。假设检验与可信区间结合本均数说明其大小。假设检验与可信区间结合起来,同时给出起来,同时给出P值
17、和可信区间值和可信区间正确理解差别有统计学意义的涵义。当专业上正确理解差别有统计学意义的涵义。当专业上和统计学上都有和统计学上都有“显著性意义显著性意义”时,才有实用时,才有实用价值价值P 值值v指在指在H0成立的假设前提下,出现当前检成立的假设前提下,出现当前检验统计量以及更极端情况的概率验统计量以及更极端情况的概率v检验后才能确定检验后才能确定v只针对某个样本而言,不同的样本可能只针对某个样本而言,不同的样本可能有不同的有不同的P 值值 vP值越小,当前实验结果越值越小,当前实验结果越“不利于不利于”接受接受H0,不能说明总体参数间的差别越不能说明总体参数间的差别越大,只能据大,只能据P 值做出拒绝或接受值做出拒绝或接受H0的定的定性判断性判断显著性水平显著性水平v检验水准检验水准(size of a test)或显著性水平或显著性水平(significance level)v需要在检验前确定(常取需要在检验前确定(常取,)v表示拒绝了实际上成立的表示拒绝了实际上成立的H0的概率大小,的概率大小,也可表示在拒绝也可表示在拒绝H0做出做出“有差别有差别”结论结论时可能犯错误的最大概率。时可能犯错误的最大概率。小小 结结假设检验的基本思想与步骤假设检验的基本思想与步骤两类错误及其相互关系两类错误及其相互关系可信区间与假设检验可信区间与假设检验P 值与值与