《[教育学]06假设检验基础课件.ppt》由会员分享,可在线阅读,更多相关《[教育学]06假设检验基础课件.ppt(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章 假设检验基础n假设检验的概念与原理nt检验n二项分布与Poisson分布资料的Z检验n假设检验与区间估计的关系n假设检验的功效n正态性检验一、假设检验的概念与原理n 某地健康成年男子的Hb 为14g,今调查该地某化工厂成年男子50 人的平均Hb含量为10g,s=2.2g,问该厂男子平均Hb 含量是否低于正常人?n 差异原因:(1)抽样误差(2)本质差异(环境因素等造成该厂男子与正常人不同)假设检验的基本步骤n 1.建立检验假设 H0:假设该化工厂成年男子平均Hb 含量与正常人相同,即 H1:假设该化工厂成年男子平均Hb 含量低于正常人,即 单侧2.计算统计量n 计算t 值自由度=n-1
2、=50-1=493.确定P 值及判断结果根据自由度=n-1=50-1=49查t界值表得 在=0.05的水准上拒绝H0,接受H1,可以认为该化工厂成年男子的平均Hb含量低于正常人。假设检验的概念与基本思想1.概念:通过样本与总体、样本与样本之间的比较来判断总体是否相同。即判断样本与总体、样本与样本的差异是抽样误差引起,还是有本质的区别。假设检验是依据样本提供的有限信息对总体作推断的统计方法,是在对研究总体的两种对立的判断之间做选择的决策程序。2.基本逻辑是“小概率事件在一次抽样中不太可能出现”。3.基本思想:(1)小概率思想(2)反证法思想假设检验的基本步骤(1)(1)建立检验假设:提出无效假设
3、和备择假设 H0:样本与总体、样本与样本之间的差异是由抽样误差引起的。H1:存在本质区别。确定检验水准(一般取0.05)。单侧检验和双侧检验(2)选定统计方法和计算统计量。假设检验的基本步骤(2)(3)确定P 值及作出推断结论:若P,则不能拒绝H0(或接受H0),可认为差别是由抽样误差引起的。若P,则拒绝H0,接受H1,可认为存在本质差别。图6-1 假设检验示意图 二、t检验应用条件:t 检验:当样本例数n 较小时,要求样本取自正态总体,成组t 检验要求方差齐性。Z(u)检验:样本例数较大(一般大于100),要求样本取自正态总体,成组u 检验要求方差齐性。1.样本均数与总体均数比较的t 检验n
4、 目的:推断样本所代表的未知总体均数与已知总体均数有无差别。n H0:=0n H1:0n 所用公式:例1:某医生在一山区随机抽查了25名健康成年男子,求得脉搏均数为74.2次/分,标准差为6.0次/分。根据大量调查,健康成年男子的脉搏均数为72次/分,能否认为该山区健康成年男子的脉搏均数高于一般?1、样本均数与总体均数的比较1.H0:0,即山区成年男子的脉搏 H1:0,即山区成年男子的脉搏2.计算t值:t1.8333.确定P值,判断结果:P0.0393 拒绝H0,接受H1,差别有统计意义,可认为1、样本均数与总体均数的比较(1)配对资料a.配对设计资料:将受试对象按一定条件配成对子,分别给予每
5、对中的两个受试对象以不同的处理。b.自身对照资料:同一个受试对象给予不同的处理或者处理前后的观察结果。2、配对t检验(2)检验目的:推断差数的总体均值是否为零,即处理是否有效或两种处理效果是否相同。(3)配对设计可减少试验误差,配对t检验可提高统计效率。(4)资料要求:差值服从正态分布。2、配对t检验 2.配对t 检验(2)所用公式:H0:d0 H1:d0自由度v n 1例2:为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清总胆固醇含量(mmol/L),结果见表1。问新药是否影响女性血清总
6、胆固醇含量?2、配对t检验2、配对t检验表1 女性血清总胆固醇含量(mmol/L)配对号 新药组 安慰剂组1 4.4 6.22 5.0 5.23 5.8 5.54 4.6 5.05 4.9 4.46 4.8 5.47 6.0 5.08 5.9 6.49 4.3 5.810 5.1 6.21.H0:d0,即避孕新药对女性血清 H1:d0,即 总胆固醇含量有影响2.计算t值:t1.5423.确定P值,判断结果:P0.154 不拒绝H0,差别无统计意义,可认为(或还不能认为)2、配对t检验(1)成组设计(完全随机设计completely randomized design):将受试对象随机分配到各实
7、验组。(2)成组t检验:用于成组设计两样本均数的比较,目的是推断两样本是否来自同一总体,或两样本分别代表的总体均数是否相等。3、成组t检验(3)资料要求:两样本来自正态或近似正态分布,并且两组总体方差相等。(4)对数正态分布的资料,在进行t检验时,要先把数据进行对数转换,用对数值作为新变量进行成组t检验。3、成组t检验(5)公式:自由度v n1n223、成组t检验5、t检验n 适用资料:正态分布但方差不齐。n 计算公式:5.两组独立样本资料的方差齐性检验6.Z(u)检验 当样本含量较大时,可用u 检验来进行两样本均数的比较。它是用于两大样本均数的比较,目的是推断两总体均数是否相同。所用公式:应
8、用条件:总体率已知:n 和n(1-)5 总体率未知:np 和n(1-p)5 类型:样本与总体的比较 两样本资料的比较 7、二项分布资料的Z检验例5.某医院称治疗声带白斑的有效率为80%。今统计前来求医的此类患者60例,其中45例治疗有效。问该医院宣称的疗效是否客观?7、二项分布样本与总体的比较1.H0:=0=0.80 H1:0,或0.1,不拒绝H0,可认为7、二项分布样本与总体的比较例6.用硝苯吡啶治疗高血压急症患者75例,有效者57例;用硝苯吡啶+卡托普利治疗同类患者69例,66例有效。问两疗法的有效率是否相同?7、二项分布两样本资料的比较1.H0:1=2 H1:122.计算统计量:u=3.
9、3383.确定P 值,判断结果:P0.001,拒绝H0,接受H1,可认为7、二项分布两样本资料的比较8、Poisson分布资料的u检验n应用条件:总体均数已知:20 总体均数未知:X 20n应用类型:n 样本和总体的比较n 两样本资料的比较8、Poisson分布样本与总体的比较例7:某地10年前计划到2000年把孕产妇死亡率降到25/10万以下。2000年监测资料显示,该地区平均每10万活产儿孕产妇死亡31人。问该地区降低孕产妇死亡率的目标是否达到?8、Poisson分布样本与总体的比较1.H0:0=25 H1:0,或 252.计算统计量:u=1.23.确定P 值,判断结果:P0.1,不拒绝H
10、0,可认为8、Poisson分布两样本资料比较单位相同:单位不同:例8:甲、乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量。每张血片均观察200个视野。结果甲计数到嗜碱粒细胞26个,乙计数到29个。试问两位检验师检查结果是否一致?8、Poisson分布两样本资料比较8、Poisson分布两样本资料比较1.H0:12 H1:1 22.计算统计量:u=0.40453.确定P 值,判断结果:P0.5,不拒绝H0,可认为例9:某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别有38、29、36颗粉尘;改革工艺后,测取两次,分别为25、18颗粉尘。问工艺改革前后粉尘数有无差别?8、Poisso
11、n分布两样本资料比较8、Poisson分布两样本资料比较1.H0:12 H1:1 22.计算统计量:u=2.7233.确定P 值,判断结果:P0.05,拒绝H0,接受H1,可认为9、假设检验与可信区间的区别和联系n 可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。前者估计总体参数的大小,后者推断总体参数有无质的不同。n 可信区间也可回答假设检验的问题。但可信区间不能提供确切的P值范围。只能给出在水准上有无统计意义。n 可信区间还可提示差别有无实际意义。第一类错误和第二类错误n 第一类错误:H0成立,但检验后被拒绝了,即“弃真”。发生的概率为,已知。n 第二类错误:H0不成
12、立,但检验后被接受了,即“取伪”,发生的概率为,未知。n 样本含量固定时,增大,减小;减小,增大。当增大样本含量时,、均减小。图6-3 假设检验的两类错误 假设检验的功效n 1-称为假设检验的功效(power of a test)。其意义是,当所研究的总体与H0确有差别时,按检验水平 能够发现它(拒绝H0)的概率。如果1-=0.90,则意味着当H0不成立时,理论上在每100 次抽样中,在 的检验水准上平均有90 次能拒绝H0。一般情况下对同一检验水准,功效大的检验方法更可取。进行假设检验应注意的问题n 要有严密的研究设计(资料间的可比性)n 正确选用统计方法,注意其适用条件n 正确理解P 值的意义n 结论不能绝对化n 报告结果时应写出P 值的确切范围。正态性检验 n 图示法n 统计检验法 七、案例讨论本章重点n 假设检验的基本思想和基本步骤。n t检验:单样本、配对、成组t检验。n 二项分布与Poisson分布资料的Z检验n 假设检验与区间估计的关系n 假设检验的功效:两类错误,假设检验的注意事项。