五、t检验.ppt

上传人:hyn****60 文档编号:88372298 上传时间:2023-04-25 格式:PPT 页数:36 大小:454KB
返回 下载 相关 举报
五、t检验.ppt_第1页
第1页 / 共36页
五、t检验.ppt_第2页
第2页 / 共36页
点击查看更多>>
资源描述

《五、t检验.ppt》由会员分享,可在线阅读,更多相关《五、t检验.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、浙江大学医学院流行病与卫生统计学教研室 沈毅t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅统统计计推推断断:包包括括估估计计参参数数的的可可信信区区间间和和进进行行假假设设检检验验。在在统统计计描描述述过过程程(如如:Explore)的的结结果果中中可可以以给给出出可可信信区区间间,在在此此不不再详述,本章着重介绍假设检验。再详述,本章着重介绍假设检验。假假设设检检验验的的基基本本思思想想:小小概概率率反反证证法法,即即原原假假设设成成立立时时,若若在在一次抽样中就发生了小概率事件,则应推翻原假设。一次抽样中就发生了小概率事件,则应推翻原假设。假设检验的两类错误假设检验的两类错误:类

2、错误(弃真)、类错误(弃真)、类错误(存伪)类错误(存伪)假假设设检检验验的的两两种种类类型型:参参数数假假设设:原原假假设设关关于于总总体体参参数数 分布检验(非参数检验):原假设关于总体分布类型分布检验(非参数检验):原假设关于总体分布类型浙江大学医学院流行病与卫生统计学教研室 沈毅t 检验检验v 单样本单样本 单样本单样本t t 检验检验 v 两样本两样本 成组设计两样本均数比较的成组设计两样本均数比较的t t 检验检验 配对设计样本均数比较的配对设计样本均数比较的t t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅v 样本均数与总体均数的比较即单样本的样本均数与总体均数的比较即

3、单样本的 t 检验通过检验通过 One-Sample T Test 过程实现。过程实现。v 建立假设:建立假设:H0:=0,样本均数与总体均数的差异完全是样本均数与总体均数的差异完全是 抽样误差造成。抽样误差造成。H1:0,样本均数与总体均数的差异除了由样本均数与总体均数的差异除了由 抽样误差造成外,也反映了两个总体均数确抽样误差造成外,也反映了两个总体均数确 实存在的差异。实存在的差异。=0.05单样本单样本 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅例例1 为为研究某山区成年男子的脉搏均数是否高于一般成年男研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一

4、山区随机抽查了子的脉搏均数。某医生在一山区随机抽查了20名健康成年男名健康成年男子,求得其脉搏的均数为子,求得其脉搏的均数为74.2次次/分,标准差为分,标准差为6.0次次/分。根分。根据大量调查,已知健康成年男子脉搏数均数为据大量调查,已知健康成年男子脉搏数均数为72次次/分,能分,能否据此认为该山区成年男子的脉搏均数高于一般成年男子的否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏数?数据见脉搏数?数据见pulse.sav:75、74、72、74、79、78、76、69、77、76、70、73、76、71、78、77、76、74、79、77。单样本单样本 t 检验检验浙江大学医学院

5、流行病与卫生统计学教研室 沈毅单样本单样本 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅单样本单样本 t 检验检验要要检验的变量:检验的变量:pulse总体均数总体均数浙江大学医学院流行病与卫生统计学教研室 沈毅v 共共有有20个个测测量量值值,质质量量均均值值为为75.05次次/分分,标标准准差差为为2.892次次/分分,标准误为标准误为0.647次次/分。分。单样本单样本 t 检验检验分析结果分析结果(1)单样本统计量单样本统计量浙江大学医学院流行病与卫生统计学教研室 沈毅单样本单样本 t 检验检验v t值值为为4.716,自自由由度度为为19,双双侧侧检检验验p值值小小于于0

6、.001,则则按按所所取取检检验验水水准准0.05,则则拒拒绝绝H0,接接受受H1,即即表表明明可可认认为为样样本本该该山山区区健健康康成成年年男男子子脉脉搏搏的的均均数数高高于于一一般般健健康康成成年年男男子子。另外,差值的均值为另外,差值的均值为3.050,95可信区间为可信区间为1.704.40。分析结果分析结果(2)单样本检验单样本检验浙江大学医学院流行病与卫生统计学教研室 沈毅单样本单样本 t 检验检验1.1.总体均数置信区间与总体均数置信区间与t t检验的一致性检验的一致性v上述分析结果同时给出了均数的置信区间和上述分析结果同时给出了均数的置信区间和 t 检验的检验的结果,两者的结

7、论实际上是完全一致的。结果,两者的结论实际上是完全一致的。v置信区间可用于回答假设检验的问题,同时这两者又置信区间可用于回答假设检验的问题,同时这两者又是互为补充的关系:置信区间回答是互为补充的关系:置信区间回答“量量”的问题,即总的问题,即总体均数的范围在哪里,而假设检验是回答体均数的范围在哪里,而假设检验是回答“质质”的问题,的问题,即总体均数之间是否存在差异,以及在统计上确认这种即总体均数之间是否存在差异,以及在统计上确认这种差异的把握有多大。差异的把握有多大。v置信区间在回答有无统计学意义的同时,还可进一步置信区间在回答有无统计学意义的同时,还可进一步回答这种差异有无实际意义。回答这种

8、差异有无实际意义。浙江大学医学院流行病与卫生统计学教研室 沈毅单样本单样本 t 检验检验2.单样本单样本 t 检验的应用条件检验的应用条件v当样本例数较小时,一般要求样本取自正态总体。当样本例数较小时,一般要求样本取自正态总体。v由由中中心心极极限限定定理理可可知知,如如果果原原始始数数据据不不服服从从正正态态分分布布,只只要要样样本本量量足足够够大大,其其样样本本均均数数的的抽抽样样分分布布仍仍然然是是正正态态的的。也也就就是是说说只只要要数数据据分分布布不不是是强强烈烈的的偏偏态态,一一般般而而言言单单样样本本 t 检验都是适用的。检验都是适用的。v总总的的来来说说,单单样样本本 t 检检

9、验验非非常常稳稳健健,只只要要没没有有明明显显的的极极端值,其分析结果都是非常稳定的。端值,其分析结果都是非常稳定的。浙江大学医学院流行病与卫生统计学教研室 沈毅成组设计成组设计 t 检验检验v 两样本均数的比较即两样本两样本均数的比较即两样本 t 检验通过检验通过Independent-Samples T Test过程实现。过程实现。v 建立假设:建立假设:H0:1=2,两个样本均数的差异完全是抽样误两个样本均数的差异完全是抽样误 差造成,两个总体均数相同。差造成,两个总体均数相同。H1:1 2,两个样本均数的差异除了由抽样误两个样本均数的差异除了由抽样误 差造成外,两个总体均数确实存在差异

10、。差造成外,两个总体均数确实存在差异。=0.05浙江大学医学院流行病与卫生统计学教研室 沈毅例例2 现希望评价两位老师的教学质量,试比较其分别任教现希望评价两位老师的教学质量,试比较其分别任教的甲、乙两班(设甲、乙两班原成绩相近,不存在差别)的甲、乙两班(设甲、乙两班原成绩相近,不存在差别)考试后的成绩是否存在差异?考试后的成绩是否存在差异?见见score.sav甲班:甲班:85 73 86 77 94 68 82 83 90 88 76 85 87 74 85 80 82 88 90 93乙班:乙班:75 90 62 98 73 75 75 76 83 66 65 78 80 68 87 7

11、4 64 68 72 80 成组设计成组设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅成组设计成组设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅要检验的变量:要检验的变量:Score分组变量分组变量成组设计成组设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅v 定义组别具体数值定义组别具体数值成组设计成组设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅成组设计成组设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅成组设计成组设计 t 检验检验v 给出两个班级的各种统计量,包括样本含量、均数、给出两个班级的各种统计量,包括样

12、本含量、均数、标准差、标准误标准差、标准误分析结果分析结果(1)各组统计量各组统计量浙江大学医学院流行病与卫生统计学教研室 沈毅成组设计成组设计 t 检验检验方差齐性检验,结果方差齐性检验,结果p=0.397表明方差齐。表明方差齐。v 若方差齐,参考若方差齐,参考Equal variances assumed一行统计量一行统计量 v 若方差不齐,参考若方差不齐,参考Equal variances not assumed一行统计量一行统计量分析结果分析结果(2)两样本检验两样本检验浙江大学医学院流行病与卫生统计学教研室 沈毅独立性独立性(independence)各观察值之间相互独立,不能相互影

13、响各观察值之间相互独立,不能相互影响正态性正态性(normality)各个样本均来自正态总体各个样本均来自正态总体方差齐性方差齐性(homoscedascity)各个样本所在总体的方差相等各个样本所在总体的方差相等成组设计成组设计 t 检验检验v 应用条件应用条件浙江大学医学院流行病与卫生统计学教研室 沈毅独独立立性性:在在实实际际应应用用中中,独独立立性性对对结结果果的的影影响响较较大大,但但检检验验数数据据独独立立性性的的方方法法比比较较复复杂杂,一一般般都都是是根根据据资资料料的的性性质质来来加加以以判判断断。例例如如遗遗传传性性疾疾病病、传传染染病病的的数数据据可可能能就就存存在在非非

14、独独立立的的问问题题。如如果果从从专专业业背背景景上上可可以以肯肯定定数数据据不存在这些问题,则一般独立性总是能够满足的。不存在这些问题,则一般独立性总是能够满足的。独立性独立性浙江大学医学院流行病与卫生统计学教研室 沈毅v 正正态态性性:在在SPSS中中,正正态态分分布布的的考考察察方方法法有有:偏偏度度系系数数、峰峰度度系系数数;直直方方图图、P-P图图;也也可可进进行行各各种种假假设设检检验验。而而最最常常用的对于正态分布的检验就是用的对于正态分布的检验就是K-S单样本检验。单样本检验。v t 检检验验对对资资料料的的正正态态性性有有一一定定的的耐耐受受能能力力,如如果果资资料料只只是是

15、少少许许偏偏离离正正态态,则则结结果果仍仍然然很很稳稳健健。若若偏偏离离正正态态很很远远,则则最最好好考虑变量变换,或用非参数方法加以分析。考虑变量变换,或用非参数方法加以分析。v以以例例2(score.sav)为为例例,用用K-S单单样样本本检检验验考考察察数数据据的的正正态性。态性。注意:应分组考察正态性,而不是合并进行注意:应分组考察正态性,而不是合并进行正态性正态性浙江大学医学院流行病与卫生统计学教研室 沈毅v 为分组进行正态性检验,首先对数据进行拆分为分组进行正态性检验,首先对数据进行拆分正态性正态性浙江大学医学院流行病与卫生统计学教研室 沈毅v 数据拆分后,右下角显示数据拆分后,右

16、下角显示Split File On,表示表示 正处于数据已拆分状态正处于数据已拆分状态正态性正态性浙江大学医学院流行病与卫生统计学教研室 沈毅正态性正态性浙江大学医学院流行病与卫生统计学教研室 沈毅正态分布正态分布泊松分布泊松分布均匀分布均匀分布指数分布指数分布正态性正态性浙江大学医学院流行病与卫生统计学教研室 沈毅正态性正态性正态性检验结果正态性检验结果P=0.779,表明数表明数据服从正态分布据服从正态分布P=0.908,表明数表明数据服从正态分布据服从正态分布浙江大学医学院流行病与卫生统计学教研室 沈毅在上述两样本在上述两样本 t 检验的结果中已经提供了检验的结果中已经提供了Levene

17、s检检验的结果,在验的结果,在SPSS的的Explore过程中提供了更为详过程中提供了更为详细的细的Levenes方差齐性检验。方差齐性检验。方差齐性方差齐性浙江大学医学院流行病与卫生统计学教研室 沈毅Levenes方差齐性检验方差齐性检验方差齐性方差齐性浙江大学医学院流行病与卫生统计学教研室 沈毅v Based on Mean:基于均数基于均数vBased on Median:基于中位数基于中位数vBased on Median and with adjusted df:基于调整自由度的中位数基于调整自由度的中位数vBased on trimmed mean:基于截尾均数基于截尾均数方差齐性

18、方差齐性浙江大学医学院流行病与卫生统计学教研室 沈毅 同一受试对象处理前后的数据同一受试对象处理前后的数据 同一受试对象两个部位的数据同一受试对象两个部位的数据 同一样品用两种方法(仪器等)检验的结果同一样品用两种方法(仪器等)检验的结果 配对两个受试对象分别接受两种处理后的数据配对两个受试对象分别接受两种处理后的数据配对设计配对设计 t 检验检验v 常用的配对设计有常用的配对设计有4种情况:种情况:v 配对设计均数的比较即配对配对设计均数的比较即配对t检验通过检验通过Paired-Samples T Test 过程实现。过程实现。v 建立假设:建立假设:H0:d=0,两种处理没有差别两种处理

19、没有差别 H1:d 0,两种处理存在差别两种处理存在差别 =0.05浙江大学医学院流行病与卫生统计学教研室 沈毅例例3 用某药治疗用某药治疗10名高血压病人,对每人治疗前、后名高血压病人,对每人治疗前、后舒张压(舒张压(mmHg)进行测量,数据见进行测量,数据见pair.sav,问该药问该药有无降压作用?有无降压作用?治疗前后的舒张压测量结果治疗前后的舒张压测量结果配对设计配对设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅配对设计配对设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅 选入配对变量选入配对变量配对设计配对设计 t 检验检验浙江大学医学院流行病与卫生统计学教研室 沈毅配对设计配对设计 t 检验检验分析结果分析结果(1)配对样本统计量配对样本统计量(2)配对变量相关性分析配对变量相关性分析浙江大学医学院流行病与卫生统计学教研室 沈毅配对差值的统计描述配对差值的统计描述差值的检验结果差值的检验结果配对设计配对设计 t 检验检验分析结果分析结果(2)配对配对 t 检验检验上表的上表的结果可知:结果可知:t=2.645,p=0.027,按所取检验水准按所取检验水准0.05,则,则拒绝拒绝H0,接受接受H1。治疗前后的差异具有统计学意义,即认为某治疗前后的差异具有统计学意义,即认为某药对高血压病人有影响。药对高血压病人有影响。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁