《SPSS统计分析均值比较与T检验.pptx》由会员分享,可在线阅读,更多相关《SPSS统计分析均值比较与T检验.pptx(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计分析常常采取抽样研究的方法。即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。第1页/共44页由此可以得出这样的认识:均值不相等的两个样本不一定来自均值不同的总体。能否用样本均数估计总体均数,两个变量均数接近的样本是否来自均值相同的总体?换句话说,两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。第2页/共44页对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个
2、被比较的样本来自正态总体。两个样本方差相等与不等时使用的计算t值的公式不同。进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。p值小于说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。F值的计算公式是:FS12(较大)/S22(较小)第3页/共44页进行均值比较及检验的过程 lMEANS 过程lT test 过程 单一样本T检验 独立样本的T检验 配对样本的T检验l单因素方差分析第4页/共44页一、MEANS过程 MEANS过程计算指定变量的综合描述统计量。当观测量按一个分类变量分组时,MEANS过程可以进行分组计算。例如要计算学生的平均身高,SEX变量把学生按性别分
3、为男、女生两组,MEANS过程可以分别计算男、女生平均身高。用于形成分组的变量应该是其值数量少且能明确表明其特征的变量。第5页/共44页 使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。MEANS过程的基本功能是分组计算指定变量的描述统计量。包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计量。还可以给出方差分析表和线性检验结果。第6页/共44页Mean过程的数据文件要求:至少有一个连续变量、一个分类变量(离散变量)。对连续变量求其基本描述统计量。分类变量用来分组。以27个学生的身高为例说明操作步骤(data11-
4、01)变量no编号,sex性别,age年龄,h身高,w体重。第7页/共44页第8页/共44页第9页/共44页ANOVA table and eta:输出第一层控制变量给出的方差分析表和eta统计值和2。统计量表明因变量和自变量之间联系的强度。2 是组间平方和与总平方和之比。Test for linearity:线性检验,输出R和R2,只有在控制变量有基本的控制级,且自变量有三个水平以上时才能选用。第10页/共44页第11页/共44页对第一层变量的方差分析结果身高*年龄(方差分析的变量信息):说明是分析不同年龄的身高均值间是否存在显著性差异;Sum of Squares(偏差平方和);df(自由
5、度);Mean square(均方);F(方差值);sig(P值);Between Groups(组间偏差平方和):由两部分组成:Linearity是由因变量与控制变量之间的线性关系引起的;Deviation from linearity不是由因变量与控制变量之间的线性关系引起的;Within Groups(组内偏差平方和):各组内的变异相对于组均值的变异;Total(偏差平方和的总和):为组间偏差平方和与组内偏差平方和之和。第12页/共44页线性检验结果lR R是因变量身高的观测值与预测值之间的的相是因变量身高的观测值与预测值之间的的相 关系数,关系数,R R值越接近值越接近1 1 表明回归
6、方程的预测性表明回归方程的预测性 越好;越好;lEtaEta:即:即值(值(0 01 1)说明因变量与自变量之)说明因变量与自变量之 间的联系程度;间的联系程度;lEta SquaredEta Squared:22为组间偏差平方和与偏差为组间偏差平方和与偏差 平方和总和之比。平方和总和之比。第13页/共44页练习题已知97个被调查幼儿的体健资料并建立了数据文件。试按性别(X2)对身高(X5)与体重(X4)做平均数分析。数据文件在SP11DATA文件夹下第14页/共44页二、T test过程 1、单一样本T检验(One-sample T Test)检验单个变量的均值是否与给定的常数(一般为理论值
7、、标准值或经过大量观察所得的稳定值等)之间存在差异。样本均数与总体均数之间的差异显著性检验属于单一样本T检验。举例:已知某地区12岁男孩平均身高为。1973年某市测量120名12岁男孩身高资料。分析该市12岁男孩的身高与该地区平均身高有无明显差异。建立数据库(data11-02)第15页/共44页Confidence interval:95%:置信区间项,可以自定义。Missing Values:选择对缺失值的处理方法 Exclude cases analysis by analysis:带有缺失值的观测值当它与分析有关时才被剔除;Exclude cases listwise:剔除所有列在Te
8、st、Grouping矩形框中的变量带缺失值的项第16页/共44页身高基本描述统计量第17页/共44页单样本T检验分析结果9595 Confidence Interval of the DifferenceConfidence Interval of the Difference(差值的95%95%置信区间):9595的置信区间均值标准误。根据上表9595置信区间是即之间。由此推出,改范围与总体均数之差为,即表中和的含义。实际上样本均值与总体均值之间的差值落在之间的占9595的范围包括0 0,由此得出样本均数与总体均数无显著性差异。也就是样本均数与总体均数之差与0 0无显著性差异。第18页/共
9、44页练习题已知某水样中含CaCO3的真值为,现用某方法重复测定该水样11次CaCO3的含量(mg/L)为:,。问该方法测得的均值是否偏高?第19页/共44页2、Independent Sample T test(独立样本T检验)独立样本的T检验用于检验是否两个不相关的样本来自具有相同均值的总体。必须注意使用这种检验的条件是必须具有来自两个不相关组(非配对)的观测量,其均值必须是对你想在两组中都计算的变量的综合测度。第20页/共44页如果分组样本彼此不独立,例如测量的是研究对象用药前后某项指标,要求比较用药前后某项指标均值是否有显著性差异,应该使用配对 T检验的功能(Paired Sample
10、 T test)。如果分组不止两个,应该使用One-Way ANOV过程进行单变量方差分析。如果你试图比较的变量明显不是正态分布的,则应该考虑使用一种非参数检验过程(Nonparametric test)。如果想比较的变量是分类变量,应该使用Crosstabs功能。第21页/共44页第22页/共44页Use special values:按分组变量的值进行分组Cut point:当分组变量为连续变量时,选择该选项后,在后面的矩形框中输入一个连续变量值,将观测量分为大于该值和小于该值的两个组,检验在这两个组之间进行,比较其因变量在两组的均数间是否有显著性差异。第23页/共44页Confidenc
11、e interval:95%:置信区间项,可以自定义。Missing Values:选择对缺失值的处理方法 Exclude cases analysis by analysis:带有缺失值的观测值当它与分析有关时才被剔除;Exclude cases listwise:剔除所有列在Test、Grouping矩形框中的变量带缺失值的项第24页/共44页例题一现有银行雇员工资为例,检验男女雇员现工资是否有显著差异。一个是要比较salary变量的均值,另一个是gender变量作为分水平变量。(data09-03)。第25页/共44页分析变量的简单描述性统计量左第一栏为分析变量标签和分类变量标签N观测量
12、数目Mean均值Std.Deviation标准差Std.Error Mean标准误第26页/共44页独立样本T检验结果Levenes Test for Equality of Variances:方差齐性检验结果。F方差值Sig:P值为0第27页/共44页t-test for Equality of Means为T检验结果栏t:t值;df:自由度;Sig:显著性概率即P值;Mean Difference:两组均值之差。表现平均当前工资女性低于男性元;Std.Error Difference:差值的标准误为;95 Confidence Interval of the Difference:差值的
13、95%置信区间。在之间,不包括0即两组均值之差与0有显著性差异。第28页/共44页例题二有29名13岁男生的身高、体重、肺活量数据,试分析大于等于155cm的与身高小于155cm的两组男生的体重和肺活量均值是否有显著差异。无效假设H0:身高大于等于155cm的与身高小于155cm的两组男生的体重平均值在99%水平上具有显著差异;身高大于等于155cm的与身高小于155cm的两组男生的肺活量平均值在99%水平上无显著差异。(在options框中,confidence输入99)。第29页/共44页练习题某克山病区测得11例急性克山病患者与13名健康人的血磷值如下:患者健康人问该地区急性克山病患者与
14、健康人的血鳞值是否不同?第30页/共44页三、配对样本T检验 配对样本T检验(Paired Sample T test)用于检验两个相关的样本是否来自具有相同均值的总体。这种相关的或配对的样本常常来自这样的实验结果,在实验中被观测对象在实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一个观测对象。一对可以两者组合而成。第31页/共44页 进行配对样本的T检验要求被比较的两个样本有配对关系。要求两个样本均来自正态总体。而且均值是对于检验有意义的描述统计量。均值的配对比较是比较常见(见以下几个例子)。第32页/共44页 同一窝实验用白鼠按性别、体重相同的配对
15、,再随机分到实验组和对照组,分别喂加入海藻的饲料和普通饲料,三个月后,分别将每对白鼠置于水中,测量其到溺死前的游泳时间。比较两组白鼠游泳时间均值,从而比较两种饲料对抗疲劳的作用。第33页/共44页同一组高血压病人在进行体育疗法前后,测量其血压。每个病人在体育疗法前后的血压测量值构成观测量对。可以求这组病人体育疗法前后血压平均值。进行配对T检验,分析体育疗法对降血压的疗效。第34页/共44页在研究人体各部位体温是否有差别,一个人的两个部位的温度构成一对数据。测量若干人的同样两个部位的温度数据,可以比较这两个部位平均温度是否有显著性差异。使用配对t检验。第35页/共44页配对样本T检验实际上是先求
16、出每对测量值之差值,对差值求均值。检验配对变量均值之间差异是否显著。其实质检验的假设实际上是差值的均值与零均值之间差异的显著性。如果差值均值与O均值无显著性差异说明配对变量均值之间无显著性差异。第36页/共44页配对样本T检验与独立样本T检验均使用T-TEST过程,但调用该过程的菜单不同,对数据文件结构的要求不同和所使用的命令语句也有区别。进行配对样本T检验的数据文件中一对数据必须作为同一个观测量中两个变量值。第37页/共44页例题一现以体育疗法治疗高血压的数据,pretreat:治疗前舒张压(mmHg),posttreat:治疗后舒张压(mmHg)。要求判断体育疗法对降低血压是否有疗效。(d
17、ata11-03)第38页/共44页治疗前后舒张压的单变量描述统计量变量名标签:列出配对变量的变量标签,对数为1;均值:分别给出治疗前后的舒张压均值;,观察量数目标准差:,标准误:,第39页/共44页配对变量之间的相关性Correlation:相关系数,;Sig:为不相关的概率,;相对于治疗前后舒张压的相关系数为0的假设成立概率为大于,可以得出结论治疗前后舒张压没有明显的线性关系第40页/共44页T检验结果Mean:均值之间的差值,;Std.Deviation:差值的标准误,;95的置信区间:;T值:;df:自由度;Sig:显著性概率,0。第41页/共44页例题二 12名排球运动员用新训练方法
18、进行训练,训练前后分别测试6项技术指标。试分析新训练方法对6项技术的提高是否有效。(data11-04)手形控制训练前后变量对:bhand-ahand睁眼力量控制训练前后变量对:bcfc1-acfc1闭眼力量控制训练前后变量对:bcfc2-acfc2准确性训练前后变量对:bacur-aacur左手用力感训练前后变量对:bfoc1-afoc1右手用力感训练前后变量对:bfocr-afocr第42页/共44页练习题10例矽肺患者经治疗前后的血红蛋白量见下表,问治疗对血红蛋白量有无作用?治疗前11.315.015.013.512.810.011.012.013.012.3治疗后14.013.814.013.513.512.014.711.413.812.0第43页/共44页感谢您的观看!第44页/共44页