《第六章SPSS参数检验.ppt》由会员分享,可在线阅读,更多相关《第六章SPSS参数检验.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章SPSS参数参数检验均均值比比较与均与均值比比较的的检验过程程均均值比比较的概念的概念统计分析常常采取抽分析常常采取抽样研究的方法,即从研究的方法,即从总体中随机抽取体中随机抽取一定数量的一定数量的样本本进行研究来推断行研究来推断总体的特性。由于体的特性。由于总总体体中的每个个体中的每个个体间均存在差异,即使均存在差异,即使严格遵守随机抽格遵守随机抽样原原则也会由于多抽到一些数也会由于多抽到一些数值较大或大或较小的个体致使小的个体致使样本本统计量与量与总体参数之体参数之间有所不同。又由于有所不同。又由于实验者者测量技量技术的差的差别或或测量量仪器精确程度的差器精确程度的差别等等也会
2、造成一定的偏差,等等也会造成一定的偏差,使使样本本统计量与量与总体参数之体参数之间存在差异。由此可以得到存在差异。由此可以得到这样的的认识:均:均值不相等的两不相等的两组样本不一定来自均本不一定来自均值不同的不同的总体。体。能否用能否用样本均本均值估估计总体均体均值?两个?两个变量均量均值接近的接近的样本本是否来自均是否来自均值相同的相同的总体?体?换句句话说,两,两组样本某本某变量均量均值不同,其差异是否具有不同,其差异是否具有统计意意义?能否?能否说明明总体具有体具有显著性差异?著性差异?这是各种研究工作中是各种研究工作中经常提出的常提出的问题。这就要就要进行均行均值比比较。6.1 参数检
3、验概述6.1.1推断推断统计统计与假与假设检验设检验 推断推断统计统计是根据是根据样样本数据推断本数据推断总总体数量特征的体数量特征的统统计计分析方法分析方法。推断推断统计统计通常包括以下两个内容:一是通常包括以下两个内容:一是总总体分布体分布已知,根据已知,根据样样本数据本数据对总对总体分布的体分布的统计统计参数(如均参数(如均值值、方差)方差)进进行推断,此行推断,此时时采用的推断方法称采用的推断方法称为为参数估参数估计计或者参数或者参数检验检验;二是;二是总总体分布未知,根据体分布未知,根据样样本数据本数据对对总总体的分布形式体的分布形式进进行推断,此行推断,此时时采用的推断方法称采用的
4、推断方法称为为非参数非参数检验检验。6.1.2 假设检验的基本思想1.事事先先对总体体参参数数或或分分布布形形式式作作出出某某种种假假设,然然后后利利用用样本信息来判断原假本信息来判断原假设是否成立;是否成立;1.2.采采用用逻辑上上的的反反证法法,依依据据统计上上的的小小概概率率原原理。理。.因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设绝假设绝假设 =50=50=50.如果这是总如果这是总如果这是总如果这是总如果这是总如果这是总体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值样本均值样本均值样本均值 =50=50抽样分布抽样分布
5、抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值样本均值样本均值 .2020206.1.36.1.3假设检验的步骤假设检验的步骤假设检验的步骤假设检验的步骤提出原假设(零假设)提出原假设(零假设)H0H0;确定适当的检验统计量;确定适当的检验统计量;计算检验统计量的值发生的概率(计算检验统计量的值发生的概率(P P值);值);给定显著性水平给定显著性水平;作出统计决策。作出统计决策。6.2 MEANS 过程功能:功能:
6、分组计算、比较指定变量的描述统计量。包括均值、标分组计算、比较指定变量的描述统计量。包括均值、标准差、总和、观测数、方差等等,还可以给出方差分析表和线准差、总和、观测数、方差等等,还可以给出方差分析表和线性检验结果。性检验结果。Analyze-Compare Means-MeansnDependent ListDependent List:用于选入需要分析的变量,如果选入两:用于选入需要分析的变量,如果选入两个以上变量,系统会在同一张输出表中依次给出分析结果。个以上变量,系统会在同一张输出表中依次给出分析结果。nLayer Layer:用于选入分组变量,如果选入两个以上的变量,:用于选入分组变
7、量,如果选入两个以上的变量,系统会根据系统会根据layerlayer的设置情况作出不同的反应。的设置情况作出不同的反应。nOptionsOptions子对话框:用于选择需要计算的描述统计量和统计子对话框:用于选择需要计算的描述统计量和统计分析。分析。Statistics Statistics框:可选的描述统计量;框:可选的描述统计量;cell ststisticscell ststistics:选入的描述性统计量:选入的描述性统计量 Statistics for first layer Statistics for first layer复选框:用于选择是否复选框:用于选择是否检验第一层的分组
8、变量对结果变量的影响有无统计意义。检验第一层的分组变量对结果变量的影响有无统计意义。Anova table and etaAnova table and eta:对分组变量进行单因素方差分析,:对分组变量进行单因素方差分析,用于度量分组变量和结果变量间的关联性。用于度量分组变量和结果变量间的关联性。EtaEta平方表示由平方表示由组间差异所解释的结果变量的方差的比例。组间差异所解释的结果变量的方差的比例。Test for Test for linearitylinearity:检验线性相关性,即不同组的均值间是否存在:检验线性相关性,即不同组的均值间是否存在线性趋势。当分组变量为数值型变量时系
9、统自动进行线性线性趋势。当分组变量为数值型变量时系统自动进行线性相关性检验。相关性检验。6.3 单样本的T检验6.3.16.3.1检验目的:检验目的:检验单个变量的均值是否与给定的常数检验单个变量的均值是否与给定的常数(总体均值总体均值)之间是否存在显著差异。如:分析学生的之间是否存在显著差异。如:分析学生的IQIQ平均平均分是否为分是否为100100分;大学生考研率是否为分;大学生考研率是否为5%5%。要求样本来自的总体服从或近似服从正态分布。要求样本来自的总体服从或近似服从正态分布。总体均值的检验总体总体 是否已知是否已知?用样本标用样本标准差准差S代替代替 t 检验检验小小小样本容量样本
10、容量n否否否是是是z 检验检验 z 检验检验大大大总体均值的检验(2 已知或2未知、大样本)1.假定条件假定条件n总体服从正态分布n若不服从正态分布,可用正态分布来近似(n30)1.2.使用使用Z-统计量量n2 已知:n2 未知:总体均值的检验(2未知小样本)1.假定条件假定条件n总体为正态分布n2未知,且小样本2.使用使用t 统计量量6.3.2 6.3.2 单样本单样本T T检验的实现思路检验的实现思路提出原假提出原假设:计算算检验统计量和概率量和概率P值 l给定定显著性水平著性水平与与p值做比做比较:如果:如果p值小于小于显著著性水平,小概率事件在一次性水平,小概率事件在一次实验中中发生,
11、生,则我我们应该拒拒绝原假原假设,反之就不能拒,反之就不能拒绝原假原假设。6.3.3 单样本本t检验的基本操作步的基本操作步骤1、选择选项AnalyzeCompare meansOne-Samples T test,出,出现窗口:窗口:2、在、在Test Value框中框中输入入检验值。3、单击Option按按钮定定义其他其他选项。Option选项用来指定缺用来指定缺失失值的的处理方法。其中,理方法。其中,Exclude cases analysis by analysis表示表示计算算时涉及的涉及的变量上有缺失量上有缺失值,则剔除在剔除在该变量上量上为缺失缺失值的个案;的个案;Exclude
12、 cases listwise表示剔除所表示剔除所有在任意有在任意变量上含有缺失量上含有缺失值的个案后再的个案后再进行分析。可行分析。可见,较第二种方式,第一种第二种方式,第一种处理方式理方式较充分地利用了充分地利用了样本数据。在本数据。在后面的分析方法中,后面的分析方法中,SPSS对缺失缺失值的的处理方法与此相同,理方法与此相同,不再不再赘述。另外,述。另外,还可以可以输出默出默认95的置信区的置信区间。至此,至此,SPSS将自将自动计算算t统计量和量和对应的概率的概率p值。练习 根据各保根据各保险公司人公司人员构成情况数据,构成情况数据,对我国目我国目前保前保险公司从公司从业人人员的受高等
13、教育的程度和年的受高等教育的程度和年轻化化的程度的程度进行推断:行推断:保保险公司具有高等教育水平的公司具有高等教育水平的员工比例的平均工比例的平均值不不低于低于0.8;年年轻人比例的平均人比例的平均值与与0.5无无显著差异。著差异。6.4 两独立样本的T检验6.4.1 两独立两独立样本本T检验的目的的目的利用来自两个总体的独立样本,推断两个总体的均值是否利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异;存在显著性差异;两独立样本的样本容量可以相等,也可以不相等;两独立样本的样本容量可以相等,也可以不相等;样本来自的总体服从或近似服从正态分布。样本来自的总体服从或近似服从正态分
14、布。两个独立样本之差的抽样分布 1 1总体总体1 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 1-1-1-1-2 22 2抽样分布抽样分布抽样分布抽样分布两个总体均值之差的检验(12、22 已知)1.假定条件假定条件n两个样本是独立的随机样本n两个总体都是正态分布n若不是正态分布,可以用正态分布来近似(n130和 n230)1.2.检验统计量量为两个总体均值之差的检验(12、22 未知,大样本)检验统计量量为两个总体均
15、值之差的检验(12、22 未知但相等,小样本)1.1.检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.2.假定条件假定条件n两个样本是独立的随机样本n两个总体都是正态分布n两个总体方差未知但相等3.3.检验统计量检验统计量其中:其中:两个两个总体均体均值之差的之差的检验(12、22 未知且不相等未知且不相等,小小样本本)1.检验具有不等方差的两个具有不等方差的两个总体体的均的均值2.假定假定条件条件n两个样本是独立的随机样本n两个总体都是正态分布n两个总体方差未知且不相等12 223.检验统计量量方差方差齐性性检验(Levene F方法):方法):计算两算两组样本的均本的均值l
16、计算各个算各个样本与本本与本组均均值的平均离差的平均离差绝对值;l利用利用单因素方差分析推断两独立因素方差分析推断两独立总体平均离差体平均离差绝对值是否有是否有显著差异。著差异。l在在对两独立两独立样本本进行行T检验时,两,两组样本方差相本方差相等和不等等和不等时使用的使用的计算算t值的公式不同,所以首先的公式不同,所以首先进行方差行方差F检验。用。用户需要根据需要根据F检验的的结果自己果自己判断判断选择t检验输出中的哪个出中的哪个结果,得出最后果,得出最后结论。如果推断两。如果推断两总体方差相等体方差相等则看方差相等的看方差相等的T检验值和和P值,如果推断两,如果推断两总体方差不相等体方差不
17、相等则看方看方差不相等的差不相等的T检验值和和P值。6.4.2 两独立两独立样本本T检验的的实现思路思路提出原假提出原假设 两两总体均体均值不存在不存在显著差异:著差异:l计算算统计量和量和P值:首先利用:首先利用F检验确定两个确定两个总体体的方差是否相等;然后再的方差是否相等;然后再选择合适的合适的T统计量量计算算观测值和概率和概率P值;l根据根据显著性水平和概率著性水平和概率P值进行行统计决策。决策。6.4.3 两独立两独立样本本t检验的基本操作步的基本操作步骤 进行两独立行两独立样本本t检验之前,正确地之前,正确地组织数据是一个非数据是一个非常关常关键的任的任务。SPSS要求将两要求将两
18、组样本数据存放在一个本数据存放在一个SPSS变量中,同量中,同时,为区分哪些区分哪些样本来自哪个本来自哪个总体,体,还应定定义一个分一个分类变量。量。SPSS两独立两独立样本本t检验的基本操作步的基本操作步骤是:是:1、选择菜菜单AnalyzeCompare meansIndependent-Samples T Test,出,出现窗口窗口2、选择检验变量到量到Test Variable(s)框中。框中。3、选择总体体标志志变量到量到Grouping Variables框中。框中。4、单击Define Groups按按钮定定义两两总体的体的标志志值。其中:。其中:Use specified va
19、lues表示分表示分别输入两个不同入两个不同总体的体的变量量值;Cut point框中框中应输入一个数字,大于等于入一个数字,大于等于该值的的对应一个一个总体,小体,小于于该值的的对应另一个另一个总体。体。5、两独立、两独立样本本t检验的的Option选项含含义与与单样本本t检验的相同。的相同。至此,至此,SPSS会首先自会首先自动计算算F统计量,并量,并计算在两算在两总体相等体相等会不相等下的均会不相等下的均值差的方差和差的方差和t统计量的量的观测值以及各自以及各自对应的的双尾概率双尾概率p值。6.4.4 两独立两独立样本本t检验的的应用用举例例例例1:城:城镇储户与与农村村储户一次存(取)
20、款金一次存(取)款金额的均的均值比比较 利用居民利用居民储蓄蓄调查数据,分析城数据,分析城镇储户与与农村村储户的一次的一次平均存(取)款金平均存(取)款金额是否存在是否存在显著差异?著差异?分析:分析:该问题中,由于城中,由于城镇储户和和农村村储户可以看成两个可以看成两个总体,且体,且储蓄金蓄金额可近似可近似认为服从正服从正态分布,且分布,且样本数据的本数据的获取是独立抽取是独立抽样的,因此,可以用两独立的,因此,可以用两独立样本本t检验的方法的方法进行分行分析。零假析。零假设是城是城镇储户和和农村村储户的一次平均存(取)款金的一次平均存(取)款金额无无显著差异,即著差异,即例例2:根据保:根
21、据保险公司人公司人员构成情况数据,分析全国性保构成情况数据,分析全国性保险公司与外公司与外资和合和合资保保险公司中具有高等教育水平公司中具有高等教育水平员工比例的均工比例的均值有无有无显著差异。著差异。例例3:工作:工作认可度与工作状可度与工作状态的分析的分析 利用某机构工作人利用某机构工作人员对自己工作看法的自己工作看法的调查数据,借助数据,借助项目目分析法的核心思想,研究工作人分析法的核心思想,研究工作人员对自己工作的不同自己工作的不同认可程度是可程度是否会影响工作否会影响工作时的的态度。度。分析:1、由于、由于变量量t9至至t16是反向是反向记分分题,在分析,在分析时需要重修需要重修记分
22、,即分,即将将变量量值1,2,3,4分分别转成成4,3,2,1。可以用数据分。可以用数据分组(Recode)过程程实现,结果分果分别保存在保存在t9_1至至t16_1。2、计算算变量量t9_1至至t16_1的的综合得分,可以利用合得分,可以利用SPSS的的变量量计算(算(Compute)过程程实现。3、对综合得分排序并指定分合得分排序并指定分组 首先首先对样本的本的综合得分按升序排序,可以利用合得分按升序排序,可以利用SPSS的数据的数据排序排序过程程实现;然后,指定低分;然后,指定低分组和高分和高分组。这里,指定得分前里,指定得分前25的的样本,即前本,即前25个个样本本为低分低分组,记为1
23、。指定得分后。指定得分后25的的样本,即后本,即后25个个样本本为高分高分组,记为2。标记变量量为bj。这里,低分里,低分组是是对自己工作有自己工作有较高高认可程度的人群,高分可程度的人群,高分组则是是对自己工作的自己工作的认可程度可程度较低的人群。低的人群。4、分析低分、分析低分组和高分和高分组人群在回答第一人群在回答第一题至第八至第八题,即在,即在变量量t1至至t8上是否存在上是否存在显著差异。著差异。6.5 两配对样本的T检验6.5.1 两配两配对样本本T检验的目的的目的利用来自两个总体的配对样本,推断两个总利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异;体的均值是否存
24、在显著性差异;两配对样本的样本容量应该相等,两组样本两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;观察值的顺序一一对应,不能随意改变;样本来自的总体服从或近似服从正态分布。样本来自的总体服从或近似服从正态分布。配对样本的 t 检验(数据形式)观察序号样本1样本2差值1x 11x 21D1=x 11-x 212x 12x 22D1=x 12-x 22MMMMix 1ix 2iD1=x 1i-x 2iMMMMnx 1nx 2nD1=x 1n-x 2n配对样本的 t 检验(检验统计量)样本差值均值样本差值均值样本差值均值样本差值均值样本差值标准差样本差值标准差样本差值标准
25、差样本差值标准差自由度自由度df df n nD D-1-1统计量统计量统计量统计量D D0 0:假设的差值:假设的差值6.5.2 两配两配对样本本T检验的的实现思路思路提出原假提出原假设:两:两总体均体均值不存在不存在显著差异;著差异;选择检验统计量。两配量。两配对样本本T检验是是间接通接通过单样本本T检验实现的。配的。配对样本本T检验实际上是先求上是先求出每出每对观测值之差之差值,对差差值变量求平均。量求平均。检验配配对变量均量均值之之间差异是否差异是否显著,著,实质是是检验差差值变量的均量的均值与与0之之间差异的差异的显著性;著性;计算算样本本统计量量观测值和概率和概率P值;根据根据显著
26、性水平和概率著性水平和概率P值进行行统计推断。推断。6.5.3 两配两配对样本本t检验的基本操作步的基本操作步骤1、选择菜菜单AnalyzeCompare meansPaired-Samples T Test,出,出现窗口窗口2、把一、把一对或若干或若干对检验变量量选择到到Paired Variables框。框。3、两配、两配对样本本t检验的的Option选项含含义与与单样本本t检验相同。相同。至此,至此,SPSS将自将自动计算算t统计量和量和对应的概率的概率p值。6.5.4 两配两配对样本本t检验的的应用用举例例 为研究某种减肥茶是否具有明研究某种减肥茶是否具有明显的减肥效果,某美体健身的减
27、肥效果,某美体健身机构机构对35名肥胖志愿者名肥胖志愿者进行了减肥跟踪行了减肥跟踪调研。首先将其喝减肥研。首先将其喝减肥茶以前的体重茶以前的体重记录下来,三个月后再依次将下来,三个月后再依次将这35名志愿者喝茶名志愿者喝茶后的体重后的体重记录下来。通下来。通过这两两组样本数据的本数据的对比分析,推断减比分析,推断减肥茶是否具有明肥茶是否具有明显的减肥作用。的减肥作用。这里,体重可以近似里,体重可以近似认为服从正服从正态分布。从分布。从样本数据的本数据的获取取过程看,程看,这两两组样本是配本是配对的,可借助两配的,可借助两配对样本本t检验的方的方法,通法,通过检验喝茶前后体重的均喝茶前后体重的均值是否是否发生生显著著变化来确定减化来确定减肥茶的减肥效果。肥茶的减肥效果。Thank you汇报结束谢谢大家!请各位批评指正