《(精品)spss第6章.ppt》由会员分享,可在线阅读,更多相关《(精品)spss第6章.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第第6章章 方差分析(续)方差分析(续)方差分析的功能模块:方差分析的功能模块:u Compare Means:One-Way ANOVA:单因素方差分析:单因素方差分析 uGeneral inearModel:Univariate:单因变量多因素方差分析:单因变量多因素方差分析 Multivariate:多因变量多因素方差分析:多因变量多因素方差分析 Repeated Measure:重复测量方差分析:重复测量方差分析 Variance Components:方差成分分析:方差成分分析2 是对一个因变量受多个因素是对一个因变量受多个因素(或因子或因子)影响而影响而进行的方差分析。进行的方差
2、分析。作用作用-用于检验不同水平组合之间因变量均值由用于检验不同水平组合之间因变量均值由于受不同因素影响是否有差异的问题。于受不同因素影响是否有差异的问题。原假设原假设H0:因变量总体均值因变量总体均值相等。相等。可以分析每一个因素的作用(可以分析每一个因素的作用(主效应主效应),也),也可以分析因素之间的交互作用(可以分析因素之间的交互作用(交互效应交互效应)。)。可以进行可以进行协方差分析协方差分析,以及各因素变量与协,以及各因素变量与协变量之间的变量之间的交互作用交互作用。6.2 Univariate(1):单因变量多因素方差分析):单因变量多因素方差分析3固定因素固定因素(Fixed
3、factor)其不同水平对实验结果产生其不同水平对实验结果产生不同影响的因素,其水平都出现,即分组变量。不同影响的因素,其水平都出现,即分组变量。随机因素随机因素(Random factor)-对实验结果产生随机影响的对实验结果产生随机影响的因素,其水平随机出现,影响的大小可以通过方差成因素,其水平随机出现,影响的大小可以通过方差成分分析确定。分分析确定。协变量协变量(Covariate)-一种难以控制的自变量一种难以控制的自变量,用以借,用以借助回归方程,剔除相应因素对因变量的影响。协方差助回归方程,剔除相应因素对因变量的影响。协方差分析时用。分析时用。注意注意-因变量和协变量必须是数值型变
4、量,协变量与因变量和协变量必须是数值型变量,协变量与因变量彼此不独立。因素变量(控制、随机)是分因变量彼此不独立。因素变量(控制、随机)是分类变量,可以是数值型和字符型。类变量,可以是数值型和字符型。4变量定义变量定义:对单因变量多因素方差分析,变量定义时,:对单因变量多因素方差分析,变量定义时,最基本需要:最基本需要:一个是因变量(观测变量);多个分组一个是因变量(观测变量);多个分组变量(固定变量)变量(固定变量)。数据录入数据录入:将各水平下数据都录入到因变量内;各控制:将各水平下数据都录入到因变量内;各控制变量不同水平区分用分组值进行(如变量不同水平区分用分组值进行(如1,2,3等)。
5、等)。【实例实例6.2】研究不同性别学生非智力因素对学习成绩的研究不同性别学生非智力因素对学习成绩的影响,数据如表:影响,数据如表:5数据准备数据准备:该问题有一个因变量:该问题有一个因变量chj,两个固定因素变量:,两个固定因素变量:性别性别xb(男、女)和非智力因素(男、女)和非智力因素fzl(高、中、低)。(高、中、低)。6设置界面:观测变量,一个观测变量,一个控制因素,可控制因素,可多个多个随机因素,不随机因素,不是必需是必需协变量协变量-用于去除该变量对因变用于去除该变量对因变量的影响量的影响,协方差分析用异方差时,将选入变量异方差时,将选入变量用加权最小用加权最小二乘法估计模型参数
6、,二乘法估计模型参数,协方差分析用7【ModelModel按钮按钮】:Full factorial 全模型,包括所有因素的主效应、交互效全模型,包括所有因素的主效应、交互效应、协变量主效应等。是系统默认的模型。应、协变量主效应等。是系统默认的模型。Custom 自定义模型。用户可以选择实验中感兴趣的效自定义模型。用户可以选择实验中感兴趣的效应。应。8Factors&covariate-框中所列出的是主对话框中所选的框中所列出的是主对话框中所选的因素:包括固定因素(标因素:包括固定因素(标F)、随机因素(标)、随机因素(标R)、)、协变量因素(标协变量因素(标C)。本例中只含有固定因素。)。本例
7、中只含有固定因素。Build terms:针对所选因素选择不同的效应。:针对所选因素选择不同的效应。Interaction 指定任意的交互效应;指定任意的交互效应;Main effects 指定主效应;指定主效应;All 2-way 指定所有指定所有2维交互效应;维交互效应;All 3-way 指定所有指定所有3维交互效应;维交互效应;All 4-way 指定所有指定所有4维交互效应维交互效应 All 5-way 指定所有指定所有5维交互效应。维交互效应。9u建立分析模型中的主效应方法建立分析模型中的主效应方法:选中一个因素变量名,再选中选中一个因素变量名,再选中“Main effects”,
8、单击,单击右箭头按钮,该变量出现在右箭头按钮,该变量出现在“Model”框中。欲在模型中框中。欲在模型中包括几个主效应项,就进行几次操作。或在标有包括几个主效应项,就进行几次操作。或在标有“F”变变量名中选中多个变量同时送到量名中选中多个变量同时送到“Model”框中。框中。本例将本例将“xb”和和“fzl”变量作为主效应,按上面的变量作为主效应,按上面的方法选送到方法选送到“Model”框中。框中。u建立模型中的交互项建立模型中的交互项:例如,因素变量有例如,因素变量有“xb(F)”和和“fzl(F)”,建立它们之间,建立它们之间的相互效应。的相互效应。连续单击连续单击“xb(F)”和和“f
9、zl(F)”变量使其选中。变量使其选中。单单击击“Build Term(s)”栏内下拉按钮,选中栏内下拉按钮,选中“Interaction”项。单击项。单击“Build Term(s)”栏内的右拉栏内的右拉按钮,按钮,“xb*fzl”交互效应就出现在交互效应就出现在“Model”框中。框中。10Sum of squares:分解平方和的选择项:分解平方和的选择项Type I项:分层处理平方和。仅对模型主效应之前的项:分层处理平方和。仅对模型主效应之前的每项进行调整。一般适用于:平衡的每项进行调整。一般适用于:平衡的AN0VA模型;模型;Type II项:对其他所有效应进行调整。一般适用于:项:
10、对其他所有效应进行调整。一般适用于:平衡的平衡的AN0VA模型、主因子效应模型、回归模型、模型、主因子效应模型、回归模型、嵌套设计。嵌套设计。Type III项项:默认默认,回归法。对其他任何效应均进行,回归法。对其他任何效应均进行调整。一般适用于:调整。一般适用于:Type I、Type II所列的模型:所列的模型:没有空单元格的平衡和不平衡模型。没有空单元格的平衡和不平衡模型。Type IV顶:一般适用于:顶:一般适用于:Type I、Type lI所列模型;所列模型;没有空单元的平衡和不平衡模型。没有空单元的平衡和不平衡模型。Include intercept in model-在模型中
11、包括截距。若在模型中包括截距。若能确定回归线不通过原点,则不选此项。能确定回归线不通过原点,则不选此项。本题选择如下图所示:本题选择如下图所示:11两个主效应两个主效应一个交互效应一个交互效应12【contrastcontrast按钮按钮】因素各水平间均值比较因素各水平间均值比较想要改变比较想要改变比较方法的因子方法的因子 比较方法选择比较方法选择比较方法修改比较方法修改确认确认选项说明选项说明:None:不进行均数比较。Deviation:比较因素变量的每个水平的效应。可以选择“Last”(最后一个水平)或“First”(第一个水平)作为忽略的水平。Simple:对因素变量的每一水平都与参考
12、水平进行比较。选择“Last”或“First”作为参考水平。比较的参考类,方法比较的参考类,方法中选中选“Deviation”或或“Simple”才有效才有效13Difference,对因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert对照方法相反。Helmert,对因素的效应,除最后一个以外,都与后续的各水平的平均效应相比较。Repeated,对相邻的水平进行比较。对预因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较。Polynomial,多项式比较。第一级自由度包括线性效应与因素水平的交叉。第二级包括二次效应等。各水平彼此的间隔被假设是均
13、匀的。14【plotsplots按钮按钮】设置均值设置均值轮廓图图(Profile Plots)u用于比较边际均值用于比较边际均值。轮廓图是线图,图中每个点表明。轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值。如因变量在因素变量每个水平上的边际均值的估计值。如果指定了协变量,该均值则是经过协变量调整的均值。果指定了协变量,该均值则是经过协变量调整的均值。u因变量做轮廓图的纵轴;一个因素变量做横轴。因变量做轮廓图的纵轴;一个因素变量做横轴。u 单因素方差分析时,轮廓图表明该因素各水平的因变单因素方差分析时,轮廓图表明该因素各水平的因变量均值;量均值;双因素方差分析时,指
14、定一个因素做横轴变量,双因素方差分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线;如果是三因另一个因素变量的每个水平产生不同的线;如果是三因素方差分析,可以指定第三个因素变量,该因素每个水素方差分析,可以指定第三个因素变量,该因素每个水平产生一个轮廓图。双因素或多因素轮廓图中的平产生一个轮廓图。双因素或多因素轮廓图中的相互平相互平行的线表明在因素间无交互效应;不平行的线表明有交行的线表明在因素间无交互效应;不平行的线表明有交互效应。互效应。15横坐标框:一个因素变量 分线框:另一个因素变量 分图框:第三个因素变量(若有)16【注意】(1)若只要选入Horlzontal Ax
15、is内内因素变量各水平的因变量均值分布,则可选完该项后直接单击“Add”按钮,将所选因素变量移入下面的“Plots”框中。否则,不点击“Add”按钮。(2)若想看两个因素变量组合的各单元格中因变量均值分布,或想看两个因素变量间是否存在交互效应,则选择另一个因素变量,送入“Separate Lines”框中。然后,单击“Add”按钮,将自动生成的图形表达式送入到“Plots”栏中。分线框中的变量的每个水平在图中是一条线。17【post Hocpost Hoc按钮按钮】多重比较选择多重比较选择18【save按钮按钮】选择保存运算值选择保存运算值 可以将所计算的预测值、残差和检测值作为新的变量保存在
16、编辑数据文件中。以便于在其他统计分析中使用这些值。残差类预测值类诊断值类协方差矩阵 19【optionoption按钮按钮】选择输出项选择输出项“Model”中指定的效应项 选择要显示的效应项 指定要求输出指定要求输出的统计量的统计量 20对本例作如下设置,其它采用默认。21【结果形式结果形式】22偏差来源偏差平方和 均方,等于偏差平方和除以相应的自由度。Soure栏说明栏说明:Corrected Model 校正模型,检验模型的统计学意义。其偏差平方和等于两个主效应xb、fzl平方和加上交互xb*fzl的平方和之和。Intercept 截距。23xb 性别主效应性别主效应,检验不同性别对成绩
17、的影响差异。,检验不同性别对成绩的影响差异。fzl 非智力主效应非智力主效应,检验不同非智力对成绩影响差异。,检验不同非智力对成绩影响差异。xb*fzl 性别和非智力交互效应性别和非智力交互效应,检验不同性别和非智力交互,检验不同性别和非智力交互作用对成绩的影响差异。作用对成绩的影响差异。Error 误差误差。其偏差平方和反应的是组内差异。也称组内偏。其偏差平方和反应的是组内差异。也称组内偏差平方和。差平方和。Total 是偏差平方和是偏差平方和,在数值上等于截距,在数值上等于截距+主效应主效应+交互效应交互效应+误差偏差平方和。误差偏差平方和。Corrected Total 校正总和校正总和
18、。其偏差平方和等于校正模型与。其偏差平方和等于校正模型与误差之偏差平方和之总和。误差之偏差平方和之总和。24【结果分析结果分析】(1)方差分析齐性检验的)方差分析齐性检验的P=0.107,满足方差齐性。,满足方差齐性。(2)模型检验)模型检验F=19.117,P=0.0000.01,说明模型有,说明模型有统计学意义。统计学意义。(3)不同性别()不同性别(xb)对学习成绩的偏差均方为)对学习成绩的偏差均方为1095.511,F=42.717,P=0.0000.05,即存在显著性差,即存在显著性差异;异;不同非智力(不同非智力(fzl)对学习成绩的偏差均方为)对学习成绩的偏差均方为563.733
19、,F=21.981,P=0.0000.05,即存在显著性差,即存在显著性差异;异;25(4)不同性别和不同非智力()不同性别和不同非智力(xb*fzl)共同对学习成绩的)共同对学习成绩的偏差均方是偏差均方是114.178,F=4.452,P=0.0150.05,即存在显,即存在显著性差异。著性差异。(5)从非智力的各水平间的两两比较结果看:)从非智力的各水平间的两两比较结果看:水平高(水平高(1)与中()与中(2)及中()及中(2)与低()与低(3)水平间存在)水平间存在显著性差异,说明中等程度的非智力因素比高等和低等显著性差异,说明中等程度的非智力因素比高等和低等对学习成绩的影响明显占优。对
20、学习成绩的影响明显占优。266.3 Univariate(2):):协方差分析协方差分析协方差分析协方差分析(Analysis of Covariance)是将线性回归分析与是将线性回归分析与方差分析结合起来使用的一种统计分析方法。方差分析结合起来使用的一种统计分析方法。基本原理基本原理:先将难以控制的因素看作自变量,称为协变量:先将难以控制的因素看作自变量,称为协变量(Covariate,一般为连续型一般为连续型),建立因变量随协变量变化的,建立因变量随协变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受回归方程,这样就可以利用回归方程把因变量的变化中受不易控制的协变量的影响扣除掉
21、,从而能够较合理地比较不易控制的协变量的影响扣除掉,从而能够较合理地比较固定因素处在不同水平下,经过回归分析手段修正后,因固定因素处在不同水平下,经过回归分析手段修正后,因变量的总体均数间差异是否有统计学意义。变量的总体均数间差异是否有统计学意义。原假设原假设H0:因变量总体均值因变量总体均值相等。相等。只有个协变量时称为只有个协变量时称为一元协方差分析;一元协方差分析;含有个及含有个及个以上协变量时称为个以上协变量时称为多元协方差分析多元协方差分析。如研究成人体重正常者和超重者的胆固醇的差异,应如研究成人体重正常者和超重者的胆固醇的差异,应该剔除掉年龄的影响,则年龄可作为协变量。该剔除掉年龄
22、的影响,则年龄可作为协变量。27协方差分析的应用条件协方差分析的应用条件:理论上要求各组资料都来自方差齐性的正态总体;各组理论上要求各组资料都来自方差齐性的正态总体;各组总体的直线回归系数相等,且都不为。总体的直线回归系数相等,且都不为。因此,严格地说,在对资料作协方差分析之前,应先对因此,严格地说,在对资料作协方差分析之前,应先对这两个前提条件作假设检验,若资料符合上述两个条件,或这两个前提条件作假设检验,若资料符合上述两个条件,或经变量变换后符合上述条件,方可进行协方差分析。经变量变换后符合上述条件,方可进行协方差分析。【实例实例6.3】研究研究 3 个专业学生在个专业学生在统计学统计学课
23、程的成绩上是课程的成绩上是否存在差异。否存在差异。因这因这 3 个专业的学生入学数学成绩不同,即学习个专业的学生入学数学成绩不同,即学习统计统计学学的数学基础不同的数学基础不同,因此分析因此分析统计学统计学 成绩是否存在差成绩是否存在差异要考虑学生的入学数学成绩。数据如表:异要考虑学生的入学数学成绩。数据如表:28数据准备数据准备:设置一个因变量:设置一个因变量tj,一个固定因素变量,一个固定因素变量zy(定(定类,类,1,2,3),一个协变量),一个协变量sx。29【设置界面设置界面】30【结果形式结果形式】【结果分析结果分析】(1)模型检验)模型检验F=7.943,P=0.0040.05,
24、即不存在显著性影响;,即不存在显著性影响;(3)专业()专业(zy)对统计学成绩影响检验,)对统计学成绩影响检验,F=10.534,P=0.0030.05即存在显著性影响(剔除掉即存在显著性影响(剔除掉sx后的结果)。后的结果)。316.3 Multivariate:多因变量多因素方差分析多因变量多因素方差分析 完全类似Univariate界面,只是可以选多个因变量。界面,只是可以选多个因变量。326.4 Repeated Measure:重复测量方差分析:重复测量方差分析适用对象适用对象:同一受试对象的同一试验指标在不同时间点进:同一受试对象的同一试验指标在不同时间点进行多次测量所得的资料。
25、常用于分析该试验指标在不同时行多次测量所得的资料。常用于分析该试验指标在不同时间点上的变化情况。间点上的变化情况。前提条件前提条件:满足正态性和方差齐性满足正态性和方差齐性。因为当一个因变量被重复测量几次,从而同一个体的几因为当一个因变量被重复测量几次,从而同一个体的几次观察结果间存在相关,这样就不满足独立性的要求,但次观察结果间存在相关,这样就不满足独立性的要求,但要求要求满足协方差矩阵的球形性满足协方差矩阵的球形性(sphericity),否则应校正。),否则应校正。33重复测量方差分析的总离差平方和分解为:重复测量方差分析的总离差平方和分解为:组间(组间(between-subjects
26、)离差:)离差:各处理间的离差平方和各处理间的离差平方和及被试间的离差平方和及被试间的离差平方和组内(组内(within-subjects)离差:)离差:被试内的离差平方和。被试内的离差平方和。其其F统计量由它们及其自由度等构成。统计量由它们及其自由度等构成。变量定义变量定义 重复测量方差分析,变量定义时,最基本需要:重复测量方差分析,变量定义时,最基本需要:一个分组变量(固定变量);至少一组因变量(组内一个分组变量(固定变量);至少一组因变量(组内因素变量,个数与重复测量次数相等,且名称前部分因素变量,个数与重复测量次数相等,且名称前部分一致,通过数字进行区分)。一致,通过数字进行区分)。数
27、据录入数据录入 将测量结果分别录入到各指标变量内;分组变将测量结果分别录入到各指标变量内;分组变量不同水平的区分用分组值进行(如量不同水平的区分用分组值进行(如1,2,3等)。等)。原假设原假设H0:各因变量总体均值相等各因变量总体均值相等。34【实例实例6.3】为研究药物作用对呼吸的影响。设置了两类为研究药物作用对呼吸的影响。设置了两类药物级别药物级别 1、2 作为因素变量,作为因素变量,12 个受试者随机分到个受试者随机分到两个小组中两个小组中(每组每组 6 人人),第一组服用药物,第一组服用药物 1,第二组,第二组服用药物服用药物 2,对每个受试者在同样条件下测试,对每个受试者在同样条件
28、下测试 3 次次,得到数据如表所示。得到数据如表所示。35数据准备数据准备:一个固定变量:一个固定变量drug(分组变量;分组变量;1,2),3个指个指标变量标变量resp1,resp2,resp3。录入数据:。录入数据:36【设置界面设置界面】因变量组名因变量组名因变量组内个数因变量组内个数重复测量名称定义重复测量名称定义可以定义多组可以定义多组37【definedefine按钮按钮】选因变量组选因变量组选组间变量选组间变量38【modelmodel按钮按钮】选因变量组名选因变量组名选组间变量选组间变量39【optionoption按钮按钮】显示各组显示各组RESP的常见的常见统计量值统计量
29、值40【结果形式结果形式】四种四种T检验变量检验变量四种四种T检验变量值检验变量值 可见,组内效应,组间与组内的交互效应对呼吸可见,组内效应,组间与组内的交互效应对呼吸的影响不显著。的影响不显著。多变量检验结果多变量检验结果41 重复测量的方差分析模型要求所检验的因变量进行球形检验(用卡方检验)。卡方为6.592,自由度为2,P值为0.037,因此resp不满足协方差矩阵的球形性协方差矩阵的球形性,此题用重复测量的方差分析应调整。球形检验球形检验42球形检验通过时球形检验通过时可见,组内效应对呼吸的影响不显著。可见,组内效应对呼吸的影响不显著。组内效应检验结果组内效应检验结果43组间效应检验结果组间效应检验结果可见,组间效应对呼吸的影响显著,即不同药物对呼吸可见,组间效应对呼吸的影响显著,即不同药物对呼吸状况的变化有显著性差异。状况的变化有显著性差异。