《spss协方差分析的基本原理.doc》由会员分享,可在线阅读,更多相关《spss协方差分析的基本原理.doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、协方差分析的基本原理1协方差分析的提出无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。又比如,考查受教育程度对个人工资是否有显著影响,这时必须考虑工作年限因素。一般情况下,工作年限越长,工资就越高。在研究此问题时必须排除工作年限因素的影响,才能得出正确的结论。再如,如果要了解接受不
2、同处理的小白鼠经过一段时间饲养后体重增加量有无差别,已知体重的增加和小白鼠的进食量有关,接受不同处理的小白鼠其进食量可能不同,这时为了控制进食量对体重增加的影响,可在统计阶段利用协方差分析(Analysis of Covariance),通过统计模型的校正使得各组在“进食量”这个变量的影响上相等,即将进食量作为协变量,然后分析不同处理对小白鼠体重增加量的影响。为了更加准确地控制变量不同水平对结果的影响,应该尽量排除其它在实验设计阶段难以控制或者是无法严格控制的因素对分析结果的影响。利用协方差分析就可以完成这样的功能。协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制
3、变量对于观察变量的影响,从而实现对控制变量效果的准确评价。协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变
4、量时,称为多元协方差分析。以下将以一元协方差分析为例,讲述协方差分析的基本思想和步骤。2协方差分析的计算公式以单因素协方差分析为例,总的变异平方和表示为:协方差分析仍然采用F检验,其零假设为多个控制变量的不同水平下,各总体平均值没有显著差异。F统计量计算公式为:,以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。如果的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生了显著的影响;如果的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生了显著的影响。3协方差分析需要满足的假设条件(1)自变量是分类变量,协变量是定距变量,因变量是连续变
5、量;(2)对连续变量或定居变量的协变量的测量不能有误差;(3)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;(4)协变量的回归系数是相同的。在分类变量形成的各组中,协变量的回归系数(即各回归线的斜率)必须是相等的,即各组的回归线是平行线。如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。(5)自变量与协变量是直角关系,即互不相关,它们之间没有交互作用。如果协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除。4协方差分析SPSS的示例在进行新的外语教学方法实验时,往
6、往需要在实验前和实验后对实验组和控制组的学生都进行成绩测试,以便确定新的教学方法对实验后成绩的影响。显然,实验前成绩与实验后成绩之间会有内在联系,如果要更准确地确定新的教学方法的效果,有必要考虑实验前成绩对实验后成绩的影响,也就是说可以把前测成绩作为协变量进行协方差分析。本例子中的实验研究共有15名受试者,将这些受试者随机分为3组,各组有5人,然后对这三组进行不同的教学方法实验。其中一组为控制组,实验时不对教学方法进行改变,仍然采用以前的传统教学方法。另两组为实验组,分别用交际法和沉浸法两种教学方法进行教学方法实验。实验开始前对这三组学生用相同的试卷进行了英语测试,得出了前测成绩。实验结束后,
7、用新的试卷同时对这三组学生进行了测试,得出了后测成绩。然后将要分析的数据输入到SPSS中去。见数据录入表格所示。我们用1表示传统教学方法,2表示交际法,3表示沉浸法。我们先不考虑前测成绩,以“教学方法”为因素变量,“后测成绩”为因变量进行单因素方差分析。从方差分析结果来看,概率值为0.463(远远大于0.05的显著性水平),说明三种教学方法在后测成绩上似乎没有显著差异,但如果以前测成绩作为协变量进行方差分析时,分析结果可能就会有差异。以下将以前测成绩作为协变量进行方差分析,检验三种不同教学方法是否真的没有显著差异。未作协方差分析之前的单因素方差分析表ANOVA后测成绩Sum of Square
8、sdfMean SquareFSig.Between Groups213.3332106.667.821.463Within Groups1560.00012130.000Total1773.33314用SPSS进行协方差分析,可以分两大步骤进行,首先检验回归斜率相等的假设,然后进行协方差分析。一、回归斜率相等的假设1、分组散点图对于本例,首先应了解三种教学方法的前测成绩与后测成绩的回归线是否平行,即前测考试成绩的影响在分别采用三种教学法的三个班级中是否相同,这可以用前测成绩与教学法是否存在交互作用来表示。对于该问题,首先可以作分组散点图,观察三组直线趋势是否近似,然后看交互作用有无统计学意义
9、,当交互作用无统计学意义时,则进行协方差分析,得出统计结论。在菜单中选择GraphsScatter/Dot,打开atter/Dot对话框,选择Simple Scatter选项,按右上角Define按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为(Panel by Rows),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单ElementFit Line at Total,可以得到如下图所示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验
10、各组总体斜率是否相等。如果按照菜单GraphsScatter/Dot,打开atter/Dot对话框,选择Simple Scatter选项,按右上角Define按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为标记变量(Set markers by),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单ElementFit Line at Total,可以得到如下图所示的散点图,作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单ElementFit Line at subgroups,可以得到如下图所
11、示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相等。2、组内回归斜率相同检验步骤1:选择协方差分析菜单(与GLM单因素方差分析菜单相同)。点击数据编辑界面的Analyze命令,选择General Linear Model,并打开Univariate对话框。步骤2:选定因变量、因素变量和协变量。在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入Dependent Variable 方框中。然后选择“教学方法”作为因素变量,将其移入到Fixed Factor(s
12、)方框中。再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。步骤3:确定分析模型。在对话框中单击Model命令按钮,进入Univariate Model对话框中。该对话框提供了两种不同形式的模型,完全因素(full factorial)和自定义因素(custom)模型。由于要进行回归斜率相同的检验,所以本例使用自定义因素模型。点击Custom选择按钮后,从左边的变量列表中选择“教学方法”,点击右向箭头将其移入Model方框中。用同样的方法将变量列表中的“前测成绩”移入Model方框中。最后在变量列表中连续点击“教学方法”和“前测成绩”,同时选中它们,再点击右向箭头,Mode
13、l方框中会出现“教学方法*前测成绩”字样,意为进行交互效应分析,即检验回归线斜率相等的假设。点击Continue命令按钮回到主对话框中,并点击OK按钮提交程序运行。组内回归斜率相同检验结果Tests of Between-Subjects EffectsDependent Variable:后测成绩 SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model1498.531(a)5299.7069.816.002Intercept632.3901632.39020.711.001教学方法84.312242.1561.381.30
14、0前测成绩86.072186.0722.819.127教学方法*前测成绩166.488283.2442.726.119Error274.802930.534Total47700.00015Corrected Total1773.33314a R Squared = .845 (Adjusted R Squared = .759)上表是组内回归斜率相同检验结果,教学方法与前测成绩的交互效应检验的F值为2.726,概率值为0.119(大于0.05),没有达到显著性水平,表明三组的回归斜率相同,即各组的回归线为平行线,符合了协方差分析的回归斜率相同的条件。这一结果表明,下面所进行的协方差分析的结果是
15、有效的。 二、协方差分析步骤步骤1:选择协方差分析菜单(与GLM单因素方差分析菜单相同)。点击数据编辑界面的Analyze命令,选择General Linear Model,并打开Univariate对话框。步骤2:选定因变量、因素变量和协变量。在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入Dependent Variable 方框中。然后选择“教学方法”作为因素变量,将其移入到Fixed Factor(s)方框中。再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。步骤3:选择组建对比方式和输出结果。由于有了协方差,无法使用主对话框中Post Hoc命令按钮
16、进行组间多重比较。但是可以按照下面的方法进行。在主对话框中点击Option按钮,进入结果输出选择对话框中,从左边的因素变量列表中选择“教学方法”将其移入Display Means for方框中,意为输出不同教学方法后测成绩调整后(考虑了协变量效应之后)的边缘平均值。选择Compare main effects,意为对“教学方法”各组的后测成绩平均值进行组间比较。在Confidence interval adjustment 下拉菜单中选择LSD,意为进行Tukey LSD事后检验。选择输出结果时,在Display部分选择Descriptive statistics、Homogeneity te
17、sts,分别意味着输出每一组的描述统计量和方差齐性检验(见下图)步骤4:指定模型形式。在主对话框中点击Model按钮进入Univariate:Model对话框。本例采用完全因素模型,即点击Full factorial按钮(见下图)。完全因素模型包括全部因素变量和协变量的主效应、因素变量间的交互效应,但不包括与协变量的交互效应。由于本例中只有一个因素变量和一个协变量,没有交互效应,计算结果只会有主效应。至此为止,所有对话框指定完毕,点击Continue按钮回到主对话框,再点击OK按钮提交程序运行即可。三、协方差分析输出结果及说明因素变量表描述统计表方差齐性检验表下表汇报了方差齐性检验结果,由表可
18、知,F值为0.220,概率值为0.806(大于0.05),说明各组之间的方差基本相同。这一结果满足了参数检验的另一个条件,因此下面些方差分析结果是有效的。协方差分析表上表包括了协变量“前测成绩”之后的方差分析结果,由表可知,协变量“前测成绩”的概率值为0.000,说明“前测成绩”能显著地预示“后测成绩”,也就是说,它对后测成绩产生了显著的影响。因素变量“教学法”也达到了显著水平(0.041),说明“教学方法”对后测成绩也产生了显著的影响,该结果告诉我们至少有一个教学组与另一个教学组之间有显著差异,但哪些组之间有差异,必须查看后面的组间多重比较结果。 这里我们不妨把协方差分析结果与没有包括协方差
19、分析结果做一比较,看看它们之间是否有差异。 未作协方差分析之前的单因素方差分析表(表1)ANOVASum of SquaresdfMean SquareFSig.Between Groups213.3332106.667.821.463Within Groups1560.00012130.000Total1773.33314协方差分析表(表2)(1)表1中,“教学方法”的概率值为0.463,大于0.05的显著性水平,方差分析结果表明,“教学方法”对“后测成绩”不产生显著影响;而表2中的协方差分析结果表明,“教学方法”达到了显著性水平(0.041),即对“后测成绩”产生了显著影响。(2)表1中由
20、组间差异(Between Groups)解释的方差是213.333;表2中而考虑了协方变量之后,模型解释的方差(Corrected Model)却增加到了1332.043。(3)表1表明,需要解释的总方差为1773.333,而“教学方法”只解释了213.333个单位,还有1560个单位的方差未得到解释;表2表明,需要解释的总方差仍然是1773.333,但“教学方法”解释的方差却增加到了346.429,除掉协变量解释的方差(1118.71),未解释的方差只有441.29。由上述3个方面可以看出,进行协方差分析能更准确地检验因素变量对因变量的作用。调整后的后测成绩平均值(Estimates)上表给
21、出的不是三个不同教学组的原始后测成绩平均值,而是调整后的各组平均值,即模型的预示平均值,本利中模型预示的三种教学法的平均成绩分别为51.097、63.387和52.516。从这一结果也可以看出,第一种与第二种的差异较大,而与第三种教学法的平均值比较接近。多重组间比较结果该结果对三个教学组分别进行了比较,由该表可知,传统教学法与交际教学法有显著差异,交际法与沉浸法之间也有显著差异。从平均值一栏中,还可以看出,交际法的教学效果优于其他两种方法。多重组间比较方差分析结果上表给出了方差来源、对比(教学方法)和误差的平方和、自由度、均方、F值和概率值。多重组间比较方差分析同样表明,不同的教学方法之间的后
22、测成绩有显著差异。结果汇报协方差分析产生了大量表格,再研究汇报时不宜一一汇报,可主要汇报描述统计表、些方差分析表以及多重组间比较结果表。练习1: 现在想研究3组同学(分别接受了3种不同的教学方法)在数学成绩上是否有显著差异。已知这些同学的数学入学成绩,数据如下表所示。表中共有四列数据,其中学生的数学成绩也会受到入学成绩的影响,而入学成绩是连续数值型,我们一般假定入学成绩与教学法(这里体现为组别,是控制变量)不存在交互影响,则我们认为在这个问题中,应该数学成绩作为观察变量;组别作为控制变量;将入学成绩作为协变量进行处理较为合适。3组学生的数学成绩列表 姓名 数学成绩 入学成绩 组别 刘静 99
23、98 1 杨洋 88 89 l 何莉 99 80 1 陈华清 89 78 1 贾月月 94 78 1 任涛 90 89 1 孙强 79 87 2 李昆 56 76 2 孙吴 89 56 2 郭剑 99 76 2 卢春伟 70 89 2 盛佳超 89 89 2 许可 55 99 3 杨杰 50 89 3 曹冰 67 88 3 姜东 67 98 3 陈瑞 56 78 3 严佳楠 56 89 3练习2:某学校在教学改革中为了考核某种课程新教学方法的效果,特选择两个班级进行试验,一个班级用标准教学法,另一个班级采用新教学法,一学期后采用相同的试卷进行测试,记录期末考试成绩,见(两种教学法成绩情况数据)
24、请通过该数据对新教学法和标准教学法的效果进行比较。练习3:为了研究三种不同饲料对生猪体重增加(wyh)的影响,将生猪随机分成三组各喂养不同的饲料(sl),得到体重增加的数据。由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重(wyq)的数据,作为自身身体条件的测量指标。为准确评价饲料的优劣,采用单因素协方差分析的方法进行分析。这里,猪体重的增加量为观测变量,饲料为控制变量,猪喂养前的体重为协变量。练习4:比较三种饲料F1、F2、F3对猪催肥的效果,测得每头猪的增加重量(WI)和出生重量(WB)的数据列于下表,检验三种饲料对猪增重是否有显著差异?饲料F1饲料F2饲料F3初
25、始体重饲后体重初始体重饲后体重初始体重饲后体重1585179722891383169024911165181002083127618952395128021103251001691221062710214841999301051790189432110练习5:将体重相近,出生3周的36只大白鼠,按照窝别、性别等条件分成12窝,没窝3只,随机分到核黄素缺乏组、限食量组与不限食量组进行喂养,测得大白鼠的体重与事物消耗量如下表所示。检验三种喂养方式是否有显著差异?核黄素缺乏组限食量组不限食量组食物消耗体重食物消耗体重食物消耗体重265.927.0260.332.0544.7160.3271.641.
26、7271.147.7481.296.1210.225.0214.736.7418.9114.6300.152.0300.165.0556.6134.8262.214.5269.739.0394.576.3304.448.8307.537.9426.672.8272.448.0278.951.5416.199.4248.29.5256.226.7549.9133.7242.837.0240.841.0580.5147.0342.956.5340.761.3608.3165.8356.976.0356.3102.1559.6169.8198.29.2199.28.1371.954.3练习6:某研究
27、者想研究不同的图式对阅读效果的影响,研究者设计了四种不同的图式,分配给四个实验小组,经过图式学习、运用图式阅读等实验环节,最后测查被试的阅读效果。在这个研究中,研究者意识到学生的智商是一个重要的干扰因素,因此,在前测中对每个被试进行了智商测验,得到下表的数据,试分析不同图式对阅读效果的影响。图式一图式二图式三图式四智商阅读成绩智商阅读成绩智商阅读成绩智商阅读成绩9570958593799278927980809576967597858484968494799584808097789884969082829081958998848686898496929998848487869590919083
28、83857998889489797994788593928475759685988689898484978397899387858598809681978289899676988895868484928895899283808092898580859298849579978786909479987895899587957696819692858698809565989384849571967993898587967896879291968685759576908986889677987782948592867690798188898796808580938985859578867885879184988185778996928996809476928895889578908093879690908198829890练习7:某研究者要研究演讲法、自学法和启发法三种教学方法对小学生数学学习成绩的影响。研究者从学校中抽取三个班级作为实验班,再以班级为单位随机分派,接受一种教学方法进行实验。由于学习能力足以影响实验的结果,故实验前对每位学生进行了学习能力测验。下表是每位学生的学习能力测验分数(X)和实验一年后的数学测验成绩(Y)。问三种教学方法之间有无差异?演讲法自学法启发法XYXYXY342133792369985456894555761389第 17 页