第5讲_SPSS方差分析.pptx

上传人:莉*** 文档编号:73442382 上传时间:2023-02-18 格式:PPTX 页数:45 大小:623.71KB
返回 下载 相关 举报
第5讲_SPSS方差分析.pptx_第1页
第1页 / 共45页
第5讲_SPSS方差分析.pptx_第2页
第2页 / 共45页
点击查看更多>>
资源描述

《第5讲_SPSS方差分析.pptx》由会员分享,可在线阅读,更多相关《第5讲_SPSS方差分析.pptx(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、本章内容本章内容5.1 方差分析概述5.2 单因素方差分析5.3 多因素方差分析5.4 协方差分析5.5多因变量的方差分析第1页/共46页例子:某研究者在某单位工作人员中进行了体重指数(BMI)抽样调查,随机抽取不同年龄组男性受试者各16名,测量了被调查者的身高和体重值,由此按照BMI=体重/身高2公式计算了体重指数,请问,不同年龄组的体重指数有无差异。项目项目18岁岁30岁岁4560岁岁21.6527.1520.2820.6628.5822.8818.8223.9326.49样本量样本量161616平均值平均值22.0725.9425.49标准差标准差8.978.117.19第2页/共46页

2、一 、概念 又叫变量分析,是英国著名统计学家R.A.Fisher于20世纪提出的。它是用以检验两个或多个两个或多个均数间均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。要求:各组观察值服从正态分布或近似正态分布,并且各组之间的方差具有齐性。(Analysis of variance,ANOVA)方差分析概述方差分析概述第3页/共46页其基本思想是把所有观察值之间的变异分解为几个部分。即把描写观察值之间的变异的离均差平方和分解为某些因素的离均差平方和及随机抽样误差的离均差平方和,进而计算其相应的均方差,构成F统计量。分类:单因素方差分析 多因素

3、方差分析 协方差分析 多因变量方差分析第4页/共46页5组间变异组间变异总变异总变异组内变异组内变异二、思想来源:观察值总变异可以分解为组间变异和组内变异 第5页/共46页61.总变异总变异(Total variation):全部测量值全部测量值Xij与总与总均数均数 间的差异间的差异 2.组间变异组间变异(between group variation):各组各组的均数的均数 与总均数与总均数 间的差异间的差异3.组内变异组内变异(within group variation):每组:每组的每个测量值的每个测量值 与该组均数与该组均数 的差异的差异可用可用离均差平方和离均差平方和反映变异的大

4、小反映变异的大小 第6页/共46页总平方和:处理间平方和处理内平方和:同样道理,总自由度也可分解为处理间自由度和处理内自由度:dfT =dft+dfe总 df 处理间df 处理内df 第7页/共46页 一般把处理间方差处理间方差作为分子,称为大方差,误差方差误差方差作为分母,称为小方差,求出两者之比为F值进行F检验。从而确定各种原因(处理效应处理效应、试验误差试验误差)在总变异中所占的重要程度。二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理

5、对结果的影响很大,不可忽视。第8页/共46页平方和平方和自由度自由度方差方差F值值F0.05、0.01处理间处理间处理内处理内总变异总变异综上所述,可归纳成方差分析表(analysis of variance table)第9页/共46页如果F值不显著,则方差分析结论是变异来源主要是误差引起的,所以过程到此结束。而如果F值显著,说明变异来源主要是因为处理的差异,具体何种处理存在差异?还需要进一步多重比较!第10页/共46页5.2 单因素方差分析单因素方差分析5.2.15.2.1单因素方差分析的基本思想单因素方差分析的基本思想 1 1、定义:、定义:单因素方差分析用来研究一个控制变量的不同水平是

6、否对观测单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生显例如:分析不同施肥量是否给农作物的产量产生显著影响;研究不同学历是否对工资收入产生显著影响等。著影响;研究不同学历是否对工资收入产生显著影响等。2 2、观测变量方差的分解、观测变量方差的分解 将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别表示为:两部分,分别表示为:其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和;SSASSA为组间离差平方

7、和,是由为组间离差平方和,是由控制变量不同水平造成的观测变量的变差;控制变量不同水平造成的观测变量的变差;SSESSE为组内平方和,是由抽样为组内平方和,是由抽样误差引起的观测变量的变差。误差引起的观测变量的变差。第11页/共46页其中:其中:第12页/共46页2 2、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来

8、解释,即控制变量给观测变量带来了显著影响。即控制变量给观测变量带来了显著影响。这里我们用这里我们用F F统计量来表示这种比例关系,统计量来表示这种比例关系,如果控制变量的不同水平对如果控制变量的不同水平对观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较大,观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较大,则则F F值就比较大;值就比较大;反之,如果控制变量的不同水平对观测变量没有造成显著反之,如果控制变量的不同水平对观测变量没有造成显著影响,那么观测变量总变差中控制变量所占的比例较小,则影响,那么观测变量总变差中控制变量所占的比例较小,则F F值就比较小。值就

9、比较小。第13页/共46页5.2.2 单因素方差分析的基本步骤提出原假设:控制变量不同水平下观测变量各总体的均值无显著差异计算检验统计量和概率P值 l给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。第14页/共46页5.2.3 单因素方差分析的应用举例mydataA.sav,请利用SPSS判断不同爱好的学生在“语文1”成绩上是否存在显著性差异。第15页/共46页5.2.4 单因素方差分析的基本操作步骤 在利用SPSS进行单因素方差分析时,应注意数据的组织形式。SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤如下:1、SPSS

10、单因素方差分析中,要求因变量为正态分布的高测度数据,故首先检验正态性。分析非参数检验旧对话框1样本K-S2.系统要求自变量必须为数值离散型变量转换重新编码为不同变量3.单因素方差分析分析比较均值单因素ANOVA 至此,SPSS便自动分解观测变量的方差,计算组间方差、组内方差、F统计量以及对应的概率p值,完成单因素方差分析的相关计算,并将结果显示到输出窗口中。第16页/共46页方差齐次性检验概率为0.5870.05,表示原假设”方差齐性”是成立的。满足单因素方差分析的前提条件本案例最终显著性检验概率为0.6760.05,说明原假设成立第17页/共46页7.2.5 单因素方差分析的进一步分析 1、

11、方差齐性检验 由于方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。SPSS单因素方差分析中,方差齐性检验采用了方差同质性(Homogeneity of Variance)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同SPSS两独立样本t检验中的方差齐性检验。第18页/共46页2、多重比较检验 上面的基本分析可以判断控制变量是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,进一步还应确定,控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明

12、显大于其它水平,哪些水平的作用是不显著的。例如已经确定不同施肥量会对农作物的产量产生显著影响,便希望进一步了解究竟是10公斤、20公斤还是30公斤施肥量最有利于提高产量,哪种施肥量对农作物产量没有显著影响。掌握了这些信息,我们就能够制定合理的施肥方案。多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显著差异。其零假设是相应组的均值之间无显著差异。第19页/共46页 SPSS提供的多重比较检验的方法比较多,有些方法适用在各总体方差相等的条件下,有些适用在方差不相等的条件下。其中LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey方法和S-N-K方法适

13、用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。第20页/共46页3、其他检验(1)先验对比检验 如果发现某些水平与另一些水平的均值差距显著,就可以进一步比较这两组总的均值是否存在显著差异。在检验中,SPSS根据用户确定的各均值的系数,再对其线性组合进行检验,来判断各相似性子集间均值的差异程度。(2)趋势检验 当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的。第21页/共46页第22页/共46页(3)Contrasts选项 Contrasts选项用来实现先验对比检验和趋势检验。如果进行趋势检验,则应选择Polynom

14、ial选项,然后在后面的下拉框中选择趋势检验的方法。其中Linear表示线性趋势检验;Quadratic表示进行二次多项式检验;Cubic表示进行三次多项式检验,4th和5th表示进行四次和五次多项式检验。如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保ci0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。第23页/共46页第24页/共46页5.3 多因素方差分析多因素方差分析7.3.17.3.1多因素方差分析的基本思想多因素方差分析的基本思想 1 1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平、定义:多因素方差分析用来研究两个及两个以

15、上控制变量的不同水平是否对观测变量产生了显著影响。是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素多因素方差分析不仅能够分析多个因素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测变量产生显著影响。变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产例如:分析不同品种、不同施肥量是否给农作物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合。的最优组合。2 2、观测变量方差的分解、观测变量方差的分

16、解 将观测变量总的离差平方和分解为:将观测变量总的离差平方和分解为:其中,其中,SSTSST为观测变量的总离差平方和;为观测变量的总离差平方和;SSASSA、SSBSSB分别为控制变量分别为控制变量A A、B B独立作用引起的变差;独立作用引起的变差;SSABSSAB为控制变量为控制变量A A、B B两两交互作用引起的变差;两两交互作用引起的变差;SSESSE为随机因素引起的变差。为随机因素引起的变差。第25页/共46页其中:其中:第26页/共46页3 3、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例 在观测变量总离差平方和中,如果在观测变量总离差平方和中,如果S

17、SASSA所占比例较大,则说明控制变所占比例较大,则说明控制变量量A A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由控制变量控制变量A A来解释,即控制变量来解释,即控制变量A A给观测变量带来了显著影响。对给观测变量带来了显著影响。对SSBSSB、SSABSSAB同理。同理。第27页/共46页5.3.2 多因素方差分析的基本步骤提出原假设:各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量交互作用对观测变量无显著影响。计算检验统计量和概率P值l给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原

18、假设,反之就不能拒绝原假设。第28页/共46页5.3.3 多因素方差分析应用举例SPSS数据文件mydataA.sav,请利用SPSS判断性别、专业、爱好、籍贯是否会对历史成绩产生影响,了解哪些因素对历史成绩的影响是显著的,哪些影响是不显著的。(1)因变量正态性检验分析非参数检验旧对话框1样本K-S(2)自变量数值化编码转换重新编码为不同变量(3)多因素方差分析分析一般线性模型单变量第29页/共46页结果解读:30第30页/共46页7.3.6 多因素方差分析中进一步分析的操作步骤1、建立非饱和模型的操作 SPSS多因素方差分析中默认建立的是饱和模型。如果希望建立非饱和模型,则应在主窗口中单击M

19、odel按钮,出现窗口:第31页/共46页 默认的选项是Full factorial,表示饱和模型。此时Factors&Covariates框、Model框以及Build Term(s)下拉框均呈不可用状态;如果选择Custom项,则表示建立非饱和模型,且Factors&Covariates框、Model框以及Build Term(s)下拉框均变为可用状态。此时便可自定义非饱和模型中的数据项。其中Interaction为交互作用;Main effects为主效应;All 2-way、All 3-way等表示二阶、三阶或更高阶交互作用。第32页/共46页5.4 协方差分析协方差分析5.4.15.

20、4.1协方差分析的基本思想协方差分析的基本思想 无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的,无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的,其各个水平可以通过人为努力得到控制和确定。其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有些但是在实际问题中,有些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显著控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显著的影响。的影响。比如:不同地块对农作物产量的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽略在方差分析中,如果忽略这些因素的存在而单纯去分析其他因素对观测变量

21、的影响,往往会夸大或这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加准缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对分确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对分析结论的影响。析结论的影响。1 1、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,排除协变量对观测变量影响的条件下,分析

22、控制变量对观测变量的影响,从而更加准确的对控制变量进行分析。从而更加准确的对控制变量进行分析。第33页/共46页2 2、协方差分析的特点、协方差分析的特点 方差分析中的控制变量都是定性变量(包括定类和定序变量),线性方差分析中的控制变量都是定性变量(包括定类和定序变量),线性回归分析中的解释变量(自变量)都是定量变量。而回归分析中的解释变量(自变量)都是定量变量。而协方差分析中的控制协方差分析中的控制变量是定性变量,而协变量一般是定量变量。变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介所以说协方差分析是一种介于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问于方

23、差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量之间有显著的线性关系。之间有显著的线性关系。第34页/共46页3 3、离差平方和的分解、离差平方和的分解 在协方差分析中,将观测变量的总离差平方和分解为由控制变量独立在协方差分析中,将观测变量的总离差平方和分解为由控制变量独立作用引起的、由控制变量交互作用引起的、由协变量引起的和随机变量引作用引起的、由

24、控制变量交互作用引起的、由协变量引起的和随机变量引起的。以单因素协方差分析为例,观测变量的总变差可以分解为:起的。以单因素协方差分析为例,观测变量的总变差可以分解为:4 4、比较观测变量总离差平方和各部分的比例、比较观测变量总离差平方和各部分的比例可以部分的由控制变量可以部分的由控制变量A A来解释,来解释,在观测变量总离差平方和中,如果在观测变量总离差平方和中,如果SSASSA所占比例所占比例较大,则说明控制变量较大,则说明控制变量A A是引起观测变量的变动主要因素之一,观测变量的变动即是引起观测变量的变动主要因素之一,观测变量的变动即控制变量控制变量A A给观测变量带来了显著影响。对给观测

25、变量带来了显著影响。对SSBSSB、SSABSSAB同理。同理。第35页/共46页5.4.2 协方差分析的基本步骤提出原假设:协变量对观测变量的线性影响是不显著的;在扣除协变量的影响条件下,控制变量各水平下观测变量的各总体均值无显著差异。计算检验统计量和概率P值l给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。第36页/共46页5.4.3 协方差分析的应用举例案例:某小学在一年级新生入学时测量了其智力水平(即IQ值),并调查了学生参加学前教育并获取知识的情况、学生的生源情况、父母的文化程度。现在需要了解学前教育情况和生源是否对学生的智力水平产生了影响

26、?在此过程中,需要屏蔽父母文化程度对学生智力因素产生的影响。操作步骤:(1)因变量正态性检验分析非参数检验旧对话框1样本K-S(2)自变量数值化编码转换重新编码为不同变量(3)多因素方差分析分析一般线性模型单变量第37页/共46页38结果解读:第38页/共46页5.5 多因变量的方差分析多因变量的方差分析5.5.1 多因变量多因素方差分析在数据分析中,如果需要分析某些因素对多个因变量的影响,就需要对研究问题具体分析、若待分析的多个因变量之间没有关联性多个单因变量多因素方差分析。若待分析的多个因变量之间有关联性多变量方差分析技术39第39页/共46页案例:某小学在一年级新生入学时测量了其智力水平

27、(即IQ值),并调查了学生参加学前教育并获取知识的情况、学生的生源情况、父母的文化程度。现在需要了解学前教育情况和生源是否对学生的智力水平、入学测试成绩产生了影响?操作:分析一般线性模型多变量选项SSCP矩阵40第40页/共46页41第41页/共46页5.5.2带重复测量的方差分析案例:mydataA“语文1”和“语文2”是针对同一批学生的两次语文考试成绩,请分析两次考试成绩有无差异,并分析性别和专业是否影响了语文考试成绩。操作分析一般线性模型重复度量重复度量定义因子重复度量对话框42第42页/共46页43第43页/共46页练习题(根据练习题(根据银行数据进行分析)银行数据进行分析)1.不同性别的收入是否不同?(独立样本T检验或单因素方差分析)2.是否少数民族的收入是否不同?(独立样本T检验或单因素方差分析)3.不同工种的收入是否不同?(单因素方差分析)4.不同性别和工种的收入是否不同?(多因素方差分析)5.是否少数民族和工种的收入是否不同?(多因素方差分析)6.不同工种的收入是否不同(消除工作时间的影响)?(协方差分析)第44页/共46页Thank you第45页/共46页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁