《SPSS统计分析—差异分析27391.pptx》由会员分享,可在线阅读,更多相关《SPSS统计分析—差异分析27391.pptx(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、均值描述均值描述MeansMeans过程过程 定义:MeansMeans过程是SPSSSPSS计算各种基本描述统计量的过程。MeansMeans过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。MeansMeans过程的计算公式为:第1页/共76页 研究问题 比较不同性别同学的数学成绩平均值和方差。数据如表所示。数学成绩表数学成绩表性性 别别数数 学学Male99795989798999Female88545623第2页/共76页假设检验的一般步骤:根据实际问题提出原假设H0与备择假设 H1。选择统计量t作为检验统计量,并在H0成立的条件下确定t的分
2、布。选择显著性水平 ,并根据统计量t的分布查表确定临界值及H0的拒绝域。根据样本值计算统计量的值,并将其与临界值作比较。下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不拒绝H0。t检验就是检验统计量为t的假设检验。用于检验两个变量之间的差异。显著性水平:0.05显著0.001非常显著0.0001极其显著第3页/共76页单样本t检验样本均值与总体均值的比较独立两样本t检验独立两样本均值比较配对样本t检验配对设计的差数均值与总体均值0的比较t检验的类型第4页/共76页单样本单样本t t检验检验统计学上的定义和计算公式统计学上的定义和计算公式 定义:SPSSSPSS单样本T T检验是检验某个变
3、量的总体均值和某指定值之间是否存在显著差异。统计的前提是样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。第5页/共76页 单样本T T检验的零假设为H H0 0总体均值和指定检验值之间不存在显著差异。采用T T检验方法,按照下面公式计算T T统计量:第6页/共76页SPSS中实现过程中实现过程分析比较均值单样本T T检验第7页/共76页SPSS中实现过程中实现过程 研究问题 分析某班级学生的高考数学成绩和全国的平均成绩7070之间是否存在显著性差异。数据如表所示。数学成绩表数学成绩表性性 别别数数 学学Male99795989798999Female88
4、545623第8页/共76页单尾检验与双尾检验(邱 P169)在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两个平均数大于、小于与不等于几种不同形式的研究假设,形成有特定方向的检验或无方向性的检验两种不同模式。当研究者只关心单一一个方向的比较关系时(例如男生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(one-tailed test),范例如下:单尾检验由于仅需考虑单方向的差异性,因此在同样的显著水平下,可以较双侧检验容易得到显著结果,统计检验力(power)大于双侧检验,因此采用单侧检验对于研究者较为有利。但是,采用单尾检验必须提出支持证据,除
5、非理论文献支持单侧的概念,或是变量间的关系具有明确的线索显示必需使用单侧检验,否则需采用双侧检验来检验平均数的特性。当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在两个极端的情况皆有可能发生,而必须设定两个拒绝区,此时即需使用双尾检验(two-tailed test)。如:分别是男生与女生数学成绩的平均数第9页/共76页独立两样本独立两样本t t检验检验 定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下:注意:两样本必须是独立的,即从一总体中抽取一批样本对
6、从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。样本来自的总体要服从正态分布且变量为连续测量数据。在进行独立两样本t t检验之前,要通过F F检验来看两样本的方差是否相等。从而选取恰当的统计方法。第10页/共76页 两独立样本T T检验的零假设H H0 0为两总体均值之间不存在显著差异。在具体的计算中需要通过两步来完成:第一,利用F F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T T统计量和自由度计算公式,进而对T T检验的结论作出判断。第11页/共76页F值异质同质结果显著结果不显著是否显著?T值显著否?T值显著否?P.05(接受虚无假设
7、)P=.05P.05(接受虚无假设)P.05第12页/共76页1判断两个总体的方差是否相同判断两个总体的方差是否相同 SPSS SPSS采用Levene FLevene F方法检验两总体方差是否相同。如果“F值”检验不显著(Sig.的值大于.05),表示两个组别群体变异数相等,此时看“方差齐性相等”所列之t值,看其是否显著。如果“F值”检验显著(Sig.的值小于.05),表示两个组别群体变异数不相等,此时看“方差齐性不相等”所列之t值,看其是否显著。第13页/共76页2根据第一步的结果,决定根据第一步的结果,决定T统计量和统计量和自由度计算公式自由度计算公式 (1 1)两总体方差未知且相同情况
8、下,T T统计量计算公式为第14页/共76页 (2 2)两总体方差未知且不同情况下,T T统计量计算公式为 T T统计仍然服从T T分布,但自由度采用修正的自由度,公式为第15页/共76页 从两种情况下的T T统计量计算公式可以看出,如果待检验的两样本均值差异较小,t t值较小,则说明两个样本的均值不存在显著差异;相反,t t值越大,说明两样本的均值存在显著差异。第16页/共76页SPSS中实现过程中实现过程分析比较均值独立样本T T检验第17页/共76页SPSS中实现过程中实现过程 研究问题 分析A A、B B两所高校大一学生的高考数学成绩之间是否存在显著性差异。两所学校学生的高考数学成绩表
9、两所学校学生的高考数学成绩表学学 校校数数 学学清华清华99 88 79 59 54 89 79 56 89北大北大99 23 89 70 50 67 78 89 56第18页/共76页图图4-6 “Independent-Samples T 4-6 “Independent-Samples T Test”Test”对话框对话框 图图4-7 “Define Groups”4-7 “Define Groups”对话框对话框第19页/共76页结果和讨论结果和讨论第20页/共76页统计学上的定义和计算公式统计学上的定义和计算公式两配对样本两配对样本T T检验检验 定义:两配对样本T T检验是根据样本
10、数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。两配对样本T T检验的前提要求如下:两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。样本来自的两个总体应服从正态分布。第21页/共76页 两配对样本T T检验的零假设H H0 0为两总体均值之间不存在显著差异。原理1 1、配对样本t t检验是配对设
11、计的样本差数的均值同总体均值0比较的t检验。2 2、配对样本t t检验是针对配对数据的t t检验。其检验方法是首先求出每对样本的差值,然后比较样本差值的均值和总体均值0 0之间的关系。如果两组数据没有差别,那么其样本差值的均值应该在0 0附近波动。否则为两组数据是有差别的。这种方法的本质就是在对配对样本的差值同总体均值0做单样本t检验。第22页/共76页 注意 单样本t检验和独立两样本t检验样本内部数据的顺序是可以任意调换。而配对样本t检验的样本必须是一一对应的。样本内数据的顺序不能随意交换顺序。第23页/共76页第24页/共76页 SPSS SPSS将自动计算T T值,由于该统计量服从n n
12、 1 1个自由度的T T分布,SPSSSPSS将根据T T分布表给出t t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平,则拒绝H H0 0,认为两总体均值之间存在显著差异。相反,相伴概率大于显著性水平,则不拒绝H H0 0,可以认为两总体均值之间不存在显著差异。第25页/共76页SPSS中实现过程中实现过程分析比较均值配对样本T T检验第26页/共76页方差分析多个独立样本的差异显著性检验,通常可以使用方差分析方法。油菜品种差异性分析 P164不同教学方式是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。第27页/共76页方差分析基本概念方差分析基本概念
13、方差分析是发明的,用于两个及两个以上样本均数差别的显著性检验。方差分析方法在不同领域的各个分析研究中都得到了广泛的应用。从方差入手的研究方法有助于找到事物的内在规律性。由于各种因素的影响,研究所得的数据呈现波动状而有所不同。造成波动的原因可分成两类:一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为随机变量;另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。方差分析可以用来判断样本数据之间的差异到底是由以上哪种因素造成的。第28页/共76页随机变量控制变量随机误差系统误差不可控有固定的大小和方向(正或负),重复测定时重复出现,可以校正或消除。第29页/共76页方差分析
14、的目的主要有以下:1、通过数据分析找出对该事物有显著影响的因素;2、研究各因素之间的交互作用是否对该事物造成影响。第30页/共76页注意:方差分析的适用条件1、样本来自的总体服从正态分布。2、样本方差必须是齐次的。3、各样本之间相互独立。第31页/共76页方差分析的类型第32页/共76页单因素方差分析单因素方差分析单因素方差分析是指只单独考虑一个因素A A对指标X X的影响。此时其他因素都不变或者控制在一定的范围之内。考虑因素A A有k k个水平,在每次水平下做nini次试验。第33页/共76页 在方差分析中,代表变异大小,并用来进行变异分解的指标是离均差平方和。总的变异平方和记为SST,被分
15、解为两项:第一项是各组的离均差平方和之和,代表组内变异(即随机变量引起的变异),称为组内平方和SSW(Within Groups);第二项是按样本含量大小加权的各组均数与总均数的差值平方之和,代表组间变异(由控制变量引起的变异),称为组间平方和或者处理平方和SSB(Between Groups)。总变异=组内变异+组间变异总变异=随机变异+处理因素导致的变异第34页/共76页 这样,我们可采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的影响确实存在,如果两者相差无几,则说明影响不存在,这就是方差分析的基本思想。第35页/共76页其中,k k为水平数;nini
16、为第i i个水平下的样本容量。可见,组间样本离差平方和是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。SST=SSW+SSB计算公式计算公式第36页/共76页F F统计量是平均组间平方和与平均组内平方和的比(组间变异与误差变异的比值)。从F F值计算公式可以看出,如果控制变量的不同水平对观察变量有显著影响,那么观察变量的组间离差平方和必然大,F F值也就比较大;相反,如果控制变量的不同水平没有对观察变量造成显著影响,那么,组内离差平方和影响就会比较大,F F值就比较小。第37页/共76页第38页/共
17、76页SPSS中实现过程中实现过程分析比较均值单因素ANOVAANOVA第39页/共76页SPSS中实现过程中实现过程 研究问题 三组学生的数学成绩三组学生的数学成绩人人 名名数数 学学组组 别别hxh99.000yaju88.000yu99.000shizg89.000hah94.000s90.000watet79.002jess56.002wish89.0022_new199.0022_new270.0022_new389.0022_new455.0012_new550.0012_new667.0012_new767.0012_new856.0012_new956.001第40页/共76页
18、 实现步骤在菜单中选择在菜单中选择“One-Way One-Way ANOVA”ANOVA”命令命令“One-Way ANOVA”“One-Way ANOVA”对话框对话框第41页/共76页“One-Way ANOVA“One-Way ANOVA:Options”Options”对话框对话框 “One-Way ANOVA“One-Way ANOVA:Contrasts”Contrasts”对话框对话框 “One-Way ANOVA “One-Way ANOVA:Post Post Hoc Multiple Hoc Multiple Comparisons”Comparisons”对话框对话框
19、第42页/共76页结果和讨论结果和讨论 (1 1)首先是单因素方差分析的前提检验结果,也就是Homogeneity of variance Homogeneity of variance testtest方差齐次性检验第43页/共76页(2 2)输出的结果文件中第2 2个表格如下所示。第44页/共76页(3 3)输出的结果文件中第3 3个表格如下所示。第45页/共76页(4 4)输出的结果文件中第4 4个表格如下所示。第46页/共76页 (5 5)输出结果的最后部分是各组观察变量均值的折线图,如图5-65-6所示。第47页/共76页事后比较方法的选择LSD法实际上是t检验的变形,只是在变异和自
20、由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然存在放大水准(一类错误)问题,但换言之就是总的二类错误非常的小,要是LSD都没有检验出差别,那恐怕真的没有差别。SNK法运用的最广泛的,它采用Student Range分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的水准等于实际设定值,即控制了一类错误。张文彤 P268第48页/共76页多因素方差分析多因素方差分析统计学上的定义和计算公式统计学上的定义和计算公式多因素方差分析用来研究两个或两个以上控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,
21、更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。第49页/共76页 多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。因此,它需要将观察变量总的离差平方和分解为3 3个部分:多个控制变量单独作用引起的平方和;多个控制变量交互作用引起的离差平方和;其他随机因素引起的离差平方和。第50页/共76页第51页/共76页第52页/共76页 以上F F统计量服从F F分布。SPSSSPSS将自动计算F F值,并根据F F分布表给出相应的相伴概率值。第53页/共76页
22、第54页/共76页SPSS中实现过程中实现过程分析常规线性模型单变量第55页/共76页SPSS中实现过程中实现过程 研究问题 表表5-25-2三组不同性别学生的数学成绩三组不同性别学生的数学成绩人人 名名数数 学学组组 别别性性 别别hxh99.000maleyaju88.000femaleyu99.000maleshizg89.000malehah94.000females90.000malewatet79.002malejess56.002femalewish89.002male2_new199.002male2_new270.002female2_new389.002male2_new4
23、55.001female2_new550.001male2_new667.001female2_new767.001male2_new856.001female2_new956.001male第56页/共76页 实现步骤图图5-7 5-7 在菜单中选择在菜单中选择“Univariate”Univariate”命令命令图图5-8 “Univariate”5-8 “Univariate”对话框(一)对话框(一)第57页/共76页图图5-9 “Univariate:Options”5-9 “Univariate:Options”对话框(一)对话框(一)图图5-10 “Univariate:Post
24、Hoc Multiple 5-10 “Univariate:Post Hoc Multiple Comparisons for Observed Means”Comparisons for Observed Means”对话框对话框第58页/共76页图图5-11 “Univariate5-11 “Univariate:Model”Model”对话框对话框第59页/共76页图图5-12 “Univariate5-12 “Univariate:Profile Plots”Profile Plots”对话框对话框 图图5-13 “Univariate5-13 “Univariate:Contrast
25、s”Contrasts”对话框对话框 第60页/共76页结果和讨论结果和讨论 (1 1)SPSSSPSS输出结果文件中的第一部分如下两表所示。第61页/共76页 (2 2)输出的结果文件中第二部分如下表所示。第62页/共76页 (3 3)输出的结果文件中第三部分如下表所示。第63页/共76页 (4 4)输出的结果文件中第四部分如下表所示。第64页/共76页 (5 5)输出的结果文件中第五部分如下表所示。第65页/共76页 (6 6)输出的结果文件中第六部分如下表所示。第66页/共76页 (7 7)输出结果的最后部分是控制变量之间是否有交互影响的图形。第67页/共76页统计学上的定义和计算公式统
26、计学上的定义和计算公式协方差分析协方差分析 定义:协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。利用协方差分析就可以完成这样的功能。协方差将那些很难控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对观察变量的影响,从而实现对控制变量效果的准确评价。协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间也没有交互影响。第68页/共76页 前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量。而协方差分析中则即包含了定性变量(控制变量),又包含了定量变量(协变量)。第
27、69页/共76页 以上F F统计量服从F F分布。SPSSSPSS将自动计算F F值,并根据F F分布表给出相应的相伴概率值。如果F F控制变量的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生显著的影响;如果F F协变量的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生显著的影响。第70页/共76页分析常规线性模型单变量第71页/共76页 研究问题表表5-35-3三组学生的数学成绩三组学生的数学成绩人人 名名数数 学学入入 学学 成成 绩绩组组 别别hxh99.0098.000yaju88.0089.000yu99.0080.000shizg89.0078.00
28、0hah94.0078.000s90.0089.000watet79.0087.002jess56.0076.002wish89.0056.0022_new199.0076.0022_new270.0089.0022_new389.0089.0022_new455.0099.0012_new550.0089.0012_new667.0088.0012_new767.0098.0012_new856.0078.0012_new956.0089.001第72页/共76页 实现步骤图图5-15 5-15 在菜单中选择在菜单中选择“Univariate”Univariate”命令命令图图5-16 “U
29、nivariate”5-16 “Univariate”对话框(二)对话框(二)第73页/共76页第74页/共76页小小 结结 方差分析用于两个及两个以上样本均值差异的显著性检验。方差分析的基本思想是:通过分析研究中不同变量的变异对总变异的贡献大小,确定控制变量对研究变量影响力的大小。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平能够对结果产生显著影响,那么它和随机变量共同作用,必将使结果有显著变化。单因素方差分析所解决的是一个因素下的多个不同水平之间的相关问题;多因素方差分析的控制变量在两个或两个以上,其主要用于分析多个控制变量的作用、多个控制变量的交互作
30、用以及其他随机变量是否对结果产生了显著影响;协方差分析将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更准确地对控制因素进行评价。单因素方差分析主要用“AnalysisAnalysis”的“Compare MeansCompare Means”菜单下的“OneOneWay ANOVAWay ANOVA”子菜单实现;多因素方差分析和协方差分析都是在“AnalysisAnalysis”下“General Linear ModelGeneral Linear Model”菜单下的“UnivariateUnivariate”子菜单实现的。第75页/共76页感谢您的观看。第76页/共76页