《最新spss操作实验手册.doc》由会员分享,可在线阅读,更多相关《最新spss操作实验手册.doc(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateSPSS操作实验手册20152.1 SPSS数据文件的建立SPSS实验操作指导手册(2015版)2.SPSS数据整理2.1 SPSS数据文件的建立SPSS数据文件的建立可以利用【File(文件)】菜单中的命令来实现。具体来说,SPSS提供了四种创建数据文件的方法: 新建数据文件【File(文件)】【New(新建)】【Data(数据)】命令; 直接打开已有数据文件【Fi
2、le(文件)】【Open (打开)】【Data(数据)】命令; 使用数据库查询;【File(文件)】【Open Database(打开数据库)】【New Query(新建查询)】命令,弹出【Database Wizard(数据库向导)】对话框 从文本向导导入数据文件。【File(文件)】【Read Text Data(打开文本 数据)】命令,弹出【Open Data(打开数据)】对话框实例分析:股票指数的导入文件2-1.xls是上证指数从2007年1月4日至2008年10月16 日的数据资料,包括了开盘价、当日最高价、当日最低价和收盘价等选项,请将该数据导入至SPSS中。2.2 SPSS数据文
3、件的属性一个完整的SPSS文件结构包括变量名称、变量类型、变量名标签、变量值标签等内容。注意:SPSS数据文件中的一列数据称为一个变量,每个变量都应有一个变量名。SPSS数据文件中的一行数据称为一条个案或观测量(Case)2.2.1 实例分析:员工满意度调查表的数据属性设计1.实例内容为了提高员工的工作积极性,完善公司各方面管理制度,并达到有的放矢的目的,某公司决定对本公司员工进行不记名调查,希望了解员工对公司的满意情况。请根据该公司设计的员工满意度调查题目(行政人事管理部分)的特点,设计该调查表数据在SPSS的数据属性。2.实例操作具体步骤如下文件(2-2.sav.)Step01:打开SPS
4、S中的Data View窗口,录入或导入原始调查数据。Step02:选择菜单栏中的【File(文件)】【Save (保存)】命令,保存数据文件,以免丢失。Step03:单击SPSS中的【Variable View(变量视图)】选项卡,按窗口提示进行数据属性的定义,如变量名称、标签、标签值等。2.3 SPSS数据文件的整理【Data(数据)】菜单中的命令主要用于实现数据文件的整理功能。2.3.1 观测量排序:地区生产总值分析1.操作详解Step01:打开观测量排序对话框【File(文件)】 【Data(数据)】【Sort Cases(排序个案)】命令Step02:选择排序变量Step03:选择排
5、序类型Step04:单击【OK】按钮,此时操作结束。2.实例内容:地区生产总值分析数据2-3.sav列出了2005年我国部分省份的地区生产总值及第一产业、第二产业和第三产业的生产总值,请根据这些数据分析不同省份经济发展状况的差异性。2.3.2数据的转置: 国家财政分项目收入1.操作详解Step01:打开转置对话框【File(文件)】 Data(数据)】【Transpose(转置)】命令Step02:选择转置变量Step03:新变量命名Step04:单击【OK】按钮,操作结束。注意:数据文件转置后,数据属性的定义都会丢失,因此用户要慎重选择本功能。2.实例内容:国家财政分项目收入数据(2-4.s
6、av)2.3.3文件合并:固定资产投资【data(数据)】【Merge Files(合并文件)】菜单中有两个命令选项:【Add Cases(添加个案)】和【Add Variables(添加变量)】。1. 观测量合并的SPSS操作详解Step01:打开观测量合并对话框【File(文件)】【Data(数据)】 【Merge Files(合并文件)】【Add Cases(添加个案)】命令Step02:选择合并文件点选【An external SPSS Statistics data file(外部SPSS Statistics数据文件)】单选钮,同时单击【Browse】按钮,选中需要合并的文件,并指
7、定文件路径,然后单击【Continue】按钮。Step03:选择合并方法。Step04:单击【OK】按钮,操作结束。2.变量合并的SPSS操作详解Step01:打开变量合并对话框。Step02:选择合并文件。Step03:选择合并方法。Step04:单击【OK】按钮,操作结束。3. 实例内容:固定资产投资文件的合并已知2-5-1.sav、2-5-2.sav和2-5-3.sav中的数据是北京、天津、河北等省市在2005年部分行业的固定投资额(亿元)数据,请完成以下问题。问题一:将2-5-1.sav和2-5-2.sav的数据文件纵向合并(观测量合并)。问题二:将2-5-1.sav和2-5-3.sa
8、v的数据文件横向合并(变量合并)。2.3.4 数据分类汇总:城乡居民储蓄存款对数据进行分类汇总就是按指定的分类变量值对所有的观测量进行分组,对每组观测量的变量求描述统计量,并生成分组数据文件。例如,将一个工厂的数据资料,按照该工厂的各个部门进行分组,并统计各个部门的人员年龄均值、方差等,这些工作就属于数据分类汇总的范畴。1.数据分类汇总的SPSS操作详解Step01:打开数据汇总对话框【File(文件)】【Data(数据)】【Aggregate(分类汇总)】命令Step02:选择分类变量; Step03:选择汇总变量Step04:选择汇总函数; Step05:添加变量标签Step06:选择汇总
9、结果保存方式Step07:大规模数据的排序选择Step08:完成上述操作后,单击【OK】按钮,操作结束2. 实例内容:城乡居民人民币储蓄存款我国部分省份2004年度城乡居民的人民币储蓄存款金额(年底余额,单位:亿元)2.3.5 数据文件的拆分Split1.数据分类汇总的SPSS操作详解Step01:打开数据拆分对话框【File(文件)】 【Data(数据)】【Split File(拆分文件)】命令Step02:选择数据拆分方式。Step03:选择拆分变量。Step04:单击【OK】按钮,操作结束。2. 实例内容:分行业职工平均工资2005年我国部分按细行业划分的职工平均工资,请根据不同的行业类
10、型,对原始数据进行拆分,数据详见2-7.sav。2.3.6 选择数据:城市设施水平1.操作详解Step01:打开数据选择对话框【File(文件)】【Data(数据)】【Select Cases(选择个案)】命令Step02:选择数据选择方式单击【If】按钮单击【Sample】按钮单击【Range】按钮Step03:选择输出方式Step04:单击【OK】按钮,操作结束2. 实例内容:城市设施水平数据文件2-8.sav中是2006年我国部分地区城市设施水平指标,包括城市用水普及率、城市燃气普及率等。请根据这些原始数据,按照以下条件选择数据。条件一:选择城市用水普及率和城市燃气普及率都大于90%的地
11、区。条件二:随机选取10个地区。条件二属于随机选择的问题,因此需要点选【Random samples of cases(随机个案样本)】单选钮,同时在弹出的【Select Cases:Random Sample(选择个案:随机样本)】对话框的“Exactly cases form the fiirst cases”文本框中分别输入10和31,表示从31个观测量中选择10个观测量。最后,单击【Continue】按钮返回主对话框,随机选取的样本结果如下页所示。2.3.7 数据加权:蔬菜的平均价格权重是数据分析中的一个重要概念,它是一个相对的概念。权重的大小描述了该指标在整体评价中的相对重要程度。在
12、数据处理中,常需要对数据进行加权处理。1. 数据加权的SPSS操作详解Step01:打开数据加权对话框【File(文件)】【Data(数据)】【Weight cases(加权个案)】命令2. 实例内容:蔬菜的平均价格某经销商希望掌握菜市场的蔬菜销销售的平均价格,收集数据见数据文件2-9.sav。现请利用这些数据,求出这些蔬菜的平均价格。Step1:以蔬菜的销售量 为权重计算各种蔬菜销售的平均价格更为合适。选择“销售量”变量作为权重变量,将其放入【Frequencies Variable(频率变量)】列表框中Step02:选择变量是否加权, 用户首先选择是否对观测量进行加权。Step03:单击【
13、OK】按钮,操作结束。2.4 SPSS数据的计算和变换2.4.1 变量计算:国内生产总值的产业构成1. SPSS操作详解【File(文件)】 【Transform转换】【Compute(计算)】命令Step02:定义新变量及其类型在【Target Variable(目标变量)】文本框中用户需要定义目标函数名,它可以是一个新变量名,也可以是已经定义的变量名。Step03:输入计算表达式Step04:条件样本选择2.实例内容:国内生产总值的产业构成数据文件2-10.sav为我国1978-2005年国内生产总值、第一产业国内生产总值、第二产业国内生产总值和第三产业国内生产总值,请分析不同产业所占国内
14、生产总值的变动情况。Step01:打开对话框Step02:定义第一产业比重变量Step03:计算第一产业生产总值所占比重Step04:完成操作2.4.2 变量重新赋值:空气质量等级划分SPSS的【Transform(转换)】菜单中有【Recode into Same Variable(重新编码为相同变量)】和【Recode into Different Variable(重新编码为不同变量)】两个命令可以实现重新赋值功能。1. SPSS操作详解Step01:打开重新赋值对话框【File(文件)】【Transform(转换)】【Recode into Different Variable】Ste
15、p02:选择重新赋值变量和输出变量Step03:设置重新赋值规则Step04:选择样本赋值Step05:最后单击【OK】按钮,此时操作结束2.实例内容:空气质量等级的划分我国部分城市2005年空气质量的指标数据(见数据文件2-11.sav),请利用这个规则对不同城市的空气质量等级进行划分。2.4.3 变量值计数: 消费价格指数的上涨项目1.SPSS操作详解Step01:打开重新赋值对话框【File(文件)】【Transform(转换)】【Count Values within Cases(对个案内的值计数)】命令Step02:输入目标计数变量Step03:选择计数变量Step04:设置计数规则
16、Step05:选择样本计数Step06:最后单击【OK】按钮,此时操作结束2.实例内容:消费价格指数的上涨项目我国城市和农村居民消费价格分类指数数据见数据文件2-12.sav。由于不同产品的价格涨跌不同,请找出城市和农村居民消费价格指数都较去年上涨超过1%的项目。3.SPSS描述性统计分析【Descriptive Statistics 】菜单中。最常用的是列在最前面的四个过程。 Frequencies:产生频数表。 Descriptives:进行基本的统计描述分析。 Explore:探索性分析。 Crosstabs:列联表分析。3.1 SPSS在频数分析中的应用3.1.2 频数分析的SPSS操
17、作详解Step01:打开主窗口选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述性统计)】 【Frequencies(频率)】命令Step02:选择分析变量Step03:输出频数分析表勾选【Display frequency tables(显示频率表格)】复选框Step04:其他基本统计分析还可以单击【Statistics(统计量)】和【Charts(图表)】等按钮Step05:输出格式选择单击【Format】按钮Step06: 完成操作单击【OK】按钮,结束操作,SPSS软件自动输出结果。3.1.3 实例图文分析:产品的销售量(见数据文件3-1.sa
18、v)假设某公司每周大约卖出2000万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。假设下面给出的销售数字(单位:百万)代表近期公司该产品每周的销售数据。利用频数分析你能得到什么有助于生产及销售的信息?24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 2715 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 193.2 SPSS在描述统计分析中的应用3.2.2 描述统计分析的SPSS操作详解Step01:打开主窗口【Analyze(分析)】 【Descr
19、iptive Statistics(描述性统计)】【Descriptives(描述)】命令Step02:选择分析变量Step03:计算基本描述性统计量Step04:保存标准化变量勾选【Save standardized values as variables(保存标准化变量值)】复选框Step05: 完成操作单击【OK】按钮,结束操作,SPSS软件自动输出结果。3.2.3 实例图文分析:奥斯卡获奖者的年龄(见数据文件3-2.sav)请你分析不同性别演员获得奥斯卡奖的年龄差异性。男演员:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 3
20、8 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60女演员:50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 343.3 SPSS在探索性分析中的应用1.使用目的:探索性数据分析(Exploratary Data Analysis,简称EDA)的基本思想是从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大致情况,也可以为进一步结合模型的研究提供线索,为传统的统计推
21、断提供良好的基础和减少盲目性。2.主要内容:检查数据是否有错、获得数据分布特征、对数据的初步观察,发现一些内在规律。3.3.2 探索性分析的SPSS操作详解SPSS中的Explore过程用于计算指定变量的探索性统计量和有关的图形。它既可以对观测量整体分析,也可以进行分组分析。从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。Step01 打开主窗口【Analyze(分析)】 【Descriptive Statistics(描述性统计)】【Explore(探索)】命令Step02 选择分
22、析变量Step03 选取分组变量Step04 选择标签值Step05 选择输出类型Step06 描述性统计量结果输出Step07 统计图形结果输出Step08 选择缺失值的处理方式Step09 操作完成3.3.3 实例图文分析:中国南北城市的温度差异Step01:打开对话框打开数据文件3-3.sav,其中增加变量“地域”表示所在城市的区域位置,“1”表示南方城市,“2”表示北方城市。选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Explore(探索)】命令,弹出【Explore(探索)】对话框。3.4 SPSS在列联表分析中的应用3.4
23、.2 列联表分析的SPSS操作详解Step01 打开主窗口选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Crosstabs(列联表)】命令Step02 选择行、列变量Step03 选择层变量Step04 列联表输出格式的选择Step05 行、列变量相关程度的度量Step06 选择列联表单元格的输出类型Step07 选择列联表单元格的输出排列顺序Step08 完成操作3.4.3 实例图文分析:大学生身体素质调查在一次上海大学生身体素质的实际调查中,选择了部分大专院校的学生进行实际问卷调查,收集的数据见3-4.sav。调查内容主要 包括:性
24、别、出生日期、身高、体重、血型、教育背景、学科、男女身高级别和男女体重级别等内容。请根据调查数据分析下面问题:(1)进行“性别”和“体重级别”双因素交叉作用下的列联表分析,并研究“性别”对“体重级别”有无显著性影响。(2)进行“教育背景”和“身高级别”双因素交叉作用下的列联表分析,并研究“教育背景”对“身高级别”有无显著性影响。4.SPSS的均值比较过程SPSS主要有以下模块实现均值比较过程。 One-Sample T Test:单样本t检验。 Independent-Sample T Test:两个独立样本均值的t检验。 Paired-Sample T Test:两个配对样本均值的t检验。4
25、.1 SPSS在单样本t检验的应用单样本t检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在明显的差异。它是对总体均值的假设检验。如果概率P值小于或等于显著性水平,则拒绝零假设;如果概率P值大于显著性水平,则接受零假设。4.1.2 单样本t检验的SPSS操作详解Step01:打开单样本t检验对话框【Analyze(分析)】【Compare Means(比较均值)】【One-Sample T Test(单样本T检验)】命令Step02:选择检验变量Step03:选择样本检验值Step04:其他选项设置Step05:单击【OK】按钮结束操作,SPSS软件自动输出结果4
26、.1.3 实例图文分析:交通通勤时间(见数据文件4-1.sav)1. 实例内容根据一份公共交通调查报告显示,对于那些在一个城市乘车上下班的人来说,平均通勤时间为19分钟,其人数总量为100万300万。假设一个研究者居住在一个人口为240万的城市里,想通过验证以确定通勤时间是否和其他城市平均水平是否一致。他随机选取了26名通勤者作为样本,收集的数据如下所示。假设通勤时间服从正态分布,这位研究者能得到什么结论?19 16 20 23 23 24 13 19 23 16 17 15 1427 17 23 18 18 20 18 18 18 23 19 19 282.实例操作(略)4.2 SPSS在两
27、独立样本t检验的应用4.2.2 两独立样本t检验的SPSS操作步骤Step01:打开两独立样本t检验对话框。【Analyze(分析)】【Compare Means(比较均值)】【Independent- Samples T Test(独立样本T检验)】命令Step02:选择检验变量Step03:选择分组变量Step04:定义组别名称Step05:单击【OK】按钮,结束操作,SPSS软件自动输出相关结果4.2.3 实例图文分析:机场等级分数比较(见数据文件4-3.sav)1. 实例内容国际航空运输协会(The International Air Tran sport Association)对商
28、务旅游人员进行了一项调查,以便确定多个国际机场的等级分数。最高可能分数是10分,分数越高说明其等级也越高。假设有一个由50名商务旅行人员组成的简单随机样本,要求这些人给迈阿密机场打分。另外有一个由50名商务旅行人员组成的样本,要求这些人给洛杉矶机场打分。这两个组人员打出的等级分数如表4-5所示。请你判断迈阿密机场和洛杉矶机场的等级评分是否相同? 4.3 SPSS在两配对样本t检验的应用在现实中,总体或样本之间不仅仅表现为独立的关系,很多情况下,总体之间存在着一定的相关性。当分析这些相关总体之间的均值关系时,就涉及到两配对样本的t检验。配对样本主要包括下列一些情况:(1)同一实验对象处理前后的数
29、据。例如对患肝病的病人实施某种药物治疗后,检验病人在服药前后的差异性。(2)同一实验对象两个部位的数据。例如研究汽车左右轮胎耐磨性有无显著差异。(3)同一样品用两种方法检验的结果。例如对人造纤维在60度和80度的水中分别作实验,检验温度对这 种材料缩水率的影响性。(4)配对的两个实验对象分别接受不同处理后的数据。例如对双胞胎兄弟实施不同的教育方案,检验他们在学习能力上的差异性。进行配对样本检验时,通常要满足以下三个要求。(1)两组样本的样本容量要相同;(2)两组样本的观察值顺序不能随意调换,要保持一一对应关系;(3)样本来自的总体要服从正态分布。4.3.2 两配对样本t检验的SPSS操作详解S
30、tep01:打开两配对样本t检验对话框【Analyze(分析)】【Compare Means(比较均值)】【Paired-Samples T Test(配对样本T检验)】命令Step02:选择配对变量Step03:其他选项选择Step04:单击图【OK】按钮,结束操作,SPSS软件自动输出结果4.3.3 实例图文分析:看电视和读书的时间(见数据文件4-5.sav)1. 实例内容“每月读书俱乐部”的成员进行了一项调查,以确信其成员用于看电视的时间是否比读书的时间多。假定抽取15个人组成的样本,得到了下列有关他们每周观看电视的小时数和每周读书时间的小时数的数据,见表4-11所示。你能够得到结论:“
31、每月读书俱乐部”的成员每周观看电视的时间比读书的时间更好吗?表4-11 每天观看电视和读书时间(单位:小时)被调查者123456789101112131415看电视时间10141618151410124816581911读书时间6168101081414785103106 5.SPSS 的方差分析多个总体均值是否相等的假设检验问题了,所采用的方法是方差分析。方差分析中有以下几个重要概念:因素、水平、单元、元素、交互作用5.1.2 方差分析的基本思想表5-1 某公司产品销售方式所对应的销售量 序号销售方式 12345水平均值方式一778681888383方式二959278968990方式三717
32、668817474方式四808479708279总均值81.5在表5-1中,要研究不同推销方式的效果,其实就归结为一个检验问题,设为第i(i=1,2,3,4)种推销方式的平均销售量,即检验原假设是否为真。从数值上观察,四个均值都不相等,方式二的销售量明显较大。从表5-1可以看到,20个数据各不相同,这种差异可能是由以下两方面的原因引起的。一是推销方式的影响,不同的方式会使人们产生不同消费冲动和购买欲望,从而产生不同的购买行动。 这种由不同水平造成的差异,称之为系统性差异。二是随机因素的影响。同一种推销方式在不同的工作日销量也会不同,因为来商店的人群数量不一,经济收入不一,当班服务员态度不一,这
33、种由随机因素造成的差异,我们称之为随机性差异。两个方面产生的差异用两个方差来计量:一是变量之间的总体差异,即水平之间的方差。二是水平内部的方差。前者既包括系统性差异,也包括随机性差异;后者仅包括随机性差异。5.1.3 方差分析的基本假设(1)各样本的独立性。即各组观察数据,是从相互独立的总体中抽取的。(2)要求所有观察值都是从正态总体中抽取,且方差相等。在实际应用中能够严格满足这些假定条件的客观现象是很少的,在社会经济现象中更是如此。但一般应近似地符合上述要求。水平之间的方差(也称为组间方差)与水平内部的方差(也称组内方差)之间的比值是一个服从F分布的统计量F = 水平间方差/ 水平内方差 =
34、 组间方差 / 组内方差5.2 SPSS在单因素方差分析中的应用用来研究一个因素的不同水平是否对观测变量产生了显著影响应用方差分析时,数据应当满足以下几个条件:在各个水平之下观察对象是独立随机抽样,即独立性;各个水平的因变量服从正态分布,即正态性;各个水平下的总体具有相同的方差,即方差齐;2.基本原理方差分析认为:SST(总的离差平方和)=SSA(组间离差平方和)+SS E(组内离差平方和)如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明
35、观测变量的变动主要由随机变量因素引起的。SPSS将自动计算检验统计量和相伴概率P值,若P值小于等于显著性水平,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零假设,认为因素的不同水平没有对观测变量产生显著影响。5.2.2 单因素方差分析的SPSS操作详解Step01:打开主操作窗口【Analyze(分析)】【Compare Means(比较均值)】【One-Way ANOVA(单因素ANOV A)】命令Step02:选择因变量Step03:选择因素变量Step04:均值精细比较Step05:均值多重比较5.2.3 实例图文分析:信息来源与传播(见数据文件5-1.sav)1.
36、 实例内容某机构的各个级别的管理人员需要足够的信息来完成各自的任务。最近,一项研究调查了信息来源对信息传播的影响。在这项特定的研究中,信息来源是上级、同级和下级。在每种情况下,对信息传播进行测度:数值越高,说明信息传播越广。检验信息来源是否对信息传播有显著影响?你的结论是什么?2.实例操作由于不同的信息来源可能导致信息传播测度不同。本案例中,信息来源是因素,“上级、同级和下级”是因素的三种不同水平,信息传播测度是因变量(观测变 量)。由于这里有三个水平,因此不能采用两样本的均值检验过程,故考虑采用单因素方差分析法。进行如下假设检验:H0:三种不同信息来源对信息传播测度平均值没有显著性影响;H1
37、:三种不同信息来源对信息传播测度平均值存在显著性影响。5.3 SPSS在多因素方差分析中的应用方法概述多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。5.3.2 多因素方差分析的SPSS操作详解Step01:打开主对话框【Analyze(分析)】【General Linear Model (一般线性模型)】【Univariate(单变量)】命令Step02:选择分析变量(因变量、因
38、素变量、随机变量、协变量、权重变量)Step03:模型选择Step04:选择比较方法Step05:选择轮廓图Step06:选择多重比较Step07:预测值保存Step08:其他选项选择5.3.3 实例图文分析:薪金的区别(见数据文件5-3.sav)1 实例内容假设某一杂志的记者要考察职业为财务管理、计算机程序员和药剂师的男女雇员其每周的薪金之间是否有显著性差异。从每种职业中分别选取了5名男性和5名女性组成样本,并且记录下来样本中每个人的周薪金(单位:美元)。所得数据见表5-11所示。请你分析职业和性别对薪金有无显著影响。2 实例操作由于薪金水平的高低和所从事的职业、性别等因素都有关系。因此这里
39、要考虑两个因素水平下的薪金差异问题,即建立双因素的方差分析模型。本案例中,职业和性别是两个影响因素,而每周薪金是因变量。同时,我们也要考虑职业和性别这两个因素之间有无交互作用。5.4 SPSS在协方差分析中的应用协方差分析是将那些很难控制的因素作为协变量。在排除协变量影响的条件下,分析因素变量对观察变量的影响,从而更加准确地对因素变量进行评价。在协方差分析中,将观察变量总的离差平方和分解为由因变量引起的、由因变量的交互作用引起的、由协变量引起的和由其他随机因 素引起的。5.4.2 协方差分析的SPSS操作详解1、确定是否存在协变量2、“Univariate”过程中引入协变量由于协方差分析也是采
40、用【General Linear Model(一般线性模型)】中的【Univariate(单变量)】命令,因此它的基本操作和多因素方差分析的SPSS操作是相同的,这里就不再重复了5.4.3 实例图文分析:人体的血清胆固醇(见数据文件5-4.sav)1 实例内容某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量可能与年龄有关系,具体资料数据见表5-17所示。请建立模型分析体重对人体胆固醇含量的影响,同时也要兼顾年龄的因素。表5-17 血清胆固醇含量正常组年龄48335143446349424047414156胆固醇3.54.65.85.84.98.73.65.54.95.14
41、.14.65.1超重组年龄58417176493354653952455867胆固醇7.34.78.48.85.14.96.76.46.07.56.46.89.22 实例操作案例中需要分析体重对人体的血清胆固醇有无直接影响,同时体重这个因素分为正常组和超重组两个水平,因此可以考虑单因素方差分析模型。但如果仅分析体重的影响作用,而不考虑实验对象 年龄的差异,那么得出的结论可能是不准确的。这是因为年龄的大小在一定程度上会影响人体的血清胆固醇含量的高低。因此,为了更准确描述体重对人体的血清胆固醇的影响,就应该尽量排除年龄因素对分析结果的影响。所以将年龄作为协变量引入模型,考虑建立协方差分析模型。在打
42、开或建立数据文件5-4.sav后,具体操作步骤如下。Step01:选择观测变量选择菜单栏中的【Graphs(图形)】【Legacy Dialogs(旧对话框)】 【Scatter/Dot(散点图/点图)】【Simple/ Scatter(简单分布)】命令,弹出【Simple Scatter plot(简单分布图)】对话框Step02:打开对话框选择菜单栏中的【Analyze(分析)】【General Linear Model (一般线性模型)】【Univariate(单变量)】命令,弹出【Univariate(单变量)】对话框。Step03:选择分析比较在候选变量列表框中选择“chol”变量作
43、为因变量,将其添加至【Dependent Variable(因变量)】列表框中。选择“group”作为因素变量,将其添加至【Fixed Variable(s)(固定变量)】列表框中。选择“age”作为协变量,将其添加至【Covariate(s)(对比)】列表框中。Step05:其他选项选择单击【Options】按钮,弹出【Options(选项)】对话框。勾选【Descriptive(描述性统计量)】复选框表示输出描述性统计量;勾选【Homogeneity-of-variance(方差同质性检验)】复选框表示输出方差齐性检验表。再单击【Continue按钮】,返回主对话框。提示:根据数据特点及您
44、的实验要求,选择不同的均值多重比较方法。Step06:完成操作最后,单击【OK(确定)】按钮,操作完成。7.SPSS的相关分析7.2 SPSS在简单相关分析中的应用7.2.2 简单相关分析的SPSS操作详解Step01:打开主菜单【Analyze(分析)】【Correlate(相关)】【Bivariate(双变量)】命令Step02:选择检验变量Step03:选择相关系数类型对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用Pearson 相关分析;对于完全等级的离散变量必须使用等级相关分析相关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用
45、Spearman 或Kendall相关。Step04:假设检验类型选择Step05:其他选项选择Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果7.2.3 实例分析:股票指数之间的联系(见数据文件7-1.sav)1. 实例内容道琼斯工业平均指数(DJIA)和标准普尔指数500(S&P 50 0)都被用做股市全面动态的测度。DJIA是基于30种股票的价格动态;S&P 500是由500种股票组成的指数。有人说S&P 500 是股票市场功能的一种更好的测度,因为它基于更多的股票。 表7-2显示了DJIA和S&P 500在1997年10周内的收盘价。请计算它们之间的样本相关系数。不仅如此,样本相关系数告诉我们 DJIA和S&P 500之间的关系是怎样的?2. 实例操作表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时根据两个股票指数的散点图,可见它们呈显著的线性相关,因此可以采用Pear son相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的Kendall和Spearman相关系数。7.3 SPSS在偏相关分析中的应用偏相关分析就是在研