《统计学常用方法之SPSS应用.doc》由会员分享,可在线阅读,更多相关《统计学常用方法之SPSS应用.doc(82页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、教材统计学常用方法-SPSS应用- 常用统计分析方法SPSS应用General Method of Statistical Analysis¾¾¾¾ SPSS Application 前 言?统计学?是一门计算科学,是自然科学在社会经济各领域中的应用学科,是许多学科的高校在校本科生的必修课程。在统计学原理的学习和统计方法的实际应用中,经常需要进行大量的计算。因此,统计分析软件问世使强大的计算机功能得到充分发挥,不仅能够减轻计算工作量,计算结果非常准确,而且还节省了统计分析时间。因此,应用统计分析软件进行数据处理已经成为社会学家和科学工作者
2、必不可少的工作内容。为了使高校的学生能够更好的适应社会的开展和需求,学习和使用统计软件已经成为当前管理学、社会学、自然科学、生物医学、工程学、农业科学、运筹学等学科的本科生或研究生所面临的普遍问题。为了使大学生和专业人员在掌握统计学原理的根底上能够正确地运用计算机做各种统计分析,掌握统计分析软件的操作是非常有必要的。现将常用的SPSS统计分析软件处理数据和分析数据的根本方法编辑成册,供高校学生及对统计分析软件有兴趣的人员学习和参考,希望能够对学习者有所帮助。本书以统计学原理为理论根底,以高等学校本科生学习的常用的统计方法为主要内容,重点介绍这些统计分析方法的SPSS 软件的应用。为了便于理解,
3、每一种方法结合一个例题解释SPSS软件的操作步骤和方法,并且对统计分析的输出结果进行相应的解释和分析。同时也结合工业、农业、商业、医疗卫生、文化教育等实际问题,力求使学生对统计分析方法的应用有更深刻的认识和理解,以提高学生学习的兴趣和主动性。另外,为了方便学习者的查询,将常用统计量的数学表达式作为附录1,SPSS中所用的主要函数释义作为附录2,希望对学习者能够的所帮助。 编者目录 第一章 数据文件的建立及根本统计描述. 11.1 SPSS的启动及数据库的建立. 11.1.2 SPSS简介. 11.1.2 启动SPSS软件包. 21.1.3 数据文件的建立. 31.2 数据的编辑与整理. 51.
4、2.1 数据窗口菜单栏功能操作. 51.2.2 Date数据功能. 51.2.3 Transform 变换及转换功能. 71.2.4 数据的编辑. 81.2.5 SPSS对变量的编辑. 131.3 根本统计描述. 161.3.1 描述统计分析过程. 161.3.2 频数分析. 181.4 交叉列联表分析. 291.4.1 交叉列联表的形成. 301.4.2 两变量关联性检验Chi-square Test卡方检验. 31 第二章 均值比拟检验与方差分析. 372.1 单个总体的 t 检验One-Sample T Test分析. 372.2 两个总体的 t 检验. 392.2.1 两个独立样本的t
5、检验Independent-sample T Test. 392.2.2 两个有联系总体间的均值比拟Paired-Sample T Test. 412.3 单因素方差分析. 432.4 双因素方差Univariate分析过程. 47 第三章 相关分析与回归模型的建立与分析. 553.1 相关分析. 553.1.1 简单相关分析. 553.1.1.1 散点图. 553.1.1.2 简单相关分析操作. 573.1.2 偏相关分析. 583.2 线性回归分析. 613.3 曲线估计. 69 第四章 时间序列分析. 764.1 实验准备工作. 764.1.1 根据时间数据定义时间序列. 764.1.2
6、 绘制时间序列线图和自相关图. 764.2 季节变动分析. 804.2.1 季节分析方法. 814.2.2 进行季节调整. 82 第五章 非参数检验. 855.1 Chi-Square Test 卡方检验. 865.2 一个样本的K-S检验. 885.3 两个独立样本的检验Test for Two Independent Sample. 915.4 两个有联系样本检验Test for Two related samples. 945.6 多个样本的非参数检验K Samples Test. 965.6 游程检验Runs Test. 100 附录1 局部常用统计量公式. 1046.1 数据的根本统
7、计特征描述. 1046.2 总体均值检验统计量. 1056.3 方差分析中的统计量. 1076.4 回归分析模型. 1096.5 非参数检验. 115 附录2 SPSS函数. 120 第一章 数据文件的建立及根本统计描述在社会各项经济活动和科学研究过程中,经常获得许多数据,而这些数据中包含着大量有用的信息。假设要准确地、科学地提取这些信息,就要应用各种统计分析方法,其中最根本的方法是数据的根本统计描述。通过数据的根本统计描述,可以得到数据的分布状况,数据的主要特征值,时间序列的趋势性,是否存在异常值以及数据的大致图形等。当然,要实现对数据的统计分析和描述,首先要从建立数据文件开始。这一章主要介
8、绍数据文件的建立和数据的根本统计描述方法。1.1 SPSS的启动及数据库的建立1.1.2 SPSS简介SPSSStatistics Package for Social Science for Windows是一种运行在Windows系统下的社会科学统计软件软件包。SPSS软件包集数据整理、分析过程、结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用方便,输出数据表格图文并貌,并且随着它的功能不断完善,统计分析方法不断充实,大大提高了统计分析工作的效率。从1968年由美国斯坦福大学开发使用至今,已经拥有全球数以万计的用户,分布在通信、医疗、银行、证券、保险、制造、商业、
9、市场研究、科学教育等众多的行业领域,成为世界上应用最广泛的专业统计软件之一。SPSS的根本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容包括描述统计、列联分析,总体的均值比拟、相关分析、回归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类,每个类中还有多个专项统计方法。SPSS设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形,能够满足用户的不同需求。一 SPSS的运行方式SPSS提供了3种根本运行方式:完全窗口菜单方式,程序运行方式、混合运行方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自己的SPSS命令程序,通过语句直接运行。
10、这里只介绍完全窗口菜单管理方式,这种操作方式简单明了,除数据输入工作需要键盘外,大局部的操作命令、统计分析方法的实现是通过菜单、图标按钮、对话框来完成的,非常适用于一般的统计分析人员和一般统计方法的应用者。 SPSS中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗口操作与Windows应用软件操作风格一致。另一类是统计分析对话框,统计分析对话框可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类变量及统计方法是对话框的主要任务。有关对话框的详细操作将在后面的统计方法的实验中解释。二 SPSS的实验环境要求1、系统运行环境SPSS10.0以上版本软件包可以工作在两种模式下,
11、单机模式和作为网络系统的用户界面模式。SPSS for Windows软件包可以运行在微软公司的Windows98、Windows NT 4.0、Windows ME、Windows2000和Windows XP操作系统之下。由于统计分析软件的数据量比拟大,所以系统运行需要大于16M以上空间。2、辅助软件环境SPSS可以直接将SPSS数据文件保存为Excel工作表,也可以直接翻开一个Excel工作表,因此,为了方便数据录入许多人对Excel工作表编辑比拟熟习,应在操作系统下安装一个Excel软件。另外,许多数据在处理之前可能保存在某个数据库中,例如FoxBase、Sybase、SQL_Serv
12、er、Oracle等等,如有需要从数据库中获取数据的分析,应在操作系统下安装相应的数据库管理系统。三 SPSS的主要界面SPSS的主要界面有数据编辑窗口和结果输出窗口。数据编辑窗口与微软的Exdel类似,但SPSS的统计功能更多。SPSS的结果输出窗口是显示统计分析的结果,此窗口的内容可以以结果文件.spo的形式保存。数据编辑窗口和结果输出窗口的详细描述将在有关SPSS的数据文件建立的内容中查到。四 SPSS的帮助系统SPSS对一些根本模块中的统计提供了帮助,可以通过单击Help菜单中的Statistics Coach命令,选择所需要的统计指导。 1.1.2 启动SPSS软件包当用户在操作系统
13、下运行SPSS软件后,计算机屏幕上出现一个对话框,如图1.1所示: 图1.1 SPSS启动后操作对话框对话框包括一个六选一单项选择对话框和一个复选对话框,其内容为:l Run the tutorial 运行操作指南;l Type in data 输入数据选项,建立新的数据集时可选择此项;l Run an existing query 运行一个已经存在的数据文件选项;l Create new query using Database Wizard 用数据库处理工具建立新文件;l Open an existing date source 翻开一个已经存在的数据文件;l Open another t
14、ype of file 翻开其他类型的文件。l Dont show this dialog in the future 是一复选对话框,选中该复选项后,下次启动SPSS时将不会显示对话框,直接显示数据编辑窗口。1.1.3 数据文件的建立当对话框选择Type in data后,点击OK,系统将显示出SPSS软件包数据编辑主窗口,数据文件的建立就是在数据编辑窗口中完成的。数据编辑窗口可以显示两张表,分别是Data View见图1.2和Variable View见图1.3,通过点击下端的2个同名窗口标签按钮实现相互切换。 数据编辑区是SPSS的主要操作窗口,是一个二维平面表格,用于对数据进行各种编辑
15、;标尺栏由纵向标尺栏和横向标尺栏,横向标尺栏显示数据变量,纵向标尺栏显示数据顺序如时间顺序。Data View表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。Variable View表用来定义和修改变量的名称、类型及其他属性,如图1.3所示。图1.3 Variable View 表在Variable View表中,每一行描述一个变量,依次是:Name:变量名。变量名必须以字母、汉字及开头,总长度不超过8个字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个字符不能是句号。Type:变量类型。变量类型有8 种,最常用的是Numeric
16、数值型变量。其它常用的类型有:String字符型,Date日期型,Comma逗号型隔3位数加一个逗号等。Width:变量所占的宽度。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在Date View 中所显示的列宽默认列宽为8。Align:数据对齐格式默认为右对齐。Measure:数据的测度方式。系统给知名义尺度、定序尺度和等间距尺度三种默认为等间距尺度。如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量Var0
17、0001,Var00002等。定义了变量的各种属性后,回到Data View表中,就可以直接在表中录入数据。输入数据后可以点击Save或Save as作为数据文件保存。另外对于统计分析的结果也可以作为文件保存起来。为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接翻开和保存下述类型的文件。SPSS DOS版本产生的数据文件*.sys;Excel 报表程序产生的数据文件*.xls;DBASE 数据库格式文件*.dbf;SAS统计软件产生的数据文件。1.2 数据的编辑与整理当录入数据之后,就可以对原始数据进行整理和分析,关于数据的
18、整理和分析都是在数据窗口完成的。下面将介绍SPSS统计分析软件在数据窗口的主要操作方式和菜单相应的功能。1.2.1 数据窗口菜单栏功能操作数据编辑窗口的主菜单如图1.4所示,主菜单中的具体功能包括:图1.4 SPSS主菜单 1.File:文件操作。2.Edit:文件编辑。3.View:视图编辑。4.Data:数据操作。5.Transform:数据转换。6.Analyze:统计分析方法。 7.Graphs: 图形编辑。8.Utilities:实用程序。 9.Windows:窗口控制。10.Help:帮助。 在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计图形的建立与编辑等操
19、作。1.2.2 Date数据功能数据编辑窗口的Data菜单为用户创立和定义数据提供了方便的功能,如图1.5所示。这个菜单是SPSS统计软件数据整理的特有功能菜单。它的功能包括:对变量、观测量的编辑处理;对变量数据的变换;对观察量数据整理。这些功能为各种统计分析要求提供极其灵活了数据整理功能,用户可以根据不同统计分析对数据的要求对数据进行整理。 一、定义和编辑变量、观测量的命令Define Variable Properties 用于定义变量属性;Copy Data Properties 由外部文件和工作文件拷贝数据变量和属性;Define Dates 定义或编辑日期变量格式;Insert Va
20、riable 在数据编辑窗口插入一个变量;Insert Case 在数据编辑窗口插入一个观测量;Goto Case 光标跳转到某一指定观测量。二、变量数据变换的命令Sort Cases 对观测量进行排序;Transpose 对观测量进行转置;Restructure 对现有的观测量进行重新构造,形成新格式的数据文件;Merge File 把外部文件数据合并到工作文件中;Aggregate 对数据进行分类或不分类汇总,产生新文件或代替工作文件。Identify Duplicate Cases 标识重复观测量;Orthogonal Design 进行正交设计。三、观察量数据整理的命令Split Fi
21、le 拆分数据文件的观测量,观测量进行条件分组;Select Cases 选择观测量;Weight Cases 对观测量进行加权处理。通过选择上述命令,可以实现对数据的整理编辑。1.2.3 Transform 变换及转换功能数据编辑窗口的Transform菜单为用户创立和定义复杂的数据提供了方便的功能,如图2.3所示。它与Data菜单共同使用,可对根本的数据进行重新编辑,形成新的变量和观测量。这个菜单主要对变量进行操作,分为三局部的功能。这些功能也为各种统计分析要求提供极其灵活了数据处理功能。 图1.6 Transform菜单项示意图 一. 通过根本变量创立各种新变量; Compute 计算产
22、生新变量,SPSS提供了10类100多个函数,通过该菜单可以用表达式产生一个新变量;Random Number Seed 创立随机数种子;Create Times Series 创立时间序列变量;二. 创立各种参数变量;Count 创立一个计数变量,用于统计计数;Recode 对变量值重新编码;Rank Cases 为观测量排秩,求得的秩在数据窗口作为一个新变量保存;Categorize Variables 建立新的分组变量,使数据分成假设干个组;Automatic Recode 对变量值自动编码,产生一个连续的变量值编码;Replace Missing Values 创立替代缺失值变量;三.
23、运行其它自定义的转输程序。Run Pending Transform 运行其它转换程序。在一般的情况下,通过Date菜单和Transform菜单的操作就可以实现对原始数据的整理和变换。1.2.4 数据的编辑在Data View中,用鼠标左键单击数据表左边框的观测个体序号,这一行值就会被选中,用鼠标左键单击上边框的变量名,这个列就被选中,和其它Windows中的操作类似,也可以用鼠标对选中一局部单元格,选中的行、列、单元格后,单击鼠标右键,可以对它们进行复制、删除、剪切等操作。如果需要对已经输入的数据进行修改,就要对已经存在的数据进行编辑,SPSS有许多数据编辑功能。下面介绍几种常用的数据编辑功
24、能。一、插入一个新观测量Case插入一个新观测量数据的命令是Insert Cases。在数据窗口主菜单上单击Date®Insert Cases命令,可以在光标所在位置的前上一行插入一行新的观测个体,可以输入新的观测数据。二、查找指定的观测量数据查找指定的观测数据的命令是Go to Case。在数据窗口单击Date®Go to Case,弹出一个对话框,如图1.7所示:输入要找的观测量的序号后,点OK按钮,数据表中光标就会指到选定的观测量个体。图1.7 Go To Case对话框三、 观测数据排序给观测量数据排序的命令是Sort Cases。在数据窗口单击Date®Sor
25、t Cases,翻开Sort Cases对话框见图1.8 。 图1.8 Sort Case对话框从对话框左侧的变量列表中选择排序变量,点击右箭头按钮参加Sort by框中,然后在Sort Order栏中选择排序顺序:Ascending 观测个体按照选定的排序变量值由小到大的升序排列;Descending 观测个体按照选定的排序变量值降序排列。注意:观测个体.排序变量可以是一个或多个,中选择多个排序变量时,首先按第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排序,依次类推。注意在排序的时候,观测个体整行的值一同变到新位置,而不是只有排序变量那一列变动。但数据表中左边框上的
26、序号并不随着变动,因此,为了保存原始数据的信息,最好自己定义一个变量来记录观测个体的序号。四、在数据中选取子集如果需要从数据文件中选取一局部数据,可以在数据编辑窗口单击Data Select Case,翻开Select Case对话框,如图1.9所示: 图1.9 Select Case对话框在该对话框的Select栏中选择挑选数据子集的方式单项选择:l All case:选择所有数据;l If condition is satisfied: 按指定条件选择数据。单击If按纽,翻开Select Case:If对话框,如图1.10所示,先选择变量,然后定义条件。l Random Sample of
27、 cases:对观察值进行随机抽样。单击Sample 按纽,翻开Select Case:Random sample对话框。如图1.11所示。 图1.10 Select Case:If对话框在Sample Size栏中有两种选择方式,一种是大概抽样Approximately,即键入抽样比例后由系统随机抽样;另一种是精确抽样(Exactly),要求输入从第几个观察值起抽取多少数据。 图1.11 Select Case:Random Sample对话框l Based on time or case range:顺序抽样。单击Range按纽,翻开Select Case: Range对话框,用户自行定义
28、从第几个观察值开始抽到第几个观察值结束。l Use filter variable:用指定变量作过滤。先选择一个变量,系统自动在数据管理器中将该变量值为0的观测单位标上删除记号,系统对标有删除记号的观测单位不作分析。选择了挑选数据子集的方式后,单击OK,在数据窗口可看到新的变量filter_s。如在数据文件SY-1中,选择年龄大于48岁的人作为选择子集。那么满足条件的年龄大于48岁的相应的新变量数据为1,否那么为0。五、数据分类汇总数据分组汇总用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以数据库SY-2两个班的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇总命令实现
29、。具体操作如下。1.指定分类变量和汇总变量。翻开数据库SY-2,在数据窗口单击Date®Aggregate命令,翻开Aggregate Date对话框。如图1.12所示: 图1.12 Aggregate Date对话框2. 在变量名列表框中选择分类变量性别进入Break Variable(s)。3. 在变量名列表框中选择汇总变量Math进入Aggregate Variable(s)。4. 单击Function按纽,翻开Aggregate Date:Function对话框,如图1.13所示。在此对话框中可以选择平均值、数据和、标准差的形式,特别值形式,百分数形式、频数形式等其中之一的方法
30、进行分类汇总。选择分类汇总的函数形式后返回Aggregate Date对话框中。 图1.13 Aggregate Date:Aggregate Function对话框5. 在Aggregate Date对话框中指定汇总文件的保存路径。有两种选择:一种是选中创立新数据文件,通过File按纽,重新指定结果文件名。一种是替代原来数据文件,用分类汇总结果覆盖当前编辑窗口的数据。6. 单击Name&Label按纽,可以重新指定结果文件中的变量名并参加变量标签。SPSS默认的结果文件中的变量名为原变量名最后加上_1.7. 如果希望在结果文件中保存各分类组的数据个数,可以选择Save number of c
31、ase in break group as variable项。最后单击OK,可得相应的数据文件。 六、缺失值的替代方式如果用户希望对缺失值进行定义,可以采用以下的操作:在数据窗口点击Transform®Replace Missing Values,翻开Replace Missing Values,对话框,如图.1.14.所示: 图1.14 Replace Missing Values对话框在变量中选择具有缺失值的变量进入New Variable框内,系统可以自动产生替代缺失值的新变量,也可处定义新变量。然后在Method的下拉菜单中选择缺失值的替代方式。五种方式依次是:Series
32、mean 用该变量所有非缺失值的平均值替代缺失值;Mean of nearly point 用缺失值相邻点的的非缺失值的平均数据替代缺失值;Median of nearly point 用缺失值相邻点的的非缺失值的中位数替代缺失值;Linear interpolation 用缺失值相邻点的的非缺失值的中点值替代缺失值;Linear trend at point 用线性拟合方式替代缺失值。七、数据秩序确实定如果用户需要对已有的数据变量排秩序,如对数据SY-1中两个班的数学成绩分别排知名次,可以在数据窗口采用以下操作。 1. 单击Transform®Rand Cases,翻开Rand Ca
33、ses对话框,如图1.15所示: 图1.15 Rand Cases对话框2. 从左边变量名列表框中选择变量数学也可选择多个变量进入Variable(s)框中,选择变量班级进入By框中,那么系统排序时将按照进入By的变量值“班级进行分别排序。3. 单击Ties按纽,选择TiesTies是指两个或两个以上的数据相等的情况的处理方式。由于秩与数据个数是一一对应的,当数据有相同的时,确定它们相应的秩有三种处理方式:对应秩的Mean平均值、Low最小值和high最大值。如本例选择最大值。选择后返回在主对话框。点击OK,就可以在数据窗口看到排序结果。Rank Types按纽提供排秩方式。单击Rank Ty
34、pes按纽,翻开types对话框,从中选择排秩类型,排秩类型从左到右依次是:Rank普通排序系统默认,新变量的值就是秩;Fractional rank as% 累计百分数排序;Savage score以指数分布为根底的原始分排序;Sum of Case weights 以分组例数之和的权重排序;Fractional rank以秩变量除以分组例数之和排序;Ntile先给定一个大于1 的整数,系统按照此数的范围确定秩。1.2.5 SPSS对变量的编辑一、插入一个新变量插入一个新变量的命令是Insert Variable。在数据窗口单击DataInsert Variable,会在光标所在位置的前一列
35、插入一个新的变量,变量名字和属性可以在Variable View窗口中定义。二、已存在的变量生成新变量对于已存在的数据变量,根据需要进行计算生成新变量的命令是Compute。在数据窗口单击Transform® Compute,翻开Compute Variable对话框,如图1.16所示。在对话框左上方Target Variable栏中,键入即将生成的新变量的名称,并单击Type & Lable按纽确定变量标签及数据类型。对话框的左下栏中给出了数据文件中所有可用的变量列表,我们可以用右箭头按钮从中选取所需的变量进入右上方的Numeric Expression栏中,该栏存放运算表达式,运算
36、表达式中所需要的常用函数可以从下的Functions列表中直接选取。这些常用函数见附录2和其它语言中的函数名称类似,在框中按字母顺序排列,用鼠标选中某个函数,用Functions右面的上箭头按钮参加数值表达式中,对话框中间是一个小键盘,可以用来输入数字、运算符号等。Compute Variable对话框的下面还有一个if按钮,可以选一局部满足某种条件的观测个体来做运算,不满足条件观测,其新变量值缺失。 图1.16 Compute Variable对话框如图1.16表示的是数据SY-2中每个学生的数学和物理总成绩。在Compute Variable对话框中填好新变量名称和运算表达式后,点击OK按
37、钮,就可以在数据文件中看到,已经生成了一个新变量Total。三、产生计数变量如果用户需要对满足某项条件的数据进行计数,可以使用Count命令。以学生成绩数据SY-1为例,说明具体操作步骤:在数据窗口单击Transform®Count,翻开Count Occurrence of Value within Cases对话框,如图1.17所示: 图1.17 Count Occurrence of Value within Cases对话框先在Target Variable中指定一个变量可以是已经存在的变量或新变量,并定义变量标签,然后指定要统计的变量加到Numeric Variables框中
38、,再单击Define Values按纽,翻开Value to Count对话框。如图1.18所示: 图1.18 Count Values within Cases:Value to Count对话框在上面的对话框中,确定需要计数的数值,其Value值的设置项依次是:Value:输入某个值为清点对象;System-missing:以系统的缺失值为清点对象;System-or user missing:以系统或用户指定的缺失值为清点对象;Range:指定数值的计数区域:其中包括: through 在框内指定下限和上限lowest through : 在框内只指定上限; highest throug
39、h: 在框内只指定下限。图中给出的是计算到达优良标准,即学生到达80分以上课程数。确定了计数数值后,单击Add,使选择结果进入Values to count 框内。单击Continue按纽,返回主对话框中。如果需要,可以单击If按纽确定计数条件。最后点OK可在数据窗口得到计数变量。四、变量分组编码与自动分组编码Transform菜单下还有以上两条分组编码命令。对变量数据的重新分组编码,是指给每个变量值重新赋予一个码来描述他们的某些属性。码数相同的即为一组。比方,可以对年龄重新分组,19岁及以下年龄赋予一个编码1,20-29岁的年龄码赋予2,30-39岁年龄码赋予3,依此类推,这些码只能取正整数
40、值。从某种程度上来讲,编码也可以看做分组:一个组对应一个组号,这样就把这些人按年龄分为几个组,一目了然。变量重新编码命令为Recode,自动重新编码命令为Automatic Recode。Automatic 两者的区别是:Automatic Recode命令是SPSS系统自动设定码为正整数,而Recode可以根据用户的需要指定特别的码值。自动编码的具体操作为:在数据窗口单击Transform® Automatic Recode翻开Automatic Recode。对话框,从左侧的变量列表中选出被将重新编码的原变量,在New Name按钮右边空白栏中输入新的码值的变量名,点New Nam
41、e按钮放到上面的栏中。对话框底下有两个选项,以确定编码是从最小的开始,还是从最大的开始,点OK执行这条命令。需要注意的是,码与秩是不同的,请读者在学习时注意它们的区别。如果用户需要自定义分组的条件,可选择Recode命令。Recode命令有两个选项,分别是:Into Same Variables:数据编码后新的码值直接放到原来的变量中;Into Different Variables:数据编码后新的码值存到一个新变量中。为了防止数据丧失,尽量不要轻易选择前者。 选择后者的Recode命令对话框如图1.19所示, 图1.19 Recode Into Different Variables对话框选
42、择需要重新分组编码的变量进入Numeric Variable®Output框中,并在右边的Output Variable框中定义新的变量名及变量标签,单击Old and New Values按纽,翻开对话框,Old and New Values对话框最左侧有六个选项,用来确定原变量的取值区间或单个变量值,它们将被赋予一个相同的新码值,新的码值在右上方的New Value栏中填入。填好后Add按钮就被激活了,单击此按钮,就把这个旧的变量区间值以及新的码值到Old-News栏中。重复以上步骤,把所有的区间一个一个都输入后,点Continue按钮回到Recode Into Different
43、 Variables菜单,点OK按钮执行命令,即在数据窗口可得到需要的分组赋值变量。1.3 根本统计描述在建立了数据文件之后,需要对数据作进一步的考察,如了解数据的根本特征,如数据的均值、标准差、四分位点,数据的分布形态等,这个过程称为对数据进行根本统计描述。所以说,数据的根本统计描述的目的是:了解数据的根本特征和根本分布形状,为进一步分析做好充分准备。u 本节主要内容:数据的根本统计描述方法:频数分析、探索分析及交叉列联表分析等。1.3.1 描述统计分析过程描述统计分析是对数据进行根底性描述。可以得出数据的平均值(Mean)、和(sum)、标准差(Std deviation)、最大值(Max
44、)、最小值(Min)、方差(Variance)、极差(range)、平均值标准误(S.E.Mean),峰度(Kurtosis)、偏度Skewness等统计量。以2002年全国职工平均工资表为例数据库SY-2,介绍描述统计分析的具体操作步骤如下:1、首先翻开数据表SY-2,按照Analyze®Descriptives Statistics® Descriptives翻开Descriptives对话框,如图1.20所示图1.20 Descriptives 主对话框2、从左边源变量中选择一个或者几个变量进入右框中,单击Options按钮,翻开Options对话框,如图1.21所示: 图1.21 Descriptives Options对话框在对话框中最上面一行是Mean:均值,sum:算术和l Dispersion离差栏Std.Deviation 标准差 Minimum 最小值Variance 方差 Maximum 最大值