《SPSS在统计分析中的运用上机.doc》由会员分享,可在线阅读,更多相关《SPSS在统计分析中的运用上机.doc(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流SPSS在统计分析中的运用上机.精品文档.SPSS在统计分析中的运用第一章 数据文件的建立及基本统计描述21.1 SPSS的启动及数据库的建立21.1.2 SPSS简介21.1.2 启动SPSS软件包31.1.3 数据文件的建立41.2 数据的编辑与整理61.2.1 数据窗口菜单栏功能操作61.2.2 Date数据功能61.2.3 Transform 变换及转换功能81.2.4 数据的编辑91.2.5 SPSS对变量的编辑141.3 基本统计描述171.3.1 描述统计分析过程171.3.2 频数分析191.4 交叉列联表分析301.4.1
2、交叉列联表的形成311.4.2 两变量关联性检验(Chi-square Test卡方检验)33第二章 均值比较检验与方差分析2.1 单个总体的 t 检验(One-Sample T Test)分析362.2.1 两个独立样本的t检验(Independent-samples T Test)382.2.2 两个有联系总体间的均值比较(Paired-Sample T Test)412.3 单因素方差分析432.4 双因素方差(Univariate)分析过程47第三章 相关分析3.1 简单相关分析543.2 偏相关分析60附录 SPSS函数61第一章 数据文件的建立及基本统计描述1.1 SPSS的启动及
3、数据库的建立1.1.2 SPSS简介SPSS(Statistics Package for Social Science )for Windows是一种运行在Windows系统下的社会科学统计软件软件包。SPSS软件包集数据整理、分析过程、结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用方便,输出数据表格图文并貌,并且随着它的功能不断完善,统计分析方法不断充实,大大提高了统计分析工作的效率。从1968年由美国斯坦福大学开发使用至今,已经拥有全球数以万计的用户,分布在通信、医疗、银行、证券、保险、制造、商业、市场研究、科学教育等众多的行业领域,成为世界上应用最广泛的专业
4、统计软件之一。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体内容包括描述统计、列联分析,总体的均值比较、相关分析、回归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类,每个类中还有多个专项统计方法。SPSS设有专门的绘图系统,可以根据使用者的需要将给出的数据绘制各种图形,能够满足用户的不同需求。一 SPSS的运行方式SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自己的SPSS命令程序,通过语句直接运行。这里只介绍完全窗口菜单管理方式,这种操作方式简单明了,除数据输
5、入工作需要键盘外,大部分的操作命令、统计分析方法的实现是通过菜单、图标按钮、对话框来完成的,非常适用于一般的统计分析人员和一般统计方法的应用者。 SPSS中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗口操作与Windows应用软件操作风格一致。另一类是统计分析对话框,统计分析对话框可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类变量及统计方法是对话框的主要任务。有关对话框的详细操作将在后面的统计方法的实验中解释。二 SPSS的实验环境要求1、系统运行环境SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系统的用户界面模式。SPSS for Win
6、dows软件包可以运行在微软公司的Windows98、Windows NT 4.0、Windows ME、Windows2000和Windows XP操作系统之下。由于统计分析软件的数据量比较大,所以系统运行需要大于16M以上空间。2、辅助软件环境SPSS可以直接将SPSS数据文件保存为Excel工作表,也可以直接打开一个Excel工作表,因此,为了方便数据录入(许多人对Excel工作表编辑比较熟习),应在操作系统下安装一个Excel软件。另外,许多数据在处理之前可能保存在某个数据库中,例如FoxBase、Sybase、SQL_Server、Oracle等等,如有需要从数据库中获取数据的分析,
7、应在操作系统下安装相应的数据库管理系统。三 SPSS的主要界面SPSS的主要界面有数据编辑窗口和结果输出窗口。数据编辑窗口与微软的Exdel类似,但SPSS的统计功能更多。SPSS的结果输出窗口是显示统计分析的结果,此窗口的内容可以以结果文件.spo的形式保存。数据编辑窗口和结果输出窗口的详细描述将在有关SPSS的数据文件建立的内容中查到。四 SPSS的帮助系统SPSS对一些基本模块中的统计提供了帮助,可以通过单击Help菜单中的Statistics Coach命令,选择所需要的统计指导。 1.1.2 启动SPSS软件包当用户在操作系统下运行SPSS软件后,计算机屏幕上出现一个对话框,如图1.
8、1所示: 图1.1 SPSS启动后操作对话框对话框包括一个六选一单选对话框和一个复选对话框,其内容为:l Run the tutorial 运行操作指南;l Type in data 输入数据选项,建立新的数据集时可选择此项;l Run an existing query 运行一个已经存在的数据文件选项;l Create new query using Database Wizard 用数据库处理工具建立新文件;l Open an existing date source 打开一个已经存在的数据文件;l Open another type of file 打开其他类型的文件。l Dont sh
9、ow this dialog in the future 是一复选对话框,选中该复选项后,下次启动SPSS时将不会显示对话框,直接显示数据编辑窗口。1.1.3 数据文件的建立当对话框选择Type in data后,点击OK,系统将显示出SPSS软件包数据编辑主窗口,数据文件的建立就是在数据编辑窗口中完成的。数据编辑窗口可以显示两张表,分别是Data View(见图1.2)和Variable View(见图1.3),通过点击下端的2个同名窗口标签按钮实现相互切换。标尺栏菜单栏工具栏数据输入区数据编辑区窗口标签标题栏图1.2 SPSS for Windows 主窗口示意图状态栏当前数据栏显示区滚动
10、条数据编辑区是SPSS的主要操作窗口,是一个二维平面表格,用于对数据进行各种编辑;标尺栏由纵向标尺栏和横向标尺栏,横向标尺栏显示数据变量,纵向标尺栏显示数据顺序(如时间顺序)。Data View表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。Variable View表用来定义和修改变量的名称、类型及其他属性,如图1.3所示。图1.3 Variable View 表在Variable View表中,每一行描述一个变量,依次是:Name:变量名。变量名必须以字母、汉字及开头,总长度不超过8个字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最
11、后一个字符不能是句号。Type:变量类型。变量类型有8 种,最常用的是Numeric数值型变量。其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数加一个逗号)等。Width:变量所占的宽度。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在Date View 中所显示的列宽(默认列宽为8)。Align:数据对齐格式(默认为右对齐)。Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种(默认为等间距尺度)。如
12、果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量Var00001,Var00002等。定义了变量的各种属性后,回到Data View表中,就可以直接在表中录入数据。输入数据后可以点击Save或Save as作为数据文件保存。另外对于统计分析的结果也可以作为文件保存起来。为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接打开和保存下述类型的文件。SPSS DOS版本产生的数据文件*.sys;Excel 报表程序产生的数据文件*.xls;DBASE 数据库格式文件*.dbf;SAS统计软
13、件产生的数据文件。1.2 数据的编辑与整理当录入数据之后,就可以对原始数据进行整理和分析,关于数据的整理和分析都是在数据窗口完成的。下面将介绍SPSS统计分析软件在数据窗口的主要操作方式和菜单相应的功能。1.2.1 数据窗口菜单栏功能操作数据编辑窗口的主菜单如图1.4所示,主菜单中的具体功能包括:图1.4 SPSS主菜单1.File:文件操作。2.Edit:文件编辑。3.View:视图编辑。4.Data:数据操作。5.Transform:数据转换。6.Analyze:统计分析方法。 7.Graphs: 图形编辑。8.Utilities:实用程序。 9.Windows:窗口控制。10.Help:
14、帮助。 在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计图形的建立与编辑等操作。1.2.2 Date数据功能数据编辑窗口的Data菜单为用户创建和定义数据提供了方便的功能,如图1.5所示。这个菜单是SPSS统计软件数据整理的特有功能菜单。它的功能包括:对变量、观测量的编辑处理;对变量数据的变换;对观察量数据整理。这些功能为各种统计分析要求提供极其灵活了数据整理功能,用户可以根据不同统计分析对数据的要求对数据进行整理。图1.5 Data菜单项示意图拷贝数据属性定义变量属性插入一个变量定义日期变量定位观测量插入观测量重构数据结构数据文件转置观测量排序标识重复观测量分类或不分类
15、汇总合并数据文件观测量加权选择观测量拆分数据文件正交设计一、定义和编辑变量、观测量的命令Define Variable Properties 用于定义变量属性;Copy Data Properties 由外部文件和工作文件拷贝数据变量和属性;Define Dates 定义或编辑日期变量格式;Insert Variable 在数据编辑窗口插入一个变量;Insert Case 在数据编辑窗口插入一个观测量;Goto Case 光标跳转到某一指定观测量。二、变量数据变换的命令Sort Cases 对观测量进行排序;Transpose 对观测量进行转置;Restructure 对现有的观测量进行重新构
16、造,形成新格式的数据文件;Merge File 把外部文件数据合并到工作文件中;Aggregate 对数据进行分类或不分类汇总,产生新文件或代替工作文件。Identify Duplicate Cases 标识重复观测量;Orthogonal Design 进行正交设计。三、观察量数据整理的命令Split File 拆分数据文件的观测量,观测量进行条件分组;Select Cases 选择观测量;Weight Cases 对观测量进行加权处理。通过选择上述命令,可以实现对数据的整理编辑。1.2.3 Transform 变换及转换功能数据编辑窗口的Transform菜单为用户创建和定义复杂的数据提供
17、了方便的功能,如图2.3所示。它与Data菜单共同使用,可对基本的数据进行重新编辑,形成新的变量和观测量。这个菜单主要对变量进行操作,分为三部分的功能。这些功能也为各种统计分析要求提供极其灵活了数据处理功能。产生新的分组变量创建时间序列变量创建计数变量变量值重新编码计算产生新变量运行其它转换程序设定随机数种子观测量排秩变量值自动编码创建代替缺失值变量图1.6 Transform菜单项示意图一. 通过基本变量创建各种新变量; Compute 计算产生新变量,SPSS提供了10类100多个函数,通过该菜单可以用表达式产生一个新变量;Random Number Seed 创建随机数种子;Create
18、 Times Series 创建时间序列变量;二. 创建各种参数变量;Count 创建一个计数变量,用于统计计数;Recode 对变量值重新编码;Rank Cases 为观测量排秩,求得的秩在数据窗口作为一个新变量保存;Categorize Variables 建立新的分组变量,使数据分成若干个组;Automatic Recode 对变量值自动编码,产生一个连续的变量值编码;Replace Missing Values 创建替代缺失值变量;三.运行其它自定义的转输程序。Run Pending Transform 运行其它转换程序。在一般的情况下,通过Date菜单和Transform菜单的操作就
19、可以实现对原始数据的整理和变换。1.2.4 数据的编辑在Data View中,用鼠标左键单击数据表左边框的观测个体序号,这一行值就会被选中,用鼠标左键单击上边框的变量名,这个列就被选中,和其它Windows中的操作类似,也可以用鼠标对选中一部分单元格,选中的行、列、单元格后,单击鼠标右键,可以对它们进行复制、删除、剪切等操作。如果需要对已经输入的数据进行修改,就要对已经存在的数据进行编辑,SPSS有许多数据编辑功能。下面介绍几种常用的数据编辑功能。一、插入一个新观测量(Case)插入一个新观测量(数据)的命令是Insert Cases。在数据窗口主菜单上单击DateInsert Cases命令
20、,可以在光标所在位置的前上一行插入一行新的观测个体,可以输入新的观测数据。二、查找指定的观测量(数据)查找指定的观测数据的命令是Go to Case。在数据窗口单击DateGo to Case,弹出一个对话框,如图1.7所示:输入要找的观测量的序号后,点OK按钮,数据表中光标就会指到选定的观测量个体。图1.7 Go To Case对话框三、 观测数据排序建立数据文件sys-1:基本结构如下,数据上机时自行录入性别受教育年限年薪刚工作年薪年龄给观测量数据排序的命令是Sort Cases。在数据窗口单击DateSort Cases,打开Sort Cases对话框(见图1.8 )。 图1.8 Sor
21、t Case对话框从对话框左侧的变量列表中选择排序变量,点击右箭头按钮加入Sort by框中,然后在Sort Order栏中选择排序顺序:Ascending 观测个体按照选定的排序变量值由小到大的升序排列;Descending 观测个体按照选定的排序变量值降序排列。注意:观测个体.排序变量可以是一个或多个,当选择多个排序变量时,首先按第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排序,依次类推。注意在排序的时候,观测个体整行的值一同变到新位置,而不是只有排序变量那一列变动。但数据表中左边框上的序号并不随着变动,因此,为了保留原始数据的信息,最好自己定义一个变量来记录观测
22、个体的序号。四、在数据中选取子集如果需要从数据文件中选取一部分数据,可以在数据编辑窗口单击Data Select Case,打开Select Case对话框,如图1.9所示: 图1.9 Select Case对话框在该对话框的Select栏中选择挑选数据子集的方式(单选):l All case:选择所有数据;l If condition is satisfied: 按指定条件选择数据。单击If按纽,打开Select Case:If对话框,如图1.10所示,先选择变量,然后定义条件。l Random Sample of cases:对观察值进行随机抽样。单击Sample 按纽,打开Select
23、Case:Random sample对话框。如图1.11所示。 图1.10 Select Case:If对话框在Sample Size栏中有两种选择方式,一种是大概抽样(Approximately),即键入抽样比例后由系统随机抽样;另一种是精确抽样((Exactly),要求输入从第几个观察值起抽取多少数据。 图1.11 Select Case:Random Sample对话框l Based on time or case range:顺序抽样。单击Range按纽,打开Select Case: Range对话框,用户自行定义从第几个观察值开始抽到第几个观察值结束。l Use filter var
24、iable:用指定变量作过滤。先选择一个变量,系统自动在数据管理器中将该变量值为0的观测单位标上删除记号,系统对标有删除记号的观测单位不作分析。选择了挑选数据子集的方式后,单击OK,在数据窗口可看到新的变量filter_s。五、数据分类汇总(数据分组汇总)建立数据库文件sys-2:基本结构如下,数据上机时自行录入姓名性别班级数学物理用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以上述建立的数据库的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇总命令实现。具体操作如下。1.指定分类变量和汇总变量。打开建立的数据库,在数据窗口单击DateAggregate命令,打开Agg
25、regate Date对话框。如图1.12所示: 图1.12 Aggregate Date对话框2. 在变量名列表框中选择分类变量”性别”进入Break Variable(s)。3. 在变量名列表框中选择汇总变量”Math”进入Aggregate Variable(s)。4. 单击Function按纽,打开Aggregate Date:Function对话框,如图1.13所示。在此对话框中可以选择平均值、数据和、标准差的形式,特别值形式,百分数形式、频数形式等其中之一的方法进行分类汇总。选择分类汇总的函数形式后返回Aggregate Date对话框中。 图1.13 Aggregate Date
26、:Aggregate Function对话框5. 在Aggregate Date对话框中指定汇总文件的保存路径。有两种选择:一种是选中创建新数据文件,通过File按纽,重新指定结果文件名。一种是替代原来数据文件,用分类汇总结果覆盖当前编辑窗口的数据。6. 单击Name&Label按纽,可以重新指定结果文件中的变量名并加入变量标签。SPSS默认的结果文件中的变量名为原变量名最后加上_1.7. 如果希望在结果文件中保存各分类组的数据个数,可以选择Save number of case in break group as variable项。最后单击OK,可得相应的数据文件。 六、缺失值的替代方式如
27、果用户希望对缺失值进行定义,可以采用以下的操作:在数据窗口点击TransformReplace Missing Values,打开Replace Missing Values,对话框,如图.1.14.所示: 图1.14 Replace Missing Values对话框在变量中选择具有缺失值的变量进入New Variable框内,系统可以自动产生替代缺失值的新变量,也可处定义新变量。然后在Method的下拉菜单中选择缺失值的替代方式。五种方式依次是:Series mean 用该变量所有非缺失值的平均值替代缺失值;Mean of nearly point 用缺失值相邻点的的非缺失值的平均数据替代
28、缺失值;Median of nearly point 用缺失值相邻点的的非缺失值的中位数替代缺失值;Linear interpolation 用缺失值相邻点的的非缺失值的中点值替代缺失值;Linear trend at point 用线性拟合方式替代缺失值。七、数据秩(序)的确定如果用户需要对已有的数据变量排秩(序),如对数据SYS-2中的数学成绩分别排出名次,可以在数据窗口采用以下操作。 1. 单击TransformRand Cases,打开Rand Cases对话框。2. 从左边变量名列表框中选择变量”数学”(也可选择多个变量)进入Variable(s)框中,选择变量”班级”进入By框中,
29、则系统排序时将按照进入By的变量值“班级”进行分别排序。如图1.15所示:图1.15 Rand Cases对话框3. 单击Ties按纽,选择Ties(Ties是指两个或两个以上的数据相等的情况)的处理方式。由于秩与数据个数是一一对应的,当数据有相同的时,确定它们相应的秩有三种处理方式:对应秩的Mean平均值、Low最小值和high最大值。如本例选择最大值。选择后返回在主对话框。点击OK,就可以在数据窗口看到排序结果。Rank Types按纽提供排秩方式。单击Rank Types按纽,打开types对话框,从中选择排秩类型,排秩类型从左到右依次是:Rank普通排序(系统默认),新变量的值就是秩;
30、Fractional rank as% 累计百分数排序;Savage score以指数分布为基础的原始分排序;Sum of Case weights 以分组例数之和的权重排序;Fractional rank以秩变量除以分组例数之和排序;Ntile先给定一个大于1 的整数,系统按照此数的范围确定秩。1.2.5 SPSS对变量的编辑一、插入一个新变量插入一个新变量的命令是Insert Variable。在数据窗口单击DataInsert Variable,会在光标所在位置的前一列插入一个新的变量,变量名字和属性可以在Variable View窗口中定义。二、已存在的变量生成新变量对于已存在的数据变
31、量,根据需要进行计算生成新变量的命令是Compute。在数据窗口单击Transform Compute,打开Compute Variable对话框,如图1.16所示。在对话框左上方Target Variable栏中,键入即将生成的新变量的名称,并单击Type & Lable按纽确定变量标签及数据类型。对话框的左下栏中给出了数据文件中所有可用的变量列表,我们可以用右箭头按钮从中选取所需的变量进入右上方的Numeric Expression栏中,该栏存放运算表达式,运算表达式中所需要的常用函数可以从下的Functions列表中直接选取。这些常用函数(见附录)和其它语言中的函数名称类似,在框中按字母
32、顺序排列,用鼠标选中某个函数,用Functions右面的上箭头按钮加入数值表达式中,对话框中间是一个小键盘,可以用来输入数字、运算符号等。Compute Variable对话框的下面还有一个if按钮,可以选一部分满足某种条件的观测个体来做运算,不满足条件观测,其新变量值缺失。 图1.16 Compute Variable对话框如图1.16表示的是数据SYS-2中每个学生的数学和物理总成绩。在Compute Variable对话框中填好新变量名称和运算表达式后,点击OK按钮,就可以在数据文件中看到,已经生成了一个新变量Total。三、产生计数变量如果用户需要对满足某项条件的数据进行计数,可以使用
33、Count命令。以学生成绩数据SYS-2为例,说明具体操作步骤:在数据窗口单击TransformCount,打开Count Occurrence of Value within Cases对话框,如图1.17所示: 图1.17 Count Occurrence of Value within Cases对话框先在Target Variable中指定一个变量(可以是已经存在的变量或新变量),并定义变量标签,然后指定要统计的变量加到Numeric Variables框中,再单击Define Values按纽,打开Value to Count对话框。如图1.18所示: 图1.18 Count Val
34、ues within Cases:Value to Count对话框在上面的对话框中,确定需要计数的数值,其Value值的设置项依次是:Value:输入某个值为清点对象;System-missing:以系统的缺失值为清点对象;System-or user missing:以系统或用户指定的缺失值为清点对象;Range:指定数值的计数区域:其中包括: ( )through( )在框内指定下限和上限lowest through( ): 在框内只指定上限;( )highest through: 在框内只指定下限。图中给出的是计算达到优良标准,即学生达到80分以上课程数。确定了计数数值后,单击Add,
35、使选择结果进入Values to count 框内。单击Continue按纽,返回主对话框中。如果需要,可以单击If按纽确定计数条件。最后点OK可在数据窗口得到计数变量。四、变量分组(编码)与自动分组(编码)Transform菜单下还有以上两条分组(编码)命令。对变量数据的重新分组(编码),是指给每个变量值重新赋予一个码来描述他们的某些属性。码数相同的即为一组。比如,可以对年龄重新分组,19岁及以下年龄赋予一个编码1,20-29岁的年龄码赋予2,30-39岁年龄码赋予3,依此类推,这些码只能取正整数值。从某种程度上来讲,编码也可以看做分组:一个组对应一个组号,这样就把这些人按年龄分为几个组,一
36、目了然。变量重新编码命令为Recode,自动重新编码命令为Automatic Recode。Automatic 两者的区别是:Automatic Recode命令是SPSS系统自动设定码为正整数,而Recode可以根据用户的需要指定特别的码值。自动编码的具体操作为:在数据窗口单击Transform Automatic Recode打开Automatic Recode。对话框,从左侧的变量列表中选出被将重新编码的原变量,在New Name按钮右边空白栏中输入新的码值的变量名,点New Name按钮放到上面的栏中。对话框底下有两个选项,以确定编码是从最小的开始,还是从最大的开始,点OK执行这条命令
37、。需要注意的是,码与秩是不同的,请读者在学习时注意它们的区别。如果用户需要自定义分组的条件,可选择Recode命令。Recode命令有两个选项,分别是:Into Same Variables:数据编码后新的码值直接放到原来的变量中;Into Different Variables:数据编码后新的码值存到一个新变量中。为了避免数据丢失,尽量不要轻易选择前者。 选择后者的Recode命令对话框如图1.19所示, 图1.19 Recode Into Different Variables对话框选择需要重新分组(编码)的变量进入Numeric VariableOutput框中,并在右边的Output
38、Variable框中定义新的变量名及变量标签,单击Old and New Values按纽,打开对话框,Old and New Values对话框最左侧有六个选项,用来确定原变量的取值区间(或单个变量值),它们将被赋予一个相同的新码值,新的码值在右上方的New Value栏中填入。填好后Add按钮就被激活了,单击此按钮,就把这个旧的变量区间(值)以及新的码值到Old-News栏中。重复以上步骤,把所有的区间一个一个都输入后,点Continue按钮回到Recode Into Different Variables菜单,点OK按钮执行命令,即在数据窗口可得到需要的分组赋值变量。1.3 基本统计描述
39、在建立了数据文件之后,需要对数据作进一步的考察,如了解数据的基本特征,如数据的均值、标准差、四分位点,数据的分布形态等,这个过程称为对数据进行基本统计描述。所以说,数据的基本统计描述的目的是:了解数据的基本特征和基本分布形状,为进一步分析做好充分准备。u 本节主要内容:数据的基本统计描述方法:频数分析、探索分析及交叉列联表分析等。1.3.1 描述统计分析过程描述统计分析是对数据进行基础性描述。可以得出数据的平均值(Mean)、和(sum)、标准差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、极差(range)、平均值标准误(S.E.Mean),峰
40、度(Kurtosis)、偏度(Skewness)等统计量。以数据库SYS-2为例,介绍描述统计分析的具体操作步骤如下:1、首先打开数据表SYS-2,按照AnalyzeDescriptives Statistics Descriptives打开Descriptives对话框,如图1.20所示图1.20 Descriptives 主对话框2、 从左边源变量中选择一个或者几个变量进入右框中,单击Options按钮,打开Options对话框,如图1.21所示(本例选两个) 图1.21 Descriptives Options对话框在对话框中最上面一行是Mean:均值,sum:算术和l Dispersi
41、on离差栏Std.Deviation 标准差 Minimum 最小值Variance 方差 Maximum 最大值Range 极差 S.E.mean 均值的标准误l Distribution分布状态栏Skewness 偏度 Kurtosis 峰度l Display Order栏,选择输出方式:Variable List 按变量表次序;Alphabetic 按字母顺序;Ascending Meas 按平均值升序;Descending Means 按平均值降序。如在此例中选择按平均值升序项,返回主对话框,单击OK,在输出窗口得描述统计分析输出表。表1.1 Descriptive Statistic
42、s基本描述统计表1.3.2 频数分析对于一组数据,考察不同的数据出现的频数,或者是数据所落入指定的区域内的频数,可以了解数据的分布状况。数据文件SYS-1是一个公司职员表,其中有性别、年龄,受教育年限等五个变量,具体操作如下:1、打开数据文件SYS-1后,单击AnalyzeDescriptive Statistics Frequencies 打开频数分析对话框如图1.22所示。 图1.22 频数分布主对话框2、在左边的变量框中选中一个或多个变量送入Variable(s)。3、选中Display frequency tables要求输出分布表。4、单击Statistics按钮,得到对话框图1.2
43、3。在Frequencies: Statistics对话框中选择要求输出的统计量。图1.23 Frequencies: Statistics对话框l Percentile Values百分数选择项栏(复选项)Quartile四分位数,Cut points equal groups等分位点百分位数(取值范围在2100之间)。Percentile(s)自定义百分数。l Dispersion 离差栏(见1.3.1基本统计描述过程)l Central Tendency 中心趋势栏Mean 算术平均值(均值), Median 中位数, Mode 众数, Sum 算术和.l Distribution分布状
44、态栏在本例中选择四分位点、10等分的百分位点;标准差、方差、最大、最小值;全距、均值、均值的标准误,中位数、偏度、峰度等复选项。5、单击Chart按钮,得到Frequencies: Chart对话框图1.24. 在对话框中有l Chart Type图形栏(单选),选择输出的图形类型。None 不输出图形(系统默许) Bar charts 条形图Pie charts 饼图 Histograms 直方图With normal curve直方图中显示正态曲线(只有选择直方图时才能选择)。l Chart Values栏,选择图形中分类值的表现形式。Frequencies直方图纵轴为频数,饼图中每块表示
45、属于该组观测值频数;Percentage直方图纵轴为百分比,饼图中每块表示该组的观测量数占总数的百分比。 图1.24 Frequencies: Chart对话框6、单击Format按钮,得到对话框图1.25。 图1.25 Frequencies: Format 对话框在Frequencies: Format 对话框中:l Order by 排序栏,表示频数分布表的排列顺序。(单选)Ascending values 按变量值升序排列(系统默许)。Descending values 按变量值降序排列。Ascending counts 按变量各种取值发生的频数升序排列。Descending counts按变量各种取值发生的频数降序排列。如果设置了直方图,频数表将按照变量值顺序排列。l Multiple Variables多变量输出表格设置(单选)。Compare variables 将所有变量的结果输出在一个表中。Organize output by variables 为每一个变量输出一个表。l Suppress tables with more than _