《SPSS简介和入门.ppt》由会员分享,可在线阅读,更多相关《SPSS简介和入门.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅SPSS简介和入门Version19.0 Version19.0浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 SPSS简介 相关概念 数据录入和数据获取 菜单补充说明浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 1968年:斯坦福大学三位学生创建了SPSS(Statistics Package for Social Science)1968年:诞生第一个用于大型机的统计软件 1975年:在芝加哥成立SPSS总部 1984年:推出用于个人电脑的SPSS/PC+1992年:推出Windows版本,同时开始全球化发展 自SPSS 11.0
2、起,SPSS全称为“Statistical Product and Service Solutions”,即“统计产品和服务解决方案”目前普遍使用的最高版本是SPSS19.0版(20.0版也已推出)产品概述浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅安装SPSS浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅运行SPSS鼠标点击此浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅SPSS19.0启动界面菜单栏工具栏浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅SPSS 中文版的使用从edit 菜单中选择Options浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅选择简体中文按O
3、K 键浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 File:对SPSS文件的管理,包括新建、打开、保存文件等 Edit:与windows类似的编辑功能,如复制、剪切、粘贴、撤消等,以及系统参数设置 View:选择显示状态条、工具栏、网格线、变量标签、变量 视图及字体设置等 Data:实现文件级别的数据管理,如记录排序、记录拆分、记录筛选、合并文件等 Transform:实现变量级别的数据管理,如计算新变量、变 量值的分组合并、连续变量的可视化分段等SPSS 菜单栏浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 Analyze:SPSS的重点菜单项,涵盖各种主要统计分析功能 Grap
4、hs:绘制各种普通统计图及交互式统计图,如直方图、茎叶图、箱图、残差图等 Utilities:提供各种实用性管理设置,如变量信息管理,输出 结果文件设置、菜单管理等 Windows:窗口拆分、最小化、当前窗口显示等 Help:帮助系统SPSS 菜单栏浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅打开文件保存文件打印召回前次菜单操作撤消查找记录查看变量信息查找变量值插入记录插入变量拆分文件设置权重选择记录显示变量标签使用数据集SPSS 工具栏插插入入变变量量浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 SPSS的常用窗口:Data、Syntax、Output、Draft Output、
5、Script 几个术语:Case、Variable、Expression SPSS的运算符:基本运算:数学运算、关系运算、逻辑运算 算术运算的优先顺序:括号、函数、乘方(冥)、乘 或除、加或减。同一优先级的按从左到右的顺序。SPSS的表达式:算术表达式、比较表达式、逻辑表达式相关概念(1)浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 SPSS的函数:十大类一百多个函数,包括算术函数、累计概率函数、概率密度函数、时间函数、逆分布函数、缺失值函数、随机函数、统计函数、字符串函数和其他函数。SPSS的文件类型:数据文件*.sav*.sys*.dat(.dbf.xls 等)、工作日志文件(.jn
6、l)、结果文件(.spo)、命令文件或语法文件(.sps)、脚本文件(.sbs)、图形模板文件(.sct)。相关概念(2)浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 SPSS的数据格式:一般以行乘列的排列方式构造,行代表 case(或记录),列表示variable(或变量)。“一个观测占一行,一个变量占一列”例1:观察了10名学生的体重,其中男性5人,女性5人应具有 210的数据结构(2个变量,10个观察对象)例2:一个22的四格表,应具有n 2的数据结构(2个变量,n 个观察对象)例3:一个22析因设计,应具有n 3的数据结构(3变量,n次 实验)相关概念(3)浙江大学公共卫生学院流
7、行病与卫生统计学学科系 沈毅数据录入和数据获取v 数 据 可 以 直 接 输 入SPSS,或 者 从 其 他 形 式:SPSS 数 据 文 件、电 子 表 应用 软 件(例 如Microsoft Excel)、数 据 库 软 件(例 如Microsoft Access)以及文本文件等导入(1)直接输入 数据录入三部曲:定义变量名指定变量的属性录入数据(2)外部数据的获取(集中在File菜单下):对于SPSS格式和其他大多数常用格式的数据文件,均可通过的 FileOpenData或单击工具栏上的 打开,以excel格式数据的 读入为例作介绍。也可利用利用数据库ODBC接口读入数据及文本向导读入文
8、本数据。浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅数据编辑窗口浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅语法编辑窗口浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅结果输出窗口目录区 内容区浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅草稿结果窗口v 结果的一种简化文本格式,即被word兼容的rtf 超文本格式,可在未安装SPSS的机子上使用 word等字处理软件将该结果打开浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅脚本窗口v 用Sax Basic语言写的程序,用于使SPSS内部 操作自动化,也适用于高级分析人员浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅
9、Case:组成数据文件的基本单位,即观测记录 Variable:SPSS对变量有如下的约定(1)变量名最多有8个字符,第一个字符必须是字母 或,数字、$和下划线均可用在变量名中(2)以$开头的变量名为系统变量(不可命名)(3)变量类型:数值型、字符型(A)、日期型等 数字 Expression:(表达式)逻辑SPSS 的几个术语浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 SPSS SPSS的运算符数学运算符 关系运算符 逻辑运算符+(GT)|(OR)*=(GE)*=(EQ)()=(NT)浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 以cases(行)和variables(列)的
10、格式进行组织v 一行是指调查中一个观测对象所有问题的回答 v 一列指调查中对于一个问题所有观测对象的回答浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅表1 10名学生的体重性别体重(kg)男56男60男62男64男65女46女48女50女52女53浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅表 2 穿新旧两种防护服工人的皮肤炎症患病率比较防护服种类皮肤炎症阳性 阴性新8 14旧10 18浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅表3 两种药物治疗缺铁性贫血后红细胞增加数(百万/mm3)乙药(B)甲药(A)用(1)不用(2)用(1)2.1 0.92.2 1.12.0 1.0不用
11、(2)1.3 0.81.2 0.91.1 0.7浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 定义变量名前,首先新建一个数据文件v 使用该菜单还可新建语法文件、结果文件、草稿结果 文件和脚本文件浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅单击切换至变量视图浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v数据录入:例1变量名浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅Type:变量类型 Width:字符宽度 Decimals:小数位数 Label:变量标签 Values:变量值标签 Missing:缺失值 Columns:单元格宽度 Align:变量值对齐方式Measur
12、e:变量的测量尺度v 注:不同变量间各属性可直接进行复制粘贴浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 点击单元格,即出现如右图所示小方格,点击小方格进行变量类型设定标准数值型字符型日期型逗号数值型圆点数值型科学计数法型美元数值型用户自定义型v 如:美元数值型浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅123浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅可定义单个缺省值(最多定义三个)可定义缺省值范围浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 定类尺度(Nominal Measurement):无序分类变量,如性别可
13、取“男”、“女”。只能计算频数和频率 定序尺度(Ordinal Measurement):有序分类变量,如对游泳的喜欢程度1非常喜欢,2喜欢,3无所谓,4不喜欢,5非常不喜欢,可计算频数、频率、累计频数、累计频率 定距尺度(Interval Measurement):对事物类别或次序之间间距的测度,如温度。无绝对“零点”,如0 并不表示“没有”,仅仅是个测量值 定比尺度(Scale Measurement):能够计算两个测度值之间比值的一种计量尺度,如职工月收入。有绝对“零点”,0就表示“没有”v SPSS 中将定比尺度和定距尺度合并为一类,统称“Scale”,且作为默认值浙江大学公共卫生学院
14、流行病与卫生统计学学科系 沈毅表1 10名学生的体重性别体重(kg)男56男60男62男64男65女46女48女50女52女53浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅数据录入三种形式:1.开放题的录入 例:年龄(age):_岁2.单选题的录入 例:性别(gender):1 男 2 女3.多选题的录入 例:你在选择健康体检的医院时关注哪些因素:a.交通方便 b.检查项目 c.检查价格 d.服务质量 e.其他浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 完成变量定义后,点击 即可切换 回数据视图,进行数据录入浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 直接输入,每输入
15、一个值后,按键盘上的向下方向键 或 按回车键,输入下一个值浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 与开放题不同的是单选题中可以定义变量值标签,可 以减少数据录入的工作量,且方便数据分析。字符直接录入 字符代码+值标签 数值代码+值标签(推荐,便于录入及分析)v 单选题录入的三种方式浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 多重二分法:每个选项定义一个二分类变量 适用于:选项不太多浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 多重分类法:每个答案定义一个变量,该用几个变量由 实际可能给出的最多答案数而定 适用于:选项较多例:你对艾滋病知识的了解主要来自哪些渠道(限选
16、3项):a.健康教育 b.电视 c.收音机 d.网络 e.朋友介绍 f.刊物 g.其他浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅SPSS中的文件类型浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 可以从电子表格式文件读入数据,第一行默认作为 变量名读入SPSS浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 打开数据文件v 使用该菜单还可打开语法文件、结果文件、草稿结果 文件和脚本文件浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅确认是否要读入变量名确认导入的单元格区域也可
17、进行自定义浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v Excel数据导入后数据显示如图,其中变量名行就是原来Excel文件中的第一行浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 关于ODBS(Open Database)本课程不进行详述,感兴趣的同学可参考有关书籍。浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅文本文件是另一种常见的数据文件,许多电子表和数据库 可以将内容存成文本格式逗号和制表位用以区分每个变量,上图中以制表位来区分浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅文件类型为文本格式的txt文件浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 用以指导
18、对文本进行定义,确定不同变量的区分 选择定义好的格式或创建新格式。选择No创建新格式从文本导入数据Step 1浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅从文本导入数据Step 2选择Yes表明变量名从文件顶行读入变量以特定界限区分,如逗号、制表位浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅表明从文本文件的第2行开始读入数据从文本导入数据Step 3此处可选择导入的样本数,默认值为全部个案也可选择前N 个或随机抽N%。浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 用直观的界面快速确定是否从SPSS正确读入你所 要求读入的数据从文本导入数据Step 4选中制表符浙江大学公共卫
19、生学院流行病与卫生统计学学科系 沈毅v 为适合SPSS的格式,某些变量名可能被缩减,该对话框用以编辑不适当的变量,使之达到你的要求。同样可以更改变量类型,如将INCOME设为Dollar格式。从文本导入数据Step 5选中Dollar选中INCOME浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅从文本导入数据Step 6浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 从文本文件导入数据完成,其中step5设置的 INCOME为Dollar形式浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 前面就File菜单下的New、Open、Open Database、Read Text D
20、ate已作了介绍,下面就File、Edit和View菜 单下的其他子菜单作补充介绍浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 Save:保存,覆盖当前文件 Mark File Read Only:使数据文件标记为只读,原文件不能被覆盖。点击该菜单项后,若对原数据文件进行改变后,对其进行保存时跳出下图,提示保存为另一个文件名或至另一个目录,表明原文件不会被改动 Save As:另存文件,可以另存为SPSS格式或其他数据格式 浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 点击Mark File Read Only后,菜单变为Mark File Read Write,点击之可以恢复到
21、可改写的状态浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 Display Date File Information:在结果窗口中显示变量信息、变量值等Working File(显示当前文件信息)External File(显示外部文件信息),查看详情 Cache Data:查看详情 Stop Processor:停止程序处理 Switch Server:用以转化、增加、编辑所登录的服务器,查看详情浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 Print Preview:打印预览 Recently Used Date:最近使用数据 Print:打印 Recently Used Fi
22、le:最近使用文件 Exit:退出 浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅 Undo:撤消 Cut:剪切 Redo:重复 Copy:复制 Paste:粘贴 Paste Variables:粘贴变量 Clear:清除 Options:设置系统参数 Find:查找 浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅状态条 Status Bar:选中,则在右下角显示状态条 Fonts:字体设置 Toolbars:用以对工具栏进行设置 Grid Lines:选中显示网格线 Value Labels:默认情况下,数据视图中显示数值,选中该项,则数据视图中显示数值标签 Varibles:选中切
23、换至变量视图浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v Ok:在下次读取该文件时(如下次运行一个统计程序时)产生缓存文件,多数情况下直接点ok即可 cache data(数据缓存):是指将当前数据文件的一份拷贝放入缓存,使多次处理程序时当前文件不必被重复读取,从而有效减少程序处理的时间。默认情况下,数据库自动产生一份数据缓存,但当使用 GET DATA语法命令读取数据库时,数据缓存不能自动产生,应该使用FileCache Data菜单使之产生。v Cache Now:立刻产生一个缓存文件,若当前文件被锁住“locked”而无法修改时使
24、用之,或者数据文件很大,它能加快处理时数据视图内容的滚动速度。浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 默认情况下,单元格内显示的是具体变量值,鼠标放在该变量名上(列的开头),出现关于该变量详细描述的标签定义.浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅v 当前,变量marital的单元格中显示的是变量标签:在婚姻状态和不在婚姻状态 浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅浙江大学图书馆可提供正版(网络版:同时在线20 人)的SPSS20.0浙江大学公共卫生学院流行病与卫生统计学学科系 沈毅点击下载镜像文件(.iso)下载安装说明,按说明步骤安装