《spss数据库的建立与编辑(二)(精品).ppt》由会员分享,可在线阅读,更多相关《spss数据库的建立与编辑(二)(精品).ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据文件的建立与编辑数据文件的建立与编辑一、相关概念一、相关概念数据库是统计分析的基础,一个完善而简洁的数数据库是统计分析的基础,一个完善而简洁的数据库,可以提高研究和分析的效率。据库,可以提高研究和分析的效率。数据库多为二维(行列)表结构,一般列为变量数据库多为二维(行列)表结构,一般列为变量(variable),),行为个体(行为个体(case)。)。数据表中数据表中的一个格(的一个格(cell)放一个数据。放一个数据。建立一个数据库分为三个步骤:建立一个数据库分为三个步骤:定义变量定义变量输入数据输入数据保存文件保存文件二、进入SPSS前的准备工作编码的概念编码的概念:根据一定的规则将研
2、究资料转换为可进行统计分析的根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。数码资料的过程。编码编码录入录入问题:您认为打工的外地人对北京市的社会秩序是问题:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)否有影响?(单选)1有很大影响 2有较大影响 3没有影响 4不好说 4编码答案编码的步骤编码的步骤确定变量确定变量变量:变量:用来反映文意概念的量化形式。在统计中往用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量由两个部分构成:变量名变量名和和变量值变量值。要注意。要注
3、意区分何为变量,何为变量值。在调查问卷中还要区分何为变量,何为变量值。在调查问卷中还要注意区分注意区分问题问题和和变量变量。问题:您有几个儿子?几个女儿?问题:您有几个儿子?几个女儿?1儿子_人 2女儿_人 问题变量1变量2变量1的值变量2的值编码的步骤制作编码表制作编码表变量变量未回答、缺失值未回答、缺失值不适用不适用不知道不知道编码:编码:根据编码表对问卷进行编码,而后将编码结果根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。记录在问卷上或编码纸上。三、定义变量变量名,唯一类型宽度小数位数标签数值标签变量类型数值型变量字符型变量变量名定义原则变量名定义原则唯一性唯一性首字符
4、不能是数字首字符不能是数字变量名不能使用键盘上的变量名不能使用键盘上的#、¥、¥、%等等变量名不能使用系统内部保留字变量名不能使用系统内部保留字,all、and、by、with、not、eq等等变量名不能以变量名不能以“.”结尾结尾四、数据录入、编辑四、数据录入、编辑在在完成变量定义后,单击左下方的完成变量定义后,单击左下方的data view标签,激活数据表。即可录入。标签,激活数据表。即可录入。编辑编辑修改修改复制和粘贴复制和粘贴数据删除数据删除操作技巧连续多个相同值的输入连续多个相同值的输入可利用复制、粘贴的方法。可利用复制、粘贴的方法。将将EXCEL数据直接引入数据直接引入SPSS先在
5、先在EXCEL中选中所有的数据(不包括变量名),拷中选中所有的数据(不包括变量名),拷贝,然后再切换到贝,然后再切换到SPSS,执行粘贴命令。再定义相应执行粘贴命令。再定义相应的变量即可。的变量即可。将将WORD中的数据直接引入中的数据直接引入SPSS与在与在EXCEL相类似。相类似。如果表中全部是数据,则全选。如果表中全部是数据,则全选。如果表中有文本,则与如果表中有文本,则与EXCEL相同相同导入外部文件数据导入外部文件数据TXT 文件文件EXCEL文件文件五、数据整理(data)概念概念数据整理是对原始数据中的变量或个体进行数据整理是对原始数据中的变量或个体进行增加增加删除删除排序排序倒
6、置(较少使用,不做介绍。)倒置(较少使用,不做介绍。)合并合并加权加权1、插入或删除(变量或个体)、插入或删除(变量或个体)Data Insert caseData Insert variable单击行首或变量名,即可定义一行或一列,然单击行首或变量名,即可定义一行或一列,然后即可删除一个体或一变量。后即可删除一个体或一变量。如果发现这是一种错误操作,可通过选择如果发现这是一种错误操作,可通过选择edit-undo进行恢复。进行恢复。插插 入入 删删 除除2、个体排序、个体排序(data-sort case)排序变量栏排序变量栏可以是多个可以是多个变量变量以第一个变以第一个变量为先。量为先。排
7、序类型排序类型升序升序降序降序3、合并文件、合并文件(data-merge files)合并文件的功能是某外部文件与当前数据合并一个合并文件的功能是某外部文件与当前数据合并一个新工作数据,新工作数据包括新工作数据,新工作数据包括个体个体或或变量变量的增加。的增加。个体的增加是纵向合并;变量的增加是横向合并。个体的增加是纵向合并;变量的增加是横向合并。增加变量时,外部文件与当前文件均增加变量时,外部文件与当前文件均必须是升序排必须是升序排列文件。列文件。(1)、数据纵向合并、数据纵向合并(merge file-add case)Indicate case source as variable:(
8、指示个体来源的变量选项)(指示个体来源的变量选项)数值数值0表示表示源工作数据源工作数据的个体,数值的个体,数值“1”表示表示外部文件外部文件的个体。的个体。unpaired variables:(不匹配变量):(不匹配变量)Variable in New working data file:(新工作数据变量)(新工作数据变量)V1.savV2.sav例题:文件例题:文件v1.sav和和v2.sav的纵向合并的纵向合并对话框合并后的文件v1.sav(2)、数据横向合并(add variable)对话框:Excluded variables:(:(拒绝变量栏)拒绝变量栏)New working
9、data:(:(新工作数据变量栏)新工作数据变量栏)Match case on key variable in sorted:(排序文件中按关键变量匹配个体选项)排序文件中按关键变量匹配个体选项)Both files provide cases:由外部和当前文件两由外部和当前文件两者提供个体。者提供个体。External file is keyed table:外部文件为关键表。外部文件为关键表。以当前数据为基准,外部文件匹配当前数据的关键变以当前数据为基准,外部文件匹配当前数据的关键变量值,如果成功,外部文件的新变量值加入当前数据量值,如果成功,外部文件的新变量值加入当前数据的新变量中,匹配
10、不成功则不加入。的新变量中,匹配不成功则不加入。Working file is keyed table:当前数据为关键当前数据为关键表。以外部文件为基准,当前数据匹配外部数据的关表。以外部文件为基准,当前数据匹配外部数据的关键变量值,如果成功,外部文件的新变量值加入当前键变量值,如果成功,外部文件的新变量值加入当前数据的新变量中,匹配不成功则舍去当前数据的该个数据的新变量中,匹配不成功则舍去当前数据的该个体。体。Key variables:关键变量栏。关键变量栏。在拒绝变量栏中选择某变量作为关键变量。在拒绝变量栏中选择某变量作为关键变量。Indicate case source as vari
11、able:指示指示个体来源的变量选项。个体来源的变量选项。数值数值0表示源工作数据的个体,数值表示源工作数据的个体,数值“1”表示外表示外部文件的个体。部文件的个体。:增加变量(不选择关键变量):增加变量(选择关键变量)4、拆分数据文件在在进行数据的处理时,经常对数据中的个体进行数据的处理时,经常对数据中的个体进行分组分析。进行分组分析。“拆分拆分”并非将一个数据文件拆分为两个或并非将一个数据文件拆分为两个或多个独立的数据文件,而在同一个数据文件多个独立的数据文件,而在同一个数据文件按某个条件分组。按某个条件分组。拆分后,拆分处理一直有效,直到取消拆分拆分后,拆分处理一直有效,直到取消拆分处理
12、或更改拆分变量才会有新的变化。处理或更改拆分变量才会有新的变化。:Data split file对话框对话框取消“拆分”结果放在一起分析单独显示指明当前状态5、选择个体(、选择个体(Select cases 抽样)抽样)选择某些符合条件的个体选择某些符合条件的个体All case:所有个体,系统默认值。所有个体,系统默认值。If condition is satisfied:按给定条件选按给定条件选择个体。择个体。If:是条件按钮,激活对话框。是条件按钮,激活对话框。Random sample of cases:随机选择个随机选择个体体Sample:随机样本按钮,激活对话框。随机样本按钮,激活
13、对话框。Based on time or case range:在某范在某范围内选择人全部个体。围内选择人全部个体。Range:范围按钮,激活对话框。范围按钮,激活对话框。Use filter variable:过滤变量为过滤变量为0值或缺失值为非选择个体,其余为选值或缺失值为非选择个体,其余为选择个体。择个体。Unselected case are:非选择个体非选择个体单选项。单选项。Filtered:过滤棵选择个体,产生过滤变量过滤棵选择个体,产生过滤变量filter_$。filter_$值为值为0时表示个体是时表示个体是非选择个体非选择个体,不进,不进行统计分析,但仍在工作文件中。变量行
14、统计分析,但仍在工作文件中。变量filter_$为为1表示该个体是表示该个体是选择个体选择个体,可以对它进行统计,可以对它进行统计分析。分析。Deleted:删除个体。删除不符合条件的个体,产生新文件。删除个体。删除不符合条件的个体,产生新文件。注意:删除的个体不可恢复注意:删除的个体不可恢复。6、加权个体、加权个体加权加权个体的功能是变量为频数变量。个体的功能是变量为频数变量。Do not weight cases:非加权个体变量选项非加权个体变量选项Weight cases by:加权个体变量选项。加权个体变量选项。Frequency variable频数变量栏。放入频数变量。频数变量栏。
15、放入频数变量。Current status:当前工作状态。是否加权频数变量。当前工作状态。是否加权频数变量。六、数据变换六、数据变换 transform 概念概念在整理数据时,常常需把某些变量的数据进行在整理数据时,常常需把某些变量的数据进行变换,这些数据变换是通过一个有效的数值表变换,这些数据变换是通过一个有效的数值表达式或达式或SPSS的内部函数(如对数、平方根、的内部函数(如对数、平方根、倒数、比值等)来实现。倒数、比值等)来实现。另外,连续变量也可以变换为分类变量。另外,连续变量也可以变换为分类变量。:这儿我们只介绍:这儿我们只介绍:如何建立新变量。如何建立新变量。建立新变量建立新变量
16、新新变量的数据是对每个个体求数据值表达式的结变量的数据是对每个个体求数据值表达式的结果。新变量可以是数值型或字符型的。果。新变量可以是数值型或字符型的。transform compute弹出一对话框。弹出一对话框。Target variable新变量栏新变量栏Type&label类型与标签类型与标签Numeric expression数值表达式数值表达式Functions函数函数If:条件表达式按钮。条件表达式按钮。应用实例1:学号语文数学180902888538690例题2测克山病人6例与6名健康人的血磷值如下:病人:2.60 3.24 3.73 4.32 4.73 5.18健康人:1.67 1.98 1.98 2.33 2.34 2.50试建立数据文件小结建立一个数据文件,有哪些步骤?变量名的定义原则?