《资料处理学习.pptx》由会员分享,可在线阅读,更多相关《资料处理学习.pptx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、原始资料的审核与复查一、原始资料的审核与复查(一)审核(一)审核 1 1、实地审核、实地审核 2 2、系统审核、系统审核实地审核实地审核的优点是特别及时,且效果较好;的优点是特别及时,且效果较好;其不足是调查工作的组织和安排要特别仔细,其不足是调查工作的组织和安排要特别仔细,调查员个人处理各种情况的能力要比较强。调查员个人处理各种情况的能力要比较强。系统审核系统审核的优点是调查工作便于统一安排和的优点是调查工作便于统一安排和管理,审核工作也可以统一在研究者的的指管理,审核工作也可以统一在研究者的的指导下进行。审核的标准比较一致,检查的质导下进行。审核的标准比较一致,检查的质量也相对好一些;
2、不足是整个调查工作的周量也相对好一些;不足是整个调查工作的周期则会相对拉长,少数个案的重新询问和核期则会相对拉长,少数个案的重新询问和核实工作有时因时间相隔较长而无法落实。实工作有时因时间相隔较长而无法落实。第1页/共11页(二)复查(二)复查所谓资料的复查,指的是研究者在调查资料收回后,又由其他人对所所谓资料的复查,指的是研究者在调查资料收回后,又由其他人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调查的质量。查的质量。基本做法:由研究者自己或是由研究者重新选择基本做法:由研究者自己或是由研究者重新选择另外的调查员
3、另外的调查员,从原,从原来的调查员所调查过的样本中,随机抽取来的调查员所调查过的样本中,随机抽取5%-15%5%-15%的个案重新进行调查。的个案重新进行调查。目的:目的:1.1.核实原来的调查员是否真的对个案进行过调查;核实原来的调查员是否真的对个案进行过调查;2.2.将两次调查的结果进行对比,以检查第一次调查的质量。将两次调查的结果进行对比,以检查第一次调查的质量。作用:发现并纠正原始资料中所存在的一些错误,还可以普遍了解整作用:发现并纠正原始资料中所存在的一些错误,还可以普遍了解整个资料收集工作的质量。个资料收集工作的质量。第2页/共11页二、资料的编码和录入二、资料的编码和录入(一)问
4、卷的编码(一)问卷的编码 1 1、编码的含义、编码的含义就是给每个问题及答案一个数字作为它的代就是给每个问题及答案一个数字作为它的代码。也即将问卷中的文字答案转换成数字的码。也即将问卷中的文字答案转换成数字的过程。过程。预编码预编码:问卷设计的同时就设计好,是问卷:问卷设计的同时就设计好,是问卷的一部分。的一部分。后编码后编码:调查完成后再进行的编码。:调查完成后再进行的编码。2 2、编码的过程与方法、编码的过程与方法 答案代码答案代码 代码宽度代码宽度 栏码栏码 编码编码第3页/共11页(1 1)答案代码的确定)答案代码的确定填空式问题填空式问题直接用回答者所填写数字作为答案的代码值。直接用
5、回答者所填写数字作为答案的代码值。如:您的年龄是如:您的年龄是 32 32 岁。岁。二项选择问题或多项选择问题二项选择问题或多项选择问题答案预编码作为代码值。答案预编码作为代码值。如:您的性别是:(如:您的性别是:()男男 女女矩阵式或表格式问题矩阵式或表格式问题资料收回后对回答进行后编码。资料收回后对回答进行后编码。习惯上,习惯上,0 0作为缺省值的代码;作为缺省值的代码;9 9作为特殊值的代码。作为特殊值的代码。如:如:我们可对表中的答案分别赋值为:我们可对表中的答案分别赋值为:1=1=不严重,不严重,2=2=不太严重,不太严重,3=3=比较严重,比较严重,4=4=很严重,很严重,9=9=
6、不清楚。不清楚。不严重不太严重比较严重很严重不清楚噪音烟尘污水垃圾第4页/共11页(2 2)代码宽度的确定)代码宽度的确定项目或问题答案最大代码的位数。项目或问题答案最大代码的位数。(3 3)问题栏码的确定)问题栏码的确定即给每一个问题分配栏码,指定该问题的编码值共几即给每一个问题分配栏码,指定该问题的编码值共几位,以及它们在整个数据文件中所处的位置。位,以及它们在整个数据文件中所处的位置。如:如:项目或问题项目或问题 宽度宽度 栏码栏码 你的性别:你的性别:男男 女女 1 11 1 你的年龄:你的年龄:岁岁 2 2-32 2-3 你的文化程度:你的文化程度:1 41 4 小学及以下小学及以下
7、 初中初中 高中及中专高中及中专 大专及以上大专及以上 您的月收入为您的月收入为 元元 4 4-74 4-7 (4 4)编码)编码第5页/共11页(二)数据录入(二)数据录入 1 1、数据录入方式、数据录入方式方式一:直接从问卷上将编好码的数据输入计算机。方式一:直接从问卷上将编好码的数据输入计算机。方式二:先将问卷上编好码的数据转录到专门的登方式二:先将问卷上编好码的数据转录到专门的登录表上,然后再从登陆表上将数据输入计算机。录表上,然后再从登陆表上将数据输入计算机。2 2、数据输入软件、数据输入软件一类:一般性的编辑软件,如一类:一般性的编辑软件,如EDED,Word star,Word
8、star,WPSWPS,WordWord等,输入后得到文本格式的文件。等,输入后得到文本格式的文件。二类:专门的数据库管理软件,如二类:专门的数据库管理软件,如dBasedBase、FoxBASEFoxBASE、FoxProFoxPro等,输入后得到后辍为等,输入后得到后辍为.DBF.DBF的数的数据文件。据文件。三类:直接在三类:直接在SPSSSPSS中输入数据。中输入数据。第6页/共11页三、数据清理三、数据清理(一)有效范围清理(一)有效范围清理对于问卷中的任何一个变量来说,它的有效的编码值往对于问卷中的任何一个变量来说,它的有效的编码值往往都有某种范围,而当数据中的数字超出了这一范围时
9、,往都有某种范围,而当数据中的数字超出了这一范围时,可以肯定这个数字的定是错误的。可以肯定这个数字的定是错误的。1 1、错误来源有四:、错误来源有四:来自于被调查者(乱填写或误填写);来自于被调查者(乱填写或误填写);来自于编码员来自于编码员 (编码错误);(编码错误);来自于录入员来自于录入员 (输入错误);(输入错误);来自于登录员来自于登录员 (登录错误)。(登录错误)。2 2、处理方法、处理方法根据个案编号找出原始问卷进行核对。如果错误来自被根据个案编号找出原始问卷进行核对。如果错误来自被调查者(即原始问卷本身有误),那么就将该问题的回调查者(即原始问卷本身有误),那么就将该问题的回答
10、作为缺省值处理;如果在同一份问卷中,错答、乱答答作为缺省值处理;如果在同一份问卷中,错答、乱答现象不止一两处,则可将整份问卷作为废卷处理。现象不止一两处,则可将整份问卷作为废卷处理。第7页/共11页(二)逻辑一致性处理(二)逻辑一致性处理1 1、其基本思路是依据卷中的问题相互之间所存在的某、其基本思路是依据卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性。种内在的逻辑联系,来检查前后数据之间的合理性。2 2、例如,相倚问题的逻辑一致性、例如,相倚问题的逻辑一致性过滤性问题是:过滤性问题是:“你有孩子吗?你有孩子吗?”a.a.有有 b.b.无无后续性问题是:后续性问题是:
11、“你的孩子今年多大你的孩子今年多大?”-岁岁如果前一问题的回答为如果前一问题的回答为“无无”,编码为,编码为2 2,则后一问,则后一问题中的回答应该是空白(即为缺省值,用题中的回答应该是空白(即为缺省值,用0 0来表示),来表示),即不需要回答。如果统计中出现了即不需要回答。如果统计中出现了1 1、2 2、3 3、4 4、5 5、6 6、7 7、8 8、9 9、1010等数字,那就说明这些数字有问题。等数字,那就说明这些数字有问题。第8页/共11页调查资料编码练习,录入、调查资料编码练习,录入、清理上机操作。清理上机操作。实作:实作:第9页/共11页掌握资料处理的主要掌握资料处理的主要流程和具体方法流程和具体方法小结:小结:第10页/共11页感谢您的观看!第11页/共11页