《应用抽样技术 李金昌 课件.ppt》由会员分享,可在线阅读,更多相关《应用抽样技术 李金昌 课件.ppt(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样理论与方法抽样理论与方法统计学本科统计学本科专业必修课专业必修课3学分学分主讲教师:刘爱芹主讲教师:刘爱芹11/19/20221统计学专业必修课3学分目目 录录n第一、二章第一、二章 概述概述n第三章第三章 简单随机抽样简单随机抽样n第四章第四章 分层随机抽样分层随机抽样n第五章第五章 比率与回归估计比率与回归估计n第六章第六章 不等概抽样不等概抽样n第七章第七章 整群抽样整群抽样n第八章第八章 系统抽样系统抽样n第九章第九章 多阶段抽样多阶段抽样n第十章第十章 二重抽样二重抽样n第十一章第十一章 非抽样误差非抽样误差11/19/20222统计学专业必修课3学分CH1-2 抽样基础知识介绍
2、抽样基础知识介绍4课时课时11/19/20223统计学专业必修课3学分内容体系内容体系n学习目的:在学习具体的抽样技术之前,对抽样理论与学习目的:在学习具体的抽样技术之前,对抽样理论与方法涉及的基础问题有大致的了解和认识方法涉及的基础问题有大致的了解和认识1 抽样技术基本问题介绍,介绍抽样技术抽样技术基本问题介绍,介绍抽样技术/抽样的概念、抽样的概念、作用作用n重点:区分概率抽样和非概率抽样,了解非概率抽样的重点:区分概率抽样和非概率抽样,了解非概率抽样的基本方法,把握抽样调查的基本程序基本方法,把握抽样调查的基本程序2 抽样技术的基本概念抽样技术的基本概念n重点:抽样框、估计量方差、偏倚与均
3、方误差、抽样误重点:抽样框、估计量方差、偏倚与均方误差、抽样误差与非抽样误差差与非抽样误差3 样本设计样本设计n重点:掌握样本设计的内容、设计原则和设计效果测定重点:掌握样本设计的内容、设计原则和设计效果测定方法方法11/19/20224统计学专业必修课3学分1 抽样技术抽样技术(CH1-1)l抽样技术就是抽样推断采用的技术,包括抽样、调抽样技术就是抽样推断采用的技术,包括抽样、调查和推断三个环节的技术。查和推断三个环节的技术。l抽样技术、抽样推断、抽样调查等概念经常混用抽样技术、抽样推断、抽样调查等概念经常混用一、抽样技术的含义一、抽样技术的含义(一)概率抽样(一)概率抽样(二)非概率抽样(
4、二)非概率抽样重点:重点:n掌握概率抽样的含义和特点,与非概率抽样的区分掌握概率抽样的含义和特点,与非概率抽样的区分n了解几种非概率抽样方法了解几种非概率抽样方法二、抽样调查的基本程序二、抽样调查的基本程序三、抽样技术的作用三、抽样技术的作用11/19/20225统计学专业必修课3学分一、抽样技术一、抽样技术/抽样调查的含义抽样调查的含义11/19/20226统计学专业必修课3学分统计学原理:统计学原理:抽样推断的含义和特点抽样推断的含义和特点Nn样本统计量样本统计量均值均值方差方差参数估计参数估计抽样平抽样平均误差均误差抽样极抽样极限误差限误差按随机原则抽样按随机原则抽样推断总体的推断总体的
5、数量特征数量特征抽样误差可以计算抽样误差可以计算并加以控制并加以控制11/19/20229统计学专业必修课3学分抽样调查抽样调查(Survey Sampling)n运用抽样技术进行的调查即抽样调查运用抽样技术进行的调查即抽样调查n抽样调查分广义和狭义两个范畴抽样调查分广义和狭义两个范畴n广义的含义:广义的含义:n一切一切非全面非全面的统计调查都是抽样调查,即从研究对象的全的统计调查都是抽样调查,即从研究对象的全体体(总体总体)中中抽取部分单位抽取部分单位作为样本,根据对所抽取的样本作为样本,根据对所抽取的样本进行调查,获得有关进行调查,获得有关总体目标量的了解总体目标量的了解n顾客买米,召开座
6、谈会了解情况等顾客买米,召开座谈会了解情况等n狭义的含义:狭义的含义:n即概率抽样即概率抽样n从总体抽取样本的方法看,抽样可分为:从总体抽取样本的方法看,抽样可分为:非概率抽样非概率抽样(nonprobability sampling)概率抽样概率抽样(probability sampling)必须正确区必须正确区分这对概念分这对概念11/19/202210统计学专业必修课3学分简单随机抽样简单随机抽样分层抽样分层抽样整群抽样整群抽样系统抽样系统抽样多阶段抽样多阶段抽样概率抽样概率抽样方便抽样方便抽样判断抽样判断抽样自愿样本自愿样本滚雪球抽样滚雪球抽样配额抽样配额抽样非概率抽样非概率抽样抽样方
7、式抽样方式不等概抽样不等概抽样11/19/202211统计学专业必修课3学分(一一)非概率抽样非概率抽样(non-probability sampling)非随机抽样非随机抽样/有目的抽样有目的抽样/判断抽样判断抽样1、含义与基本方法、含义与基本方法n非概率抽样与概率抽样相对应,无严格定义。主要非概率抽样与概率抽样相对应,无严格定义。主要特征是:抽样时并不依据随机原则,各单位被抽中特征是:抽样时并不依据随机原则,各单位被抽中的概率事先未知或难以确定的概率事先未知或难以确定n如我国所谓的典型调查和重点调查,西方国家称为如我国所谓的典型调查和重点调查,西方国家称为有目的抽样有目的抽样(purpos
8、ive s)或判断抽样或判断抽样(judgment s)或或有代表性抽样有代表性抽样(representative s)n市场调查中通常采用的配额抽样市场调查中通常采用的配额抽样(quota sampling)、方便抽样方便抽样(convenience sampling)n社会调查中的滚雪球抽样、网上进行调查时的自愿社会调查中的滚雪球抽样、网上进行调查时的自愿样本等样本等11/19/202212统计学专业必修课3学分(1)随意随意/任意任意/方便抽样方便抽样n抽样者遵循抽样者遵循简便性原则随意地、任意地或按其方便性简便性原则随意地、任意地或按其方便性从总体中抽取样本,比如从总体中抽取样本,比如
9、n实验人员从笼子里抓取最靠近笼门的小白鼠做实验实验人员从笼子里抓取最靠近笼门的小白鼠做实验n节目主持人从放在玻璃缸里的众多观众来信中随手节目主持人从放在玻璃缸里的众多观众来信中随手抽出几封来宣读内容或颁奖抽出几封来宣读内容或颁奖n每年每年“3.15”前后,中央电视台、中国消费者协会前后,中央电视台、中国消费者协会和国家技术监督局组织国家新闻单位开展和国家技术监督局组织国家新闻单位开展“质量万质量万里行里行”活动,到全国各地了解市场商品质量,打击活动,到全国各地了解市场商品质量,打击假冒伪劣商品,其中很多都是在街头向行人假冒伪劣商品,其中很多都是在街头向行人了解了解对对商品质量的反映商品质量的反
10、映n简便易行成本低简便易行成本低n但样本偏差往往较大,调查或推断的结论不具有一般但样本偏差往往较大,调查或推断的结论不具有一般意义意义11/19/202213统计学专业必修课3学分(2)判断判断/有目的有目的/有代表性抽样有代表性抽样n抽样者抽样者根据自己的知识、经验和判断根据自己的知识、经验和判断从从N中挑选出中挑选出“典典型的型的”或或“有代表性的有代表性的”单位来组成样本单位来组成样本n常用于企业管理水平调查、市场商品消费结构调查、常用于企业管理水平调查、市场商品消费结构调查、居民家庭收入调查等,比如居民家庭收入调查等,比如n调查企业管理水平,可以按经验分别选取管理水平高、调查企业管理水
11、平,可以按经验分别选取管理水平高、管理水平一般、管理水平较差等不同类型作为调查样本,管理水平一般、管理水平较差等不同类型作为调查样本,以调查结果为依据,综合评价企业管理工作中的经验和以调查结果为依据,综合评价企业管理工作中的经验和问题问题划类选典式划类选典式n编制市场物价指数时,常采用判断抽样法选取商品目录编制市场物价指数时,常采用判断抽样法选取商品目录和地区样本和地区样本n优缺点:优缺点:n可以充分发挥主观能动性和利用已有信息可以充分发挥主观能动性和利用已有信息n但样本单位的但样本单位的“代表性代表性”很有限,且无法衡量很有限,且无法衡量11/19/202214统计学专业必修课3学分(3)定
12、额定额/配额配额/计划抽样计划抽样n美国盖洛普公司发明使用的,美国盖洛普公司发明使用的,目的是目的是增进判断抽样的增进判断抽样的样本代表性样本代表性n做法:做法:抽样者按照规定的定额获得一个在某些特征上抽样者按照规定的定额获得一个在某些特征上与总体结构大致成比例的样本与总体结构大致成比例的样本n单变量配额,即独立控制配额单变量配额,即独立控制配额n多变量配额,即交叉控制配额多变量配额,即交叉控制配额n这种抽样具有一定的科学性,因而在市场调查、民意这种抽样具有一定的科学性,因而在市场调查、民意测验等方面有较广泛的应用测验等方面有较广泛的应用n但判断抽样的缺点它同样难以克服但判断抽样的缺点它同样难
13、以克服11/19/202215统计学专业必修课3学分(4)流动总体抽样流动总体抽样/捕获再捕获抽样捕获再捕获抽样(sampling of mobile population)/(capture-tag-recapture)n一般用于流动总体的总体总量的推算一般用于流动总体的总体总量的推算n做法做法:n抽样者先从总体抽样者先从总体(比如水库中的鱼比如水库中的鱼)中获取部分单位中获取部分单位(如如300尾鱼尾鱼),加以标记后再放回总体,过段时间,加以标记后再放回总体,过段时间再获取部分单位再获取部分单位(如如1000尾鱼尾鱼),然后根据再获取,然后根据再获取单位中有标记单位的比例来推算总体的数量单
14、位中有标记单位的比例来推算总体的数量n适用性适用性:n这种抽样适用于事先对总体缺乏认识而调查单位又这种抽样适用于事先对总体缺乏认识而调查单位又处于流动状态的研究对象处于流动状态的研究对象11/19/202216统计学专业必修课3学分2、非概率抽样的特点及优缺点、非概率抽样的特点及优缺点n样本的抽选样本的抽选不是按照随机原则不是按照随机原则,而是,而是根据主观判断根据主观判断,有目的、有意识或根据方便的原则有目的、有意识或根据方便的原则进行进行优点:可充分利用已知信息,优点:可充分利用已知信息,人为地选择人为地选择较为典型的较为典型的样本,从而可以缩小抽样范围,节约调查时间、人员样本,从而可以缩
15、小抽样范围,节约调查时间、人员和经费和经费缺点:采用非概率抽样方法获得的数据缺点:采用非概率抽样方法获得的数据不能计算抽样不能计算抽样误差误差,也,也不能从概率的意义上控制误差并保证推断的不能从概率的意义上控制误差并保证推断的可靠性可靠性。所以,它虽然重视样本与总体的关系,即也。所以,它虽然重视样本与总体的关系,即也可以从样本特征推断总体特征,但这种推论缺乏理论可以从样本特征推断总体特征,但这种推论缺乏理论上的科学依据,上的科学依据,其效果的好坏在很大程度上依赖于抽其效果的好坏在很大程度上依赖于抽样者的主观判断能力和经验,因此其可靠程度也只能样者的主观判断能力和经验,因此其可靠程度也只能由调查
16、人员主观评定,而不能客观衡量由调查人员主观评定,而不能客观衡量11/19/202217统计学专业必修课3学分3、适用性、适用性n为了快速得到总体一般性质方面的信息为了快速得到总体一般性质方面的信息n对某突发事件的现场调查对某突发事件的现场调查n为进一步深入调查研究而作的为进一步深入调查研究而作的前期预备性实验性调前期预备性实验性调查查等等n非概率抽样法在市场调查中得到了广泛的应用非概率抽样法在市场调查中得到了广泛的应用11/19/202218统计学专业必修课3学分(二二)概率抽样概率抽样/随机抽样随机抽样本课程内容本课程内容(probability sampling)/(random samp
17、ling)n概率抽样是严格意义上的抽样调查,即概率抽样是严格意义上的抽样调查,即“狭义的狭义的”抽样调抽样调查查n按照随机原则抽取样本,使总体中每个单位都有一个按照随机原则抽取样本,使总体中每个单位都有一个事先事先已知已知的的非零概率非零概率被抽中被抽中n总体各单位被抽中的概率可以通过样本设计总体各单位被抽中的概率可以通过样本设计(sample design)来规定,并通过某种随机化来规定,并通过某种随机化(randomization)操作操作来实现来实现n常用的概率抽样的方式:常用的概率抽样的方式:n简单随机抽样简单随机抽样(srs:simple random sampling)n分层抽样分
18、层抽样(st:stratified sampling)n系统抽样系统抽样(sy:systematic sampling)n整群抽样整群抽样(cl:cluster sampling)n多阶段抽样多阶段抽样(ms:multi-stage sampling)11/19/202219统计学专业必修课3学分概率抽样的特点概率抽样的特点(重点掌握重点掌握)(1)样本的抽取遵循样本的抽取遵循随机原则随机原则u按随机原则取样按随机原则取样 抽取样本时抽取样本时排除主观排除主观上有意识地抽取,某个单位上有意识地抽取,某个单位是否被抽中完全是否被抽中完全由客观的随机化程序由客观的随机化程序来决定来决定随机化程序随
19、机化程序即抽样组织方式,体现了统计学家即抽样组织方式,体现了统计学家的抽样技术研究成果的抽样技术研究成果主观只能决定选择哪种随机化程序,即决定怎样抽,主观只能决定选择哪种随机化程序,即决定怎样抽,而不能决定抽哪个而不能决定抽哪个u每个单位都按照一定的、事先已知或可以计算出的每个单位都按照一定的、事先已知或可以计算出的概率被抽中概率被抽中两个核两个核心点心点11/19/202220统计学专业必修课3学分对对“随机随机”的理解的理解n可将按随机原则取样的过程看成是进行一次随机试验可将按随机原则取样的过程看成是进行一次随机试验的过程,随机化程序给出了随机取样的实现过程的过程,随机化程序给出了随机取样
20、的实现过程n随机试验的特点包括:随机试验的特点包括:n试验可以重复进行试验可以重复进行n可能结果不止一个,但可以列示可能结果不止一个,但可以列示n每次试验取到哪个结果不知道每次试验取到哪个结果不知道n咬文嚼字:咬文嚼字:n“随随”,包含有,包含有“随从随从”、“因应变化因应变化”之意之意n“机机”,包含有,包含有”机遇机遇”、”机会机会”、“可能可能”、“说不清说不清的因由的因由”之意之意n“随机随机”的意思是指:结果任由天定,过程中要避免任何可的意思是指:结果任由天定,过程中要避免任何可能带来系统性或趋势性影响的人为干预,具有不确定性和难能带来系统性或趋势性影响的人为干预,具有不确定性和难以
21、预测性以预测性n所以,随机抽样就是以一定的概率抽取样本的一种方所以,随机抽样就是以一定的概率抽取样本的一种方法,这种方法法,这种方法“各种结果的可能性都不能排除,人们各种结果的可能性都不能排除,人们事先不能确知结果事先不能确知结果”11/19/202221统计学专业必修课3学分理解:每个单元被抽中的概率是已知理解:每个单元被抽中的概率是已知的,或是可以计算出来的的,或是可以计算出来的比如,简单随机抽样比如,简单随机抽样srs,1000个单元中抽个单元中抽100个个比如,分层随机抽样比如,分层随机抽样str100501000100100005001/21/101/20Nhnh大型企业大型企业中型
22、企业中型企业小型企业小型企业被抽中的概率被抽中的概率又如,又如,PPS抽样,抽样,2个企业中取个企业中取1个个1000万元万元 500万元万元2/31/3净利润净利润入样概率入样概率甲甲乙乙扩展扩展入样概率入样概率11/19/202222统计学专业必修课3学分关于关于“入样概率入样概率”的注意事项的注意事项n“入样概率入样概率”必须是必须是“非非0概率概率”n估计量的形式与入样概率有关,即,用样本资料估计总体估计量的形式与入样概率有关,即,用样本资料估计总体目标量时,要考虑该样本目标量时,要考虑该样本(或每个样本单元或每个样本单元)被抽中的概率,被抽中的概率,也就是说,估计量不仅与样本单元的观
23、测值有关,也与其也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关入样概率有关n如果各单元入样概率均相等如果各单元入样概率均相等 简单估计简单估计 比如比如srs及其他复杂抽样的特殊情况及其他复杂抽样的特殊情况n如果入样概率不等如果入样概率不等 加权估计加权估计 比如比如str、pps等等11/19/202223统计学专业必修课3学分2、可运用概率估计的方法推断总体的、可运用概率估计的方法推断总体的数量特征数量特征n大数定律和中心极限定理通过抽样分布规律描述了样大数定律和中心极限定理通过抽样分布规律描述了样本和总体的内在联系本和总体的内在联系n根据这种内在联系,运用概率估计的方法,
24、就可以对根据这种内在联系,运用概率估计的方法,就可以对总体数量特征做出具有一定概率保证程度的推断总体数量特征做出具有一定概率保证程度的推断11/19/202224统计学专业必修课3学分3、抽样误差可以计算并加以控制、抽样误差可以计算并加以控制n抽样调查是非全面调查,比如存在误差抽样调查是非全面调查,比如存在误差n抽样误差是由样本抽取的随机性所引起的抽样误差是由样本抽取的随机性所引起的n抽样误差的大小反映了抽样推断的效果抽样误差的大小反映了抽样推断的效果n抽样分布规律给出了计算和控制抽样误差的依据抽样分布规律给出了计算和控制抽样误差的依据11/19/202225统计学专业必修课3学分注意:注意:
25、n注意区分:注意区分:n概率抽样与非概率抽样概率抽样与非概率抽样n等概率抽样与不等概率抽样等概率抽样与不等概率抽样n问题:问题:n概率抽样是等概率抽样吗?概率抽样是等概率抽样吗?n非概率抽样是不等概率抽样吗?非概率抽样是不等概率抽样吗?n解答关键点:解答关键点:n概率抽样既有等概率抽样,也有不等概率抽样概率抽样既有等概率抽样,也有不等概率抽样n非概率抽样中没有入样概率这一概念,也就谈不上抽样是等非概率抽样中没有入样概率这一概念,也就谈不上抽样是等概率还是不等概率概率还是不等概率11/19/202226统计学专业必修课3学分二、抽样调查的基本程序二、抽样调查的基本程序n首先要确定调研问题、明确研
26、究对象等首先要确定调研问题、明确研究对象等n1、设计抽样方案、设计抽样方案n2、编制抽样框和设计调查表、编制抽样框和设计调查表n3、试抽样调查、试抽样调查n4、正式抽样调查、正式抽样调查n5、数据处理、数据处理n6、推断分析、推断分析n7、总结评估、总结评估11/19/202227统计学专业必修课3学分抽样调查基本程序抽样调查基本程序确定调研问题确定调研问题抽样否抽样否否否抽样方案设计抽样方案设计问卷问卷/调查表调查表设计设计实施抽样实施抽样实施调查实施调查数据整理数据整理分析分析撰写调研报告撰写调研报告研究环节研究环节实施环节实施环节如何抽样如何抽样抽多少抽多少数据怎样搜集数据怎样搜集试试/
27、预调查预调查正式调查正式调查11/19/202228统计学专业必修课3学分确定调研问题确定调研问题n确定调研问题即确定调查目的确定调研问题即确定调查目的n调查目的决定了调查的内容和方法,体现了调查目的决定了调查的内容和方法,体现了科学性和可行性科学性和可行性的结合的结合n确定调研问题的关键:确定调研问题的关键:n关键是关键是明确定义问题明确定义问题,包括对整个问题的叙述以及确定研究,包括对整个问题的叙述以及确定研究问题的具体组成部分问题的具体组成部分n回答回答“要做什么样的调查研究要做什么样的调查研究”以及以及“为什么要做这项调查为什么要做这项调查研究研究”n调研人员需要做的工作:调研人员需要
28、做的工作:n考虑考虑研究的目的研究的目的,相关的,相关的背景资料背景资料,所需,所需信息信息,以及这些信,以及这些信息进行分析时息进行分析时如何使用如何使用n需要与有关部门的决策者进行需要与有关部门的决策者进行反复多轮次反复多轮次的认真讨论,访问的认真讨论,访问有关行业专家,分析二手资料,必要时还需要进行如座谈会有关行业专家,分析二手资料,必要时还需要进行如座谈会那样的定性调查那样的定性调查11/19/202229统计学专业必修课3学分例例1:1994年某市居民住宅消费调查年某市居民住宅消费调查n总研究目的的表述:总研究目的的表述:n“通过对某市部分居民的收入水平、住房现状、住宅消费与通过对某
29、市部分居民的收入水平、住房现状、住宅消费与购房意向、存贷款观念等方面的实地调查,分析金融机构开购房意向、存贷款观念等方面的实地调查,分析金融机构开展住宅储蓄以及购房抵押贷款业务的市场需求与潜力,为展住宅储蓄以及购房抵押贷款业务的市场需求与潜力,为银行在这两项业务上推出新举措提供客观可靠的参考依据银行在这两项业务上推出新举措提供客观可靠的参考依据”n总研究目的的具体化:总研究目的的具体化:n被调查者及其家庭的基本情况被调查者及其家庭的基本情况n被调查者家庭的住房现状及改善意向被调查者家庭的住房现状及改善意向n被调查者的储蓄观念被调查者的储蓄观念n被调查者对住宅存、贷款业务的看法被调查者对住宅存、
30、贷款业务的看法n部分企事业单位对其职员住房问题的计划等部分企事业单位对其职员住房问题的计划等11/19/202230统计学专业必修课3学分例例2:五次人口普查:五次人口普查n第一次,第一次,1953年年7月月1日日0时。目的:配合召开全国人大,时。目的:配合召开全国人大,确定选民及人大代表名额的需要,并为国家制定一五计划确定选民及人大代表名额的需要,并为国家制定一五计划提供确实的人口数字,所以调查项目有:姓名、与户主关提供确实的人口数字,所以调查项目有:姓名、与户主关系、年龄、性别、民族、本户住址等系、年龄、性别、民族、本户住址等6个项目个项目n第二次,第二次,1964年年7月月1日日0时。在
31、第一次基础上增加了:时。在第一次基础上增加了:本人成分、文化程度、职业等本人成分、文化程度、职业等n第三次,第三次,1982年年7月月1日日0时。目的:为配合社会主义现时。目的:为配合社会主义现代化建设,统筹安排人民的物质和文化生活,为制定人口代化建设,统筹安排人民的物质和文化生活,为制定人口政策和规划,提供准确的人口数字资料,所以搞了政策和规划,提供准确的人口数字资料,所以搞了13项项人记录项目,人记录项目,6项户记录项目项户记录项目n第四次,第四次,1990年年7月月1日日0时。目的:为研究近五年改革时。目的:为研究近五年改革开放后的人口流动和迁移状况,所以在开放后的人口流动和迁移状况,所
32、以在1982年的基础上年的基础上又增加了又增加了2项人记录项目项人记录项目n第五次,第五次,2000年年11月月1日日0时,普查项目比时,普查项目比90年增加了年增加了一倍多,且首次增加了住房内容一倍多,且首次增加了住房内容11/19/202231统计学专业必修课3学分1、设计抽样方案、设计抽样方案(重点掌握框架重点掌握框架)n明确规定调查目的及目标总体,确定所要估计的目标量明确规定调查目的及目标总体,确定所要估计的目标量n确定搜集哪些资料以及搜集的方法确定搜集哪些资料以及搜集的方法n确定抽样组织方式,即确定抽样组织方式,即如何抽样如何抽样,兼顾科学性和可行性,兼顾科学性和可行性n编制编制抽样
33、框抽样框,要根据抽样方法和数据收集方法的不同来,要根据抽样方法和数据收集方法的不同来编制编制n规定要达到的精度、规定要达到的精度、确定确定n、经费核算等问题、经费核算等问题n给出与抽样设计相匹配的总体参数的给出与抽样设计相匹配的总体参数的估计量,并考察估估计量,并考察估计量的性质计量的性质n对非抽样误差的预防和控制办法,比如对拒访等的处理对非抽样误差的预防和控制办法,比如对拒访等的处理方法方法11/19/202232统计学专业必修课3学分2、调查表、调查表/问卷设计问卷设计n对调查项目的要求对调查项目的要求n问卷的项目应当有确切的含义和统一的解释问卷的项目应当有确切的含义和统一的解释n应该列入
34、能取得确切资料的项目应该列入能取得确切资料的项目n问题间要具有逻辑关系问题间要具有逻辑关系n形式形式n易填易答,便于计算机处理。一个形式繁琐的问卷会使被访易填易答,便于计算机处理。一个形式繁琐的问卷会使被访者难以忍受,从而易出现错答、拒答或不完全回答、随意回者难以忍受,从而易出现错答、拒答或不完全回答、随意回答的情况答的情况n提问技巧提问技巧n问卷开头的设计问卷开头的设计n各种问题的提问技巧各种问题的提问技巧n答案设计技巧答案设计技巧n监控手段的使用监控手段的使用11/19/202233统计学专业必修课3学分Nielsen电视收视率调查中的有关定义电视收视率调查中的有关定义n是否拥有汽车:私家
35、车是否拥有汽车:私家车n家庭成员数:家庭成员数:n一周内有五天或以上吃住于该家庭住址内的所有成一周内有五天或以上吃住于该家庭住址内的所有成员员n家庭月总收入:家庭月总收入:n每个家庭成员每月的收入总和,包括汇款及其他任每个家庭成员每月的收入总和,包括汇款及其他任何形式的收入何形式的收入11/19/202234统计学专业必修课3学分问卷中敏感性问题不能太多问卷中敏感性问题不能太多n某高校关于考风考纪的调查某高校关于考风考纪的调查nn你在以往的历次期末考试中有没有作弊?你在以往的历次期末考试中有没有作弊?(有,没有,没有有)n如果你作弊了,作弊的门次数大约为如果你作弊了,作弊的门次数大约为(1次,
36、次,2-3次,次,4-6次,次,6次以上次以上)n你主要在以下哪种性质的课程中作弊?你主要在以下哪种性质的课程中作弊?(通识教育通识教育课、学科共同基础课、专业必修课、专业选修课课、学科共同基础课、专业必修课、专业选修课)n选学科共同基础课的同学请回答:你主要在以下哪选学科共同基础课的同学请回答:你主要在以下哪些课程中作弊了?些课程中作弊了?n11/19/202235统计学专业必修课3学分问卷的开头问卷的开头n_女士女士/小姐小姐/先生:先生:n 您好!我是中国人民大学调查技术研究所的访问员,您好!我是中国人民大学调查技术研究所的访问员,我们正在进行一项有关公众医疗保险意识的调查,目我们正在进
37、行一项有关公众医疗保险意识的调查,目的是想了解人们对医疗保险的看法和意见。的是想了解人们对医疗保险的看法和意见。您的回答您的回答无所谓对错无所谓对错,只要是您真实的情况和看法,都将有益,只要是您真实的情况和看法,都将有益于改善公众医疗保险方面的服务,我们都将十分珍视。于改善公众医疗保险方面的服务,我们都将十分珍视。同时我们再次郑重向您做出承诺:对您的回答和个人同时我们再次郑重向您做出承诺:对您的回答和个人情况将完全保密,既不泄露给第三者,也不会公开发情况将完全保密,既不泄露给第三者,也不会公开发表,除非您本人完全愿意。可能要耽误您表,除非您本人完全愿意。可能要耽误您15分钟左右分钟左右的时间,
38、请您配合,谢谢您的支持!的时间,请您配合,谢谢您的支持!n 摘自摘自公众医疗保险意识调查问卷公众医疗保险意识调查问卷11/19/202236统计学专业必修课3学分提问技术提问技术n问题问题1:你是否经常看电影?:你是否经常看电影?n改为:你上个月看了几次电影?改为:你上个月看了几次电影?n问题问题2:调查工人的劳动定额是否合理,如果直接向:调查工人的劳动定额是否合理,如果直接向每个工人提问:您觉得本公司的劳动定额制定的是否每个工人提问:您觉得本公司的劳动定额制定的是否合理?合理?n改为:您觉得对于大多数工人来说,劳动定额制定改为:您觉得对于大多数工人来说,劳动定额制定的是否合理?的是否合理?n
39、这样的提问可能回获得较为客观的资料这样的提问可能回获得较为客观的资料11/19/202237统计学专业必修课3学分“撒胡椒面撒胡椒面”的做法控制作弊的做法控制作弊n问卷上撒上一些检查用的问题,这些问题与问卷中的问卷上撒上一些检查用的问题,这些问题与问卷中的某些题是高度相关甚至是完全相同的,不注意就是出某些题是高度相关甚至是完全相同的,不注意就是出现矛盾现矛盾n固定接驳电视录影机与家庭录像机固定接驳电视录影机与家庭录像机n被访者名单上安插一些被访者名单上安插一些“检查员检查员”,可能是调查公司,可能是调查公司或委托客户公司中的工作人员或委托客户公司中的工作人员11/19/202238统计学专业必
40、修课3学分3、实施调查过程、实施调查过程n关键:保证原始数据质量关键:保证原始数据质量n调查实施调查实施前前,需要对调查员进行技术培训,使调查,需要对调查员进行技术培训,使调查员熟悉调查问卷,掌握访谈技巧,增强责任心员熟悉调查问卷,掌握访谈技巧,增强责任心n调查过程调查过程中中,加强质量检验,出现问题及时总结,加强质量检验,出现问题及时总结,及时补救。如果调查项目比较大,又是第一次进行,及时补救。如果调查项目比较大,又是第一次进行,或者对问卷设计的把握不够大,在正式调查实施前,或者对问卷设计的把握不够大,在正式调查实施前,还应当进行一次还应当进行一次预调查预调查(试调查试调查),以检验各方面的
41、工,以检验各方面的工作是否完善作是否完善n调查调查后后,复查、验收调查员工作,复查、验收调查员工作11/19/202239统计学专业必修课3学分专业调研公司的工作手册专业调研公司的工作手册n专业性调研公司对每一部分的工作一般都会制定详细专业性调研公司对每一部分的工作一般都会制定详细的工作手册或工作流程的工作手册或工作流程n调查员的基本条件调查员的基本条件n调查员的培训手册调查员的培训手册n督导员工作手册督导员工作手册n一审要求及问卷、二审要求及问卷一审要求及问卷、二审要求及问卷n复查规则复查规则n调查员评价标准等调查员评价标准等11/19/202240统计学专业必修课3学分4、数据处理分析、数
42、据处理分析n首先要对经过调查获得的原始数据进行检查、核对首先要对经过调查获得的原始数据进行检查、核对n对验收合格的调查问卷进行编码和录入对验收合格的调查问卷进行编码和录入n进行数据的进行数据的预处理预处理,为统计分析做好准备,为统计分析做好准备n录入数据的再编码,它是对原编码的补充和调整录入数据的再编码,它是对原编码的补充和调整n对缺失值进行插补,以构造出完整的数据集对缺失值进行插补,以构造出完整的数据集n变量的转换,比如标准化处理,使不同单位或不同变量的转换,比如标准化处理,使不同单位或不同量纲、不同量表的变量在分析中具有可比性量纲、不同量表的变量在分析中具有可比性n计算目标量的估计值、方差
43、及变异系数的估计值等计算目标量的估计值、方差及变异系数的估计值等n必要时还需要结合研究目的进行深入的统计处理与必要时还需要结合研究目的进行深入的统计处理与分析分析11/19/202241统计学专业必修课3学分数据的分析数据的分析n背景分析背景分析n原因分析原因分析n目标市场特征分析目标市场特征分析n途径分析等途径分析等分析的基础上来推断总体分析的基础上来推断总体不同抽样方法下推断方式不尽相同不同抽样方法下推断方式不尽相同11/19/202242统计学专业必修课3学分5、撰写调查报告、撰写调查报告/总结评估总结评估n(1)主题主题n(2)范围范围n(3)调查对象调查对象 n(4)资料收集方法资料
44、收集方法n(5)调查期、参考期和报告期调查期、参考期和报告期 n(6)抽样设计和估计程序抽样设计和估计程序n(7)结论的描述结论的描述 n(8)精确度精确度n(9)责任责任n(10)参考文献参考文献11/19/202243统计学专业必修课3学分三、抽样技术三、抽样技术/抽样调查的作用抽样调查的作用一般性掌握一般性掌握与与统计学原理统计学原理相关知识衔接相关知识衔接11/19/202244统计学专业必修课3学分(一)从研究对象的角度来说(一)从研究对象的角度来说1.对那些不可能进行全面观察或普查而又需要了解全面对那些不可能进行全面观察或普查而又需要了解全面情况的客观对象情况的客观对象(总体总体)
45、,只能抽样调查,只能抽样调查n所研究的总体是无限的所研究的总体是无限的n破坏性测试破坏性测试2.适用于大规模的社会经济调查和民意测验等适用于大规模的社会经济调查和民意测验等n这类调查的总体虽然是有限的,理论上可以进行普这类调查的总体虽然是有限的,理论上可以进行普查,但实际难以操作。普查耗资巨大,而且也不必查,但实际难以操作。普查耗资巨大,而且也不必得到确切的结论。比如:得到确切的结论。比如:n对居民的家庭收支状况或消费情况调查对居民的家庭收支状况或消费情况调查n各类市场调查各类市场调查n居民电视节目的收视率调查等等居民电视节目的收视率调查等等11/19/202245统计学专业必修课3学分(二)
46、有时全面调查、抽样调查都可用,(二)有时全面调查、抽样调查都可用,用抽样调查有以下优点用抽样调查有以下优点n1.节约费用,特别是当总体较大时节约费用,特别是当总体较大时n2.时效性强时效性强n对时效性要求比较强的调查,都普遍采用抽样调查方对时效性要求比较强的调查,都普遍采用抽样调查方法及时取得信息法及时取得信息n重大事件新闻舆论调查重大事件新闻舆论调查n西方国家反映总统竞选过程的调查西方国家反映总统竞选过程的调查n大多数市场及消费行为调查大多数市场及消费行为调查n季节性农作物产量调查以准备组织调运季节性农作物产量调查以准备组织调运n3.有助于提高调查数据的质量有助于提高调查数据的质量11/19
47、/202246统计学专业必修课3学分调查中的误差来源调查中的误差来源调查中的调查中的误差按产误差按产生的原因生的原因来分来分工作工作性误差性误差(登记登记性误差性误差)代表性误差代表性误差偶然性的偶然性的代表性误差代表性误差系统性的系统性的代表性误差代表性误差是调查登记、汇是调查登记、汇总计算中的总计算中的差错差错无法计算,无法计算,可采可采取措施尽量避免取措施尽量避免抽样误差抽样误差。随机。随机抽样特有的,不抽样特有的,不是差错,不可避是差错,不可避免,但可以计算免,但可以计算并控制并控制违反随机原违反随机原则抽样导致则抽样导致的,可以尽的,可以尽可能地避免可能地避免样本不足以代样本不足以代
48、表总体而产生表总体而产生的误差的误差非抽样非抽样误差误差11/19/202247统计学专业必修课3学分思考:思考:P17 1.11.6l注:注:l此类题目没有标准答案,只有参考的思路此类题目没有标准答案,只有参考的思路l原因是:原因是:l不同时间、空间、背景下可能有差异不同时间、空间、背景下可能有差异1结束结束11/19/202248统计学专业必修课3学分2 基本概念基本概念(CH2-1/2/3)一、总体与样本一、总体与样本二、估计量与抽样分布二、估计量与抽样分布三、抽样误差与置信区间三、抽样误差与置信区间11/19/202249统计学专业必修课3学分一、总体与样本一、总体与样本n(一)总体:
49、目标总体与调查总体(一)总体:目标总体与调查总体n(二)调查单位与抽样单位(二)调查单位与抽样单位n(三)抽样框(三)抽样框n(四)样本(四)样本n(五)总体指标与样本指标(五)总体指标与样本指标11/19/202250统计学专业必修课3学分目标总体目标总体(target population)n简称为总体,简称为总体,即即研究对象的全体,研究对象的全体,由研究对象中由研究对象中所有性质所有性质相同的个体相同的个体组成组成n总体中包含的基本单元数用总体中包含的基本单元数用N表示表示n在一项调查中,要对目标总体的范围做出具体规定,目标在一项调查中,要对目标总体的范围做出具体规定,目标总体的划分有
50、时容易,有时不太容易,要注意统计口径总体的划分有时容易,有时不太容易,要注意统计口径n比如,对山东财政学院的教工调查比如,对山东财政学院的教工调查n教师、教工、教职工、教职员工教师、教工、教职工、教职员工n比如,家庭常住人口数比如,家庭常住人口数n有时,目标总体非常复杂,尤其在社会经济调查中,想得有时,目标总体非常复杂,尤其在社会经济调查中,想得到一个包括目标总体全部单位的框架往往很难,只能用一到一个包括目标总体全部单位的框架往往很难,只能用一个接近目标总体,且容易取得和便于操作的框架来代替个接近目标总体,且容易取得和便于操作的框架来代替 抽样框抽样框/抽样总体抽样总体/调查总体调查总体(sa