《第八章 抽样设计精选文档.ppt》由会员分享,可在线阅读,更多相关《第八章 抽样设计精选文档.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章 抽样设计本讲稿第一页,共五十四页返回总目录返回总目录返回本章返回本章8.1 8.1 抽样调查的基本概念抽样调查的基本概念一、抽样调查的特点二、抽样调查的作用三、常用术语四、抽样方案设计本讲稿第二页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样调查的特点1.1.1.1.定义:定义:定义:定义:指从总体中抽取一部分单位作为样本进行调查,然后根据样指从总体中抽取一部分单位作为样本进行调查,然后根据样本调查结果对总体情况作出推断和估计的调查法。本调查结果对总体情况作出推断和估计的调查法。抽样调查的理论原理是数理统计知识抽样调查的理论原理是数理统计知识 。总体总体总体总体样本样本样本样
2、本样本统计量样本统计量样本统计量样本统计量 (X X X X)总体参数估计总体参数估计总体参数估计总体参数估计本讲稿第三页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样调查的特点2.2.2.2.分类:分类:分类:分类:按被抽取机会是否相等,可以分为:按被抽取机会是否相等,可以分为:随机抽样:按照随机原则抽取样本。随机抽样:按照随机原则抽取样本。随机抽样:按照随机原则抽取样本。随机抽样:按照随机原则抽取样本。随机原则:完全排除了人的主观应因素影响,使每一个单位都有同等的可能性被抽到 。优点:优点:优点:优点:1、抽出样本的分布情况接近总体,样本对总体研究具有充分的代表性。2、有助于调查
3、人员准确地计算抽样误差,并有效的加以控制,从而提高调查的精度 本讲稿第四页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样调查的特点非随机抽样:不遵循随机原则,从方便出发或根据主观判断非随机抽样:不遵循随机原则,从方便出发或根据主观判断非随机抽样:不遵循随机原则,从方便出发或根据主观判断非随机抽样:不遵循随机原则,从方便出发或根据主观判断来抽取样本。来抽取样本。来抽取样本。来抽取样本。非随机抽样简单易行,尤其适用于做探所性研究非随机抽样简单易行,尤其适用于做探所性研究 。非随机抽样无法估计和控制抽样误差,无法用样本的非随机抽样无法估计和控制抽样误差,无法用样本的定量资料,采用统计方法来
4、推断总体,定量资料,采用统计方法来推断总体,优点:优点:优点:优点:缺点:缺点:缺点:缺点:本讲稿第五页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样调查的特点3.3.3.3.特点:特点:特点:特点:(1 1)经济,抽样调查节约人力、物力和财力。)经济,抽样调查节约人力、物力和财力。(2 2)高效,抽样调查更节省时间。如城市住户调查。)高效,抽样调查更节省时间。如城市住户调查。(3 3)准确。)准确。本讲稿第六页,共五十四页返回总目录返回总目录返回本章返回本章1 1 1 1、作用:作用:作用:作用:(1 1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽)对一些不可能或不必
5、要进行全面调查的社会经济现象,最宜用抽样方式解决。样方式解决。二、抽样调查的作用 (2 2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节节省费用,争取时效省费用,争取时效,用较少的人力物力和时间达到满意的调查效果。,用较少的人力物力和时间达到满意的调查效果。(3 3)运用抽样调查对全面调查进行验证。运用抽样调查对全面调查进行验证。全面调查涉及面广、工作量大、全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然
6、不能用全面调查方式进行。时,显然不能用全面调查方式进行。(4 4)对调查主体进行连续调查。对调查主体进行连续调查。(5 5)可运用于企业质量管理。可运用于企业质量管理。举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。体的调查(如对森林木材积蓄量的调查)等。本讲稿第七页,共五十四页返回总目录返回总目录返回本章返回本章三、常用术语1 1 1 1、总体与样本总体与样本总体与样本总体与样本总体:总体:所要研究的对象全体。一般用所要研究的对象全体。一般用“N N”表示。表示。样本:样本:从总体按一
7、定程序抽取的个体或单元组合。从总体按一定程序抽取的个体或单元组合。一般用一般用“n n”表示。表示。某市在某市在12 12万名大学生中抽出万名大学生中抽出10001000人进行消费结构调查。人进行消费结构调查。认识:认识:总体:总体:12 12万名大学生就是调查。万名大学生就是调查。样本:被抽到的样本:被抽到的10001000名大学生。名大学生。本讲稿第八页,共五十四页返回总目录返回总目录返回本章返回本章三、常用术语2 2 2 2、总体指标和样本指标总体指标和样本指标总体指标和样本指标总体指标和样本指标总体指标:总体指标:即根据总体各个单位的标志值或属性值计算的综合指即根据总体各个单位的标志值
8、或属性值计算的综合指标。主要有:总体平均数、总体成数和总体方差。标。主要有:总体平均数、总体成数和总体方差。样本指标:样本指标:即根据样本各个单位的标志值计算的综合指标。即根据样本各个单位的标志值计算的综合指标。主要有:样本平均数、样本成数和样本方差。主要有:样本平均数、样本成数和样本方差。认识:认识:方差方差方差方差比例比例比例比例平均数平均数平均数平均数nN单位数单位数单位数单位数样本样本样本样本总体总体总体总体本讲稿第九页,共五十四页返回总目录返回总目录返回本章返回本章三、常用术语3 3 3 3、重复抽样与不重复抽样、重复抽样与不重复抽样、重复抽样与不重复抽样、重复抽样与不重复抽样 重复
9、抽样又称作重置抽样、有放回抽样:重复抽样又称作重置抽样、有放回抽样:即每抽一个单位,登记即每抽一个单位,登记结果后,又重新放回参加下一次的抽取,这样连续抽足一个样本结果后,又重新放回参加下一次的抽取,这样连续抽足一个样本所需的单位。所需的单位。抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取程序:程序:程序:程序:特点:特点:特点:特点:同一总体单位有可能被重复抽中,而且每次抽取都是独立进行。本讲稿第十页,共五十四页返回总目录返回总目录返回本章返回本章三、常用术语不重复抽样又被称作不重置抽样、不放回抽样:不重复抽样又被称作不重置抽样、不放回抽样:不重复抽样又被称作不重置抽样、不
10、放回抽样:不重复抽样又被称作不重置抽样、不放回抽样:即每抽一个单即每抽一个单即每抽一个单即每抽一个单位后,就不再放回参加下次的抽取,每抽一次,总体的单位数位后,就不再放回参加下次的抽取,每抽一次,总体的单位数位后,就不再放回参加下次的抽取,每抽一次,总体的单位数位后,就不再放回参加下次的抽取,每抽一次,总体的单位数就减少一个。就减少一个。就减少一个。就减少一个。程序:程序:程序:程序:特点:特点:特点:特点:同一总体中每个单位被抽中的机会并不均等,在连续同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都抽取时,每次抽取都不是独立不是独立进行。进行。抽出抽出个体个体登记登记特征特征
11、继续继续抽取抽取本讲稿第十一页,共五十四页返回总目录返回总目录返回本章返回本章三、常用术语3 3 3 3、抽样框与抽样单元、抽样框与抽样单元、抽样框与抽样单元、抽样框与抽样单元 抽样框抽样框指对可以供抽样用的所有调查单位的名册或详细名单。认识:认识:例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。常见的抽样框:常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册名录、街道派出所里居民户籍册、意向购房人信息册。注意:注意:在利用现有的名单作为抽样框时,要
12、先对该名录进行在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。总体的代表性。本讲稿第十二页,共五十四页返回总目录返回总目录返回本章返回本章三、常用术语抽样单元抽样单元指构成抽样框的有限又不重复的个体。指构成抽样框的有限又不重复的个体。1 1、抽样单元不仅指构成抽样框的目录项,同时还表示、抽样单元不仅指构成抽样框的目录项,同时还表示该目录项所对应的实际总体该目录项所对应的实际总体特定的一个或一些单元特定的一个或一些单元。2 2、抽样单元可大可小。、抽样单元可大可小。如:如:在手机调查中我们抽中
13、一栋居民楼,居民楼是一级单元,在手机调查中我们抽中一栋居民楼,居民楼是一级单元,而楼中的每个居民就是二级单元。而楼中的每个居民就是二级单元。说明:说明:说明:说明:本讲稿第十三页,共五十四页返回总目录返回总目录返回本章返回本章四、抽样方案设计1 1、定义:、定义:在抽取样本资料以前,预先确定抽样程序和方案。在抽取样本资料以前,预先确定抽样程序和方案。目的:目的:保证样本有代表性,经济、实惠。保证样本有代表性,经济、实惠。2 2 2 2、基本内容:、基本内容:、基本内容:、基本内容:明确抽样目的和明确抽样目的和明确抽样目的和明确抽样目的和任务要求任务要求任务要求任务要求确抽样框和单确抽样框和单确
14、抽样框和单确抽样框和单位位位位选择抽样选择抽样选择抽样选择抽样方法方法方法方法确定样本确定样本确定样本确定样本容量容量容量容量制定实施总体方案制定实施总体方案制定实施总体方案制定实施总体方案的办法和步骤的办法和步骤的办法和步骤的办法和步骤确定目标量的确定目标量的确定目标量的确定目标量的估算方法估算方法估算方法估算方法确定抽样确定抽样确定抽样确定抽样精度精度精度精度本讲稿第十四页,共五十四页返回总目录返回总目录返回本章返回本章3 3、抽样方案设计的主要程序:、抽样方案设计的主要程序:四、抽样方案设计本讲稿第十五页,共五十四页8.2 8.2 随机抽样技术随机抽样技术一、简单随机抽样返回总目录返回总
15、目录返回本章返回本章二、等距抽样三、分层抽样四、整群抽样五、多阶段抽样本讲稿第十六页,共五十四页返回总目录返回总目录返回本章返回本章一、简单随机抽样 简单随机抽样(简单随机抽样(简单随机抽样(简单随机抽样(SRSSRS)按照随机原则,从总体中不加任何分组、按照随机原则,从总体中不加任何分组、按照随机原则,从总体中不加任何分组、按照随机原则,从总体中不加任何分组、划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称非常非常非常
16、非常简单随机抽样(简单随机抽样(简单随机抽样(简单随机抽样(VSRSVSRS )性质:用不重复抽样方法,按随机原则从N个单位中抽取n个单位组成样本。则其样本数目 方法:抽签法或随机数法抽签法或随机数法抽签法或随机数法抽签法或随机数法抽签法抽签法给总体各单位编号后,把号码写在结构均匀的字签上,将字签给总体各单位编号后,把号码写在结构均匀的字签上,将字签混合均匀后即可从中抽取。混合均匀后即可从中抽取。随机数法随机数法 利用随机数表进行抽样的方法。利用随机数表进行抽样的方法。本讲稿第十七页,共五十四页返回总目录返回总目录返回本章返回本章一、简单随机抽样仅适用于规模不大、内部各单位标志值差异较小的总体
17、仅适用于规模不大、内部各单位标志值差异较小的总体应用:应用:应用:应用:优点:优点:(1 1)简单、直观比较容易理解和掌握;)简单、直观比较容易理解和掌握;(2 2)抽样框不需要其他辅助信息;)抽样框不需要其他辅助信息;(3 3)理论上比较成熟,有现成的方差估计公式。)理论上比较成熟,有现成的方差估计公式。缺点:缺点:(1 1)对样本编号困难;)对样本编号困难;(2 2)样本分散,费用较高;)样本分散,费用较高;(3 3)总体方差大时,样本代表性差;)总体方差大时,样本代表性差;(4 4)有些情况不能使用,如连续生产质检。)有些情况不能使用,如连续生产质检。本讲稿第十八页,共五十四页返回总目录
18、返回总目录返回本章返回本章二、等距抽样又称系统抽样又称系统抽样又称系统抽样又称系统抽样先把总体单位按某种顺序排列成行先把总体单位按某种顺序排列成行先把总体单位按某种顺序排列成行先把总体单位按某种顺序排列成行(或按自然顺序或按自然顺序或按自然顺序或按自然顺序),用随,用随,用随,用随机方法抽取第一个单位,机方法抽取第一个单位,机方法抽取第一个单位,机方法抽取第一个单位,以后每隔若干单位抽取一个单位。以后每隔若干单位抽取一个单位。以后每隔若干单位抽取一个单位。以后每隔若干单位抽取一个单位。1 1、和调查项目无关,如按照门牌号排列;、和调查项目无关,如按照门牌号排列;2 2、和调查项目有关,如按收入
19、给家庭排序。、和调查项目有关,如按收入给家庭排序。排列:排列:排列:排列:抽选抽选抽选抽选 方法:方法:方法:方法:设总体单元数为设总体单元数为N N,要抽,要抽n n个单元为样本,先计算抽样间隔个单元为样本,先计算抽样间隔k=N/nk=N/n(取整)取整),在在1 1到到k k之间抽取一个随机起点之间抽取一个随机起点r r,则被抽中单元的顺序,则被抽中单元的顺序位置是:位置是:r r,r+kr+k,r+2kr+2k,。当。当N N不能被不能被n n整除时,采用整除时,采用圆形系统抽样方法圆形系统抽样方法圆形系统抽样方法圆形系统抽样方法。本讲稿第十九页,共五十四页返回总目录返回总目录返回本章返
20、回本章二、等距抽样举例:举例:举例:举例:某企业对购进的某企业对购进的1000010000台电视机的质量进行调查,计划抽台电视机的质量进行调查,计划抽取取400400台作为样本调查,总体编号为台作为样本调查,总体编号为1-100001-10000。1 1、样本间距为、样本间距为K=10000/400=25K=10000/400=25。2 2、然后从、然后从1-251-25中任意抽取一个数为样本,中任意抽取一个数为样本,假定为第假定为第8 8台台,则,则第第2 2个样本为个样本为8+25=338+25=33,即抽取第,即抽取第3333台作为第台作为第2 2个样本,以个样本,以此类推,一直抽够此类
21、推,一直抽够400400台为止。台为止。本讲稿第二十页,共五十四页返回总目录返回总目录返回本章返回本章二、等距抽样 (1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)要知道有关材料,如排序标志;(3)没有一个无偏的方差估计量;误差计算复杂。优点:优点:优点:优点:(1)简便易行,容易确定样本单元(2)分布比较均匀,有利于提高估计精度 例 如:对公路旁树木进行病虫害防治,确定每30棵树检查1棵,只要确定了起点的被检查树,每隔30棵检查1棵即可。缺点:缺点:缺点:缺点:国家统计局的调查多采用系统抽样,它便于操作。国家统计局的调查多采用系统抽样,它便于操作。国家统计局的调查多采用系
22、统抽样,它便于操作。国家统计局的调查多采用系统抽样,它便于操作。本讲稿第二十一页,共五十四页返回总目录返回总目录返回本章返回本章三、分层抽样 将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样方式从各组中抽取一定数目的总体单位组成样本的抽样组织方式。方式从各组中抽取一定数目的总体单位组成样本的抽样组织方式。方式从各组中抽取一定数目的总体单位组成样本的抽样组织方式。方式从各组中抽取一定数目的总体单位组成样本的抽样组织
23、方式。总体总体N样本样本n等额抽取等额抽取不等比例抽取不等比例抽取等比例抽取等比例抽取描述:描述:描述:描述:本讲稿第二十二页,共五十四页返回总目录返回总目录返回本章返回本章三、分层抽样等比例等比例等比例等比例抽样抽样抽样抽样指分层后,按随机原则根据各层中单位数量占总体单位数量的比例抽取各层的样本数量。每层抽取的样本数计算公式为:每层抽取的样本数计算公式为:式式 中:中:nini为第为第i i层抽出的样本数层抽出的样本数 NiNi为第为第i i层的总单位数层的总单位数N N为总体单位数为总体单位数n n为总体样本数为总体样本数本讲稿第二十三页,共五十四页返回总目录返回总目录返回本章返回本章三、
24、分层抽样非等比例非等比例非等比例非等比例抽样抽样抽样抽样指分层后,不按各层中单位数量占总体单位数量的比例抽取各层的样本数量。一般用最佳抽样或最低成本抽最佳抽样或最低成本抽样。样。每层抽取的样本数计算公式为:每层抽取的样本数计算公式为:最佳抽最佳抽样:样:根据各层标准差的大小来调整各层样本数目的抽样根据各层标准差的大小来调整各层样本数目的抽样方法。方法。为第为第i i层的标准差层的标准差本讲稿第二十四页,共五十四页返回总目录返回总目录返回本章返回本章优点:优点:1 1)在调查中不仅可对总体进行参数估计,还可对层的参数进行估)在调查中不仅可对总体进行参数估计,还可对层的参数进行估计。计。2 2)使
25、样本更具代表性。)使样本更具代表性。3 3)对不同层可以按照不同情况和条件,具体采用不同的抽样方)对不同层可以按照不同情况和条件,具体采用不同的抽样方法。法。4 4)分层抽样可以提高估计量的精度)分层抽样可以提高估计量的精度缺点:缺点:1 1)对抽样框的要求比较高,必须有分层的辅助信息;)对抽样框的要求比较高,必须有分层的辅助信息;2 2)估计值的计算比简单随机抽样复杂)估计值的计算比简单随机抽样复杂三、分层抽样本讲稿第二十五页,共五十四页返回总目录返回总目录返回本章返回本章四、整群抽样 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后随机抽取一部分,然后随机抽取一部分“群群”,被抽
26、中群体的所有单位进行全面调查的抽样组织方式。被抽中群体的所有单位进行全面调查的抽样组织方式。ABCDEFGHIJKLMNOPLHPD样本容量样本容量示意图:示意图:示意图:示意图:本讲稿第二十六页,共五十四页返回总目录返回总目录返回本章返回本章四、整群抽样特特 点点(1 1)总体和样本都是由)总体和样本都是由“群群”组成;组成;(2 2)引起的抽样误差的方差是群间方差,群内方差不影响)引起的抽样误差的方差是群间方差,群内方差不影响抽样误差;抽样误差;(3 3)整群抽样均为不重复抽样,可提高样本的代表性。)整群抽样均为不重复抽样,可提高样本的代表性。(4 4)每群的数量可等可不等,而且抽样方法方
27、便。)每群的数量可等可不等,而且抽样方法方便。本讲稿第二十七页,共五十四页返回总目录返回总目录返回本章返回本章四、整群抽样优点:优点:简单、方便,易于组织,能节省人力、物力、简单、方便,易于组织,能节省人力、物力、财力和时间,财力和时间,缺点:缺点:限制了样本在总体中分配的均匀性,误差大。限制了样本在总体中分配的均匀性,误差大。本讲稿第二十八页,共五十四页返回总目录返回总目录返回本章返回本章五、多阶段抽样先抽大的调查单位,再抽取小的调查单位的抽样方式。总体第一阶样本最终样本示意图:示意图:示意图:示意图:本讲稿第二十九页,共五十四页返回总目录返回总目录返回本章返回本章五、多阶段抽样例如,我国职
28、工家计调查,则实行阶段抽样调查。第一阶段从全部城市抽选调查城市,第二阶段从中选城市的各部门抽选调查单位,第三阶段再从中选调查单位抽选职工,确定调查户,进行每月实际的家庭收支情况调查。这种分阶段进行抽样调查,称为阶段调查。特点:1、分布进行,至少分两步;2、组织方便;尤其对总体单位过于分散,在组织技术上解决进行抽样调查存在很大困难的矛盾;本讲稿第三十页,共五十四页返回总目录返回总目录返回本章返回本章8.3 8.3 非非随机抽样技术随机抽样技术一、方便抽样二、判断抽样三、配额抽样四、雪球抽样本讲稿第三十一页,共五十四页返回总目录返回总目录返回本章返回本章一、方便抽样 根据调查者的方便与否来抽取样本
29、的抽样方法。根据调查者的方便与否来抽取样本的抽样方法。如:如:如在商店门口、街头路口、车站码头、公园广场等公共场所,随便选取某些顾客、行人、旅客、观众等 。好处:简单方便 ;不足:是应答者往往不具有代表性或者无法判断他们的代表性,样本的代表性较差,具有很大的偶然性,故适用于探索性调研。本讲稿第三十二页,共五十四页返回总目录返回总目录返回本章返回本章二、判断抽样 调查者根据自己的主观印象、以往的经验和对调查对象的了解来选调查者根据自己的主观印象、以往的经验和对调查对象的了解来选取样本的一种方法。取样本的一种方法。例如例如当在们对某一群体作调查时,就可以根当在们对某一群体作调查时,就可以根据我们所
30、了解的群体情况选取某些样本做研究。据我们所了解的群体情况选取某些样本做研究。方法:方法:方法:方法:1 1、选择最能代表普遍情况的调查对象,分平均型和多、选择最能代表普遍情况的调查对象,分平均型和多数型。数型。平均型:选择代表平均水平的样本。平均型:选择代表平均水平的样本。多数型:选择代表多数水平的样本。多数型:选择代表多数水平的样本。2 2、根据统计资料,按一定标准选择样本。、根据统计资料,按一定标准选择样本。本讲稿第三十三页,共五十四页返回总目录返回总目录返回本章返回本章二、判断抽样好处:样本不能分类时,用该方法具有优越性 ;不足:样本的精确性和客观性不稳定。请记忆:请记忆:请记忆:请记忆
31、:本讲稿第三十四页,共五十四页返回总目录返回总目录返回本章返回本章三、配额抽样 首先将总体按照一定标志分类,然后再在每一类中按照方便抽首先将总体按照一定标志分类,然后再在每一类中按照方便抽样或判断抽样的方法进行抽样。这些分类标志称样或判断抽样的方法进行抽样。这些分类标志称控制特征控制特征。优点:优点:简单易行,代表性高。简单易行,代表性高。基本步骤:基本步骤:(1 1)选择控制特性作为分层标准)选择控制特性作为分层标准 (2 2)分层)分层 (3 3)确定各层样本额)确定各层样本额 (4 4)配额指派)配额指派根据其抽样方法可以分为:根据其抽样方法可以分为:(1 1)独立控制配额抽样)独立控制
32、配额抽样 (2 2)交叉控制配额抽样)交叉控制配额抽样本讲稿第三十五页,共五十四页返回总目录返回总目录返回本章返回本章三、配额抽样独立控制配额抽样:独立控制配额抽样:分别按照单个控制特征进行分别按照单个控制特征进行独立独立的控制配额抽的控制配额抽样。样。优点:优点:简单易行;简单易行;缺点:缺点:样本可能过于偏向某一组。样本可能过于偏向某一组。举例:举例:举例:举例:收入水平年龄性别高10050以上50男50中7025-50100女150低3025以下50-合计200合计200合计200本讲稿第三十六页,共五十四页返回总目录返回总目录返回本章返回本章三、配额抽样交叉控制配额抽样:交叉控制配额抽
33、样:对调查对象各个特征的样本数交叉分配。对调查对象各个特征的样本数交叉分配。优点:优点:提高了样本的代表性;提高了样本的代表性;缺点:缺点:操作复杂。操作复杂。收入水平高中低合计性别男女男女男女年龄50以上619413265025-50133792631210025以下6195132550合计25751852723200合计1007030举例:举例:举例:举例:本讲稿第三十七页,共五十四页返回总目录返回总目录返回本章返回本章四、雪球抽样 即以少量样本为基础,逐渐扩大样本的规模,直至找出足够的即以少量样本为基础,逐渐扩大样本的规模,直至找出足够的样本。样本。优点:优点:有针对性寻找样本;有针对性
34、寻找样本;缺点:缺点:样本之间必须保持联系。样本之间必须保持联系。例如:例如:我们要了解某个人经常交往的社会圈子,就可以通过这个人提供我们要了解某个人经常交往的社会圈子,就可以通过这个人提供的线索找到更多与他有关联的人。的线索找到更多与他有关联的人。步骤:步骤:步骤:步骤:1 1、先找到一个或几个符合研究目的的对象,、先找到一个或几个符合研究目的的对象,2 2、然后再根据这些对象所提供的线索找另外相关的对象,、然后再根据这些对象所提供的线索找另外相关的对象,3 3、依次进行,直至达到研究目的、依次进行,直至达到研究目的 。本讲稿第三十八页,共五十四页返回总目录返回总目录返回本章返回本章8.4
35、8.4 抽样误差与样本量抽样误差与样本量一、抽样误差的种类和概念二、样本量的确定本讲稿第三十九页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样误差的种类和概念 调查结果和客观事实之间的出入。分调查结果和客观事实之间的出入。分非抽样误差和抽样误差。非抽样误差和抽样误差。非抽样误差非抽样误差是基于抽样之外的许多其它原因而产生的误差,产生的原因是基于抽样之外的许多其它原因而产生的误差,产生的原因多样,如下:多样,如下:非抽样误差非抽样误差非抽样误差非抽样误差非观察偏误非观察偏误非观察偏误非观察偏误观察偏误观察偏误观察偏误观察偏误无回答无回答无回答无回答覆盖不周覆盖不周覆盖不周覆盖不周被访者
36、责任被访者责任被访者责任被访者责任访问员责任访问员责任访问员责任访问员责任不在家不在家不在家不在家拒答拒答拒答拒答故意错答故意错答故意错答故意错答误解而错答误解而错答误解而错答误解而错答访问员过失访问员过失访问员过失访问员过失访问员作弊访问员作弊访问员作弊访问员作弊本讲稿第四十页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样误差的种类和概念 抽样误差抽样误差是由于抽样造成的误差,误差大小受四个因素影响:是由于抽样造成的误差,误差大小受四个因素影响:q总体各单位的差异程度:总体各单位的差异程度:标准差标准差 越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:
37、越大,抽样误差越小;越大,抽样误差越小;q抽样方法:抽样方法:不重复抽样比重复抽样小;不重复抽样比重复抽样小;q抽样组织方式:抽样组织方式:简单随机抽样最大。简单随机抽样最大。本讲稿第四十一页,共五十四页返回总目录返回总目录返回本章返回本章二、样本量的确定意义:意义:意义:意义:1、若n过大,调查工作量增大,体现不出抽样调查的优越性;2、若n 过小,抽样误差会增大,抽样推断就会失去价值。样本容量样本容量样本容量样本容量指样本中含有的总体单位的数目,通常用指样本中含有的总体单位的数目,通常用n 来来表示。表示。一般来讲:一般来讲:当当 n 30n 30,称为,称为大样本大样本;当当 n 30n
38、30,称为,称为小样本小样本。本讲稿第四十二页,共五十四页返回总目录返回总目录返回本章返回本章二、样本量的确定q q允许误差范围的大小;允许误差范围的大小;允许误差范围的大小;允许误差范围的大小;q q抽样调查的组织方式和方法;抽样调查的组织方式和方法;抽样调查的组织方式和方法;抽样调查的组织方式和方法;q q人力、财力和物力的允许条件;人力、财力和物力的允许条件;人力、财力和物力的允许条件;人力、财力和物力的允许条件;q q被调查对象标志的差异程度;被调查对象标志的差异程度;被调查对象标志的差异程度;被调查对象标志的差异程度;q q结果的可靠程度。结果的可靠程度。结果的可靠程度。结果的可靠程
39、度。影响因素影响因素影响因素影响因素样本量的确定样本量的确定样本量的确定样本量的确定本讲稿第四十三页,共五十四页返回总目录返回总目录返回本章返回本章二、样本量的确定1 1、先试验性调查,了解总体的相关特征值。、先试验性调查,了解总体的相关特征值。2 2、根据计算公式和允许的误差范围计算。、根据计算公式和允许的误差范围计算。分类计算分类计算分类计算分类计算1 1 1 1在简单随机抽样重复抽样条件下在简单随机抽样重复抽样条件下在简单随机抽样重复抽样条件下在简单随机抽样重复抽样条件下 测定平均数时:测定平均数时:测定成数时:测定成数时:测定成数时:测定成数时:2 2 2 2简单随机不重复抽样条件下简
40、单随机不重复抽样条件下简单随机不重复抽样条件下简单随机不重复抽样条件下 本讲稿第四十四页,共五十四页返回总目录返回总目录返回本章返回本章二、样本量的确定测定平均数时:测定平均数时:测定成数时:测定成数时:测定成数时:测定成数时:本讲稿第四十五页,共五十四页返回总目录返回总目录返回本章返回本章二、样本量的确定例:例:例:例:假定总体为假定总体为假定总体为假定总体为3000300030003000单位,单位,单位,单位,被研究的标志方差不少于被研究的标志方差不少于被研究的标志方差不少于被研究的标志方差不少于400400400400,当抽样,当抽样,当抽样,当抽样误差不超过误差不超过误差不超过误差不
41、超过3 3 3 3,保证机率为,保证机率为,保证机率为,保证机率为0.99730.99730.99730.9973时,需抽取多少单位时,需抽取多少单位时,需抽取多少单位时,需抽取多少单位?已知:已知:已知:已知:NNNN3000300030003000,2 2 2 2400400400400,3 3 3 3t=3(t=3(t=3(t=3(因保证机率为因保证机率为因保证机率为因保证机率为0.9973)0.9973)0.9973)0.9973)则:则:则:则:(单位单位单位单位)这里因总体单位不大,故需采用不重复抽样公式。这里因总体单位不大,故需采用不重复抽样公式。这里因总体单位不大,故需采用不重
42、复抽样公式。这里因总体单位不大,故需采用不重复抽样公式。本讲稿第四十六页,共五十四页返回总目录返回总目录返回本章返回本章8.5 8.5 有关有关抽样设计的几个问题抽样设计的几个问题一、抽样精确度二、抽样框误差三、样本量确定四、抽样方式确定五、样本轮换六、无回答问题七、敏感性问题本讲稿第四十七页,共五十四页返回总目录返回总目录返回本章返回本章一、抽样精确度百分之百百分之百百分之百百分之百准确?准确?准确?准确?不惜代价的准不惜代价的准不惜代价的准不惜代价的准确?确?确?确?满足决策需满足决策需满足决策需满足决策需要即可?要即可?要即可?要即可?太多选择,心太多选择,心太多选择,心太多选择,心乱如
43、麻,如何乱如麻,如何乱如麻,如何乱如麻,如何是好?是好?是好?是好?不要太完美,实用不要太完美,实用不要太完美,实用不要太完美,实用即可。即可。即可。即可。本讲稿第四十八页,共五十四页返回总目录返回总目录返回本章返回本章二、抽样框误差1 1号杀手:号杀手:搜集不到搜集不到2 2号杀手:号杀手:遗漏遗漏3 3号杀手:号杀手:非总体非总体杀!杀!杀!杀!杀!杀!杀!杀!杀!杀!杀!杀!样本样本框框哇!呀!呀!呀呀呀!哇!呀!呀!呀呀呀!哇!呀!呀!呀呀呀!哇!呀!呀!呀呀呀!样本框产生误差。如何样本框产生误差。如何样本框产生误差。如何样本框产生误差。如何是好?是好?是好?是好?哈哈!哈哈!哈哈哈!
44、哈哈!哈哈!哈哈哈!哈哈!哈哈!哈哈哈!哈哈!哈哈!哈哈哈!如此这般!这般!即如此这般!这般!即如此这般!这般!即如此这般!这般!即可:可:可:可:1 1 1 1、按抽样框重新定义总体!、按抽样框重新定义总体!、按抽样框重新定义总体!、按抽样框重新定义总体!2 2 2 2、用加权方法调整资料!、用加权方法调整资料!、用加权方法调整资料!、用加权方法调整资料!本讲稿第四十九页,共五十四页返回总目录返回总目录返回本章返回本章三、样本量确定问题问题问题问题问题1 1 问题问题问题问题2 2 .问题问题问题问题n n 问题问题问题问题3 3 为什么每次都是我为什么每次都是我为什么每次都是我为什么每次都
45、是我来解决问题?来解决问题?来解决问题?来解决问题?你产生幻觉了。有关样本计算你产生幻觉了。有关样本计算和影响因素,老师前面已经介和影响因素,老师前面已经介绍了。最优设计如下:绍了。最优设计如下:1 1 1 1、允许一定误差,费用最少;、允许一定误差,费用最少;、允许一定误差,费用最少;、允许一定误差,费用最少;2 2 2 2、一定费用,精度最高。、一定费用,精度最高。、一定费用,精度最高。、一定费用,精度最高。本讲稿第五十页,共五十四页返回总目录返回总目录返回本章返回本章四、抽样方式确定轮到我了!轮到我了!轮到我了!轮到我了!抽样方式如此之多抽样方式如此之多抽样方式如此之多抽样方式如此之多我
46、该如何抉择?我该如何抉择?我该如何抉择?我该如何抉择?太简单了考虑如下内太简单了考虑如下内太简单了考虑如下内太简单了考虑如下内容即可:容即可:容即可:容即可:1 1、根据不同调查对误差的要求和实际条件,适、根据不同调查对误差的要求和实际条件,适当选择抽样方式当选择抽样方式 2 2、根据调查对象本身特点和熟悉程度。、根据调查对象本身特点和熟悉程度。3 3、综合考虑人力、物力和财力、时间等、综合考虑人力、物力和财力、时间等调查条件。调查条件。注意:不排除各种方法的综合使用!注意:不排除各种方法的综合使用!本讲稿第五十一页,共五十四页返回总目录返回总目录返回本章返回本章五、样本轮换我忒爱学习!样本轮
47、换我忒爱学习!样本轮换我忒爱学习!样本轮换我忒爱学习!样本轮换就是每隔一段时间,换就是每隔一段时间,换就是每隔一段时间,换就是每隔一段时间,换部分样本,原因如下:部分样本,原因如下:部分样本,原因如下:部分样本,原因如下:1 1、防止样本老化;、防止样本老化;2 2、提高被调查者合作程度;、提高被调查者合作程度;3 3、保持调查资料的代表性。、保持调查资料的代表性。注意:在更换样本时,要考虑带来的抽样误差和注意:在更换样本时,要考虑带来的抽样误差和经费的许可程度!经费的许可程度!本讲稿第五十二页,共五十四页返回总目录返回总目录返回本章返回本章六、无回答问题最近销售部做调查,有部分最近销售部做调
48、查,有部分最近销售部做调查,有部分最近销售部做调查,有部分单位调查结果空缺,怎么办单位调查结果空缺,怎么办单位调查结果空缺,怎么办单位调查结果空缺,怎么办?我刚学过,这是我刚学过,这是我刚学过,这是我刚学过,这是无回答问题无回答问题无回答问题无回答问题,看看老师课件,有了:看看老师课件,有了:看看老师课件,有了:看看老师课件,有了:1 1、多次调查;、多次调查;会增加费用;会增加费用;2 2、对调查结果进行估算;、对调查结果进行估算;要求高;要求高;3 3、在无回答者中抽取随机子样本调查。、在无回答者中抽取随机子样本调查。本讲稿第五十三页,共五十四页返回总目录返回总目录返回本章返回本章七、敏感
49、性问题最近对大学生吸毒、考试作最近对大学生吸毒、考试作最近对大学生吸毒、考试作最近对大学生吸毒、考试作弊、交友做调查,很多学生弊、交友做调查,很多学生弊、交友做调查,很多学生弊、交友做调查,很多学生不配合,怎么办?不配合,怎么办?不配合,怎么办?不配合,怎么办?这是敏感问题!这是敏感问题!这是敏感问题!这是敏感问题!教你两招:教你两招:教你两招:教你两招:1 1、随机化回答、随机化回答 A A:您吸毒吗?:您吸毒吗?1-1-是,是,2-2-否;否;B B:您不:您不吸毒吸毒吗?吗?1-1-是,是,2-2-否。否。注意:要使被调查人确信,调查人不知道其选择。注意:要使被调查人确信,调查人不知道其选择。2 2、提出无关的第二个问题,随化回答、提出无关的第二个问题,随化回答 A A:您:您吸毒吸毒吗?吗?1-1-是,是,2-2-否;否;B B:您是五月份生吗?:您是五月份生吗?1-1-是,是,2-2-否。否。本讲稿第五十四页,共五十四页