《管理第四讲抽样设计.pptx》由会员分享,可在线阅读,更多相关《管理第四讲抽样设计.pptx(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四讲 抽样设计 数字化时代的我们? 买火柴的故事? 普查 抽样 一个好的抽样调查胜过一次蹩脚的普查一个好的抽样调查胜过一次蹩脚的普查. 候选人候选人 预测结果预测结果 (%)选举结果选举结果 (%)兰顿兰顿5738罗斯福罗斯福4362 在在1936年美国总统选举前,一份颇有名气的杂志年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿的工作人员做了一次民意测验,调查兰顿 和罗斯福中和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查过电话簿和车辆登记簿上的名单给一大批人发了调查
2、表(表(在在1936年电话和汽车只有少数富人拥有年电话和汽车只有少数富人拥有),通过),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。志预测兰顿将在选举中获胜。 实际选举结果正好相反,最后罗斯福在选举中获实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:胜。其数据如下: 简简 单单 随随 机机 抽抽 样样思 考问题:为什么调查失败?问题:为什么调查失败?如何科学地如何科学地抽取样本?抽取样本? 使得样本能比较准确地反映总体使得样本能比较准确地反映总体搅拌搅拌均匀均匀使得使得每个个体每个个体被抽取的被抽取的机会均
3、等机会均等合理、公平合理、公平 简简 单单 随随 机机 抽抽 样样 在高考阅卷过程中,为了统计每一道试在高考阅卷过程中,为了统计每一道试题的得分情况,如平均得分、得分分布情题的得分情况,如平均得分、得分分布情况等,如果将所有考生的每题的得分情况况等,如果将所有考生的每题的得分情况都统计出来,再进行计算,结果是非常准都统计出来,再进行计算,结果是非常准确的,但也是十分烦琐的,那么如何了解确的,但也是十分烦琐的,那么如何了解各题的得分情况呢?各题的得分情况呢? 通常,在考生有这么多的情况下,我们只从中抽通常,在考生有这么多的情况下,我们只从中抽取部分考生取部分考生 (比如说比如说1000名名) ,
4、统计他们的得分情况,统计他们的得分情况,用他们的得分情况去估计所有考生的得分情况。用他们的得分情况去估计所有考生的得分情况。联联系系生生活活样本样本 总体总体估计估计思思 考:样本一定能准确地反应总体吗?考:样本一定能准确地反应总体吗?抽抽 样样统计学统计学:统计的基本思想统计的基本思想: 用样本估计总体用样本估计总体,即即当总体容量很大或检当总体容量很大或检测过程具有一定的破坏性时,测过程具有一定的破坏性时,通常不直接去研通常不直接去研究总体,而是通过从总体中抽取一个样本,根究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况据样本的情况去估计总体的相应情况。 是研究如何
5、搜集、整理、归纳和分析是研究如何搜集、整理、归纳和分析数据的数据的学科,它可以为人们制定决策提供学科,它可以为人们制定决策提供依据。依据。抽抽 样样一、基本概念和术语 1. 1. 抽样调查:抽样调查: 从研究对象的总体中选择一部分代表从研究对象的总体中选择一部分代表加以调查研究加以调查研究, ,然后用所得的结果推论和说明总体特然后用所得的结果推论和说明总体特征征, ,这种由总体中选取一部分代表的过程就是抽样这种由总体中选取一部分代表的过程就是抽样, ,所所选取的这一部分代表就称为样本选取的这一部分代表就称为样本. . 选取样本的方法分为两大类选取样本的方法分为两大类: : 一类是依据研究任务的
6、要求和对调查对象的分一类是依据研究任务的要求和对调查对象的分析析, ,主观地主观地, ,有意识地在研究对象的总体中进行选择有意识地在研究对象的总体中进行选择. .叫非概率抽样,主要用于案例研究叫非概率抽样,主要用于案例研究. . 另一类是依据概率理论另一类是依据概率理论, ,按照随机原则选择样本按照随机原则选择样本, ,完全不带调查者的主观意识完全不带调查者的主观意识, ,称为概率抽样,主要用称为概率抽样,主要用于以调查为基础的研究于以调查为基础的研究. . 抽样调查的特点抽样调查的特点与普查相比具有如下特点与普查相比具有如下特点: : 1. 1. 调查费用较低调查费用较低. . 2. 2.
7、速度快速度快 3.3. 应用范围广应用范围广 4.4. 可获得内容丰富的资料可获得内容丰富的资料 5.5. 准确性高准确性高2.2.总体总体(population)(population) 总体通常与构成它的元素总体通常与构成它的元素(element)(element)共共同定义同定义; ;总体是构成它的所有元素的集合总体是构成它的所有元素的集合, ,而元素而元素则是构成总体的最基本单位则是构成总体的最基本单位. .总体中所包含元素的总体中所包含元素的数目通常用大写字母数目通常用大写字母 N N 表示表示. .3.3. 样本样本(Sample)(Sample) 样本就是从总体中按一定方式抽取出
8、的一样本就是从总体中按一定方式抽取出的一部分元素的集合部分元素的集合如从某省总数为如从某省总数为12.812.8万的大学生万的大学生总体中总体中, ,按一定方式抽取出按一定方式抽取出10001000名大学生进行调查名大学生进行调查, ,这这10001000名大学生就构成该总体的一个样本名大学生就构成该总体的一个样本. .样本中样本中的元素数目通常用小写字母的元素数目通常用小写字母 n n 表示表示. . 4.4.抽样框抽样框(Sampling Frame)(Sampling Frame) 抽样框也叫抽样范围,是指一次抽样时抽样框也叫抽样范围,是指一次抽样时总体中所有个案(元素)的完整清单总体中
9、所有个案(元素)的完整清单. . 5.5.参数值参数值( Parameter )( Parameter ) 也称总体值也称总体值, ,它是关于总体中某一变量的它是关于总体中某一变量的综合描述综合描述, ,或者说是总体中所有元素的某种特征的或者说是总体中所有元素的某种特征的综合数量表现综合数量表现. .在统计中最常见的参数值是总体某在统计中最常见的参数值是总体某一变量的平均数一变量的平均数, , 需要注意的是需要注意的是, ,参数值只有对总参数值只有对总体中的每一个元素都进行调查或测量才能得到体中的每一个元素都进行调查或测量才能得到. .6.6.统计值统计值(Statistic(Statisti
10、c) 统计值也称为样本值统计值也称为样本值, ,它是关于样本中某一变量它是关于样本中某一变量的综合描述的综合描述. .或者说是样本中所有元素的某种特征或者说是样本中所有元素的某种特征的综合数量表现的综合数量表现. .统计值是从样本中计算出来的统计值是从样本中计算出来的, ,它是相应的参数值的估计量,比如样本平均数就它是相应的参数值的估计量,比如样本平均数就是总体平均数的估计量。是总体平均数的估计量。参数值和统计值的区别是参数值和统计值的区别是: :参数值是固定不变的参数值是固定不变的, ,唯唯一的一的, ,通常是未知的通常是未知的, ,而统计值是变化的而统计值是变化的, ,即,对于即,对于同一
11、个总体来说同一个总体来说, ,不同样本的统计值是有差别的不同样本的统计值是有差别的, ,对于任一特定样本来说统计值是已知的对于任一特定样本来说统计值是已知的, ,可计算的,可计算的,从统计值推论参数值从统计值推论参数值, ,正是社会调查的一项重要内正是社会调查的一项重要内容。容。 7.7.置信度置信度(Confidence level)(Confidence level)与与 置信区间置信区间 (Confidence (Confidence Interval)Interval)置信度也称为置信水平置信度也称为置信水平, ,它是指总体参数值落在样本统计值它是指总体参数值落在样本统计值某一区间内的
12、概率某一区间内的概率, ,或者说是总体参数值落在样本统计值或者说是总体参数值落在样本统计值某一区间中的把握性程度某一区间中的把握性程度. .它反映的是抽样的可靠性程度它反映的是抽样的可靠性程度. . 置信区间指的是样本统计值与总体参数值之间的误差置信区间指的是样本统计值与总体参数值之间的误差范围范围, ,置信区间反映的是抽样的精确性程度置信区间反映的是抽样的精确性程度, ,比如比如, ,从某一机关一万名干部中抽取从某一机关一万名干部中抽取200200人为样本人为样本, ,调查其平调查其平均工资均工资, ,若样本的平均工资为若样本的平均工资为100100元元, ,那么总体平均工资落那么总体平均工
13、资落在在95-10595-105元这一区间的概率可能为元这一区间的概率可能为96%(96%(误差为误差为5 5元元),),落落在在90-11090-110元这一区间的概率可能为元这一区间的概率可能为99%(99%(误差为误差为1010元元) )可可见见, ,置信区间越大置信区间越大, ,即,误差范围越大即,误差范围越大, ,置信水平越高置信水平越高, ,抽样抽样的精确性程度就越低的精确性程度就越低, ,反之反之, ,置信区间越小置信区间越小, ,误差范围越小误差范围越小, ,抽样的精确性程度就越高抽样的精确性程度就越高. .二、抽样的程序 抽样的程序抽样的程序 在总体中抽取一个样本时在总体中抽
14、取一个样本时, ,总要尽可能地使样本具总要尽可能地使样本具有代表性有代表性. .如果样本的统计值近似总体的参数值如果样本的统计值近似总体的参数值, ,则 这 个 样 本 可 以 称 为 一 个 代 表 性 样则 这 个 样 本 可 以 称 为 一 个 代 表 性 样本本.(representative sample).(representative sample).问题是怎样做才问题是怎样做才可以减少抽样的误差可以减少抽样的误差, ,求得一个有代表性的样本呢求得一个有代表性的样本呢? ? 这就要依据下面的四个步骤这就要依据下面的四个步骤: :二、抽样的程序1 1 界定总体界定总体 根据调查的目
15、的要求根据调查的目的要求, ,确定调查对象的范围确定调查对象的范围, ,包括包括时间时间, ,地点和人物地点和人物, , 例如我们要研究北师大大学生生活态度例如我们要研究北师大大学生生活态度, ,可以界定可以界定总体的范围如下总体的范围如下,2011,2011年北京师范大学大一至大四年北京师范大学大一至大四的在校本科大学生的在校本科大学生. .总体的定义越清楚越好总体的定义越清楚越好, ,由样由样本所得的研究结果本所得的研究结果, ,原则上只能推论到这个所界定原则上只能推论到这个所界定的总体范围的总体范围. .二、抽样的程序2 2 确定抽样框确定抽样框 在应用之前必须审核其完整性和准确性在应用
16、之前必须审核其完整性和准确性, , 例如例如, ,有无遗漏有无遗漏, ,有无列于名单上但实际上有无列于名单上但实际上不存在的个案不存在的个案, ,有没有重复或不属于研究范有没有重复或不属于研究范围的等等围的等等. .二、抽样的程序3 3 设计和选取样本设计和选取样本 确定样本的数量确定样本的数量. . 决定样本的大小时决定样本的大小时, ,必须同时考必须同时考虑抽样误差和研究代价虑抽样误差和研究代价. .如如, ,抽样框中有三万大学抽样框中有三万大学生生, ,不可能全部调查不可能全部调查, ,要抽取多少个案来进行研究要抽取多少个案来进行研究呢?在正常的情况下呢?在正常的情况下, ,样本越大就越
17、有代表性样本越大就越有代表性, ,但但是样本越大是样本越大, ,所需的研究代价就越大所需的研究代价就越大. . 选择抽样的具体方法选择抽样的具体方法 抽样方法有许多种抽样方法有许多种, ,不同的不同的方法产生的样本代表性是不同的方法产生的样本代表性是不同的. .二、抽样的程序4 4 样本评估样本评估 在样本抽出后在样本抽出后, ,需采用各种调查方法对样本需采用各种调查方法对样本进行实际调查以收集资料进行实际调查以收集资料, ,最后对收集到的资最后对收集到的资料进行计算并将结果推论和说明总体料进行计算并将结果推论和说明总体. . 在开始调查之前要对样本进行评估在开始调查之前要对样本进行评估, ,
18、评估评估的目的是初步检查样本的代表性的目的是初步检查样本的代表性, ,以免由于前以免由于前面步骤中的失误使样本偏差太大面步骤中的失误使样本偏差太大, , 评估样本:收集若干容易得到的资料以进评估样本:收集若干容易得到的资料以进行总体和样本之间的比较行总体和样本之间的比较. . 如果样本与总体的情况相似如果样本与总体的情况相似, ,这样的样本就这样的样本就有代表性有代表性, ,如果两者资料相差甚多如果两者资料相差甚多, ,则表明前面则表明前面的抽样步骤有问题要检查的抽样步骤有问题要检查, ,修正修正. .二、抽样的基本方法 1.概率取样:按照随机原则抽取样本,即在总体中抽取单位时,完成排除了人的
19、主观因素的影响,使每一个单位都有同等的可能性被抽中,具有代表性,可用作推论。多用于正式、量化研究。包括简单随机取样、分层随机取样、聚类随机取样、系统随机取样。 2.非概率取样:每个研究对象的抽取概率是未知、抽样方式不是随机、样本通常按照研究目的选择。不具有代表性、不能判断总体,用于非正式质化研究三、抽样技术的分类抽样技术非概率抽样概率抽样便利抽样判断抽样配额抽样滚雪球抽样简单随机抽样系统抽样分层抽样整群抽样概率抽样3.1简单随机取样 两个方法:抽签法 随机数表法实例 现从我班现从我班89名同学中选取名同学中选取10名参加文艺汇名参加文艺汇演演,为保证选取的公平性,你打算如何操作为保证选取的公平
20、性,你打算如何操作? .抽签法抽签法思 考开始开始抽抽签签法法89名同学从名同学从0到到88编号编号制作编号为制作编号为0到到88的号签的号签(共(共89个)个)将将89个号签搅拌均匀个号签搅拌均匀随机从中逐一抽出随机从中逐一抽出10个号签个号签与所抽取号码一致的学生即被选中与所抽取号码一致的学生即被选中结束结束 简简 单单 随随 机机 抽抽 样样抽签法的一般步骤抽签法的一般步骤(总体个数(总体个数N,样本容量,样本容量n)(1)将总体中的)将总体中的N个个体编个个体编号;号;(2)将这)将这N个号码写在形状、个号码写在形状、 大小相大小相 同的号签上;同的号签上;(3)将号签放在同一箱中,)
21、将号签放在同一箱中,并搅拌均匀;并搅拌均匀;(4)从箱中每次抽出)从箱中每次抽出1个号个号签,连续抽出签,连续抽出n次;次; (5)将总体中与抽到的号签)将总体中与抽到的号签编号一致的编号一致的n个个体取出。个个体取出。这种方法适用于调研总体中个体数目较少的情况。开始开始编号编号制签制签搅匀搅匀抽签抽签取出个体取出个体结束结束随机数表法 要考察某公司生产的要考察某公司生产的500克袋装牛奶的质量是否克袋装牛奶的质量是否达标,现从达标,现从800袋牛奶中抽取袋牛奶中抽取60袋进行检验,若袋进行检验,若用用抽签法抽签法抽取,请抽取,请写出其过程写出其过程 有简化制签的方法吗? 简化制签过程的一个有
22、效方法就是制作一个表,其中的每个数都是用随机方法产生的,这样的表称为随机数表,于是,我们只需要按一定的规则到随机数表中选取号码就可以了,这种抽样方法叫做随机数表法随机数表法 随机数表:随机数表:制作一个表制作一个表(由数字由数字0,1,2,.,9组成组成),表中各个位置上的数都是随机产生表中各个位置上的数都是随机产生的(随机数)的(随机数)即每个数字在表中各个位置即每个数字在表中各个位置上出现的机会都是一样上出现的机会都是一样。范例:范例: 要考察某公司生产的要考察某公司生产的500克袋装牛奶的质量克袋装牛奶的质量是否达标,现从是否达标,现从800袋牛奶中抽取袋牛奶中抽取60袋进行检验袋进行检
23、验,用用随机数表法随机数表法抽取的过程如下抽取的过程如下 第一步第一步, ,先将先将800800袋牛奶编号袋牛奶编号, ,可以编为可以编为000,001,000,001,799799第二步第二步, ,在随机数表中在随机数表中任选任选一个数一个数, ,例如选出第例如选出第8 8行第行第7 7 列的数列的数7.7.(为了便于说明为了便于说明,下面摘取了附表下面摘取了附表1的第的第6行至第行至第10行)行)16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 7
24、8 59 16 95 55 67 19 98 10 50 71 75 33 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 64 21 76 33 50 25 83 92 12 06 76 12 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步第三步, ,从选定的数从选定的数7 7开始向右读开始向
25、右读( (读数的方向也可以是向读数的方向也可以是向左、向上、向下等)左、向上、向下等), ,得到一个得到一个 三位数三位数 785,785,由于由于785785799,799,说明号码说明号码785785在总体内在总体内, ,将它取出将它取出; ;继续向右读继续向右读, ,得到得到916,916,由于由于916916799,799,将它去掉将它去掉, ,按照这种方法继续向右读按照这种方法继续向右读, ,又取出又取出567,199,507,567,199,507,依次下去依次下去, ,直到样本的直到样本的6060个号码个号码全部取出全部取出, ,这样我们就得到一个容量为这样我们就得到一个容量为6
26、060的样本的样本. . 随机数表法随机数表法随机数表:随机数表: 表中各个位置上的数都是随机产生的(随机数)表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一即每个数字在表中各个位置上出现的机会都是一样样。第一步、第一步、先将总体中的所有个体先将总体中的所有个体(共有共有N个个) )编号,编号,第二步、第二步、然后在随机数表内然后在随机数表内任选任选一个数作为开始一个数作为开始, ,第三步第三步、再从选定的起始数,沿再从选定的起始数,沿任意方向任意方向取数取数( (不在不在 号码范围内的数、重复出现的数必须去掉号码范围内的数、重复出现的数必须去掉) ),第四
27、步、第四步、最后根据所得号码抽取总体中相应的个体,最后根据所得号码抽取总体中相应的个体, 得到总体的一个样本得到总体的一个样本. .步 骤: 编号、选数( (起始数起始数) )、取数、抽取. 简简 单单 随随 机机 抽抽 样样简单随机取样 1.实施方便, 2.适合N小的情况、变异情况小的情况 3.rand 函数 生成生成A与与B之间的随机数字(之间的随机数字(A随机数随机数B) =RAND()*(B-A)+A 生成生成A与与B之间的随机整数(之间的随机整数(A随机数随机数B) =INT(RAND()*(B-A)+A) 生成生成A与与B之间的随机数字(之间的随机数字(A随机数随机数B) =RAN
28、D()*(B-A+1)+A 生成生成A与与B之间的随机整数(之间的随机整数(A随机数随机数B) =INT(RAND()*(B-A+1)+A) 3.2.分层随机取样 总体单位按其属性特征分成若干类型或层次,然后在各类型或者层次中随机抽样。 分层抽样的方式一般有等比例抽样与非等比例抽样两种。 (1)等比例分层抽样。等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。(2)非等比例分层抽样不是按各层中个体数占总体数的比例分配样本个体,而是根据其他因素(如各层平均数或成数均方差的大小,抽取样本的工作量和费用大小等),调整各层的样本个体数,即有的层可多抽些样本个体,有的可少
29、抽些样本个体。特点、步骤 1.适用于总体有明显差别的几部分组成的情况 2.抽取的样本更好地反映了总体的情况 3.是等可能抽样,每个个体被抽到的可能性都n/N 1.分层:分为互不交错的层 2.求比:根据总体个数N和样本容量n计算抽样比k= n/N 3.定数:确定每一层抽取的个体数目,之和等于n 4.抽样:按照定数随机抽样实例 某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1000000户,已确定样本数为1,000户,家庭年收入分10000元以下,1000030000元;30,00060,000元,60,000元以上四层,其中收入在
30、10,000元以下家庭户为180,000户,收入在10,00030,000元家庭户为350,000户,收入在30,00060,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,应进行如下抽样 分层比例抽样示意图总体 层 子样本 样本 N 1000000 N1 180000 N2 350000 N3 300000 N4 170000 n1 180 n2 350 n3 300 n4 170 n 1000 某校有在校高中生某校有在校高中生13501350人,高一,高二、人,高一,高二、高三学生人数和男、女生分布情况如下表:高三学生人数和男、女生分布情况如下表:年级
31、年级 人数人数 男生男生 女生女生 高一高一 450240210高二高二 440240200高三高三 460240220问:如果想通过抽查学校中问:如果想通过抽查学校中10%学生来调查学生来调查学生身高,以了解青少年生长发育情况,学生身高,以了解青少年生长发育情况,应采用怎样的抽样方法?如何抽样?应采用怎样的抽样方法?如何抽样?运用运用例: 某地共有居民20000户,按收人高低进行分类,其中,高收入居民为4000户,占总体的20%;中等收人为12000户,占总体的60%;低收入为4000户,占总体的20%。从中抽选200户进行购买力调查,则各类型应抽取的样本个体数? 等比例分层抽样等比例分层抽
32、样 收入高的样本数目为20020%40(户) 收入中的样本数目为20060%120(户) 收入低的样本数目为20020%=40(户)3.3.聚类随机抽样 整群抽样:把组成总体的所有部分分为若干群体,从随机选择某一群体或几个群体中抽取个体组成样本。 应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。 优点:实施方便、节省经费; 缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。 总体 分群 R=130 抽取群体 R=5 样本 N 5000 R1 53 R3 58 R4 48 R130 45 170000 R1 53 R33 52 n 250
33、 R2 50 R4 48 R98 50 R11 47 170000 3.4.系统随机取样 等距取样:按照某一特征,把总体中的个体进行排序,然后按随机原则确定七点,每隔一定的间隔抽取一个单位的一种抽样方法。例:要从例:要从600600件产品中抽取件产品中抽取6060件进行质量件进行质量检查,应如何操作?检查,应如何操作? 第一步,将这第一步,将这600600件产品编号为件产品编号为1 1,2 2,3 3,600.600.第二步,将总体平均分成第二步,将总体平均分成6060部分,每一部分含部分,每一部分含1010个个体个个体. .第三步,在第第三步,在第1 1部分中用简单随机抽样抽取一个号码部分中
34、用简单随机抽样抽取一个号码(如(如8 8号)号). .第四步,从该号码起,每隔第四步,从该号码起,每隔1010个号码取一个号码,就得个号码取一个号码,就得到一个容量为到一个容量为6060的样本的样本. .(8 8,1818,2828,598598) 思考思考1:用系统抽样从总体中抽取样本时,用系统抽样从总体中抽取样本时,首先要做的工作是什么?首先要做的工作是什么? (将总体中的所有个体编号(将总体中的所有个体编号.)思考思考2:用系统抽样从含有用系统抽样从含有N个个体的总体中个个体的总体中抽取一个容量为抽取一个容量为n的样本,要平均分成多少的样本,要平均分成多少段,每段各有多少个号码?段,每段
35、各有多少个号码? 例如:例如:如果用系统抽样从如果用系统抽样从605件产品中抽取件产品中抽取60件进行质量检查,由于件进行质量检查,由于605件产品不能均件产品不能均衡分成衡分成60部分,对此应如何处理?部分,对此应如何处理? 先从总体中随机剔除先从总体中随机剔除5个个体,再均衡分成个个体,再均衡分成60部分部分.)因此,在分段时,如果因此,在分段时,如果N N不能被不能被n n整除整除从总体中随机剔除从总体中随机剔除N N除以除以n n的余数个个体的余数个个体后再分段后再分段. .思考思考3 3:将含有将含有N N个个体的总体平均分成个个体的总体平均分成n n段,每段的号码个数称为分段间隔,
36、段,每段的号码个数称为分段间隔,那么分段间隔那么分段间隔k k的值如何确定?的值如何确定?总体中的个体数总体中的个体数N N除以样本容量除以样本容量n n所得所得的商的商. . 用简单随机抽样抽取第用简单随机抽样抽取第1 1段的个体编段的个体编号号. .在抽取第在抽取第1 1段的号码之前,自定义规段的号码之前,自定义规则确定以后各段的个体编号,通常是将则确定以后各段的个体编号,通常是将第第1 1段抽取的号码依次累加间隔段抽取的号码依次累加间隔k.k.思考思考4 4:用系统抽样抽取样本时,每段用系统抽样抽取样本时,每段各取一个号码,其中第各取一个号码,其中第1 1段的个体编号段的个体编号怎样抽取
37、?以后各段的个体编号怎样怎样抽取?以后各段的个体编号怎样抽取?抽取?步骤一般地,用系统抽样从含有一般地,用系统抽样从含有N个个体的总体个个体的总体中抽取一个容量为中抽取一个容量为n的样本,其操作步骤:的样本,其操作步骤: 第一步,将总体的第一步,将总体的N个个体编号个个体编号. 第二步,确定分段间隔第二步,确定分段间隔k,对编号进行分段,对编号进行分段. 第三步,在第第三步,在第1段用简单随机抽样确定起始段用简单随机抽样确定起始个体编号个体编号l. 第四步,按照一定的规则抽取样本第四步,按照一定的规则抽取样本.注意 在使用系统抽样时,容易忽视的两点: 1.分割间断(样本距离)K的确定:要注意K
38、=总体单位数N/样本单位数n,K为整数,如果N/n不为整数时,应剔除部分各个,获得整数K 2. 每段抽取时并不是任取的,它是由第一段所抽每段抽取时并不是任取的,它是由第一段所抽出的编号加上间隔数决定的,故利用系统抽样方出的编号加上间隔数决定的,故利用系统抽样方法时,一定要准确掌握其遵循的特征,否则会失法时,一定要准确掌握其遵循的特征,否则会失误误 例:某中学有高一学生例:某中学有高一学生322322名,为了了解学生名,为了了解学生的身体状况,要抽取一个容量为的身体状况,要抽取一个容量为4040的样本,用系的样本,用系统抽样法如何抽样?统抽样法如何抽样?. . 第一步,随机剔除第一步,随机剔除2
39、名学生,把余下的名学生,把余下的320名名学生编号为学生编号为1,2,3,320.第二步,把总体分成第二步,把总体分成40个部分,每个部分有个部分,每个部分有8 个个体个个体第三步,在第第三步,在第1部分用抽签法确定起始编号部分用抽签法确定起始编号.第四步,从该号码起,每间隔第四步,从该号码起,每间隔8个号码抽取个号码抽取1个号码,就可得到一个容量为个号码,就可得到一个容量为40的样本的样本.概率取样课堂总结:课堂例题 某大学为了支持亚运会,从报名的某大学为了支持亚运会,从报名的24名名大三的学生中选大三的学生中选6人组成志愿小组,适人组成志愿小组,适合用哪种方法?合用哪种方法? 总体个数较少
40、,适合简单随机抽样:抽签或随机样表法【解解】抽签法抽签法第一步:将第一步:将24名志愿者编号,编号为名志愿者编号,编号为1,2,3,24;第二步:将第二步:将24个号码分别写在个号码分别写在24张外形完张外形完全相同的纸条上,并揉成团,制成号签;全相同的纸条上,并揉成团,制成号签;第三步:将第三步:将24个号签放入一个不透明的盒个号签放入一个不透明的盒子中,充分搅匀;子中,充分搅匀;第四步:从盒子中逐个抽取第四步:从盒子中逐个抽取6个号签,并记个号签,并记录上面的编号;录上面的编号;第五步:所得号码对应的志愿者,就是志第五步:所得号码对应的志愿者,就是志愿小组的成员愿小组的成员随机数表法随机数
41、表法第一步:将第一步:将24名学生编号,编号为名学生编号,编号为01,02,03,24;第二步:在随机数表中任选一数开始,第二步:在随机数表中任选一数开始,按某一确定方向读数;按某一确定方向读数;第三步:凡不在第三步:凡不在0124中的数或已读中的数或已读过的数,都跳过去不作记录,依次过的数,都跳过去不作记录,依次记录下得数;记录下得数;第四步:找出号码与记录的数相同的第四步:找出号码与记录的数相同的学生组成志愿小组学生组成志愿小组在例在例1中,若把中,若把“24名学生名学生”改为改为“1800名学生名学生”,仍选取仍选取6人,应该如何进行抽样?人,应该如何进行抽样? 总体数较大,故应选用随机
42、数表法总体数较大,故应选用随机数表法第一步:先将第一步:先将1800名学生编号,可以编为名学生编号,可以编为0001,0002,0003,1800.第二步:在随机数表中任选一个数,例如第二步:在随机数表中任选一个数,例如选出第选出第2行第行第5列的数列的数2.第三步:从选定的数开始向右读,依次可第三步:从选定的数开始向右读,依次可得得0736,0751,0732,1355,1410,1256为样本为样本的的6个号码,这样我们就得到一个容量为个号码,这样我们就得到一个容量为6的样本的样本 要从要从1002个学生中选取一个容量为个学生中选取一个容量为20的样本试用系统抽样的方法给出抽的样本试用系统
43、抽样的方法给出抽样过程样过程100220502,为了保证,为了保证“等距等距”分段,应分段,应先剔除先剔除2人人第一步,将第一步,将1002名学生用随机方式编号名学生用随机方式编号第二步,从总体中剔除第二步,从总体中剔除2人人(剔除方法可用随剔除方法可用随机数表法机数表法),将剩下的,将剩下的1000名学生重新编号名学生重新编号(编号分别为编号分别为000,001,002,999),并分,并分成成20段段、第三步,在第一段、第三步,在第一段000,001,002,049这这50个编号中用简单随机抽样抽出一个号个编号中用简单随机抽样抽出一个号(如如003)作为起始号码作为起始号码第四步,将编号为
44、第四步,将编号为003,053,103,953的个的个体抽出,组成样本体抽出,组成样本 某政府机关有在编人员某政府机关有在编人员100人,其中副人,其中副处级以上干部处级以上干部10人,一般干部人,一般干部70人,人,工人工人20人上级机关为了了解政府机人上级机关为了了解政府机构改革意见,要从中抽取一个容量为构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,的样本,试确定用何种方法抽取,副处、一般干部和工人各抽取多少人?副处、一般干部和工人各抽取多少人?(二)、非概率取样1、相对于概率抽样而言、相对于概率抽样而言2、抽取样本时不是依据随机原则,而是根据研、抽取样本时不是依据随机
45、原则,而是根据研究目的对数据的要求,采用某种方式从总体中究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查抽出部分单位对其实施调查3、有随意抽样、判断抽样、志愿参加者抽样、有随意抽样、判断抽样、志愿参加者抽样、滚雪球抽样、配额抽样、修正的概率抽样等方滚雪球抽样、配额抽样、修正的概率抽样等方式式 4.应用应用 形成一种想法;形成一种想法; 作为设计开发概率抽样调查的初始步骤;作为设计开发概率抽样调查的初始步骤; 在后续步骤中帮助理解概率抽样调查结果在后续步骤中帮助理解概率抽样调查结果 5、优点、优点 |快速简便;费用低廉;快速简便;费用低廉; 不需要规范的抽样框不需要规范的抽样框
46、对探索性研究和调查的设计开发有用对探索性研究和调查的设计开发有用 6、缺点、缺点 1、主观性,使结果有偏差;、主观性,使结果有偏差; 2、无抽样框,不可能计算各个元素的入样概率,无法得、无抽样框,不可能计算各个元素的入样概率,无法得到可靠的估计值及抽样误差估计值,不能推断总体。到可靠的估计值及抽样误差估计值,不能推断总体。4.1 简便取样任意抽样又称便利抽样,是根据调研者的方便与否来抽取样本的一种抽任意抽样又称便利抽样,是根据调研者的方便与否来抽取样本的一种抽样方法。样方法。“街头拦人法街头拦人法”和和“空间抽样法空间抽样法”是方便抽样的两种最常见的是方便抽样的两种最常见的方法。方法。“街头拦
47、人法街头拦人法”是在街上或路口任意找某个行人,将其作为被调研者,是在街上或路口任意找某个行人,将其作为被调研者,进行调研。例如在街头向行人询问其对市场物价的看法,请行人填写某进行调研。例如在街头向行人询问其对市场物价的看法,请行人填写某种问卷等。种问卷等。“空间抽样法空间抽样法”是对某一聚集的人群,从空间的不同方向和方位对他们是对某一聚集的人群,从空间的不同方向和方位对他们进行抽样调研,如在商场内向顾客询问对商场服务质量的意见;在劳务进行抽样调研,如在商场内向顾客询问对商场服务质量的意见;在劳务市场调研外来劳工打工情况等。市场调研外来劳工打工情况等。任意抽样简便易行,能及时取得所需的信息资料,
48、省时、省力、节约经任意抽样简便易行,能及时取得所需的信息资料,省时、省力、节约经费,但抽样偏差较大,一般用于非正式的探测性调研,只有在调研总体费,但抽样偏差较大,一般用于非正式的探测性调研,只有在调研总体各单位之间的差异不大时,抽取的样本才具有较高的代表性。各单位之间的差异不大时,抽取的样本才具有较高的代表性。适合刚刚发生的大事或者敏感问题适合刚刚发生的大事或者敏感问题不能代表总体。不能代表总体。 简便取样案例: 央视:你幸福吗?视频 今天作业:简便取样: 调查问题 1.马航飞机 2.今年毕业生就业 3.你考研吗? 要求:视频3-5分钟4.2 判断取样 判断抽样是判断抽样是便利抽样的一种形式,
49、根据研究人员的判断选便利抽样的一种形式,根据研究人员的判断选出总体中的个体出总体中的个体 进行判断的研究人员或专家选出要被包括进样本的个体进行判断的研究人员或专家选出要被包括进样本的个体 是主观的判断,其价值完全取决于研究人员的判断、专业知识以是主观的判断,其价值完全取决于研究人员的判断、专业知识以及创造力及创造力 需要判断或推测谁能代表总体。具有大量有关总体知识的调研者或某些有需要判断或推测谁能代表总体。具有大量有关总体知识的调研者或某些有助于调研者的个体,将选择他或她觉得该选取的那些个体组成样本。助于调研者的个体,将选择他或她觉得该选取的那些个体组成样本。 焦点小组座谈会通常利用判断抽样。
50、焦点小组座谈会通常利用判断抽样。 缺点是不支持特定总体的直接推断缺点是不支持特定总体的直接推断 优点是成本低、便利且快速优点是成本低、便利且快速案例 最近一个小组座谈会调查人们关注对低卡最近一个小组座谈会调查人们关注对低卡路里、低脂肪微波炉烹饪技术的要求并选路里、低脂肪微波炉烹饪技术的要求并选择择12名妇女作为目前和未来市场的代表。名妇女作为目前和未来市场的代表。这些妇女中有这些妇女中有6名已经拥有微波炉在名已经拥有微波炉在3年或年或3年以上。另有年以上。另有3名妇女拥有微波炉至少名妇女拥有微波炉至少3年,年,还有还有3名妇女在市场上寻找微波炉。名妇女在市场上寻找微波炉。4.3配额抽样 首先将