《系统抽样与分层抽样精品文稿.ppt》由会员分享,可在线阅读,更多相关《系统抽样与分层抽样精品文稿.ppt(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、系统抽样与分层抽样第1页,本讲稿共14页复习回顾复习回顾复习回顾复习回顾复习回顾复习回顾1 1、什么是简单随机抽样?、什么是简单随机抽样?2 2、什么样的总体适宜简单随机抽样?、什么样的总体适宜简单随机抽样?3 3、随机数表法的步骤如何?、随机数表法的步骤如何?设一个总体的个数为设一个总体的个数为N N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。适用范围:总体的个体数不多时。适用范围:总体的个体数不多时。1 1、给总体中
2、各个个体编号;(起始号码选、给总体中各个个体编号;(起始号码选0000,而不选,而不选0101,可使,可使100100个个体都可用个个体都可用2 2位数表位数表示)示)2 2、选定开始的数字;(随机)、选定开始的数字;(随机)3 3、获取样本号码。(按顺序列出,以免重复)、获取样本号码。(按顺序列出,以免重复)第2页,本讲稿共14页系统抽样系统抽样系统抽样系统抽样系统抽样系统抽样例例1 1为了解参加某种知识竞赛的为了解参加某种知识竞赛的10001000名学生的成绩,名学生的成绩,打算抽取容量为打算抽取容量为5050的一个样本进行了解。过程如下:的一个样本进行了解。过程如下:(1 1)随机将这)
3、随机将这10001000名学生编号为名学生编号为1 1,2 2,3 3,10001000;(2 2)将总体按编号顺序平均分成)将总体按编号顺序平均分成5050部分,每部分包含部分,每部分包含2020个个体;个个体;(3 3)在第一部分的个体编号)在第一部分的个体编号1 1,2 2,2020中,利用简单随机抽样抽取中,利用简单随机抽样抽取一个号码,比如一个号码,比如1313;(4 4)以)以1313为起始号,每间隔为起始号,每间隔2020抽取一个号码,这样就得到一个容量为抽取一个号码,这样就得到一个容量为5050的样本:的样本:1313,3333,5353,973973,993993。第3页,本
4、讲稿共14页系统抽样系统抽样系统抽样系统抽样系统抽样系统抽样 将总体分成均衡的几个部分,然后按照预先定出将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做本,这种抽样叫做系统抽样系统抽样(也称为机械抽样)。(也称为机械抽样)。问题一问题一 系统抽样中,每个个体被抽中的概率是否一样?系统抽样中,每个个体被抽中的概率是否一样?答:在上面的抽样中,由于在第一部分(编号为答:在上面的抽样中,由于在第一部分(编号为120120)中的起始号码是随机确定的,每个号码被抽取的概率都中的起始号码是随机确定的,每个
5、号码被抽取的概率都等于等于 ,所以在抽取第,所以在抽取第1 1部分的个体前,其他各部分中部分的个体前,其他各部分中每个号码被抽取的概率也都是每个号码被抽取的概率也都是 。就是说,在这个系统。就是说,在这个系统抽样中,每个个体被抽取的概率都是抽样中,每个个体被抽取的概率都是 。第4页,本讲稿共14页情景设置情景设置情景设置情景设置情景设置情景设置例例2 2为了了解参加某种知识竞赛的为了了解参加某种知识竞赛的10031003名学生的成绩,名学生的成绩,应采用什么样的抽样方法恰当?应采用什么样的抽样方法恰当?解:(解:(1 1)随机将这)随机将这10031003个个体进行编号个个体进行编号1 1,2
6、 2,3 3,10031003。(2 2)利用简单随机抽样,先从总体中剔除)利用简单随机抽样,先从总体中剔除3 3个个体(可以随机数表法),剩下的个体个个体(可以随机数表法),剩下的个体数数10001000通通被通通被5050整除,然后按系统抽样的方法进行。整除,然后按系统抽样的方法进行。问题问题2 2 如果个体总数不能被样本容量整除时该怎么办?如果个体总数不能被样本容量整除时该怎么办?答:先从总体中随机地剔除余数(可用随机数表),答:先从总体中随机地剔除余数(可用随机数表),再按系统抽样方法往下进行。(每个被抽到的概率是再按系统抽样方法往下进行。(每个被抽到的概率是否一样?)否一样?)第5页
7、,本讲稿共14页情景设置情景设置情景设置情景设置情景设置情景设置讨论:在这整个抽样过程中每个个体被抽取的概率是否相等?讨论:在这整个抽样过程中每个个体被抽取的概率是否相等?1 1、总体中的每个个体被剔除的概率是相等的、总体中的每个个体被剔除的概率是相等的 ,2 2、也就是每个个体不被剔除的概率相等、也就是每个个体不被剔除的概率相等 ;3 3、采用系统抽样时每个个体被抽取的概率都是、采用系统抽样时每个个体被抽取的概率都是 ;4 4、在整个抽样过程中每个个体被抽取的概率仍、在整个抽样过程中每个个体被抽取的概率仍相等,都是相等,都是 。第6页,本讲稿共14页阶段小结阶段小结阶段小结阶段小结阶段小结阶
8、段小结系统抽样的步骤:系统抽样的步骤:采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个采用随机的方式将总体中的个体编号。为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 ;在第一段用简单随机抽样确定起始的个体编号在第一段用简单随机抽样确定起始的个体编号l l;按照事先确定的规则抽取样本(通常是将按照事先确定的规则抽取样本(通常是将l l加上间隔加上间隔k k,得到第,得到第2 2个编号个编号l l+k,+k,第第3 3个编号个编号l l+2k+2k,这样继续下去,直到获取整个样本)。,
9、这样继续下去,直到获取整个样本)。整个的编号分段(即分成几个部分),要确定分段的间整个的编号分段(即分成几个部分),要确定分段的间隔隔k k。当。当 (N N为总体中的个体的个数,为总体中的个体的个数,n n为样本容量)是为样本容量)是整数时,整数时,k=k=;当;当 不是整数时,通过从总体中剔除一不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数些个体使剩下的总体中个体的个数N N,能被能被n n整除,这时整除,这时k=k=;第7页,本讲稿共14页阶段练习阶段练习阶段练习阶段练习阶段练习阶段练习1、P21练习1、2 2、从含有500个个体的总体中一次性抽取25个个体,每个个体被抽到
10、的概率相等,那么总体中的每个个体被抽到的概率等于?第8页,本讲稿共14页分层抽样分层抽样分层抽样分层抽样分层抽样分层抽样问题问题一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容单位职工与身体状况有关的某项指标,要从中抽取一个容量为量为100100的样本。由于职工年龄与这项指标有关,试问:的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在应用什么方法抽取?能在
11、500500人中任意取人中任意取100100个吗?能将个吗?能将100100个份额均分到这三部分中吗?个份额均分到这三部分中吗?分析:考察对象的特点是由具有明显差异的几部分组成。分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。第9页,本讲稿共14页分层抽样分层抽样分层抽样分层抽样分层抽样分层抽样问题问题一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535
12、到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100100的样本。由于的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在职工年龄与这项指标有关,试问:应用什么方法抽取?能在500500人中任意取人中任意取100100个吗?能将个吗?能将100100个份额个份额均分到这三部分中吗?均分到这三部分中吗?解:(1)确定样本容量与总体的个体数之比100:500=1:5。(3)利用简单随机抽样或系统抽样的方法,从各年龄
13、段分别抽取25,56。19人,然后合在一起,就是所抽取的样本。(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即25,56,19。第10页,本讲稿共14页阶段练习阶段练习阶段练习阶段练习阶段练习阶段练习1 1、P22P22练习练习1 1、2 2、3 32 2、某单位有职工、某单位有职工200200人,其中老年职工人,其中老年职工4040人,现从该人,现从该单位的单位的200200人中抽取人中抽取4040人进行健康普查,如果采用分人进行健康普查,如果采用分层抽样进行抽取,则老年职工应抽取的人数为多少?层抽样进行抽取,则老年职工应抽取的人数为多少?强调两点:强调两点:(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于 。第11页,本讲稿共14页本课小结本课小结本课小结本课小结本课小结本课小结第12页,本讲稿共14页第13页,本讲稿共14页第14页,本讲稿共14页