《系统抽样与分层抽样.ppt》由会员分享,可在线阅读,更多相关《系统抽样与分层抽样.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.1.2 2.1.2 系统抽样系统抽样复习2.2.简单随机抽样有哪两种常用方法?其简单随机抽样有哪两种常用方法?其操作步骤分别如何?操作步骤分别如何?第三步,搅拌均匀第三步,搅拌均匀.抽签法:抽签法:第一步,编号第一步,编号.第二步第二步, 制作号签制作号签.第四步,抽取号签。第四步,抽取号签。第五步,第五步, 取出个体取出个体第一步,编号第一步,编号. .第三步,取数第三步,取数. .第四部,第四部,取出样本取出样本.第二步,选起始数第二步,选起始数. .随机数表法:随机数表法: 2 2、当总体中的个体数很多时,用、当总体中的个体数很多时,用简单随机抽样抽取样本,操作上并不方简单随机抽样抽
2、取样本,操作上并不方便、快捷便、快捷. . 因此,在保证抽样的公平性,因此,在保证抽样的公平性,不降低样本的代表性的前提下,我们还不降低样本的代表性的前提下,我们还需要进一步学习其它的抽样方法,以弥需要进一步学习其它的抽样方法,以弥补简单随机抽样的不足补简单随机抽样的不足. .提问:提问:1、利用简单随机抽样时每个个体、利用简单随机抽样时每个个体被抽到的概率是多少?被抽到的概率是多少?问题:问题:某中学高一年级有某中学高一年级有1212个班,每班个班,每班5050人,为了了解高一年级学生对老师教人,为了了解高一年级学生对老师教学的意见,教务处打算从年级学的意见,教务处打算从年级600600名学
3、名学生中抽取生中抽取6060名进行问卷调查,那么年级名进行问卷调查,那么年级每个同学被抽到的概率是多少?每个同学被抽到的概率是多少? 思考:思考:你能否设计其他的抽样方法?具你能否设计其他的抽样方法?具体如何操作?体如何操作? 第二步,将总体平均分成第二步,将总体平均分成6060部分,每部分,每一部分含一部分含1010个个体个个体. .第四步,从该号码起,每隔第四步,从该号码起,每隔1010个号码取个号码取一个号码,就得到一个容量为一个号码,就得到一个容量为6060的样本的样本. .(如(如8 8,1818,2828,598598)第三步,在第第三步,在第1 1部分中用简单随机抽样部分中用简单
4、随机抽样抽取一个号码(如抽取一个号码(如8 8号)号). .第一步,将这第一步,将这600600件产品编号为件产品编号为1 1,2 2,3 3,600.600.上述抽样方法称为上述抽样方法称为系统抽样系统抽样,一般地,一般地,怎样理解系统抽样的含义?怎样理解系统抽样的含义? 将总体分成均衡的将总体分成均衡的n n个部分,再按照预先个部分,再按照预先定出的规则,从每一部分中抽取定出的规则,从每一部分中抽取1 1个个体,个个体,即得到容量为即得到容量为n n的样本的样本. .知识探究(二):系统抽样的操作步骤知识探究(二):系统抽样的操作步骤 思考思考1 1:用系统抽样从总体用系统抽样从总体N N
5、中抽取样本中抽取样本n n时,每个个体被抽到的概率是多少?时,每个个体被抽到的概率是多少?思考思考2 2:如果用系统抽样从如果用系统抽样从605605件产品中件产品中抽取抽取6060件进行质量检查,由于件进行质量检查,由于605605件产品件产品不能均衡分成不能均衡分成6060部分,对此应如何处理?部分,对此应如何处理? 先从总体中随机剔除先从总体中随机剔除5 5个个体,再均衡个个体,再均衡分成分成6060部分部分. .剔除这剔除这5个个体用什么方法?个个体用什么方法?思考思考3 3:用系统抽样从含有用系统抽样从含有N N个个体的总个个体的总体中抽取一个容量为体中抽取一个容量为n n的样本,要
6、平均的样本,要平均分成多少段,每段各有多少个号码?分成多少段,每段各有多少个号码?思考思考4 4:如果如果N N不能被不能被n n整除怎么办?整除怎么办? 从总体中随机剔除从总体中随机剔除N N除以除以n n的余数个个体的余数个个体后再分段后再分段. .思考思考5 5:将含有将含有N N个个体的总体平均分成个个体的总体平均分成n n段,每段的号码个数称为分段间隔,段,每段的号码个数称为分段间隔,那么分段间隔那么分段间隔k k的值如何确定?的值如何确定?总体中的个体数总体中的个体数N N除以样本容量除以样本容量n n所得所得的商的商. . 用简单随机抽样抽取第用简单随机抽样抽取第1 1段的个体编
7、段的个体编号号. .在抽取第在抽取第1 1段的号码之前,自定义规段的号码之前,自定义规则确定以后各段的个体编号,通常是将则确定以后各段的个体编号,通常是将第第1 1段抽取的号码依次累加间隔段抽取的号码依次累加间隔k.k.思考思考6 6:用系统抽样抽取样本时,每段用系统抽样抽取样本时,每段各取一个号码,其中第各取一个号码,其中第1 1段的个体编号段的个体编号怎样抽取?以后各段的个体编号怎样怎样抽取?以后各段的个体编号怎样抽取?抽取?思考思考7 7:一般地,用系统抽样从含有一般地,用系统抽样从含有N N个个个体的总体中抽取一个容量为个体的总体中抽取一个容量为n n的样本,的样本,其操作步骤如何?其
8、操作步骤如何?第四步,按照一定的规则抽取样本第四步,按照一定的规则抽取样本.第一步,将总体的第一步,将总体的N N个个体编号个个体编号. .第三步,在第第三步,在第1 1段用简单随机抽样确定段用简单随机抽样确定起始个体编号起始个体编号l. .第二步,确定分段间隔第二步,确定分段间隔k k,对编号进,对编号进行分段行分段. .思考思考8 8:系统抽样适合在哪种情况下使用?系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更与简单随机抽样比较,哪种抽样方法更使样本具有代表性?使样本具有代表性?总体中个体数比较多;系统抽样更使总体中个体数比较多;系统抽样更使样本具有代表性样本具有代表性.
9、 . 思考思考9 9:我校共有我校共有360360名老师,为了支持名老师,为了支持海南的教育事业,现要从中随机抽取海南的教育事业,现要从中随机抽取4040名老师到湖南师大海口中学任教,用系名老师到湖南师大海口中学任教,用系统抽样选取奔赴海南的教师团合适吗?统抽样选取奔赴海南的教师团合适吗?理论迁移理论迁移 例例1 1 某中学有高一学生某中学有高一学生322322名,为名,为了了解学生的身体状况,要抽取一个容了了解学生的身体状况,要抽取一个容量为量为4040的样本,用系统抽样法如何抽样?的样本,用系统抽样法如何抽样?第一步,随机剔除第一步,随机剔除2 2名学生,把余下的名学生,把余下的32032
10、0名学生编号为名学生编号为1 1,2 2,3 3,320.320.第四步,从该号码起,每间隔第四步,从该号码起,每间隔8 8个号码个号码抽取抽取1 1个号码,就可得到一个容量为个号码,就可得到一个容量为4040的样本的样本. .第三步,在第第三步,在第1 1部分用抽签法确定起始部分用抽签法确定起始编号编号. . 第二步,把总体分成第二步,把总体分成4040个部分,每个个部分,每个部分有部分有8 8个个体个个体. . 2.2.系统抽样适合于总体的个体数较多的系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样除余数
11、个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、动生成,从而使得系统抽样操作简单、方便方便. .小结作业小结作业1.1.系统抽样也是等概率抽样,即每个系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保个体被抽到的概率是相等的,从而保证了抽样的公平性证了抽样的公平性. .2.1.32.1.3分层抽样分层抽样 问题问题1:如果要调查我校高二:如果要调查我校高二同学同学(550人人)的平均身高,用的平均身高,用前面学过的抽样方法怎么做?前面学过的抽样方法怎么做? 问题问题2:由经验看,以上的:由经验看,以上
12、的方法有没有不妥的地方?方法有没有不妥的地方?样本的代表性一定好吗?样本的代表性一定好吗? 可能会出现样本代表性不好的情况!可能会出现样本代表性不好的情况!例例1:假设某地区有假设某地区有高中生高中生2400人人,初中初中生生10900人人,小学生小学生11000人人.此地区此地区小学初中高中 年级020406080近视率/%教育部门为了了解本地区中小学生教育部门为了了解本地区中小学生的近视情况及其形成原因的近视情况及其形成原因,要从本地要从本地区的中小学生中抽取区的中小学生中抽取1%的学生进行的学生进行调查调查,你认为应当怎样抽取样本你认为应当怎样抽取样本? 问题问题1:你认为哪些因素可能影
13、响学你认为哪些因素可能影响学生的视力?设计抽样方法时生的视力?设计抽样方法时需要考虑这些因素吗?需要考虑这些因素吗? 年龄对视力有影响年龄对视力有影响问题问题2:请问例请问例1中的总体是什么?中的总体是什么?总体可看成由几部分组成?总体可看成由几部分组成?总体中的个体数是多少?总体中的个体数是多少?问题问题3: 1%的样本在本例中是什么含义?的样本在本例中是什么含义?问题问题4:(1)你打算怎么从各部分中抽取样你打算怎么从各部分中抽取样本?本?(2)为什么要这样取各个学段的个)为什么要这样取各个学段的个体数?体数?样本容量与总体个数的比例为样本容量与总体个数的比例为1:100,则,则高中应抽取
14、人数为高中应抽取人数为2400*1/100=24人人,初中应抽取人数为初中应抽取人数为10800*1/100=108人,人,小学应抽取人数为小学应抽取人数为11100*1/100=111人人.问题问题5:在上述抽样过程中,每个学生在上述抽样过程中,每个学生被抽到的概率相等吗?是多少?被抽到的概率相等吗?是多少?因此,上述抽样方法不仅保证了抽样的因此,上述抽样方法不仅保证了抽样的公平性,而且抽取的样本具公平性,而且抽取的样本具有较好的代有较好的代表性表性,从而是一种科学、合理的抽样方,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样法,这种抽样方法称为分层抽样. .一般一般地,分层抽样的
15、基本思想是什么?地,分层抽样的基本思想是什么? 若总体由若总体由差异明显差异明显的几部分组成,的几部分组成,抽样时,先将总体分成抽样时,先将总体分成互不交叉的层互不交叉的层,然后然后按照一定的比例按照一定的比例,从各层独立地,从各层独立地抽取一定数量的个体,再将各层取出抽取一定数量的个体,再将各层取出的个体合在一起作为样本的个体合在一起作为样本. .特点:特点: 分层抽样是当总体由分层抽样是当总体由 的几部分组成时采用的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:的抽样方法,进行分层抽样时应注意以下几点:(1)分层时将相似的个体归入一类,即为一层,分)分层时将相似的个体归入一类,
16、即为一层,分层要求每层的个体互不交叉,即遵循不重复不遗漏层要求每层的个体互不交叉,即遵循不重复不遗漏的原则,即保证的原则,即保证 与与 一一致性。致性。(3)在每层抽样时,应采用)在每层抽样时,应采用 的的方法进行抽样。方法进行抽样。差异明显差异明显总体结构总体结构 样本结构样本结构(2)为了保证每个个体等可能入样,所有层应)为了保证每个个体等可能入样,所有层应采用同一采用同一 等等可能抽样。可能抽样。抽样比抽样比简单随机抽样或系统抽样简单随机抽样或系统抽样分层抽样的具体步骤是什么分层抽样的具体步骤是什么? 步骤步骤1:根据已经掌握的信息,将总体分成互根据已经掌握的信息,将总体分成互不相交的层
17、不相交的层步骤步骤2:根据总体的个体数根据总体的个体数N和样本容量和样本容量n计算抽计算抽样比样比k= n:N步骤步骤3:确定每一层应抽取的个体数目确定每一层应抽取的个体数目,并使每一并使每一层应抽取的个体数目之和为样本容量层应抽取的个体数目之和为样本容量n步骤步骤4:按步骤按步骤3确定的数目在各层中随机抽取个确定的数目在各层中随机抽取个体,合在一起得到容量为体,合在一起得到容量为n样本样本分层分层求比求比定数定数抽样抽样例例2、一个单位的职工有、一个单位的职工有500人,其中不到人,其中不到35岁的有岁的有125人,人,3549岁的有岁的有280人,人,50岁以上的有岁以上的有95人。为了了
18、解该单人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取位职工年龄与身体状况的有关指标,从中抽取100名职工名职工作为样本,应该怎样抽取?作为样本,应该怎样抽取? 分析:这总体具有某些特征,它可以分成几个不分析:这总体具有某些特征,它可以分成几个不同的部分:不到同的部分:不到35岁;岁;3549岁;岁;50岁以上,把每岁以上,把每一部分称为一个层,因此该总体可以分为一部分称为一个层,因此该总体可以分为3个层。个层。由于抽取的样本为由于抽取的样本为100,所以必须确定每一层的比,所以必须确定每一层的比例,在每一个层中实行简单随机抽样例,在每一个层中实行简单随机抽样。 解:抽取人数与职工总数
19、的比是解:抽取人数与职工总数的比是100:5001:5,则,则各年龄段(层)的职工人数依次是各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽,然后分别在各年龄段(层)运用简单随机抽样方法抽取。取。答:在分层抽样时,不到答:在分层抽样时,不到35岁、岁、3549岁、岁、50岁以上的三岁以上的三个年龄段分别抽取个年龄段分别抽取25人、人、56人和人和19人。人。三种抽样方法的比较三种抽样方法的比较 例例3 3 某公司共有某公司共有10001000名员工,下设名员工,下设若干部门,现用分层抽样法,从全体员若干部门,现用分层抽样法,从全
20、体员工中抽取一个容量为工中抽取一个容量为8080的样本,已知策的样本,已知策划部被抽取划部被抽取4 4个员工,求策划部的员工人个员工,求策划部的员工人数是多少?数是多少?5050人人. . 例例4 4 某中学有某中学有180180名教职员工,其中名教职员工,其中教学人员教学人员144144人,管理人员人,管理人员1212人,后勤人,后勤服务人员服务人员2424人,设计一个抽样方案,从人,设计一个抽样方案,从中选取中选取1515人去参观旅游人去参观旅游. . 用分层抽样,抽取教学人员用分层抽样,抽取教学人员1212人,管人,管理人员理人员1 1人,后勤服务人员人,后勤服务人员2 2人人. .例5
21、:某单位有老年人某单位有老年人27人,人,中年人中年人55人,青年人人,青年人81人,为人,为了调查他们的身体情况,需从了调查他们的身体情况,需从他们中抽取一个容量为他们中抽取一个容量为36的样的样本,则适合的抽取方法是(本,则适合的抽取方法是( ) A简单随机抽样简单随机抽样 B系统抽样系统抽样C分层抽样分层抽样 D先从中年人中剔除先从中年人中剔除1人,然后再分人,然后再分层抽样层抽样 例例6 6 某公司在甲、乙、丙、丁四个某公司在甲、乙、丙、丁四个地区分别有地区分别有150150个、个、120120个、个、180180个、个、150150个销售点,公司为了调查产品的销售情个销售点,公司为了
22、调查产品的销售情况,需从这况,需从这600600个销售点中抽取一个容个销售点中抽取一个容量为量为100100的样本,记这项调查为的样本,记这项调查为;在;在丙地区中有丙地区中有2020个特大型销售点,要从中个特大型销售点,要从中抽取抽取7 7个调查其销售收入和售后服务等个调查其销售收入和售后服务等情况,记这项调查为情况,记这项调查为,完成这两项调,完成这两项调查宜分别采用什么方法?查宜分别采用什么方法?用分层抽样,用分层抽样,用简单随机抽样用简单随机抽样. .请根据上述基本数据,设计一个样本容请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样量为总体中个体数量的千分之一的抽样
23、方案方案. . 例例7 7 某地区中小学生人数的分布情某地区中小学生人数的分布情况如下表所示(单位:人):况如下表所示(单位:人):学段学段城市城市县镇县镇农村农村小学小学357 000357 000221 600221 600258 100258 100初中初中226 200226 200134 200134 200 11 29011 290高中高中112 000112 000 43 30043 300 6 3006 300作业:作业: P64P64习题习题2.1A2.1A组:组:3.5.63.5.6【能力提高能力提高】1.(20041.(2004年全国高考天津卷年全国高考天津卷) )某工厂
24、生某工厂生产产A A、B B、C C三种不同型号的产品三种不同型号的产品, ,产品数量产品数量之比为之比为2:3:5,2:3:5,现用分层抽样方法抽取一个现用分层抽样方法抽取一个容量为容量为n n的样本的样本, ,样本中样本中A A型产品有型产品有1616种种, ,那那么此样本容量么此样本容量n=_.n=_.802、某单位有工程师、某单位有工程师6人人,技术员技术员12人人,技工技工18人人,要从这些人中抽取一个容量为要从这些人中抽取一个容量为n的样本的样本;如果采如果采用系统抽样和分层抽样方法抽取用系统抽样和分层抽样方法抽取,不用剔除个体不用剔除个体;如果样本容量增加如果样本容量增加1个个,
25、则在采用系统抽样时则在采用系统抽样时,需要需要在总体中先剔除在总体中先剔除1个个体个个体,求得样本容量为求得样本容量为_.分析分析:总体容量总体容量N=36(人人)当样本容量为当样本容量为n时时,系统抽样间隔为系统抽样间隔为36/nN,所以,所以n是是 36的约数;的约数;分层抽样的抽样比为分层抽样的抽样比为n/36,求得工程师、技术员、技工求得工程师、技术员、技工的人数分别为的人数分别为n/6,n/3,n/2,所以,所以n应是应是6的倍数的倍数,当样本容量为当样本容量为n+1时时,总体中先剔除总体中先剔除1人还有时人还有时35人人,系统抽样间隔为系统抽样间隔为35/(n+1)N,所以所以n只能是只能是6.6所以所以n=6或或12或或18.