《随机抽样整理幻灯片.ppt》由会员分享,可在线阅读,更多相关《随机抽样整理幻灯片.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、随机抽样整理第1页,共28页,编辑于2022年,星期三我们将要学学习的几种随机抽样方法我们将要学学习的几种随机抽样方法1、简单随机抽样、简单随机抽样3、系统抽样、系统抽样2、分层抽样、分层抽样抽签法抽签法随机数法随机数法第2页,共28页,编辑于2022年,星期三(1)、简单随机抽样的概念定义定义:设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样简单随机抽样.第3页,共28页,编辑于2022年,星期三关于“随机抽样”随机抽样定义特征方法注意设.如果,且,就称.有限性、逐个性、不回性、等率性抽签法编号、标签、搅拌、抽取
2、随机数表法编号、选数、取号、抽取适用总体中个体数较少的抽样.第4页,共28页,编辑于2022年,星期三(2)简单随机抽样的方法抽签法 先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.第5页,共28页,编辑于2022年,星期三抽签法的一般步骤:抽签法的一般步骤:(1)将总体中的)将总体中的N个个体编号;个个体编号;(2)将这)将这N个号码写在形状、大小相个号码写在形状、大小相 同的同的号签上;号签上;(3)将
3、号签放在同一箱中,并搅拌均匀;)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出)从箱中每次抽出1个号签,连续抽个号签,连续抽出出n次;次;(5)将总体中与抽到的号签编号一致的)将总体中与抽到的号签编号一致的n个个个体取出。个体取出。(总体个数(总体个数N,样本容量,样本容量n)开始编号编号制签制签搅匀搅匀抽签抽签取出个体取出个体结束第6页,共28页,编辑于2022年,星期三(2)简单随机抽样的方法随机数表法 先将总体中的所有个体(共有N个)编号,然后在随机数表内任选一个数作为开始,再从选定的起始数,沿任意方向取数(不在号码范围内的数、重复出现的数必须去掉),最后根据所得号码抽取总体中相应
4、的个体,得到总体的一个样本.步 骤:编号、选数、取号、抽取.第7页,共28页,编辑于2022年,星期三 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”.2、分层抽样第8页,共28页,编辑于2022年,星期三(1)分层抽样是等概率抽样,它也是公平的.用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于 .关于分层抽样(2)分层抽样是建立在简单随机抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,
5、在实用中更为广泛.第9页,共28页,编辑于2022年,星期三5、分层抽样的步骤、分层抽样的步骤:(1)(1)将总体按一定的标准分层;将总体按一定的标准分层;(2)(2)计算各层的个体数与总体的计算各层的个体数与总体的 个体数的比;个体数的比;(3)(3)按各层个体数占总体的个按各层个体数占总体的个 体数的比确定各层应抽取体数的比确定各层应抽取 的样本容量;的样本容量;(5)(5)综合每层抽样,组成样本综合每层抽样,组成样本.(4)(4)在每一层进行抽样在每一层进行抽样;(可用简单(可用简单随机抽样或系统抽样随机抽样或系统抽样)开始分层分层计算计算比比定层抽取容量定层抽取容量抽样抽样组样组样结束
6、第10页,共28页,编辑于2022年,星期三关于“分层抽样”分层抽样定义特征步骤注意当,为了,常,然后,叫做.有限性、分层性、随机性、等率性三步分层,层抽样,合并层样本1.分层抽样法适用于总体中个体差异明显的抽样;2.分层是按总体中个体的明显差异进行分类;3.层抽样是按各层中含个体在总体中所占的比例,确定层抽样的个体个数进行随机抽样第11页,共28页,编辑于2022年,星期三(1).(1).某县有某县有3030个乡,其中山区有个乡,其中山区有6 6个,丘陵地区有个,丘陵地区有1212个,平个,平原地区有原地区有1212个,要从中抽出个,要从中抽出5 5个乡进行调查,则应在山区抽个乡进行调查,则
7、应在山区抽个乡,在丘陵地区抽乡,在平原地区抽个乡。个乡,在丘陵地区抽乡,在平原地区抽个乡。2 22 21 1(2).(2).高三某班有男生高三某班有男生5656人,女生人,女生4242人,现在用分层抽人,现在用分层抽样的方法,选出样的方法,选出2828人参加一项活动,则男生和女生人参加一项活动,则男生和女生的人数分别是的人数分别是:_:_16和和12练习练习:第12页,共28页,编辑于2022年,星期三例例1 1:某单位有老年人:某单位有老年人2828人,中年人人,中年人5454人,青年人人,青年人8181人,为了调查他们的身体状况的某项指标,需从人,为了调查他们的身体状况的某项指标,需从中抽
8、取一个容量为中抽取一个容量为3636的样本,适合抽取样本的方法的样本,适合抽取样本的方法是是 ()A.A.简单随机抽样简单随机抽样B B.系统抽样系统抽样C.C.分层抽样分层抽样D.D.先从老年人中排除一人,然后分层抽样先从老年人中排除一人,然后分层抽样D D例题分析例题分析:第13页,共28页,编辑于2022年,星期三分析:相对身体状况来说,总体是由个体差异明显分析:相对身体状况来说,总体是由个体差异明显的三个部分组成的,故可排除的三个部分组成的,故可排除A A ,B,B,因为人数比因为人数比为为285481,285481,且且3636不能整除(不能整除(2828545481),81),而在
9、而在D D中中,人数比为人数比为 27 5481=12 3 27 5481=12 3且(且(272754548181)能被)能被3636整除整除第14页,共28页,编辑于2022年,星期三 一个工厂有若干个车间,今采用分层抽样方法从全厂某天2048件产品中抽取一个容量为128的样本进行质量检查.若一车间一天生产256件产品,则从该车间抽取产品件数为 .16 某大学共有全日制学生15000人,其中专科生3788人、本科生9874人、研究生1338人,现为了调查学生上网查找资料的情况,欲从中抽取225人,为了使样本具有代表性,问如何抽样才合适?57、148、20例题第15页,共28页,编辑于202
10、2年,星期三两种抽样方法的比较抽样小结类别共同点各自特点相互联系适用范围简单随机抽样分层抽样抽样过程中每个个体被抽到的概率总相等从总体中逐个抽取将总体分成几层,分层进行抽取总体由差异明显的几部分组成各层抽样时采用简单随机抽样总体中的个体数较少第16页,共28页,编辑于2022年,星期三第17页,共28页,编辑于2022年,星期三一、一、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。第18页,共28页,编辑于2022年,星期三【说明说明】由系统抽样的定义可知
11、系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k.(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。第19页,共28页,编辑于2022年,星期三4 4、从容量为、从容量为N N的总体中抽取容量为的总体中抽取容量为n n的样本的样本,用系统抽样的一般步骤为用系统抽样的一般步骤为:(1 1)将总体中的)将总体中的N N个个体编号个个体编号.有时可直接有时可直接利用个体自身所带的号码利用个体自身所带的号码,
12、如学号、准考证如学号、准考证号、门牌号等;号、门牌号等;(2 2)将编号按间隔)将编号按间隔k k分段分段(kN(kN).(3 3)在第一段用简单随机抽样确定起始个)在第一段用简单随机抽样确定起始个体的编号体的编号L L(LN,LkLN,Lk)。)。(4 4)按照一定的规则抽取样本,通常是将)按照一定的规则抽取样本,通常是将起始编号起始编号L L加上间隔加上间隔k k得到第得到第2 2个个体编号个个体编号L+KL+K,再加上再加上K K得到第得到第3 3个个体编号个个体编号L+2KL+2K,这样继续,这样继续下去,直到获取整个样本下去,直到获取整个样本.编号编号分段分段定起始号定起始号抽取抽取
13、结束开始第20页,共28页,编辑于2022年,星期三应用举例应用举例 例例2 某校小礼堂举行心理讲座某校小礼堂举行心理讲座,有有500人参加听课人参加听课,坐满小坐满小礼堂,现从中选取礼堂,现从中选取25名同学了解有关情况名同学了解有关情况,选取怎样的抽选取怎样的抽样方式更为合适样方式更为合适.分析:宜采用系统抽样的方法,请写出具体的操作步骤。分析:宜采用系统抽样的方法,请写出具体的操作步骤。2把第一组的把第一组的120号写成标签号写成标签,用抽签的方法从中用抽签的方法从中抽出第一个号码抽出第一个号码.设这个号码为设这个号码为x3号码为号码为x、x+10、x+20、x+490作为样本作为样本1
14、把把500人的座位号按从小到大的顺序平均分成人的座位号按从小到大的顺序平均分成25组组,组组距为距为20第21页,共28页,编辑于2022年,星期三应用举例应用举例例例1 填空填空:为了了解某地区参加数学竞赛的为了了解某地区参加数学竞赛的1005名学生的数学成绩名学生的数学成绩,打算从打算从中抽取一个容量为中抽取一个容量为50的样本的样本,现用系统抽样的方法现用系统抽样的方法,需要用需要用 方法先从总体中剔除方法先从总体中剔除 个个体个个体,然后按编号顺序每间隔然后按编号顺序每间隔_个号个号码抽取一个码抽取一个.简单随机抽样简单随机抽样520第22页,共28页,编辑于2022年,星期三简单随机
15、抽样、系统抽样、分层抽样的比较简单随机抽样、系统抽样、分层抽样的比较类类 别别共同点共同点各自特点各自特点相互相互联系联系适适 用用范范 围围简简 单单随随 机机抽抽 样样(1 1)抽样过程)抽样过程中每个个体被中每个个体被抽到的可能性抽到的可能性相等相等(2 2)每次抽出)每次抽出个体后不再将个体后不再将它放回,即不它放回,即不放回抽样放回抽样从总体中逐个从总体中逐个抽取抽取总体中总体中个体个体较少较少将总体平均分将总体平均分成几部分,按成几部分,按预先制定的规预先制定的规则在各部分抽则在各部分抽取取在起始部在起始部分时采用简分时采用简单随机抽单随机抽样样总体中总体中个体较个体较多多系系 统
16、统抽抽 样样将总体分成几将总体分成几层,层,分层进行抽取分层进行抽取各层抽样时各层抽样时采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样总体由总体由差异明差异明显的几显的几部分组部分组成成分分 层层抽抽 样样第23页,共28页,编辑于2022年,星期三1.1.下列问题应采用什么样的抽样方法下列问题应采用什么样的抽样方法(1 1)某乡镇)某乡镇1212个行政村,现考察其人口中癌症的发病率个行政村,现考察其人口中癌症的发病率.要从要从 30003000人中抽出人中抽出300300人进行分析人进行分析.(2 2)某小区有)某小区有800800个家庭个家庭,其中高收入家庭其中高收入家庭200200
17、个个,中等收入家庭中等收入家庭480480个个,低收入家庭低收入家庭120120个个.为了解有关家用轿车购买力的某个指标为了解有关家用轿车购买力的某个指标,要从中抽一个要从中抽一个容量为容量为100100的样本的样本.(3 3)从)从1010名同学中抽取名同学中抽取3 3人参加座谈会人参加座谈会.(4)4)从某厂生产的从某厂生产的20002000个电子元件中抽取个电子元件中抽取200200个入样个入样.自我评价自我评价:2.2.某个工厂中共有职工某个工厂中共有职工30003000人,其中中,青,老年职工的比例为人,其中中,青,老年职工的比例为532532。要用分层抽样的方法从所有职工中抽出一个
18、样本量为要用分层抽样的方法从所有职工中抽出一个样本量为400400人的样本,则人的样本,则中,青,老职工应分别抽取中,青,老职工应分别抽取_,_,_._,_,_.第24页,共28页,编辑于2022年,星期三1 1、为为了了解解初初一一学学生生的的身身体体发发育育情情况况,打打算算在在初初一一年年级级1010个个 班班的的某某两两个班按男女生比例抽取样本,正确的抽样方法是(个班按男女生比例抽取样本,正确的抽样方法是()A A、随机抽样、随机抽样 B B、分层抽样、分层抽样 C C、先用简单随机抽样,再用分层抽样、先用简单随机抽样,再用分层抽样 D D、先用分层抽样,再用简单随机抽样、先用分层抽样
19、,再用简单随机抽样C练练 习习2、(、(2005年湖南高考题)某工厂生产了某种产品年湖南高考题)某工厂生产了某种产品16800件,它们来自甲、乙、丙三条生产线。为检件,它们来自甲、乙、丙三条生产线。为检查产品的质量,决定采用分层抽样法进行抽样。已查产品的质量,决定采用分层抽样法进行抽样。已知甲、乙、丙三条生产线抽取的个数成等差数列,知甲、乙、丙三条生产线抽取的个数成等差数列,则乙生产了则乙生产了_件产品。件产品。5600第25页,共28页,编辑于2022年,星期三3、某某单单位位有有老老年年人人28人人,中中年年人人54人人,青青年年人人81人人,为为了了调调查查他他们们的的身身体体情情况况,
20、需需从从他他们们中中抽抽取取一一个个容容量量为为36的的样样本本,则适合的抽取方法是则适合的抽取方法是 ()A简单随机抽样简单随机抽样 B系统抽样系统抽样 C分层抽样分层抽样 D先从老人中剔除先从老人中剔除1人,然后再分层抽样人,然后再分层抽样4、某某校校有有500名名学学生生,其其中中O型型血血的的有有200人人,A型型血血的的人人有有125人人,B型型血血的的有有125人人,AB型型血血的的有有50人人,为为了了研研究究血血型型与与色色弱弱的的关关系系,要要从从中中抽抽取取一一个个20人人的的样样本本,按按分分层层抽抽样样,O型型血血应应抽抽取取的的人人数数为为 人人,A型型血血应应抽抽取
21、取的的人人数数为为 人人,B型型血血应应抽抽取取的的人人数数为为 人人,AB型型血血应应抽抽取取的的人人数数为为 人。人。D 8552第26页,共28页,编辑于2022年,星期三5、(2004年全国高考湖南卷年全国高考湖南卷)某公司在甲、乙、丙、某公司在甲、乙、丙、丁四个地区分别有丁四个地区分别有150个、个、120个、个、180个、个、150个销售点,个销售点,公司为了调查产品销售的情况,需从这公司为了调查产品销售的情况,需从这600个销售点中抽个销售点中抽取一个容量为取一个容量为100的样本,记这项调查为的样本,记这项调查为;在丙地区中有;在丙地区中有20个特大型销售点,要从中抽取个特大型
22、销售点,要从中抽取7个调查其销售收入和个调查其销售收入和销后服务等情况,记这项调查为销后服务等情况,记这项调查为.则完成则完成、这两这两项调查采用的抽样方法依次是项调查采用的抽样方法依次是()A.分层抽样法分层抽样法,系统抽样法系统抽样法B.分层抽样法分层抽样法,简单随机抽样法简单随机抽样法C.系统抽样法系统抽样法,分层抽样法分层抽样法D.简单随机抽档法简单随机抽档法,分层抽样法分层抽样法B第27页,共28页,编辑于2022年,星期三6、某单位有工程师、某单位有工程师6人人,技术员技术员12人人,技工技工18人人,要从这些人中抽取一个容量为要从这些人中抽取一个容量为n的样本的样本;如果采用系统
23、如果采用系统抽样和分层抽样方法抽取抽样和分层抽样方法抽取,不用剔除个体不用剔除个体;如果样本容量如果样本容量增加增加1个个,则在采用系统抽样时则在采用系统抽样时,需要在总体中先剔除需要在总体中先剔除1个个体个个体,求得样本容量为求得样本容量为_.分析分析:总体容量总体容量N=36(人人)当样本容量为当样本容量为n时时,系统抽样间隔为系统抽样间隔为36/n N.分层抽样的抽样比为分层抽样的抽样比为n/36,求得工程师、技术员、技工的人求得工程师、技术员、技工的人数分别为数分别为n/6,n/3,n/2,所以,所以n应是应是6的倍数的倍数,36的约数的约数,即即n=6,12,18.当样本容量为当样本容量为n+1时时,总体中先剔除总体中先剔除1人还有时人还有时35人人,系统系统抽样间隔为抽样间隔为35/(n+1)N,所以所以n只能是只能是6.6第28页,共28页,编辑于2022年,星期三