《21随机抽样.pptx》由会员分享,可在线阅读,更多相关《21随机抽样.pptx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、如何才能收集到高质量的样本数据? 用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概率等于 Nn当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。问题情景:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是 ,因,因而
2、第而第1排被抽取前,其他各排中各号码被抽取概率也是排被抽取前,其他各排中各号码被抽取概率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简单随机抽样,因此这种,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。抽样的方法是系统抽样。 401401401一个礼堂有一个礼堂有30排座位,每排有排座位,每排有40个座位。一次报告会礼堂坐满了个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为听众。会后为听取意见留下了座位号为20的的30名听众进行座谈。名听众进行座谈。(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均
3、衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。 是整数时,是整数时, ; 不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。nNnNk nN(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l 。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk (等距)(等距) 系统抽样时,将总体中的个体均分后的每一段进行系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的体中各个个
4、体被抽取的概率也是相等的;如总体的个体如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说明体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。的是整个抽样过程中每个个体被抽到的概率仍然相等。A如何改进?问题情景:一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取? 解:抽取人数与职工总数的比是解:抽取人数与职工总数
5、的比是100:5001:5,则各年龄段(层)的职工人数依次是则各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随,然后分别在各年龄段(层)运用简单随机抽样方法抽取。机抽样方法抽取。 答:在分层抽样时,不到答:在分层抽样时,不到35岁、岁、3549岁、岁、50岁以岁以上的三个年龄段分别抽取上的三个年龄段分别抽取25人、人、56人和人和19人。人。Nnk iiNkn nninnNkniii,问题:每个个体在整个抽样过程中被抽取的概率是否相等?每部分抽取的个体数样本容量该部分的个体总数总体中的个体数nND.nC.NB.NnA.11A 15, 5,
6、25 B 15, 15 ,15C 10, 5, 30 D 15, 10, 20A总体中的个总体中的个体数较多体数较多从总体中从总体中逐个抽取逐个抽取将总体均分成几部将总体均分成几部分,按事先确定的分,按事先确定的规则在各部分抽取规则在各部分抽取将总体分成将总体分成 几层,几层,分层进行抽取分层进行抽取在起始部分抽在起始部分抽样时采用简单样时采用简单随机抽样随机抽样各层抽样时采各层抽样时采用简单随机抽用简单随机抽样或系统抽样样或系统抽样总体中的个总体中的个体数较少体数较少总体由差异总体由差异明显的几部明显的几部分组成分组成抽样过程中抽样过程中每个个体被每个个体被抽取的抽取的概率概率相等相等简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单,在有充分的总体信息的前提下,估计精度比随机抽样简单,在有充分的总体信息的前提下,估计精度比随机抽样高,且操作简单。分层抽样由于已经利用了总体信息,因此高,且操作简单。分层抽样由于已经利用了总体信息,因此估计精度也比随机简单抽样要高。估计精度也比随机简单抽样要高。