《系统抽样、分层抽样.pptx》由会员分享,可在线阅读,更多相关《系统抽样、分层抽样.pptx(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。数理统计所要解决的问题是如何根据样本来推断总体,第一个问题就是采集样本,然后才能作统计推断。第1页/共18页注意以下四点:(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种等概率抽样。简单随机抽样是在特定总体
2、中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概卒等于 一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。1、简单随机抽样第2页/共18页抽签法 随机抽样的方法:随机数表法练习:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。分析并说明整个抽签过程中每个同
3、学被抽到的概率是相等的。1、抽签法、抽签法 先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。第3页/共18页2 2、用随机数表法进行抽取、用随机数表法进行抽取 随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表
4、并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。第4页/共18页抽签法 随机抽样的方法:随机数表法练习:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。上述问题中抽取样本的方法用随机数表法来进行!规则1:从107页表中第6行第5列的两位数开始,依次向下读数,到头
5、后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。第5页/共18页(2)要抽样了解某年参加高考考生的语文考试成绩,我们可以提出问题(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。按照科目分类:文科、理科、艺术、体育和外语五个层次。按照地区分类:大城市、中等城市、城镇、乡镇四个层次。按照学校分类:重点、非重点两个层次。第6页/共18页 为了了解高一年级12000名学生的数学成绩,需要抽取容量为120的样本,请用合适的方法抽取.解:(1)对全体学生的数学成绩进行编
6、号:1,2,3,12000.(2)分段:由于样本容量与总体容量的 比是1:100,我们将总体平均分为100个部分,其中每一部分包含100个个体.(3)在第一部分即1号到100号用简单随机抽样,抽取一个号码,比如是50.(4)以50作为起始数,然后顺序抽取150,250,350,.11950.这样就得到容量为100的一个样本.第7页/共18页 由于每排的座位有40个,各排每个号码被抽取的概率都是,第1排被抽取前,其他各排中各号码被抽取哪率也是 ,也就是说被抽取的概率是 ,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听
7、众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样。2系统抽样第8页/共18页系统抽样的步骤为:(1)先将总体中的N个体编号.有时可直接利用个体自身所带的号码.(2)确定分段间隔k。对编号均衡地分段,是整数时,;不是整数时,从N中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l;lk;l2k;lnk 系统抽样时,将总体中的个体均分后的每
8、一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。第9页/共18页 系统抽样与简单随机抽样比较系统抽样与简单随机抽样比较,有何优、缺点?有何优、缺点?1、系统抽样比简单随机抽样更容易实施;2、系统抽样的效果会受个体编号的影 响,而简单随机抽样的效果不受个体编号的影响;3、系统抽样比简单随机抽样的应用范围广。第10页/共18页3分层抽样 当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情
9、况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。其中所分成的各部分叫做层。由于分层抽样的要求不同,各层的抽样的样本容量也不相同,所以,应当按照实际情况,合理地将样本容量分配到各个层,以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。第11页/共18页分层抽样的实施
10、步骤:(2)根据总体中的个体数N与样本容量n确定抽样比:k=(3)确定各层应该抽取的个体数。各层的抽取数之和应等于样本容量。对于不能取整的数,求其近似值。(4)按(3)中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本.(1)根据已有信息,将总体分成互不相交的层;第12页/共18页 (1)分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。而且更具代表性。(2)分层抽样的一个重要问题是总体如何分层,分多少层,这要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可
11、能地大,否则将失去分层的意义。注:第13页/共18页例2、一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;3549岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。解:抽取人数与职工总数的比是100:5001:5,则各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段
12、(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、3549岁、50岁以上的三个年龄段分别抽取25人、56人和19人。第14页/共18页分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。第15页/共18页4三种抽样方法的比较 第16页/共18页 一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下所示:很喜爱 喜爱 一般 不喜爱2400 4200 3800 1600打算从中抽取60人进行详细调查,如何抽取?5 5课堂练习 6、布置作业 教科书习题21第4、5、6题。第17页/共18页感谢您的观看!第18页/共18页