《211随机抽样.ppt》由会员分享,可在线阅读,更多相关《211随机抽样.ppt(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、12 本本 章章 引引 言言 数字化的时代数字化的时代产品的合格率产品的合格率农作物的产量农作物的产量3产品的销售量产品的销售量某地的气温某地的气温4自然资源自然资源就业状况就业状况5电视台的收视率电视台的收视率 我国是世界上的第我国是世界上的第13个贫水个贫水国国,人均淡水占量排世界第人均淡水占量排世界第109位位6我国土地沙漠化问题非常严重我国土地沙漠化问题非常严重, ,全国沙漠化土地面积已超全国沙漠化土地面积已超过过174000174000平方公里平方公里, ,并以每年并以每年34003400平方公里的速度扩张。平方公里的速度扩张。 你知道这些数据是怎么来的吗?你知道这些数据是怎么来的吗
2、?通过调查获得的。通过调查获得的。 怎么调查?怎么调查?是对考察对象进行全面调查还是抽样调查?是对考察对象进行全面调查还是抽样调查?7妈妈妈妈:“儿子,帮妈妈买盒火柴去。儿子,帮妈妈买盒火柴去。”妈妈妈妈:“这次注意点,上次你买的火柴好多划不着。这次注意点,上次你买的火柴好多划不着。” 儿子高兴地跑回来。儿子高兴地跑回来。孩子:孩子:“妈妈,这次的火柴全划得着,我妈妈,这次的火柴全划得着,我每根每根都试过了。都试过了。”笑过之后笑过之后,谈谈你的看法谈谈你的看法 这个调查具有破坏性,不可能这个调查具有破坏性,不可能每根每根试过试过,不能展开全面不能展开全面调查。调查。看一看看一看8 例如,为了
3、了解一批计算器的寿命,我们能将它们逐一测例如,为了了解一批计算器的寿命,我们能将它们逐一测试吗?很明显,这既不可能也没必要。实践中,由于所考察试吗?很明显,这既不可能也没必要。实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察此,我们通常只考察总体总体中的一个中的一个样本样本,通过样本来了解总,通过样本来了解总体的情况。体的情况。提出问题提出问题 进一步,从节约费用的角度考虑,在保证样本估计总体达进一步,从节约费用的角度考虑,在保证样本估计总体达到一定的精度的前提下,样本中包含的个体数越少越好。到一定的精
4、度的前提下,样本中包含的个体数越少越好。9 要了解要了解全国高中生的视力全国高中生的视力情况,在全国抽取了这情况,在全国抽取了这15所中学所中学的全部高中生的全部高中生15000人进行视力测试。人进行视力测试。考察对象是什么考察对象是什么?在统计中,我们把所要考察的对象的在统计中,我们把所要考察的对象的全体叫做总体全体叫做总体全国每位高中学生的全国每位高中学生的视力情况。视力情况。把组成总体的每一个考察的对象叫把组成总体的每一个考察的对象叫做个体做个体这这15000名学生的视力情名学生的视力情况又组成一个集体况又组成一个集体从总体中取出的一部分个体的集体从总体中取出的一部分个体的集体叫做这个总
5、体的一个样本。叫做这个总体的一个样本。15000样本中的个体的数目叫做样本样本中的个体的数目叫做样本的容量。的容量。10 那么,怎样从总体中抽取样本呢?如何表示样本数据?那么,怎样从总体中抽取样本呢?如何表示样本数据?如何从样本数据中提取基本信息(样本分布、样本数字特征如何从样本数据中提取基本信息(样本分布、样本数字特征等),来推断总体的情况呢?这些正是本章要解决的问题。等),来推断总体的情况呢?这些正是本章要解决的问题。 数理统计所要解决的问题是如何根据样本来推断总体。数理统计所要解决的问题是如何根据样本来推断总体。首先必须清楚地知道要收集的数据是什么;其次,我们检验首先必须清楚地知道要收集
6、的数据是什么;其次,我们检验样本的目的是为了了解总体的情况;再次,我们要知道如何样本的目的是为了了解总体的情况;再次,我们要知道如何才能收集到高质量的样本数据。才能收集到高质量的样本数据。在抽样调查中要注意什么问题?在抽样调查中要注意什么问题?11阅读阅读一个著名的案例一个著名的案例 在抽样调查中,样本的选择是至关重要的,样本能否代表总体,在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一调查,被称为抽样中的泰
7、坦尼克事件。它可以帮助我们理解为什么一个好的样本如此重要。个好的样本如此重要。在在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在年簿和车辆登记簿上的名单给一大批人发了调查表(注意在年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿电话和
8、汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:下:候选人候选人预测结果预测结果选举结果选举结果罗斯福罗斯福兰顿兰顿12思考思考你认为预期结果出错的原因是什么?你认为预期结果出错的原因是什么?原因是:用于统计推断的样本来自少数富人,只能代原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表富人的观点,不能代表全体选民的观点(样本不具有代表性)
9、。表性)。像本例中这样容易得到的样本称为方便样本。如果使像本例中这样容易得到的样本称为方便样本。如果使用用“方便样本方便样本”,那么得出与事实不符的结论的可能性就,那么得出与事实不符的结论的可能性就会大大增加。会大大增加。结论:在抽样时不能只图方便。如果只从一些容易得结论:在抽样时不能只图方便。如果只从一些容易得到的个体中抽取样本,那么所得到的样本只是一个到的个体中抽取样本,那么所得到的样本只是一个“方便方便样本样本”,“方便样本方便样本”的代表性差,基本这种方便样本得的代表性差,基本这种方便样本得出的结论就会与事实相左。出的结论就会与事实相左。13 品尝一勺汤品尝一勺汤,就可以知道一锅汤的味
10、道就可以知道一锅汤的味道,你知道其中蕴你知道其中蕴涵的道理吗涵的道理吗?生活中的生活中的“数学数学” 高质量的样本数据来自高质量的样本数据来自“搅拌均匀搅拌均匀”的总体。如果我们的总体。如果我们能够设法将总体能够设法将总体“搅拌均匀搅拌均匀”,那么从中任意抽取一部分,那么从中任意抽取一部分个体的样本,它们含有与总体基本相同的信息。个体的样本,它们含有与总体基本相同的信息。1415注意以下点:注意以下点: (1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;)它是一种不放回抽样;
11、(4)它是一种等概率抽样。)它是一种等概率抽样。 简单随机抽样是在特定总体中抽取样本,总体中每一个体简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为会是独立的。如果用从个体数为N的总体中抽取一个容量为的总体中抽取一个容量为n的样本,那么每个个体被抽取的概卒等于的样本,那么每个个体被抽取的概卒等于 . Nn 一般地,设一个总体的个体数为一般地,设一个总体的个体数为N,如果通过逐个,如果通过逐个不放不放回回地抽取的方法从中抽取一个样本,且每次抽取时各个个体地抽取
12、的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率被抽到的概率相等相等,就称这样的抽样为,就称这样的抽样为简单随机抽样简单随机抽样。简单随机抽样简单随机抽样161 1、抽签法、抽签法( (抓阄法抓阄法) ) 先将总体中的所有个体(共先将总体中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),并把号码写在形状、大小相同的号签上(),并把号码写在形状、大小相同的号签上( 号签可号签可以用小球、卡片、纸条等制作),然后将这些号签放在同以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1
13、 个个号签,连续抽取号签,连续抽取n次,就得到一个容量为次,就得到一个容量为n的样本。对个体的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位编号时,也可以利用已有的编号。例如学生的学号,座位号等。号等。17抽签法的步骤抽签法的步骤:1、把总体中的、把总体中的N个个体编号;个个体编号;2、 把号码写在号签上,将号签放在一个容器中把号码写在号签上,将号签放在一个容器中搅拌均匀;搅拌均匀;3、每次从中抽取一个号签,连续抽取、每次从中抽取一个号签,连续抽取n次,就得到次,就得到一个容量为一个容量为n的样本。的样本。18总结抽签法的优点和缺点:总结抽签法的优点和缺点: 缺点:当总体个数较
14、多时不方便,而且缺点:当总体个数较多时不方便,而且产生的样本代表性差的可能性很大产生的样本代表性差的可能性很大. . 优点:简单易行,个体有均等的机会被优点:简单易行,个体有均等的机会被抽中,从而能保证样本的代表性抽中,从而能保证样本的代表性. .192 2、用随机数表法进行抽取、用随机数表法进行抽取(1)随机数表是统计工作者用计算机生成的随机数,并保)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。证表中的每个位置上的数字是等可能出现的。(3)用随机数表抽取样本,可以任选一个数作为开始,读)用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,
15、也可以向右、向上、向下等等。因此并数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的不是唯一的.(2)用随机数表进行抽样的步骤:将总体中个体编号;选)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。本保证了被抽取个体的概率是相等的。2016 22 7 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17
16、 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 2821例题:例题:1. 下
17、列抽取样本的方式是属于简单随机抽样的是(下列抽取样本的方式是属于简单随机抽样的是( )从无限多个个体中抽取从无限多个个体中抽取100个个体作样本;个个体作样本;盒子里有盒子里有80个零件,从中选出个零件,从中选出5个零件进行质量检验,在抽样操个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;子里;从从8台电脑中不放回的随机抽取台电脑中不放回的随机抽取2台进行质量检验(假设台进行质量检验(假设8台电脑台电脑已编好号,对编号随机抽取)已编好号,对编号随机抽取) A. B. C. D.以上都不对以上都不对 四
18、个特点:四个特点:总体个数有限;总体个数有限;逐个抽取;逐个抽取;不放回;不放回;每个个体机会均等,与先后每个个体机会均等,与先后无关。无关。22例题例题2.在简单随机抽样中,某一个个体被抽中的可能性是(在简单随机抽样中,某一个个体被抽中的可能性是( )A.与第与第n次抽样无关,第一次抽中的可能性大一些;次抽样无关,第一次抽中的可能性大一些;B.与第与第n次抽样无关,每次抽中的可能性都相等;次抽样无关,每次抽中的可能性都相等;C.与第与第n次抽样无关,最后一次抽中的可能性大一些;次抽样无关,最后一次抽中的可能性大一些;D.与第与第n次抽样无关,每次都是等可能抽样,但每次抽中的可次抽样无关,每次
19、都是等可能抽样,但每次抽中的可能性不一样;能性不一样;答:答:B23练习 :1. 某种福利彩票有某种福利彩票有1000个人有机会中奖的号码(设个人有机会中奖的号码(设号码号码 为为000999),有关机构按随机抽取的方式),有关机构按随机抽取的方式确定最后确定最后 两位数为两位数为36的号码为中奖号码,试分别写的号码为中奖号码,试分别写出出10个中奖号个中奖号 码。码。2. 要从编号为要从编号为1到到100的的100道选择题中随机抽取道选择题中随机抽取20道组成一份试卷,请你用抽签法完成这一工作。道组成一份试卷,请你用抽签法完成这一工作。24抽签法抽签法 2.简单随机抽样的方法:简单随机抽样的
20、方法:随机数表法随机数表法注:随机抽样并不是随意或随便抽取,因为随意或随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素随便抽取都会带有主观或客观的影响因素.小结小结 一般地,设一个总体的个体数为一般地,设一个总体的个体数为N,如果通过逐个,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。被抽到的概率相等,就称这样的抽样为简单随机抽样。1.简单随机抽样的概念简单随机抽样的概念25系统抽样系统抽样2.1.226复习复习 1 1、简单随机抽样有哪些常用方法?、简单随
21、机抽样有哪些常用方法?2 2、它们的操作步骤分别如何?、它们的操作步骤分别如何?抽签法,随机数法抽签法,随机数法27 第二步,将号签放在一个容器中,并搅拌均匀第二步,将号签放在一个容器中,并搅拌均匀. .抽签法:抽签法: 第一步,将总体中的所有个体编号,并把号第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上码写在形状、大小相同的号签上. . 第三步,每次从中抽取一个号签,连续抽取第三步,每次从中抽取一个号签,连续抽取n n次,就得到一个容量为次,就得到一个容量为n n的样本的样本. .28 第一步,将总体中的所有个体编号第一步,将总体中的所有个体编号. . 第三步,从选定的数
22、开始依次向右(向左、向上、第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满去掉,直到取满n n个号码为止,就得到一个容量为个号码为止,就得到一个容量为n n的的样本样本. . 第二步,在随机数表中任选一个数作为起始数第二步,在随机数表中任选一个数作为起始数. .随机数表法:随机数表法:29 探究:某中学为了了解高一年级学生对教师教学探究:某中学为了了解高一年级学生对教师教学的意见,教务处打算从高一年级的意见,教务处打算从高一年级500500名学生中抽取名学生中抽取5050名进行问卷调查,请你设
23、计抽取样本的方法,具体如名进行问卷调查,请你设计抽取样本的方法,具体如何操作?何操作? 你还能设计其它的抽样方法吗?具体如何操作?你还能设计其它的抽样方法吗?具体如何操作? 30 第二步,将总体平均分成第二步,将总体平均分成5050部分,每一部分含部分,每一部分含1010个个体个个体. . 第四步,从该号码起,每隔第四步,从该号码起,每隔1010个号码取一个号个号码取一个号码,就得到一个容量为码,就得到一个容量为5050的样本的样本. .(如(如8 8,1818,2828,498498) 第三步,在第第三步,在第1 1部分中用简单随机抽样抽取一个号码部分中用简单随机抽样抽取一个号码(如(如8
24、8号)号). . 第一步,将这第一步,将这500500名学生编号为名学生编号为1 1,2 2,3 3,500.500.31 上述抽样方法称为上述抽样方法称为系统抽样系统抽样. . 将总体分成均衡的将总体分成均衡的n n个部分,再按照预先定出的个部分,再按照预先定出的规则,从每一部分中抽取规则,从每一部分中抽取1 1个个体,即得到容量为个个体,即得到容量为n n的样本的样本. . 怎样理解系统抽样的含义?怎样理解系统抽样的含义? 32 用系统抽样从含有用系统抽样从含有N N个个体的总体中抽取一个容个个体的总体中抽取一个容量为量为n n的样本的操作步骤:的样本的操作步骤: 第四步,按照一定的规则抽
25、取样本第四步,按照一定的规则抽取样本. . 第一步,将总体的第一步,将总体的N N个个体编号个个体编号. .有时可以直有时可以直接利用个体自身所带的号码,如学号等接利用个体自身所带的号码,如学号等. . 第三步,在第第三步,在第1 1段用简单随机抽样确定起始个体编段用简单随机抽样确定起始个体编号号l l. . 第二步,确定分段间隔第二步,确定分段间隔k k,对编号进行分段,对编号进行分段. .当当N/nN/n是整数时,取是整数时,取k=N/n.k=N/n.33 探究:如果用系统抽样从探究:如果用系统抽样从605605件产品中抽取件产品中抽取6060件件进行质量检查,由于进行质量检查,由于605
26、605件产品不能均衡分成件产品不能均衡分成6060部分,部分,对此应如何处理?对此应如何处理? 先从总体中随机剔除先从总体中随机剔除5 5个个体,再均衡分成个个体,再均衡分成6060部分部分. . 推广:如果推广:如果N N不能被不能被n n整除怎么办?整除怎么办? 从总体中随机剔除从总体中随机剔除N N除以除以n n的余数个个体后再分段的余数个个体后再分段. .34 探究:用系统抽样从含有探究:用系统抽样从含有N N个个体的总体中抽个个体的总体中抽取一个容量为取一个容量为n n的样本,要平均分成多少段,每段的样本,要平均分成多少段,每段各有多少个号码?各有多少个号码? 将含有将含有N N个个
27、体的总体平均分成个个体的总体平均分成n n段,每段的号段,每段的号码个数称为分段间隔码个数称为分段间隔. .35 用简单随机抽样抽取第用简单随机抽样抽取第1 1段的个体编号段的个体编号. .以后各以后各段的个体编号,通常是将第段的个体编号,通常是将第1 1段抽取的号码依次累加段抽取的号码依次累加间隔间隔k.k. 探究:用系统抽样抽取样本时,每段各取一个探究:用系统抽样抽取样本时,每段各取一个号码,其中第号码,其中第1 1段的个体编号怎样抽取?以后各段的段的个体编号怎样抽取?以后各段的个体编号怎样抽取?个体编号怎样抽取?36 讨论:系统抽样适合在哪种情况下使用?与简单讨论:系统抽样适合在哪种情况
28、下使用?与简单随机抽样比较,哪种抽样方法使样本更具有代表性?随机抽样比较,哪种抽样方法使样本更具有代表性? 总体中个体数比较多;系统抽样更使样本具有代总体中个体数比较多;系统抽样更使样本具有代表性表性. . 37 练习练习1 1:某校共有:某校共有118118名老师,为了支持西部的教名老师,为了支持西部的教育事业,现要从中随机抽取育事业,现要从中随机抽取1616名老师到西部任教,用名老师到西部任教,用系统抽样选取支援西部的教师团合适吗?应该怎样抽系统抽样选取支援西部的教师团合适吗?应该怎样抽样?样?38 “现代研究证明,现代研究证明,99%99%以上的人皮肤感染有螨虫以上的人皮肤感染有螨虫.
29、.” “某化妆品,可以彻底清除脸部皱纹,只需某化妆品,可以彻底清除脸部皱纹,只需1010天,就能让你的肌肤得到改善天,就能让你的肌肤得到改善. .” “某减肥药真的灵,其减肥的有效率为某减肥药真的灵,其减肥的有效率为75%.75%.” 练习练习2 2:在数字化时代,各种各样的统计数字和:在数字化时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观、具体,图表充斥着媒体,由于数字给人的印象直观、具体,所以让数据说话是许多广告的常用手法所以让数据说话是许多广告的常用手法. .下列广告中下列广告中的数据可靠吗?的数据可靠吗?39 练习练习3 3: 某中学有高一学生某中学有高一学生3233
30、23名,为了了解名,为了了解学生的身体状况,要抽取一个容量为学生的身体状况,要抽取一个容量为4040的样本,用的样本,用系统抽样法如何抽样?系统抽样法如何抽样? 第一步,随机剔除第一步,随机剔除3 3名学生,把余下的名学生,把余下的320320名学名学生编号为生编号为1 1,2 2,3 3,320.320. 第四步,从该号码起,每间隔第四步,从该号码起,每间隔8 8个号码抽取个号码抽取1 1个号个号码,就可得到一个容量为码,就可得到一个容量为4040的样本的样本. . 第三步,在第第三步,在第1 1部分用抽签法确定起始编号部分用抽签法确定起始编号. . 第二步,把总体分成第二步,把总体分成40
31、40个部分,每个部分有个部分,每个部分有8 8个个个体个体. . 40 练习练习4 4:一个总体中有:一个总体中有100100个个体,随机编号为个个体,随机编号为0 0,1 1,2 2,9999,依编号顺序平均分成,依编号顺序平均分成1010组,组号依组,组号依次为次为1 1,2 2,3 3,1010,现用系统抽样抽取一个容量,现用系统抽样抽取一个容量为为1010的样本,并规定:如果在第一组随机抽取的号的样本,并规定:如果在第一组随机抽取的号码为码为m m,那么在第,那么在第k k(k=2k=2,3 3,1010)组中抽取的)组中抽取的号码的个位数字与号码的个位数字与m+km+k的个位数字相同
32、的个位数字相同. .若若m=6m=6,求该,求该样本的全部号码样本的全部号码. . 6 6,1818,2929,3030,4141,5252,6363,7474,8585,96.96.41 2 2、系统抽样适合于总体的个体数较多的情形、系统抽样适合于总体的个体数较多的情形. .小结小结 1 1、系统抽样也是等概率抽样,即每个个体被、系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性抽到的概率是相等的,从而保证了抽样的公平性. .423 3、系统抽样的步骤为:、系统抽样的步骤为:(1 1)采用随机的方法将总体中个体编号;)采用随机的方法将总体中个体编号;(2 2)将整
33、体编号进行分段,确定分段间隔)将整体编号进行分段,确定分段间隔k(kNk(kN) ); (3 3)在第一段内采用简单随机抽样的方法确)在第一段内采用简单随机抽样的方法确定起始个体编号定起始个体编号L L;(4 4)按照事先预定的规则抽取样本)按照事先预定的规则抽取样本. .43 4 4、在确定分段间隔、在确定分段间隔k k时应注意:分段间隔时应注意:分段间隔k k为为整数,当整数,当 不是整数时,应采用等可能剔除的不是整数时,应采用等可能剔除的方法剔除部分个体,以获得整数间隔方法剔除部分个体,以获得整数间隔k.k.nN44分层抽样分层抽样2.1.345复习复习 1 1、我们学了哪些常用的收集相
34、关数据的方法?、我们学了哪些常用的收集相关数据的方法?抽签法,随机数法抽签法,随机数法 2 2、简单随机抽样有哪些常用方法?、简单随机抽样有哪些常用方法?简单随机抽样,系统抽样简单随机抽样,系统抽样3 3、系统抽样的基本含义如何?、系统抽样的基本含义如何? 将总体分成均衡的将总体分成均衡的n n个部分,再按照预先定出的个部分,再按照预先定出的规则,从每一部分中抽取规则,从每一部分中抽取1 1个个体,即得到容量为个个体,即得到容量为n n的样本的样本. .46 第二步,确定分段间隔第二步,确定分段间隔k k,对编号进行分段,对编号进行分段. . 第四步,按照一定的规则抽取样本第四步,按照一定的规
35、则抽取样本. . 第三步,在第第三步,在第1 1段用简单随机抽样确定起始个体编段用简单随机抽样确定起始个体编号号l l. . 第一步,将总体的所有个体编号第一步,将总体的所有个体编号. .4 4、系统抽样的操作步骤是什么?、系统抽样的操作步骤是什么? 47 探究:某地区有高中生探究:某地区有高中生24002400人,初中生人,初中生1090010900人,人,小学生小学生1100011000人人. .当地教育部门为了了解本地区中小学当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生生的近视情况及其形成原因,要从本地区的中小学生中抽取中抽取1%1%的学生进行调查,你认
36、为应当怎样抽取样本?的学生进行调查,你认为应当怎样抽取样本? 设计科学、合理的抽样方法,其核心问题是设计科学、合理的抽样方法,其核心问题是保证保证抽样公平,并且样本具有好的代表性抽样公平,并且样本具有好的代表性. .影响学生视力影响学生视力的因素是很复杂的,例如,不同年龄段的学生的近视的因素是很复杂的,例如,不同年龄段的学生的近视情况可能存在明显差异情况可能存在明显差异. .故用简单随机抽样或系统抽故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性样,都可能使样本不具有好的代表性. .对于此类抽样对于此类抽样问题,我们需要一个更好的抽样方法来解决问题,我们需要一个更好的抽样方法来解决.
37、.48 探究:某地区有高中生探究:某地区有高中生24002400人,初中生人,初中生1090010900人,人,小学生小学生1100011000人人. .当地教育部门为了了解本地区中小学当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生生的近视情况及其形成原因,要从本地区的中小学生中抽取中抽取1%1%的学生进行调查,你认为应当怎样抽取样本?的学生进行调查,你认为应当怎样抽取样本?样本容量与总体个数的比例为样本容量与总体个数的比例为1:1001:100,则,则高中应抽取人数为高中应抽取人数为24002400* *1/100=241/100=24人人, ,初中应抽取人数
38、为初中应抽取人数为1090010900* *1/100=1091/100=109人,人,小学应抽取人数为小学应抽取人数为1100011000* *1/100=1101/100=110人人. .49 问题问题2 2:具体在三类学生中抽取样本时(如在:具体在三类学生中抽取样本时(如在1080010800名初中生中抽取名初中生中抽取108108人),可以用哪种抽样方法人),可以用哪种抽样方法进行抽样?进行抽样? 问题问题3 3:在上述抽样过程中,每个学生被抽到的:在上述抽样过程中,每个学生被抽到的概率相等吗?概率相等吗? 问题问题1 1:在此,总体的个体数为:在此,总体的个体数为2430024300
39、,抽取,抽取1%1%的学生,样本容量为的学生,样本容量为243243,具体每个层次抽取的个体,具体每个层次抽取的个体数是如何计算的?数是如何计算的?50 上述抽样方法从学生人数这个角度来看,获得上述抽样方法从学生人数这个角度来看,获得的样本结构与这一地区全体中小学生的结构是基本的样本结构与这一地区全体中小学生的结构是基本相同的相同的. .不仅保证了抽样的公平性,而且抽取的样不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为样方法,这种抽样方法称为分层抽样分层抽样. . 一般地,若总体由差异明显的几
40、部分组成,抽一般地,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这种抽样的方各层取出的个体合在一起作为样本,这种抽样的方法是一种法是一种分层抽样分层抽样. .51高中生高中生8 8人,初中生人,初中生3636人,小学生人,小学生3737人人. . 练习:某地区有高中生练习:某地区有高中生24002400人,初中生人,初中生1090010900人,人,小学生小学生1100011000人人. .若用分层抽
41、样从该地区抽取若用分层抽样从该地区抽取8181名学生名学生调查身体发育状况,那么高中生、初中生和小学生应调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?分别抽取多少人?52 练习:某校有练习:某校有500500名学生,其中名学生,其中O O型血的有型血的有200200人,人,A A型血的人有型血的人有125125人,人,B B型血的有型血的有125125人,人,ABAB型血的有型血的有5050人,为了研究血型与色弱的关系,要从中抽取一人,为了研究血型与色弱的关系,要从中抽取一个个2020人的样本人的样本. . 思考思考1 1:该项调查应采用哪种抽样方法进行?:该项调查应采用哪种抽
42、样方法进行? 思考思考3 3:在各血型具体如何抽样?:在各血型具体如何抽样? 思考思考2 2:按比例,各血型分别抽取多少人?:按比例,各血型分别抽取多少人?53 讨论:一般地,分层抽样的操作步骤如何?讨论:一般地,分层抽样的操作步骤如何? 第一步,计算样本容量与总体的个体数之比第一步,计算样本容量与总体的个体数之比. . 第四步,将各层抽取的个体合在一起,就得第四步,将各层抽取的个体合在一起,就得到所取样本到所取样本. . 第三步,用简单随机抽样或系统抽样在各层中第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体抽取相应数量的个体. . 第二步,将总体分成互不交叉的层,按比例确第二步,
43、将总体分成互不交叉的层,按比例确定各层要抽取的个体数定各层要抽取的个体数. .54 调节样本容量,剔除个体调节样本容量,剔除个体. . 讨论:样本容量与总体的个体数之比是分层抽讨论:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如个体数,如果各层应抽取的个体数不都是整数该如何处理?何处理?55 讨论:简单随机抽样、系统抽样和分层抽样既讨论:简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,请你对三种抽样方法作一有其共性,又有其个性,请你对三种抽样方法作一个比较个比较. .
44、 共同特点:抽样过程中每个个体被抽取的概率共同特点:抽样过程中每个个体被抽取的概率相等相等.56将总体分成均衡几部分,按规则关联抽取将总体分成均衡几部分,按规则关联抽取将总体分成几层,按比例分层抽取将总体分成几层,按比例分层抽取. .用简单随机抽样抽取起始号码用简单随机抽样抽取起始号码总体中的个体数较少总体中的个体数较少总体中的个体数较多总体中的个体数较多总体由差异明显的几部分组成总体由差异明显的几部分组成. .从总体中逐个不放回抽取从总体中逐个不放回抽取用简单随机抽样或系统抽样对各层抽样用简单随机抽样或系统抽样对各层抽样. .简单随机抽样简单随机抽样: :系统抽样系统抽样: :分层抽样分层抽
45、样: :57 请根据上述基本数据,设计一个样本容量为总体请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案中个体数量的千分之一的抽样方案. . 探究探究: :某地区中小学生人数的分布情况如下表所某地区中小学生人数的分布情况如下表所示(单位:人):示(单位:人):学段学段城市城市县镇县镇农村农村小学小学357 000357 000221 600221 600258 100258 100初中初中226 200226 200134 200134 200 11 290 11 290高中高中112 000112 000 43 300 43 300 6 300 6 30058 探究探
46、究: :某地区中小学生人数的分布情况如下表所某地区中小学生人数的分布情况如下表所示(单位:人):示(单位:人):学段学段城市城市县镇县镇农村农村小学小学357 000357 000221 600221 600258 100258 100初中初中226 200226 200134 200134 200 11 290 11 290高中高中112 000112 000 43 300 43 300 6 300 6 300 提醒:由于总体的复杂性,在实际抽样中,为了提醒:由于总体的复杂性,在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法使样本具有代表性,通常要同时使用几种抽样方法. .59
47、 1 1、可以先用分层抽样法确定此地区城市、县、可以先用分层抽样法确定此地区城市、县镇、农村的被抽个体数镇、农村的被抽个体数. . 2 2、再用分层抽样法将城市的被抽个体数分配、再用分层抽样法将城市的被抽个体数分配到小学、初中、高中等不同阶层中去,县镇、农村到小学、初中、高中等不同阶层中去,县镇、农村的被抽个体数的分配法也一样的被抽个体数的分配法也一样. . 3 3、接着将城市划分为学生数大致相当的小区,、接着将城市划分为学生数大致相当的小区,用简单随机抽样法选取一些小区,再用简单随机抽用简单随机抽样法选取一些小区,再用简单随机抽样法确定每一小区中的各类学校样法确定每一小区中的各类学校. .
48、4 4、在选中的学校中用系统抽样法或简单随机、在选中的学校中用系统抽样法或简单随机抽样选取学生进行调查抽样选取学生进行调查. .60 练习:分小组设计一个你想了解的问题,交换练习:分小组设计一个你想了解的问题,交换讨论收集数据的方案讨论收集数据的方案. .61小结小结 2 2、分层抽样是按比例分别对各层进行抽样,再、分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本将各个子样本合并在一起构成所需样本. . 1 1、分层抽样利用了调查者对调查对象(总体)、分层抽样利用了调查者对调查对象(总体)事先掌握的各种信息,考虑了保持样本结构与总体结事先掌握的各种信息,考虑了保持样本结
49、构与总体结构的一致性,提高样本的代表性,在实际中广泛应用构的一致性,提高样本的代表性,在实际中广泛应用. . 3 3、简单随机抽样是基础,系统抽样与分层抽样、简单随机抽样是基础,系统抽样与分层抽样是补充和发展,很多时候要同时采用这几种抽样方法是补充和发展,很多时候要同时采用这几种抽样方法. .62 2.1 2.1 随机抽样随机抽样 2.1.3 2.1.3 分层抽样分层抽样63复习回顾复习回顾 已经学过的两种抽样方法?已经学过的两种抽样方法?简单随机抽样简单随机抽样:抽签法;抽签法; 随机数表法;随机数表法;适用范围:总体中个体较少。适用范围:总体中个体较少。系统抽样系统抽样:适用范围:总体中个
50、体较多。适用范围:总体中个体较多。 步骤:步骤: 编号编号 分段分段 抽取抽取 64问题情景问题情景:思考:思考:(2)如果在)如果在2500名学生中随机抽取名学生中随机抽取100名学名学生,有无不足之处?生,有无不足之处?(1 1)总体、个体、样本、样本容量分别是)总体、个体、样本、样本容量分别是什么?什么? 某校小学六年级、初中三年级和高中三年级分别某校小学六年级、初中三年级和高中三年级分别有有10001000,800800和和700700名同学,为了了解全校毕业班学生的名同学,为了了解全校毕业班学生的视力情况,从以上三个年级中视力情况,从以上三个年级中抽取容量为抽取容量为100100的样