《211简单的随机抽样.pptx》由会员分享,可在线阅读,更多相关《211简单的随机抽样.pptx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中国人民大学附属中学中国人民大学附属中学2.1.1简单的随机抽样简单的随机抽样 我们知道,工厂生产的产品必须经过我们知道,工厂生产的产品必须经过检验,只有合格产品才能进入市场流通。检验,只有合格产品才能进入市场流通。而有些检验带有极大的破坏性,那么我而有些检验带有极大的破坏性,那么我们应该如何解决既要确保出厂的产品必们应该如何解决既要确保出厂的产品必须合格,又不能对其造成大面积破坏的须合格,又不能对其造成大面积破坏的矛盾呢?矛盾呢? 某校有高中学生某校有高中学生900人,校医务室想对人,校医务室想对全校高中学生的身高作一次调查,为不全校高中学生的身高作一次调查,为不影响正常的教学准备抽取影响正
2、常的教学准备抽取50名学生作为名学生作为调查对象,应该怎样设计方案?调查对象,应该怎样设计方案? 每年高考过后,考试中心的工作人员每年高考过后,考试中心的工作人员需要对考生的答卷进行分析,总结经验,需要对考生的答卷进行分析,总结经验,找出问题,以利于下一年度的高考命题,找出问题,以利于下一年度的高考命题,指导下一届考生备考。而调研每位考生指导下一届考生备考。而调研每位考生答卷的工作量太大,那么应如何科学地答卷的工作量太大,那么应如何科学地进行调研呢?进行调研呢? . 总之,无论是生活、工作、学习,我总之,无论是生活、工作、学习,我们每时每刻都要同数据打交道,那么如何们每时每刻都要同数据打交道,
3、那么如何从众多的数据中科学地从众多的数据中科学地提取有效数据提取有效数据,又,又如何如何科学地对数据进行分析科学地对数据进行分析,从而使我们,从而使我们能够能够作出科学的决策作出科学的决策,这正是,这正是统计的内涵统计的内涵. 本章先介绍了本章先介绍了简单随机抽样、系统抽样、简单随机抽样、系统抽样、分层抽样分层抽样这三种常用的抽样方法。这三种常用的抽样方法。 接着介绍如何接着介绍如何用样本估计总体用样本估计总体,一是如,一是如何用样本的频率分布估计何用样本的频率分布估计总体分布总体分布;二是;二是如何用样本的某种特征数去估计总体的相如何用样本的某种特征数去估计总体的相应的应的特征数特征数。 最
4、后介绍了两个变量之间的关系,除了最后介绍了两个变量之间的关系,除了函数关系这种确定性的关系以外,还存在函数关系这种确定性的关系以外,还存在因变量的取值带有一定随机性的两个变量因变量的取值带有一定随机性的两个变量之间的关系之间的关系相关性相关性。 统计是研究如何统计是研究如何合理地收集、整理、合理地收集、整理、分析数据分析数据的学科,它可以为人们制定决的学科,它可以为人们制定决策提供依据。在日常生活中,人们常常策提供依据。在日常生活中,人们常常需要收集数据,根据所获得的数据提取需要收集数据,根据所获得的数据提取有价值的信息,作出合理的决策。有价值的信息,作出合理的决策。 在本章中通过对在本章中通
5、过对数据的收集数据的收集、整理和整理和分析分析,可以增强我们的社会实践能力,可以增强我们的社会实践能力,培养我们解决问题的能力,增强我们学培养我们解决问题的能力,增强我们学习数学的兴趣。习数学的兴趣。2.1.1简单随机抽样简单随机抽样 在一次考试中,考生有在一次考试中,考生有2万名,如果为万名,如果为了了解这些考生的数学主观题的得分情了了解这些考生的数学主观题的得分情况,而将他们所有的考卷加以统计,那况,而将他们所有的考卷加以统计,那将是十分麻烦的,怎么才能了解这些学将是十分麻烦的,怎么才能了解这些学生的主观题的得分情况呢?生的主观题的得分情况呢? 今有某灯泡厂生产的灯泡今有某灯泡厂生产的灯泡
6、10000只,只,怎样才能了解这批灯泡的使用寿命呢?怎样才能了解这批灯泡的使用寿命呢? 一一. 统计的有关概念及统计的基本思想统计的有关概念及统计的基本思想 1总体、个体、样本总体、个体、样本(1)总体:一般把所考察对象的某一数)总体:一般把所考察对象的某一数值指标的全体构成的集合看作是总体;值指标的全体构成的集合看作是总体;(2)个体:构成总体的每一个元素叫做)个体:构成总体的每一个元素叫做个体;个体;(3)样本:从总体中抽出的若干个个体)样本:从总体中抽出的若干个个体所组成的集合叫做样本;所组成的集合叫做样本;(4)样本容量:样本中个体的个数叫做)样本容量:样本中个体的个数叫做样本容量。样
7、本容量。2随机抽样随机抽样 抽样时保证每一个个体都可能被抽到,抽样时保证每一个个体都可能被抽到,并且每一个个体被抽到的机会是均等的,并且每一个个体被抽到的机会是均等的,满足这样的条件的抽样就是随机抽样。满足这样的条件的抽样就是随机抽样。3统计的基本思想方法统计的基本思想方法 统计的基本思想方法就是统计的基本思想方法就是用样本估计用样本估计总体总体,即通常不直接去研究总体,而是通,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。况去估计总体的相应情况。 在在1936年的美国总统选举前,一份颇有年的美国总统选举前,一份颇
8、有名气的杂志的工作人员做了一次名气的杂志的工作人员做了一次民意测验民意测验,调查兰顿(当时任堪萨斯州州长)和罗斯调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)谁将当选下一届总统。福(当时的总统)谁将当选下一届总统。为了了解公众意向,调查者根据为了了解公众意向,调查者根据电话簿和电话簿和俱乐部的车辆登记簿俱乐部的车辆登记簿上的名单,统一给大上的名单,统一给大批人发了调查表。批人发了调查表。 通过分析收回的调查表,通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜。实际选举结果正好相顿将在选举中获胜。实际选举结果正好相反,最后罗斯福
9、在选举中获胜,其数据如反,最后罗斯福在选举中获胜,其数据如下:下: 你认为预测结果出错的原因是什么?你认为预测结果出错的原因是什么? 分析:当时的访问对象是从分析:当时的访问对象是从电话号码簿电话号码簿和和俱乐部会员名册俱乐部会员名册上选取的,但在上选取的,但在1936年,年,美国家庭电话尚未普及,只有美国家庭电话尚未普及,只有100万部左右,万部左右,尤其是有条件参加俱乐部的人,大多数是尤其是有条件参加俱乐部的人,大多数是经济上富有,政治上保守,倾向于共和党经济上富有,政治上保守,倾向于共和党的选民,这就造成了显著的系统误差的选民,这就造成了显著的系统误差. 本例说明了抽样方法的重要性,只有
10、本例说明了抽样方法的重要性,只有正确的抽样方法才能正确的抽样方法才能使其样本代表总体使其样本代表总体。 也就是也就是“一个好的抽样调查胜过一次蹩一个好的抽样调查胜过一次蹩脚的普查脚的普查”(尽管普查耗费了大量的人(尽管普查耗费了大量的人力、物力、财力),因此,我们必须掌力、物力、财力),因此,我们必须掌握科学的抽样方法,首先在抽样时,必握科学的抽样方法,首先在抽样时,必须将总体须将总体“ 搅拌均匀搅拌均匀”;其次还要掌握;其次还要掌握几个常用的抽样方法,如本章所学习的几个常用的抽样方法,如本章所学习的简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样。 二、简单随机抽样二、简单随
11、机抽样 一般地,从元素个数为一般地,从元素个数为N的总体中不放的总体中不放回地抽取容量为回地抽取容量为n的样本,如果每一次抽的样本,如果每一次抽取时总体中的取时总体中的各个个体有相同的可能性各个个体有相同的可能性被被抽到,这种抽样方法叫做抽到,这种抽样方法叫做简单随机抽样简单随机抽样,这样抽取的样本,叫做简单随机样本。这样抽取的样本,叫做简单随机样本。简单随机抽样的特点简单随机抽样的特点 :(1)它要求被抽取的)它要求被抽取的样本的个数有限样本的个数有限,这样,便于通过随机抽取的样本对总体这样,便于通过随机抽取的样本对总体进行分析;进行分析;(2)它是)它是从总体中逐个地进行抽取从总体中逐个地
12、进行抽取。 这这样,便于在抽样实践中进行操作;样,便于在抽样实践中进行操作;(3)它是一种)它是一种不放回抽样不放回抽样。 由于抽样实由于抽样实践中多采用不放回抽样,使其具有较广践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,没有被重复抽取的个体,便于进行有关便于进行有关的分析和计算的分析和计算。(4)它每一次抽取时总体中的)它每一次抽取时总体中的各个个体各个个体有相同的可能性被抽到有相同的可能性被抽到,从而保证了这,从而保证了这种抽样方法的公平性。种抽样方法的公平性。问题:下面的抽样方法是简单随机抽样问题:下面的抽样
13、方法是简单随机抽样吗,为什么?吗,为什么?(1)某班)某班45名同学,指定个子最高的名同学,指定个子最高的5名同学参加学校组织的某项活动。名同学参加学校组织的某项活动。(2)从)从20个零件中一次性抽出个零件中一次性抽出3个进行个进行质量检验。质量检验。(3)一儿童从玩具箱中的)一儿童从玩具箱中的20件玩具中件玩具中随意拿出一件来玩,玩后放回再拿下一随意拿出一件来玩,玩后放回再拿下一件,连续玩了件,连续玩了5件。件。三、抽签法三、抽签法 抽签法就是把总体中的抽签法就是把总体中的N个个体编号,个个体编号,把号码写在号签上,将号签放在一个容器把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次
14、从中抽取一个号签,中,搅拌均匀后,每次从中抽取一个号签,连续抽取连续抽取n次,记下号签上的号码,就得次,记下号签上的号码,就得到一个容量为到一个容量为n的样本的样本 抽签法的优点和缺点抽签法的优点和缺点 :优点优点:抽签法能够保证每个个体入选样本的:抽签法能够保证每个个体入选样本的机会都相等机会都相等(得到的样本是简单随机样本得到的样本是简单随机样本); 缺点缺点:(1)当总体中的个体数较多时,制作当总体中的个体数较多时,制作号签的成本将会增加,使得抽签法成本高号签的成本将会增加,使得抽签法成本高(费时、费力费时、费力);(2)号签很多时,把它们号签很多时,把它们“搅拌均匀搅拌均匀”就比就比较
15、困难,结果很难保证每个个体入选样本较困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本的可能性相等,从而使产生坏样本(即代表即代表性差的样本性差的样本)的可能性增加。的可能性增加。 某班有学生某班有学生40人,为了了解学生各方人,为了了解学生各方面的情况,需要从中抽取一个容量为面的情况,需要从中抽取一个容量为10的样本,用抽签法确定要抽取的学生的样本,用抽签法确定要抽取的学生解:注意抽签法的要求:解:注意抽签法的要求:S1 将这将这40名学生按学号编号,分别为名学生按学号编号,分别为1, 2,40;S2 将这将这40个号码分别写在相同的个号码分别写在相同的40张纸张纸片上;片上;
16、S3 将这将这40张纸片放在一个盒子里搅拌均张纸片放在一个盒子里搅拌均匀,抽出一张纸片,记下上面的号码,然匀,抽出一张纸片,记下上面的号码,然后再搅拌均匀,继续抽取第后再搅拌均匀,继续抽取第2张纸片,记张纸片,记下号码;重复这个过程直到取到第下号码;重复这个过程直到取到第10个号个号码时终止。码时终止。 于是,和这于是,和这10个号码对应的个号码对应的10个学生就个学生就构成了一个简单随机样本构成了一个简单随机样本 。四、随机数表法四、随机数表法 随机数表随机数表由数字由数字0,1,2,3,9 这这10个数字组成,并且个数字组成,并且每个数字在表中各每个数字在表中各个位置上出现的机会一样个位置
17、上出现的机会一样。通过随机数生。通过随机数生成器,例如计算器或计算机的应用程序生成器,例如计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表成随机数的功能,可以生成一张随机数表. 通过随机数表,根据实际需要和方便使通过随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后抽用的原则,将几个数组合成一组,然后抽取样本。取样本。 例如要考察某种品牌的例如要考察某种品牌的850颗种子的发颗种子的发芽率,从中抽取芽率,从中抽取50颗种子进行实验。用颗种子进行实验。用随机数表抽取的步骤如下:随机数表抽取的步骤如下:(1) 对对850颗种子进行编号:可以编为颗种子进行编号:可以编为0
18、01,002,850.(2) 给出的随机数表是给出的随机数表是5个数一组,使用个数一组,使用各个各个5位数组的前位数组的前3位,从各组数中任选位,从各组数中任选一个前一个前3位小于或等于位小于或等于850的数作为起始的数作为起始号码,例如从第号码,例如从第1行第行第7组开始,取出组开始,取出530作为抽取的第作为抽取的第1个代号;个代号;(3) 继续向右读,由于继续向右读,由于987850,跳过这,跳过这组数不取,继续向右读,得到组数不取,继续向右读,得到415作为第作为第2个代号。数组的前个代号。数组的前3位数不大于位数不大于850且不且不与前面取出的数重复,就把它取出,否与前面取出的数重复
19、,就把它取出,否则跳过不取,取到一行末尾时转到下一则跳过不取,取到一行末尾时转到下一行从左到右继续读,如此下去,直到得行从左到右继续读,如此下去,直到得到在到在001850之间的之间的50个三位数。个三位数。 上面我们是从左到右读数,也可以从上面我们是从左到右读数,也可以从上到下读数或其它有规则的读数方法。上到下读数或其它有规则的读数方法。用随机数表法抽取样本的步骤:用随机数表法抽取样本的步骤: S1 将总体中的所有个体编号(每个号码将总体中的所有个体编号(每个号码位数一致);位数一致);S2 在随机数表中任选一个数作为开始;在随机数表中任选一个数作为开始;S3 从选定的数开始按一定的方向读下
20、去,从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过;若在得到的号码若不在编号中,则跳过;若在编号中,则取出。得到的号码若在前面已编号中,则取出。得到的号码若在前面已经取出,也跳过,如此进行下去,直到取经取出,也跳过,如此进行下去,直到取满为止;满为止;S4 根据选定的号码抽取样本。根据选定的号码抽取样本。用随机数表法抽取样本的优缺点:用随机数表法抽取样本的优缺点: 优点:优点:简单易行简单易行。 它很好地解决了用抽它很好地解决了用抽签法时,当总体中的个体数较多时制签难签法时,当总体中的个体数较多时制签难的问题。的问题。缺点:当总体中的个体数很多,缺点:当总体中的个体数很多,需
21、要的样需要的样本容量也很大时本容量也很大时,用随机数表法抽取样本,用随机数表法抽取样本仍仍不方便不方便。例例1从从30个灯泡中抽取个灯泡中抽取10个进行质量检个进行质量检测,说明利用随机数表法抽取这个样本的测,说明利用随机数表法抽取这个样本的步骤。步骤。 (随机数表见本章末第随机数表见本章末第87页附表页附表)解:解:S1 将将30个灯泡编号:个灯泡编号:00,01,02,03,30;S2 在随机数表中任取一组数作为开始。在随机数表中任取一组数作为开始。 如从第如从第5行第行第5组的数组的数12开始;开始;S3 从从12开始向右读,依次选出开始向右读,依次选出12,22,13,09,26,25
22、,21,20,30,19这这10个编号的灯泡。个编号的灯泡。 例例2要从某汽车厂生产的要从某汽车厂生产的30辆汽车中随辆汽车中随机抽取机抽取3辆进行测试,请选择合适的抽样辆进行测试,请选择合适的抽样方法,写出抽样过程。方法,写出抽样过程。 解:本题总体容量较小,样本容量也较小,解:本题总体容量较小,样本容量也较小,可用抽签法。可用抽签法。S1 将将30辆汽车编号,号码是辆汽车编号,号码是01, 02, ,30;S2 将号码分别写在一张纸条上,揉成团,将号码分别写在一张纸条上,揉成团,制成号签;制成号签;S3 将得到的号签放入一个不透明的袋将得到的号签放入一个不透明的袋子中,并充分搅匀;子中,并充分搅匀;S4 从袋子中依次抽取从袋子中依次抽取3个号签,并记录个号签,并记录上面的编号;上面的编号;S5 所得号码对应的所得号码对应的3辆汽车就是要抽取辆汽车就是要抽取的对象。的对象。