《必修三统计复习教案和习题(共17页).doc》由会员分享,可在线阅读,更多相关《必修三统计复习教案和习题(共17页).doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上统计复习简单随机抽样重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。教学设想:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本。(为什么?)那么,应当怎样获取样本呢?【探究新知】一、简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。【说明】简单随机抽样必须具
2、备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。(2)简单随机样本数n小于等于样本总体的个数N。(3)简单随机样本是从总体中逐个抽取的。(4)简单随机抽样是一种不放回的抽样。(5)简单随机抽样的每个个体入样的可能性均为n/N。思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。二、抽签法和随机数法1、抽签法的定义。一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后
3、,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。【说明】抽签法的一般步骤:(1)将总体的个体编号。(2)连续抽签获取样本号码。思考?你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?2、随机数法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。第一步,先将800袋牛奶编号,可以编为000,001,799。第二步,在随机数表
4、中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 75 33 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 64 21
5、 76 33 50 25 83 92 12 06 76 12 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916799,将它去掉,按照这种方法继续向右读,又取出567,199,507,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。【说明】随机数表法的步骤:(1)将总体的个
6、体编号。(2)在随机数表中选择开始数字。(3)读数获取样本号码。【例题精析】例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?分析 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?分析 简单随机抽样一般采用两种方法:抽签法和随机数表法。解法1:(抽签法)将100件
7、轴编号为1,2,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。解法2:(随机数表法)将100件轴编号为00,01,99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。【课内小结】 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法。2、抽签法的优点是简单易行,缺
8、点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误。【课堂小练】1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A总体是240 B、个体是每一个学生C、样本是40名学生 D、样本容量是402、为了
9、正确了解加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )A、总体 B、个体是每一个学生C、总体的一个样本 D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 。4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 。 系统抽样重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题。教学设想:【创设情境】:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否
10、设计其他抽取样本的方法?【探究新知】一、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。【说明】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k.(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。思考? (1)你能举几个系统抽样的例子吗?(2)下
11、列抽样中不是系统抽样的是 ( )A、从标有115号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈点拨:(2)c不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。二、系统抽样的一般步骤。(1)采用随机抽样的方法将总体中的N个个编
12、号。(2)将整体按编号进行分段,确定分段间隔k(kN,Lk).(3)在第一段用简单随机抽样确定起始个体的编号L(LN,Lk)。(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。【说明】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。【例题精析】 例1、某校高中三年级的295名学生已经编号为1,2,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。分析按1:5分段,每段5人,共分59
13、段,每段抽取一人,关键是确定第1段的编号。解:按照1:5的比例,应该抽取的样本容量为2955=59,我们把259名同学分成59组,每组5人,第一组是编号为15的5名学生,第2组是编号为610的5名学生,依次下去,59组是编号为291295的5名学生。采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1k5),那么抽取的学生编号为k+5L(L=0,1,2,,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,288,293。例2、从已编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所
14、选取5枚导弹的编号可能是A5,10,15,20,25 B、3,13,23,33,43C1,2,3,4,5 D、2,4,6,16,32分析用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B。【课内小结】1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:(1)采用随机的方法将总体中个体编号;(2)将整体编号进行分段,确定分段间隔k(kN);(3)在第一段内采用简单随机抽样的方法确定起始个体编号L;(4)按照事先预定的规则抽取样本。2、在确定
15、分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。【课堂小练】1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( )A99 B、99,5C100 D、100,52、从学号为050的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( )A1,2,3,4,5 B、5,16,27,38,49C2, 4, 6, 8, 10 D、4,13,22,31,403、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 ( )A8 B.8,3
16、C8.5 D.94、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。5、某单位的在岗工作为624人,为了调查工作上班时,从家到单位的路上平均所用的时间,决定抽取10%的工作调查这一情况,如何采用系统抽样的方法完成这一抽样? 分层抽样重点与难点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法解决现实生活中的抽样问题。教学设想: 【创设情景】假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成
17、原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?【探究新知】 一、分层抽样的定义。一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求:(1)分层:将相似的个体归为一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。二、分层抽样的步骤:(1)分层:按某种特
18、征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。【说明】(1)分层需遵循不重复、不遗漏的原则。(2)抽取比例由每层个体占总体的比例确定。(3)各层抽样按简单随机抽样进行。探究交流(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( ) A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为 ( ) A B. C. 点拨
19、:(1)保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的,故此选C。 (2)根据每个个体都等可能入样,所以其可能性本容量与总体容量比,故此题选C。 简单随机抽样、系统抽样、分层抽样的比较类 别共同点各自特点联 系适 用范 围简 单随 机抽 样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少将总体均分成几部 分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多系 统抽 样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明
20、显的几部分组成分 层抽 样【例选精析】例1、 某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为A.15,5,25 B.15,15,15C.10,5,30 D15,10,20分析因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各抽取的个体数分别为3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20,故选D。例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个3
21、00人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。分析采用分层抽样的方法。解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。3003/15=60(人),3002/15=100(人),3002/15=40(人),3002/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。(3)将300人组到一起,即得到一个样本。【课内小结】1、分层抽样是当总体由
22、差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)、分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。 【课堂小练】1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的
23、抽取方法是 ( )A简单随机抽样B系统抽样C分层抽样D先从老人中剔除1人,然后再分层抽样2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n= 。4、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人
24、事部门提供了如下资料:任职年限5年以下5年至10年10年以上人数300500200试利用上述资料设计一个抽样比为1/10的抽样方法。用样本的频率分布估计总体分布重点与难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。难点:能通过样本的频率分布估计总体的分布。教学设想【创设情境】在的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下甲运动员得分12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何
25、根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容用样本的频率分布估计总体分布,引申以下概念:一频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:(1) 计算一组数据中最大值与最小值的差,即求极差(2) 决定组距与组数(3) 将数据分组(4) 列频率分布表(5) 画频率分布直方图频率分布直方图的特征:(1) 从频率分布直方图可以清楚的看出数据分布的总体趋势。(2) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。同样一组数据,如果组距不同,横轴、纵轴的单位不同,
26、得到的图和形状也会不同。二频率分布折线图、总体密度曲线1频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。思考:对于任何一个总体,它的密度曲线是不是一定存在?为什么?对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,
27、样本容量越大,这种估计就越精确【例题精析】例1:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位) (1)列出样本频率分布表(2)一画出频率分布直方图;(3)估计身高小于134的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。解:()样本频率分布表如下122126130134138142146150158154身高(cm)o0.010.020.030.040.050.060.07频率/组距()其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于13
28、4cm的人数占总人数的19%.例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1) 第二小组的频率是多少?样本容量是多少?(2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036分析:在频率分布直
29、方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=所以 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。【课内小结】1 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。2 总体的分布分两种情况:当总体中的个体取值很少时,用
30、茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。【课堂练习】1.某校为了了解高一年级学生的体能情况,抽调了一部分学生进行一分钟跳绳测试,将测试成绩整理后作出如下统计图,甲同学计算出前两组的频率和是012,乙同学计算出跳绳次数不少于100次的同学占96%,丙同学计算出从左至右第二、三、四组的频数比为4:17:15,结合统计图回答下列问题:(1)这次共抽调了多少人?高考资源网w。w-w*k&s%5¥u(2)若跳绳次数不少于130次为优秀,则这次测试成绩的优秀率是多少? 2.(2010福建文) 将容量为n的样本中
31、的数据分成6组,绘制频率分布直方图若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于 3.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为175岁18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在565,645) kg的学生人数是( ) (A)20(B)30(C)40(D)504.(2010北京理)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)由图中数据可知a 若要从身高在 120 , 130),130 ,140) , 140 , 150三组内的学生中,用分层
32、抽样的方法选取18人参加一项活动,则从身高在140 ,150内的学生中选取的人数应为 用样本的数字特征估计总体的数字特征重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。难点:能应用相关知识解决简单的实际问题。教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。【探究新知】、众数、中位数、平均数(1)怎样将各个样本数据汇总为
33、一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(回忆初中所学的一些统计知识,思考后讨论)思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(讨论,并举例)、标准差、方差标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。
34、因此,只有平均数难以概括样本数据的实际状态。例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,。两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。样
35、本数据的标准差的算法:() 、算出样本数据的平均数。() 、算出每个样本数据与样本数据平均数的差:() 、算出()中的平方。() 、算出()中n个平方数的平均数,即为样本方差。() 、算出()中平均数的算术平方根,即为样本标准差。其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。提问:标准差的取值范围是什么?标准差为的样本数据有什么特点?从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。方差从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一
36、样的,但在解决实际问题时,一般多采用标准差。【例题精析】例1:画出下列四组样本数据的直方图,说明他们的异同点。(1),(2),(3),(),分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。解:(图略)四组数据的平均数都是.,标准差分别为:.,.,.,.。他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。例2对甲、乙的学习成绩进行抽样分析,各抽5门功课,了解到的观测值如下:甲6080709070乙8060708075(1)甲、乙的平均成绩谁较好?(2)谁的各门功课发展较平衡?解析(1)甲(6080709070)74
37、.乙(8060708075)73,甲乙,甲的平均成绩较好(2)s(142624216242)104s(72132327222)56.ss,乙的各门功课发展较平衡【课内小结】(1)众数、中位数和平均数都是描述一组数据集中趋势的特征数; 标准差、方差都是用来描述一组数据波动情况的特征数,标准差更具无偏性(2)当两个样本的平均数相等或相差无几时,就要用标准差来反映样本数据的离散程度【课堂练习】1.已知数据5,7,7,8,10,11,则其标准差为()A8 B4 C2 D92. 若样本1x1,1x2,1x3,1xn的平均数是10,方差为2,则对于样本2x1,2x2,2xn,下列结论正确的是()A平均数为
38、10,方差为2B平均数为11,方差为3C平均数为11,方差为2D平均数为12,方差为43. 下列对一组数据的分析,不正确的说法是()A数据极差越小,样本数据分布越集中、稳定B数据平均数越小,样本数据分布越集中、稳定C数据标准差越小,样本数据分布越集中、稳定D数据方差越小,样本数据分布越集中、稳定课后练习说明:本卷满分150分,考试时间120分钟.一 选择题(每题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的.)1. 在统计中,样本的方差可以近似地反映总体的 【 】A.平均状态 B. 分布规律 C. 波动大小 D. 最大值和最小值2. 已知一组数据1、2、y的平均数为4,那么
39、 【 】A.y=7 B.y=8 C.y=9 D.y=103. 甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、x分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是 【 】A.100分 B.95分 C.90分 D.85分 4. 某校1000名学生中,O型血有400人,A型血有250人,B型血有250人,AB型血有100人,为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,按照分层抽样的方法抽取样本,则O型血、A型血、B型血、AB型血的人要分别抽的人数为 【 】A.16、10、10、4 B.14、10、10、6 C.13、12、12、3 D.15、8、8、9 5. 为
40、了了解广州地区初三学生升学考试数学成绩的情况,从中抽取50本密封试卷,每本30份试卷,这个问题中的样本容量是 【 】A.30 B.50 C.1500D.150 6. 某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为 【 】A.4 B.5 C.6D.无法确定7. 已知三年级四班全班35人身高的算术平均数与中位数都是158 cm,但后来发现其中有一位同学的身高登记错误,将160 cm写成166 cm,正确的平均数为a cm,中位数为b
41、 cm.关于平均数a的叙述,下列正确的是 【 】A.大于158 B.小于158 C.等于158D.无法确定 8. 在7题中关于中位数b的叙述,下列正确的是 【 】A.大于158 B.小于158 C.等于158D.无法确定 9. 在频率分布直方图中,每个小长方形的面积表示 【 】A.组数 B.频数 C.频率D. 10. 在某餐厅内抽取100人,其中有30人在15岁以下,35人在16至25岁,25人在26至45岁,10人在46岁以上,则数 0.35是16到25岁人员占总体分布的 【 】A.概率 B.频率 C.累计频率D.频数11. 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,适合的抽取样本的方法是 【 】A.简单的随机抽样 B.系统抽样C.先从老年人中排除一人,再用分层抽样 D.分层抽样 12. 一个容量为20的样本数据,分组后组距与频数如下: