《2017-2018学年高中数学新人教版必修3教案:第2章 2.2.2 用样本的数字特征估计总体的数字特征 .doc》由会员分享,可在线阅读,更多相关《2017-2018学年高中数学新人教版必修3教案:第2章 2.2.2 用样本的数字特征估计总体的数字特征 .doc(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.2用样本的数字特征估计总体的数字特征1会求样本的众数、中位数、平均数、标准差、方差(重点)2理解用样本的数字特征来估计总体数字特征的方法(重点)3会应用相关知识解决实际统计问题(难点)基础初探教材整理1众数、中位数、平均数阅读教材P72P73的内容,完成下列问题1众数:在一组数据中,出现次数最多的数叫做众数如果有两个或两个以上数据出现的最多且出现的次数相等,那么这些数据都是这组数据的众数;如果一组数据中,所有数据出现的次数都相等,那么认为这组数据没有众数2中位数:将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的那个数是这组数据的中位数;当数据有偶数个时,处在最中间的两
2、个数的平均数是这组数据的中位数3平均数:一组数据的总和除以这组数据的个数取得的商叫做这组数据的平均数,一般记为(x1x2xn)4三种数字特征的比较名称优点缺点众数体现了样本数据的最大集中点;容易计算它只能表达样本数据中很少的一部分信息;无法客观地反映总体的特征中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响;容易计算,便于利用中间数据的信息对极端值不敏感平均数代表性较好,是反映数据集中趋势的量一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变数据越“离群”,对平均数的影响越大1判断(正确的打“”,错误的打“”)(1)中位数一定是样本数据中的某个数
3、()(2)在一组样本数据中,众数一定是唯一的()【答案】(1)(2)2已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A平均数中位数众数B平均数中位数众数C中位数众数平均数D众数中位数平均数【解析】众数为50,平均数(2030405050607080)50,中位数为(5050)50,故选D.【答案】D3一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为()A4.55B4.5C12.5D1.64【解析】4.55.【答案】A教材整理2频率分布直方图中的众数、中位数、平均数阅读教材P72P73的内容,完成下列问题在频率分布直方
4、图中,众数是最高矩形中点的横坐标,中位数左边和右边的直方图的面积应该相等,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和教材整理3标准差、方差阅读教材P74P77例2上面的内容,完成下列问题1标准差的计算公式标准差是样本数据到平均数的一种平均距离,一般用s表示,s .2方差的计算公式标准差的平方s2叫做方差s2(x1)2(x2)2(xn)2其中,xi(i1,2,n)是样本数据,n是样本容量,是样本平均数某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为_;(2)命中环数的标准差为_【解析】(1)7
5、.(2)s2(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,s2.【答案】(1)7(2)2小组合作型众数、中位数、平均数某工厂人员及工资构成如下表:人员经理管理人员高级技工工人学徒合计周工资/元2 2001 2501 2201 200490人数16510123(1)指出这个问题中的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么? 【精彩点拨】先结合众数、中位数、平均数的意义求出众数、中位数、平均数,再结合影响平均数的因素作答【尝试解答】(1)由题中表格可知:众数为1 200,中位数为1 220,平均
6、数为(2 2001 25061 22051 20010490)231 230(元/周)(2)虽然平均数为1 230元/周,但从题中表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平1众数、中位数、平均数都是刻画数据特征的,但任何一个样本数据改变都会引起平均数的改变,而众数、中位数不具有这个性质所以平均数可以反映出更多的关于样本数据全体的信息,它是样本数据的重心2在样本中出现极端值的情况下,众数、中位数更能反映样本数据的平均水平再练一题1已知一组数据按从小到大排列为1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是_,
7、平均数是_【解析】中位数为5,5,即x6.该组数据的众数为6,平均数为5.【答案】65方差和标准差甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定【精彩点拨】【尝试解答】(1)甲9910098100100103100,乙9910010299100100100,s(99100)2(100100)2(98100)2(100100)2(100100)2(103100)2,s(99100)2(100100)2(10
8、2100)2(99100)2(100100)2(100100)21.(2)由(1)知甲乙,比较它们的方差,ss,故乙机床加工零件的质量更稳定1在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定2关于统计的有关性质及规律(1)若x1,x2,xn的平均数为,那么mx1a,mx2a,mxna的平均数是ma;(2)数据x1,x2,xn与数据x1a,x2a,xna的方差相等;(3)若x1,x2,xn的方差为s2,那么ax1,ax2,axn的方差为a2s2.再练一题2某校高二年级在一次数学选拔赛中,由
9、于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:甲127138130137135131乙133129138134128136求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛【解】设甲、乙两人成绩的平均数分别为甲,乙,则甲130(380751)133,乙130(318426)133,s(6)252(3)24222(2)2,s(02(4)25212(5)232.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适频率分布直方图与数字特征的综合应用已知一组数据:1
10、25121123125127129125128130129126124125127126122124125126128(1)填写下面的频率分布表:分组频数累计频数频率120.5,122.5)122.5,124.5)124.5,126.5)126.5,128.5)128.5,130.5合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 【精彩点拨】将数据分组后依次填写分布表然后画出直方图,最后根据数字特征在直方图中的求法求解【尝试解答】(1)分组频数累计频数频率120.5,122.5)20.1122.5,124.5)30.15124.5,126.
11、5)80.4126.5,128.5)40.2128.5,130.530.15合计201(2)(3)在124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5,事实上,众数的精确值为125.图中虚线对应的数据是124.52125.75,事实上中位数为125.5.使用“组中值”求平均数:121.50.1123.50.15125.50.4127.50.2129.50.15125.8,事实上平均数的精确值为125.75.1利用频率分布直方图求数字特征(1)众数是最高的矩形的底边的中点;(2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底
12、边中点的横坐标之和2利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数再练一题3某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图2220所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:图2220(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩【解】(1)由题图可知众数为65,又第一个小矩形的面积为0.3,设中位数为60x,则0.3x0.040.5,得x5,中位数为60565.(2)依题意,平均成绩为:550
13、.3650.4750.15850.1950.0567,平均成绩约为67.探究共研型平均数、中位数、众数的特征探究1一组数据的平均数、中位数、众数唯一吗?【提示】一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个,还可以没有如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数探究2如何从样本的数字特征中了解数据中是否存在极端数据?【提示】中位数不受几个极端数据的影响,而平均数受每个数据的影响,“越离群”的数据,对平均数的影响越大,因此如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值在实
14、际应用中,如果同时知道样本中位数和样本平均数,可以了解样本数据中极端数据的信息探究3众数、中位数有哪些应用?【提示】(1)众数只与这组数据中的部分数据有关,当一组数据中有不少数据重复出现时,众数往往更能反映问题(2)中位数仅与数据的排列位置有关,中位数可能在所给数据中,也可能不在所给数据中当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势方差、标准差的特征探究4从数据的哪些数字特征可以得到数据的离散程度?【提示】(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性
15、小极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差样本的数字特征探究5样本的数字特征具有哪些性质?【提示】(1)样本的数字特征具有随机性,这种随机性是由样本的随机性引起的(2)样本的数字特征具有规律性,在很广泛的条件下,简单随机样本的数字特征(如众数、中位数、平均数和标准差等)随样本容量的增加而稳定于总体相应的数字特征(总体的数字特征是一定的,不存在随机性)某班4个小组
16、的人数为10,10,x,8,已知该组数据的中位数与平均数相等,求这组数据的中位数【精彩点拨】x的大小未知,可根据x的取值不同分别求中位数【尝试解答】该组数据的平均数为(x28),中位数一定是其中两个数的平均数,由于x不知是多少,所以要分几种情况讨论:(1)当x8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为(108)9.若(x28)9,则x8,此时中位数为9.(2)当8x10时,原数据按从小到大的顺序排列为8,x,10,10,其中位数为(x10)若(x28)(x10),则x8,而8不在810时,原数据按从小到大的顺序排列为8,10,10,x,其中位数为(1010)10.若(x2
17、8)10,则x12,此时中位数为10.综上所述,这组数据的中位数为9或10.当在数据中含有未知数x,求该组数据的中位数时,由于x的取值不同,所以数据由小到大(或由大到小)排列的顺序不同,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,故需分情况讨论,讨论时要做到全面合理,不重不漏.再练一题4为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_【解析】设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知7,(x17)2(x27)2(
18、x37)2(x47)2(x57)220,五个整数的平方和为20,则必为0119920,由|x7|3可得x10或x4.由|x7|1可得x8或x6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.【答案】101样本101,98,102,100,99的标准差为()A.B0C1D2【解析】样本平均数100,方差为s22,标准差s,故选A.【答案】A2甲乙两名学生六次数学测验成绩(百分制)如图2221所示图2221甲同学成绩的中位数大于乙同学成绩的中位数;甲同学的平均分比乙同学高;甲同学的平均分比乙同学低;甲同学成绩的方差小于乙同学成绩的方差上面说法正确的是()ABCD【解析】甲的中位数8
19、1,乙的中位数87.5,故错,排除B、D;甲的平均分(767280828690)81,乙的平均分(697887889296)85,故错,对,排除C,故选A.【答案】A3甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如下表所示,则选送决赛的最佳人选应是()甲乙丙丁7887s26.36.378.7A.甲B乙C丙D丁【解析】乙丙甲丁,且ssss,应选择乙进入决赛【答案】B4为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图2222,则图2222(1)这20名工人中一天生产该产品数量在55,75)的人数是_(2)这20名工人中一天生产该产品数
20、量的中位数为_(3)这20名工人中一天生产该产品数量的平均数为_【解析】(1)(0.040100.02510)2013.(2)设中位数为x,则0.2(x55)0.040.5,x62.5.(3)0.2500.4600.25700.1800.059064.【答案】(1)13(2)62.5(3)645甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图2223所示:图2223(1)填写下表:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:从平均数和方差结合分析偏离程度;从平均数和中位数结合分析谁的成绩好些;从平均数和命中9环以上的次数相结合看谁的
21、成绩好些;从折线图上两人射击命中环数及走势分析谁更有潜力. 【解】(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以乙(24687789910)7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲71.271乙75.47.53(2)甲、乙的平均数相同,均为7,但ss,说明甲偏离平均数的程度小,而乙偏离平均数的程度大甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好甲、乙的平均水平相同
22、,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力学业分层测评(十三)用样本的数字特征估计总体的数字特征(建议用时:45分钟)学业达标一、选择题1甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图2224所示,则()图2224A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差【解析】由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均
23、为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为(46)2(56)2(66)2(76)2(86)22,(56)2(56)2(56)2(66)2(96)2,C对;甲、乙的成绩的极差均为4,D错【答案】C2若样本1x1,1x2,1x3,1xn的平均数是10,方差为2,则对于样本2x1,2x2,2xn,下列结论正确的是()A平均数是10,方差为2B平均数是11,方差为3C平均数是11,方差为2D平均数是10,方差为3【解析】若x1,x2,xn的平均数为,方差为s,那么x1a,x2a,xna的平均数为a,方差为s.【答案】C3如图2225是某赛季甲、乙两名篮球运动员每场比赛
24、得分的茎叶图,甲、乙两人这几场比赛得分的平均数分别为甲,乙;标准差分别是s甲,s乙,则有()图2225A.甲乙,s甲s乙B.甲乙,s甲s乙C.甲乙,s甲s乙 D.甲乙,s甲s乙【解析】观察茎叶图可大致比较出平均数与标准差的大小关系,或者通过公式计算比较【答案】C4已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数据3x12,3x22,3x32,3x42,3x52的平均数和方差分别为()A2,B2,1C4,D4,3【解析】平均数为323224,方差为s29s293.【答案】D5为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如
25、图2226所示由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为() 图2226A0.27,78B0.27,83C2.7,78D2.7,83【解析】由题意,4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d,则60.2715d10.010.030.09,d0.05.b(0.2746d)10078,a0.27.【答案】A二、填空题6一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x_.【解析】
26、由题意知22,则x21.【答案】217甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图2227所示,则平均分数较高的是_,成绩较为稳定的是_图2227【解析】甲70,乙68,s(22121222)2,s(52121232)7.2.【答案】甲甲8已知样本9,10,11,x,y的平均数是10,标准差为,则xy_. 【解析】由平均数得91011xy50,xy20.又由(910)2(1010)2(1110)2(x10)2(y10)2()2510,得x2y220(xy)192,(xy)22xy20(xy)192,xy96.【答案】96三、解答题9从高三抽出50名学生参加数学竞赛,由成绩得到如图22
27、28的频率分布直方图图2228由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩【解】(1)由众数的概念可知,众数是出现次数最多的数在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求0.004100.006100.02100.040.060.20.3,前三个小矩形面积的和为0.3.而第
28、四个小矩形面积为0.03100.3,0.30.30.5,中位数应约位于第四个小矩形内设其底边为x,高为0.03,令0.03x0.2得x6.7,故中位数应约为706.776.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可平均成绩为45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02110)95(0.01610)73.65.10对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲273830373531乙33293834283
29、6(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?【解】(1)画茎叶图如下:中间数为数据的十位数从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些乙发挥比较稳定,总体情况比甲好(2)甲33.乙33.s(2733)2(3833)2(3033)2(3733)2(3533)2(3133)215.67.s(3333)2(2933)2(3833)2(3433)2(2833)2(3633)212.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,选乙参加比赛较合适能力提升1有一笔统计资
30、料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x,已知这组数据的平均数为6,则这组数据的方差为()A6B.C66D6.5【解析】(24455678911x)(61x)6,x5.方差为:s26.【答案】A2将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图2229中以x表示:图2229则7个剩余分数的方差为()A. B. C36 D.【解析】根据茎叶图,去掉1个最低分87,1个最高分99,则8794909190(90x)9191,x4.s2(8791)2(9491)2(9
31、091)2(9191)2(9091)2(9491)2(9191)2.【答案】B3若40个数据的平方和是56,平均数是,则这组数据的方差是_,标准差是_【解析】设这40个数据为xi(i1,2,40),平均数为.则s2(x1)2(x2)2(x40)2xxx402(x1x2x40)0.9.s.【答案】0.94某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:0,0.5),4;0.5,1),8;1,1.5),15;1.5,2),22;2,2.5),25;2.5,3),14;3,3.5),6;3.5,4),4;4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根
32、据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?【解】(1)频率分布表分组频数频率0,0.5)40.040.5,1)80.081,1.5)150.151.5,2)220.222,2.5)250.252.5,3)140.143,3.5)60.063.5,4)40.044,4.5)20.02合计1001(2)频率分布直方图如图:众数:2.25,中位数:2.02,平均数:2.02.(3)人均月用水量在3t以上的居民所占的比例为6%4%2%12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.版权所有:高考资源网()