《艺术生高考数学专题讲义-考点47用样本估计总体及样本的数字特征.docx》由会员分享,可在线阅读,更多相关《艺术生高考数学专题讲义-考点47用样本估计总体及样本的数字特征.docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、考点四十七 用样本估计总体及样本的数字特征知识梳理1统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等2.频率分布直方表(1)含义:把反映总体频率分布的表格称为频率分布表(2)频率分布表的画法步骤:第一步:求极差,决定组数和组距,组距;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表3. 频率分布直方图利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图(1)作频率分布直方图的方法先制作频率分布表,然后作直角坐标系把横轴分成若干段,每一线段对应一个组的组距,然后以此
2、线段为底作一矩形,它的高等于该组的,这样得出一系列的矩形每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图(2)频率分布直方图的特征从频率分布直方图可以清楚地看出数据分布的总体趋势;从频率分布直方图中得不出原始的数据内容,把数据表示为频率分布直方图后,原有的数据信息就丢失了;直方图中各小长方形的面积之和为1.直方图中纵轴表示,故每组样本的频率为组距,即矩形的面积直方图中每组样本的频数为频率总体数4.频率分布折线图将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图5.总体密度曲线如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲
3、线,即总体密度曲线6茎叶图茎相同者共用一个茎(如两位数中的十位数),茎按从小到大的顺序从上向下列出,共茎的叶(如两位数中的个位数),一般按从小到大(或从大到小)的顺序同行列出这样将样本数据有条理地列出来的图形叫做茎叶图其优点是当样本数据较少时,茎叶图可以保留样本数据的所有信息,直观反映出数据的水平状况、稳定程度,且便于记录和表示;缺点是对差异不大的两组数据不易分析,且样本数据很多时效果不好茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧7样本的数字特征:众数、中位数、平均数、方差、
4、标准差(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数在频率分布直方图中,中位数左边和右边的直方图的面积应该相等(3)平均数:样本数据的算术平均数,即(x1x2xn)(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为x,则这组数据的标准差和方差分别是s ,s2(x1)2(x2)2(xn)2标准差是反映总体波动大小的特征数,样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差(5)标准差和方差的一些结论若取值x1,x2,xn的频率分别为p1
5、,p2,pn,则其平均值为x1p1x2p2xnpn;若x1,x2,xn的平均数为,方差为s2,则ax1b,ax2b,axnb的平均数为ab,方差为a2s2. 典例剖析题型一 频率分布直方图例1为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为_答案12解析 志愿者的总人数为50,所以第三组人数为500.36
6、18,有疗效的人数为18612.变式训练 某中学为了了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是_答案600解析由直方图易得数学考试中成绩小于60分的频率为(0.0020.0060.012)100.2,所以所求分数小于60分的学生数为3 0000.2600.解题要点 解决频率分布直方图时要明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1. 常用的结论有:直方图中各小长
7、方形的面积之和为1.直方图中纵轴表示,故每组样本的频率为组距,即矩形的面积直方图中每组样本的频数为频率总体数题型二 茎叶图例2在如图所示的茎叶图中,甲、乙两组数据的中位数分别是_,_答案 4546解析 甲组数据为:28,31,39,42,45,55,58,57,66,中位数为45.乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.变式训练 若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是_答案91.5和91.5解析这组数据由小到大排列为87,89,90,91,92,93,94,96,中位数为(9192)91.5.平均数为(87
8、89909192939496)91.5.解题要点 求解茎叶图的习题,要读懂图,弄清楚“茎”和“叶”分别是什么,从而还原出具体的数据题型三 用样本的数字特征估计总体的数字特征例3(2014高考陕西卷)某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为_答案 100,s2解析,yixi100,所以y1,y2,y10的均值为100,方差不变.变式训练 甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品质量,从产品中各随机抽出6件进行测量,测得数据如下:(单位:mm)甲:99,1
9、00,98,100,100,103;乙:99,100,102,99,100,100.(1) 分别计算上述两组数据的平均数和方差;(2) 根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求解析 (1) 甲100(102003)100;乙100(102100)100.s(1)202(2)2020232,s(1)20222(1)202021.(2) 由(1)知,甲乙,ss, 乙机床加工的这种零件更符合要求解题要点 1.熟记一些常用结论:若取值x1,x2,xn的频率分别为p1,p2,pn,则其平均值为x1p1x2p2xnpn;若x1,x2,xn的平均数为,方差为s2,则ax1b,ax2b,a
10、xnb的平均数为ab,方差为a2s2.2. 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小当堂练习1(2015安徽理)若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为_答案16解析已知样本数据x1,x2,x10的标准差为s8,则s264,数据2x11,2x21,2x101的方差为22s22264,所以其标准差为2816.2(2015江苏)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为_答案6解析这组数据的平均数为(465876)6.3
11、. (2015重庆文)重庆市2013年各月的平均气温()数据的茎叶图如下:则这组数据的中位数是_答案20解析由茎叶图,把数据由小到大排列,处于中间的数为20,20,所以这组数据的中位数为20.4(2015山东文)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲乙986289113012甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差
12、其中根据茎叶图能得到的统计结论的编号为_答案解析甲地5天的气温为:26,28,29,31,31,其平均数为甲29;方差为s(2629)2(2829)2(2929)2(3129)2(3129)23.6;标准差为s甲.乙地5天的气温为:28,29,30,31,32,其平均数为乙30;方差为s(2830)2(2930)2(3030)2(3130)2(3230)22;标准差为s乙.甲乙,s甲s乙5如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为_答案 5,8解析 因为甲组数据的中位数为15,由茎
13、叶图可得x5,因乙组数据的平均数为16.8,则16.8,解得y8.课后作业一、 填空题1样本中有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为_答案 2解析 由题意知该组数据的平均值为(a0123)1,解得a1,所以样本方差为s2(11)2(01)2(11)2(21)2(31)22.2学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在20,60)元的样本,其频率分布直方图如图所示,其中支出在50,60)元的同学有30人,则n的值为_答案 100解析 支出在50,60)元的频率为10.360.240.10.3,因此0.3,故n100.3如图是某公司1
14、0个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为_答案 0.4解析 落在22,30)的频数为4,则所求频率为P0.4.4已知一组数据按从小到大的顺序排列,得到1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为_答案5,245对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是_1252 02333 1244894 555778895 00114796 178答案 46,45,56解析 样本中数据共30个,中位数为46;显然样本数据中出现次数最多的为45,故众数为45;极差为681256
15、.6一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是_答案62.8,3.6解析平均数增加60,即为62.8.方差(ai60)(60)2 (ai)23.6.7某校甲、乙两个班级各有编号为1,2,3,4,5的五名学生进行投篮练习,每人投10次,投中的次数如表:学生1号2号3号4号5号甲班67787乙班67679则以上两组数据的方差中较小的一个为s2,则s2_答案 解析 甲班的平均数为甲7,甲班的方差为s;乙班的平均数为乙7,乙班的方差为s.,s2.8(2013福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成
16、绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为_答案480解析少于60分的学生人数600(0.050.15)120(人),不少于60分的学生人数为480人9某学校高一年级男生人数占该年级学生人数的40%.在一次考试中,男、女生平均分数分别为75、80,则这次考试该年级学生平均分数为_答案 78解析 由题意得750.4800.6304878,平均分为78.10 (2015湖北文)某电子商务公司对10 000名网络购物者2014年度的消
17、费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示(1)直方图中的a_;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_答案(1)3(2)6 000解析由频率分布直方图及频率和等于1可得0.20.10.80.11.50.120.12.50.1a0.11,解得a3.于是消费金额在区间0.5,0.9内频率为0.20.10.80.120.130.10.6,所以消费金额在区间0.5,0.9内的购物者的人数为:0.610 0006 000,故应填3,6 000.11下面茎叶图是甲、乙两人在5次综合测评中成绩的茎叶图,其中一个数字被污损,则甲
18、的平均成绩超过乙的平均成绩的概率为_答案解析设被污损的数字为a(0a9且aN),则由甲的平均成绩超过乙的平均成绩得88899091928383879990a,解得8a,即得0a7且aN,甲的平均成绩超过乙的平均成绩的概率为P.二、解答题12 (2015广东理)某工厂36名工人的年龄数据如下表.工人编号 年龄工人编号 年龄工人编号 年龄工人编号 年龄14010361927283424411312043293934012382141304344113392237313853314432334324264015452442335374516392537343784217382644354994318
19、3627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值和方差s2;(3)36名工人中年龄在s与s之间的有多少人?所占的百分比是多少(精确到0.01%)?解析 (1)44,40,36,43,36,37,44,43,37.(2)40.s2(4440)2(4040)2(3640)2(4340)2(3640)2(3740)2(4440)2(4340)2(3740)2.(3)40,40在的有23个,占63.89%.13(2015广东文)某城市100户居民的月平均用电量(单位:度),以160,
20、180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?解析 (1)由(0.0020.009 50.0110.012 5x0.0050.002 5)201得:x0.007 5,所以直方图中x的值是0.007 5.(2)月平均用电量的众数是230.因为(0.0020.009 50.011)200.450.5,所以月平均用电量的中位数在220,240)内,设中位数为a,由(0.0020.009 50.011)200.012 5(a220)0.5得:a224,所以月平均用电量的中位数是224.(3)月平均用电量为220,240的用户有0.012 52010025户,月平均用电量为240,260)的用户有0.007 52010015户,月平均用电量为260,280)的用户有0.0052010010户,月平均用电量为280,300的用户有0.002 5201005户,抽取比例,所以月平均用电量在220,240)的用户中应抽取255户