《(黄冈名师)2020版高考数学大一轮复习11.2用样本估计总体课件理新人教A版.ppt》由会员分享,可在线阅读,更多相关《(黄冈名师)2020版高考数学大一轮复习11.2用样本估计总体课件理新人教A版.ppt(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二节用样本估计总体(全国卷5年2考) 【知识梳理知识梳理】1.1.常用统计图表常用统计图表(1)(1)频率分布表的画法频率分布表的画法: :第一步第一步: :求求_,_,决定组数和组距决定组数和组距, ,组距组距=_;=_;极差极差极差组数第二步第二步:_,:_,通常对组内数值所在区间取左闭右开区通常对组内数值所在区间取左闭右开区间间, ,最后一组取闭区间最后一组取闭区间; ;第三步第三步: :登记频数登记频数, ,计算频率计算频率, ,列出频率分布表列出频率分布表. .分组分组(2)(2)频率分布直方图频率分布直方图: :反映样本频率分布的直方图反映样本频率分布的直方图. .如图如图: :
2、2.2.样本的数字特征样本的数字特征如果有如果有n n个数据个数据x x1 1,x,x2 2,x,xn n, ,那么这那么这n n个数的个数的(1)(1)平均数平均数 =_.=_.(2)(2)标准差标准差s=_.s=_.12n1(xxx )nx22212n1(xx)(xx)(xx)n(3)(3)方差方差s s2 2=_=_22212n1(xx)(xx)(xx)n【常用结论常用结论】 1.1.必记结论必记结论(1)(1)众数的估计值是最高矩形底边中点的横坐标众数的估计值是最高矩形底边中点的横坐标. .(2)(2)平均数的估计值等于频率分布直方图中每个小矩形平均数的估计值等于频率分布直方图中每个小
3、矩形的面积乘以小矩形底边中点的横坐标之和的面积乘以小矩形底边中点的横坐标之和. .(3)(3)中位数的估计值的左边和右边小矩形的面积和是相中位数的估计值的左边和右边小矩形的面积和是相等的等的. .2.2.常用公式常用公式(1)(1)若数据若数据x x1 1,x,x2 2,x,xn n的平均数是的平均数是 , ,则则mxmx1 1+a,mx+a,mx2 2+a,mx+a,mxn n+a+a的平均数是的平均数是m +a.m +a.(2)(2)若数据若数据x x1 1,x,x2 2,x,xn n的方差为的方差为s s2 2, ,则则axax1 1+b,ax+b,ax2 2+b,+b,axaxn n+
4、b+b的方差为的方差为a a2 2s s2 2, ,标准差为标准差为as.as.xx【基础自测基础自测】题组一题组一: :走出误区走出误区1.1.判断正误判断正误( (正确的打正确的打“”“”, ,错误的打错误的打“”)”)(1)(1)作频率分布直方图时作频率分布直方图时, , 组数越多越能准确反映样本组数越多越能准确反映样本的频率分布的频率分布. .( () )(2)(2)利用频率分布直方图计算的样本数字特征是样本数利用频率分布直方图计算的样本数字特征是样本数字特征的估计值字特征的估计值. .( () )(3)(3)在众数、中位数、平均数中在众数、中位数、平均数中, ,众数可以反映更多的众数
5、可以反映更多的关于样本数据全体的信息关于样本数据全体的信息. .( () )提示提示: :(1)(1). .组数太多或太少都不能准确反映样本的频组数太多或太少都不能准确反映样本的频率分布率分布. .(2).(2).由频率分布直方图的制作和特征可知正确由频率分布直方图的制作和特征可知正确. .(3)(3). .任何一个样本数据的改变都会引起平均数的改任何一个样本数据的改变都会引起平均数的改变变, ,因此平均数反映更多的关于样本数据全体的信息因此平均数反映更多的关于样本数据全体的信息. .2.2.已知某已知某7 7个数的平均数为个数的平均数为4,4,方差为方差为2,2,现加入一个新数现加入一个新数
6、据据4,4,此时这此时这8 8个数的平均数为个数的平均数为 , ,方差为方差为s s2 2, ,则则( () )A. =4,sA. =4,s2 2222C. 4,sC. 4,s2 224,sD. 4,s2 222xxxxx【解析解析】选选A.A.由题意知平均数为由题意知平均数为 没变没变, ,方差方差s s2 2变小变小. .x3.3.为了了解某校今年准备报考飞行员的学生的体重情为了了解某校今年准备报考飞行员的学生的体重情况况, ,将所得的数据整理后将所得的数据整理后, ,画出了频率分布直方图画出了频率分布直方图( (如如图图),),已知图中从左到右的前已知图中从左到右的前3 3个小组的频率之
7、比为个小组的频率之比为123,123,第第1 1小组的频数为小组的频数为6,6,则报考飞行员的学生人数则报考飞行员的学生人数是是( () )A.36A.36B.40B.40C.48C.48D.50D.50【解析解析】选选C.C.设报考飞行员的人数为设报考飞行员的人数为n,n,根据前根据前3 3个小组个小组的频率之比为的频率之比为1 12 23,3,可设前三小组的频率分别为可设前三小组的频率分别为x,x,2x,3x;2x,3x;由题意可知所求频率和为由题意可知所求频率和为1,1,即即x+2x+3x+(0.037+x+2x+3x+(0.037+0.013)0.013)5=1,5=1,解得解得x=0
8、.125,x=0.125,则则0.125= ,0.125= ,解得解得n=48.n=48.6n题组二题组二: :走进教材走进教材1.(1.(必修必修3P763P76例例1 1改编改编) )甲乙两名同学在高三的甲乙两名同学在高三的6 6次测试次测试的成绩统计如图的成绩统计如图, ,甲乙两组数据的平均数分别为甲乙两组数据的平均数分别为 、 , ,标准差分别为标准差分别为甲甲、乙乙, ,则则( () )x甲x乙A. ,A. ,甲甲乙乙B. ,B. 乙乙C. ,C. ,甲甲 ,D. ,甲甲乙乙x甲x乙x甲x乙x甲x乙x甲x乙【解析解析】选选C.C.由图可知由图可知, ,甲同学除第二次考试成绩略低甲同学
9、除第二次考试成绩略低于乙同学于乙同学, ,其他次考试都远高于乙同学其他次考试都远高于乙同学, ,可知可知 , ,图中数据显示甲同学的成绩比乙同学稳定图中数据显示甲同学的成绩比乙同学稳定, ,故故甲甲”连接连接).).【解析解析】根据频率分布直方图知根据频率分布直方图知, ,甲的数据的两端的数甲的数据的两端的数字较多字较多, ,离平均值较远离平均值较远, ,表现的最分散表现的最分散, ,标准差最大标准差最大; ;乙乙的数据的数据, ,分布均匀分布均匀, ,没有甲组偏离平均值的程度大没有甲组偏离平均值的程度大, ,标准标准差比甲组中的小差比甲组中的小; ;丙的数据绝大部分都集中在平均值左丙的数据绝
10、大部分都集中在平均值左右右, ,数据表现的最集中数据表现的最集中, ,标准差最小标准差最小. .故故s s1 1ss2 2ss3 3. .答案答案: :s s1 1ss2 2ss3 32.2.在一次歌咏比赛中在一次歌咏比赛中, ,七位裁判为一选手打出的分数如七位裁判为一选手打出的分数如下下:90,89,90,95,93,94,93.:90,89,90,95,93,94,93.去掉一个最高分和一个最低去掉一个最高分和一个最低分后分后, ,所剩数据的平均数与方差分别为所剩数据的平均数与方差分别为( () )A.92,2.8A.92,2.8B.92,2B.92,2C.93,2C.93,2D.93,2
11、.8D.93,2.8【解析解析】选选A.A.由题意所剩数据由题意所剩数据:90,90,93,94,93.:90,90,93,94,93.所以平均数所以平均数 = = 方差方差s s2 2= (90-92)= (90-92)2 2+(90-92)+(90-92)2 2+(93-92)+(93-92)2 2+(93-92)+(93-92)2 2+ +(94-92)(94-92)2 2=2.8.=2.8.x909093949392.5153.3.贵阳地铁贵阳地铁1 1号线号线1212月月2828日开通运营日开通运营, ,某机车某时刻从某机车某时刻从下麦西站驶往贵阳北站的过程中下麦西站驶往贵阳北站的过
12、程中,10,10个车站上车的人数个车站上车的人数统计如下统计如下:70,60,60,50,60,40,40,30,30,10,:70,60,60,50,60,40,40,30,30,10,则这组数则这组数据的众数、平均数、中位数的和为据的众数、平均数、中位数的和为 ( () )A.170A.170B.165B.165C.160C.160D.150D.150【解析解析】选选D.D.数据数据70,60,60,50,60,40,40,30,30,1070,60,60,50,60,40,40,30,30,10的的众数是众数是6060、中位数是、中位数是4545、平均数是、平均数是45,45,故众数、中
13、位数、故众数、中位数、平均数的和为平均数的和为150.150.4.AQI4.AQI是表示空气质量的指数是表示空气质量的指数,AQI,AQI指数值越小指数值越小, ,表明空表明空气质量越好气质量越好, ,当当AQIAQI指数值不大于指数值不大于100100时时, ,称空气质量为称空气质量为“优良优良”, ,如图是某市如图是某市4 4月月1 1日到日到1212日日AQIAQI指数值的统计指数值的统计数据数据, ,图中点图中点A A表示表示4 4月月1 1日的日的AQIAQI指数值为指数值为201,201,则下列叙则下列叙述不正确的是述不正确的是( () )A.A.这这1212天中有天中有6 6天空
14、气质量为天空气质量为“良良”B.B.这这1212天中有空气质量最好的是天中有空气质量最好的是4 4月月9 9日日C.C.这这1212天的天的AQIAQI指数值的中位数是指数值的中位数是9090D.D.从从4 4日到日到9 9日日, ,空气质量越来越好空气质量越来越好【解析解析】选选C.C.其中不大于其中不大于100100的共有的共有6 6个个, ,所以所以A A正确正确; ;从从4 4日到日到9 9日日AQIAQI指数值逐渐降低指数值逐渐降低, ,即空气质量越来越好即空气质量越来越好,9,9号最低号最低, ,所以所以B B、D D正确正确; ;把把1212个数据从小到大重新排列个数据从小到大重
15、新排列, ,即即67,72,77,85,92,95,104,111,135,138,144,201,67,72,77,85,92,95,104,111,135,138,144,201,可可得中位数为得中位数为 所以所以C C错误错误. .95 10499.52,5.5.已知数据已知数据x x1 1,x,x2 2,x,x1010,2,2的平均值为的平均值为2,2,方差为方差为1,1,则数则数据据x x1 1,x,x2 2,x,x1010相对于原数据相对于原数据( () )A.A.一样稳定一样稳定 B.B.变得比较稳定变得比较稳定C.C.变得比较不稳定变得比较不稳定D.D.稳定性不可以判断稳定性不
16、可以判断【解析解析】选选C.C.数据数据x x1 1,x,x2 2,x,x1010,2,2的平均值为的平均值为2,2,方差为方差为1,1,所以所以 (x(x1 1-2)-2)2 2+(x+(x2 2-2)-2)2 2+(x+(x1010-2)-2)2 2+(2-2)+(2-2)2 2=1,=1,数据数据x x1 1,x,x2 2,x,x1010的方差的方差s s2 2= = (x(x1 1-2)-2)2 2+(x+(x2 2-2)-2)2 2+(x+(x1010-2)-2)2 21,1,所以数据所以数据x x1 1,x,x2 2,x,x1010相对于原数据变得比较不稳定相对于原数据变得比较不稳
17、定. .111110【规律方法规律方法】众数、中位数、平均数、方差的意义及众数、中位数、平均数、方差的意义及常用结论常用结论(1)(1)平均数与方差都是重要的数字特征平均数与方差都是重要的数字特征, ,是对总体的一是对总体的一种简明的描述种简明的描述, ,它们所反映的情况有着重要的实际意义它们所反映的情况有着重要的实际意义, ,平均数、中位数、众数描述其集中趋势平均数、中位数、众数描述其集中趋势, ,方差和标准差方差和标准差描述波动大小描述波动大小. .(2)(2)方差的简化计算公式方差的简化计算公式:s:s2 2= = 或写成或写成s s2 2= = 即方差等于原数据平方即方差等于原数据平方
18、的平均数减去平均数的平方的平均数减去平均数的平方. .222212n1(xxx )nx ,n222212n1(xxx )x ,n考点二茎叶图及其应用考点二茎叶图及其应用【典例典例】(1)(1)某学校某学校A A、B B两个班的数学兴趣小组在一次两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下数学对抗赛中的成绩绘制茎叶图如下, ,通过茎叶图比较通过茎叶图比较两个班数学兴趣小组成绩的平均值及方差两个班数学兴趣小组成绩的平均值及方差A A班数学兴趣小组的平均成绩高于班数学兴趣小组的平均成绩高于B B班的平均成绩班的平均成绩B B班数学兴趣小组的平均成绩高于班数学兴趣小组的平均成绩高于A A
19、班的平均成绩班的平均成绩A A班数学兴趣小组成绩的标准差大于班数学兴趣小组成绩的标准差大于B B班成绩的标准班成绩的标准差差A A班数学兴趣小组成绩的标准差小于班数学兴趣小组成绩的标准差小于B B班成绩的标准班成绩的标准差差其中正确结论的编号为其中正确结论的编号为 ( () )A.A.B.B.C.C.D.D.(2)(2)某公司某公司1616个销售店某月销售产品数量个销售店某月销售产品数量( (单位单位: :台台) )的的茎叶图如图茎叶图如图, ,已知数据落在已知数据落在18,2218,22中的频率为中的频率为0.25,0.25,则则这组数据的中位数为这组数据的中位数为_._.【解析解析】(1)
20、(1)选选D.D.因为由已知中的茎叶图可得因为由已知中的茎叶图可得: : = (40+53+62+64+76+74+78+78+76+81+85+86+ = (40+53+62+64+76+74+78+78+76+81+85+86+88+82+92+95)=75.625,88+82+92+95)=75.625,xA116 = (40-75.625)= (40-75.625)2 2+(53-75.625)+(53-75.625)2 2+(62-75.625)+(62-75.625)2 2+ +(64-75.625)(64-75.625)2 2+(76-75.625)+(76-75.625)2 2
21、+(74-+(74-75.625)75.625)2 2+(78-75.625)+(78-75.625)2 2+(78-75.625)+(78-75.625)2 2+(76-+(76-75.625)75.625)2 2+(81-75.625)+(81-75.625)2 2+(85-75.625)+(85-75.625)2 2+(86-+(86-75.625)75.625)2 2+(88-75.625)+(88-75.625)2 2+(82-75.625)+(82-75.625)2 2+(92-+(92-75.625)75.625)2 2+(95-75.625)+(95-75.625)2 2198
22、.609 4198.609 42sA116 = (45+48+51+53+56+62+64+65+73+73+74+70+ = (45+48+51+53+56+62+64+65+73+73+74+70+83+82+91)=66,83+82+91)=66, = (45-66) = (45-66)2 2+(48-66)+(48-66)2 2+(51-66)+(51-66)2 2+(53-66)+(53-66)2 2+(56-+(56-66)66)2 2+(62-66)+(62-66)2 2+(64-66)+(64-66)2 2+(65-66)+(65-66)2 2+(73-66)+(73-66)2
23、 2+(73-+(73-66)66)2 2+(74-66)+(74-66)2 2+(70-66)+(70-66)2 2+(83-66)+(83-66)2 2+(82-66)+(82-66)2 2+(91-+(91-66)66)2 2=175.2,=175.2,xB1152sB115所以所以 , , , ,正确正确. .xA2sAxB2sB(2)(2)根据茎叶图中的数据知根据茎叶图中的数据知, ,数据落在数据落在18,2218,22中的频率为中的频率为0.25,0.25,则频数为则频数为16160.25=4,0.25=4,所以所以a2,a2,所以这组数据的中位数为所以这组数据的中位数为 (26+
24、28)=27.(26+28)=27.答案答案: :272712【误区警示误区警示】本题容易出现未能判断本题容易出现未能判断a a的大小的错误的大小的错误, ,应利用题目条件中的频率确定应利用题目条件中的频率确定a a的大小的大小. .【互动探究互动探究】 本例本例(2)(2)中中, ,若中位数为若中位数为27.5,27.5,试求试求a a的值的值. .【解析解析】因为一共有因为一共有1616个数据个数据, ,故中位数为第故中位数为第8 8、9 9个数个数字的平均数字的平均数, ,因为第因为第9 9个数为个数为28,28,又中位数为又中位数为27.5,27.5,故第故第8 8个数为个数为27,2
25、7,故故a=7.a=7.【规律方法规律方法】茎叶图的使用策略茎叶图的使用策略(1)(1)茎叶图的绘制需注意茎叶图的绘制需注意: :“叶叶”的位置只有一个数字的位置只有一个数字, ,而而“茎茎”的位置的数字的位置的数字位数一般不需要统一位数一般不需要统一; ;重复出现的数据要重复记录重复出现的数据要重复记录, ,不能遗漏不能遗漏, ,特别是特别是“叶叶”的位置上的数据的位置上的数据. .(2)(2)茎叶图通常用来记录两位数的数据茎叶图通常用来记录两位数的数据, ,可以用来分析可以用来分析单组数据单组数据, ,也可以用来比较两组数据也可以用来比较两组数据. .通过茎叶图可以通过茎叶图可以确定数据的
26、中位数确定数据的中位数, ,数据大致集中在哪个茎数据大致集中在哪个茎, ,数据是否数据是否关于该茎对称关于该茎对称, ,数据分布是否均匀等数据分布是否均匀等. .【对点训练对点训练】1.1.甲、乙两位射击运动员的甲、乙两位射击运动员的5 5次比赛成绩次比赛成绩( (单位单位: :环环) )如如茎叶图所示茎叶图所示, ,若两位运动员平均成绩相同若两位运动员平均成绩相同, ,则成绩较稳则成绩较稳定定( (方差最小方差最小) )的那位运动员的方差为的那位运动员的方差为( () )A.2A.2B.4B.4C.6C.6D.8D.8【解析解析】选选A.A.根据茎叶图中的数据知根据茎叶图中的数据知, ,甲、
27、乙二人的平甲、乙二人的平均成绩相同均成绩相同, ,即即 (87+89+90+91+93)= (87+89+90+91+93)= (88+89(88+89+90+91+90+x).+90+91+90+x).解得解得x=2,x=2,所以平均数为所以平均数为 =90;=90;根据茎叶图中的数据知根据茎叶图中的数据知甲的成绩波动性小甲的成绩波动性小, ,较为稳定较为稳定( (方差较小方差较小).).1515x甲成绩的方差为甲成绩的方差为s s2 2= = (88-90)(88-90)2 2+(89-90)+(89-90)2 2+(91-90)+(91-90)2 2+(90-90)+(90-90)2 2
28、+(92-+(92-90)90)2 2=2.=2.152.2.某校开展某校开展“爱我家乡爱我家乡”演讲比赛演讲比赛,9,9位评委给小明同位评委给小明同学打分的分数如茎叶图所示学打分的分数如茎叶图所示, ,记分员去掉一个最高分和记分员去掉一个最高分和一个最低分后一个最低分后, ,算得平均分为算得平均分为91,91,复核员在复核时复核员在复核时, ,发现发现有一个数字在茎叶图中的却无法看清有一个数字在茎叶图中的却无法看清, ,若记分员计算无若记分员计算无误误, ,则数字则数字x=_.x=_.【解析解析】由题意知去掉一个最低分由题意知去掉一个最低分88,88,若最高分为若最高分为94,94,去掉最高
29、分去掉最高分94,94,余下的余下的7 7个分数平均值是个分数平均值是91,91,即即 (89+89+92+93+90+x+92+91)=91,(89+89+92+93+90+x+92+91)=91,解得解得x=1.x=1.17若最高分为若最高分为(90+x)(90+x)分分, ,去掉最高分去掉最高分90+x,90+x,则余下的则余下的7 7个分个分数平均值是数平均值是: : (89+89+92+93+92+91+94)91,(89+89+92+93+92+91+94)91,不满不满足题意足题意. .答案答案: :1 117考点三频率分布直方图及其应用考点三频率分布直方图及其应用【明考点明考点
30、知考法知考法】 频率分布直方图是高考考查的重点频率分布直方图是高考考查的重点, ,试题在选择、试题在选择、填空、解答题中均有体现填空、解答题中均有体现, ,考查利用频率分布直方图估考查利用频率分布直方图估计样本的数字特征计样本的数字特征, ,考查学生数据分析、数学运算的能考查学生数据分析、数学运算的能力力. .命题角度命题角度1 1利用频率分布直方图求频率、频数利用频率分布直方图求频率、频数【典例典例】通常通常, ,满分为满分为100100分的试卷分的试卷,60,60分为及格线分为及格线. .若若某次满分为某次满分为100100分的测试卷分的测试卷,100,100人参加测试人参加测试, ,将这
31、将这100100人人的卷面分数按照的卷面分数按照24,36),36,48),84,96)24,36),36,48),84,96)分组后分组后绘制的频率分布直方图如图所示绘制的频率分布直方图如图所示. .由于及格人数较少由于及格人数较少, ,某位老师准备将每位学生的卷面得分采用某位老师准备将每位学生的卷面得分采用“开方乘以开方乘以1010取整取整”的方法进行换算以提高及格率的方法进行换算以提高及格率( (实数实数a a的取整的取整等于不超过等于不超过a a的最大整数的最大整数),),如如: :某位学生卷面某位学生卷面4949分分, ,则换则换算成算成7070分作为他的最终考试成绩分作为他的最终考
32、试成绩, ,则按照这种方式则按照这种方式, ,这这次测试的及格率将变为次测试的及格率将变为_._. 【解析解析】由题意可知低于由题意可知低于3636分的为不及格分的为不及格, ,若某位学若某位学生卷面生卷面3636分分, ,则换算成则换算成6060分作为最终成绩分作为最终成绩, ,由频率分布由频率分布直方图可得直方图可得24,36)24,36)组的频率为组的频率为0.0150.01512=0.18,12=0.18,所以所以这次测试的及格率为这次测试的及格率为1-0.18=0.82.1-0.18=0.82.答案答案: :0.820.82【状元笔记状元笔记】频数频数, ,频率的求法频率的求法(1)
33、(1)明确公式明确公式: :频率为小矩形面积频率为小矩形面积, ,频数等于样本数量乘频数等于样本数量乘以频率以频率. .(2)(2)灵活运用灵活运用: :频率和等于频率和等于1 1常作为隐含条件常作为隐含条件, ,注意应用注意应用. .命题角度命题角度2 2利用频率分布直方图估计数字特征利用频率分布直方图估计数字特征【典例典例】为征求个人所得税法修改建议为征求个人所得税法修改建议, ,某机构调查了某机构调查了10 00010 000名当地职工的月收入情况名当地职工的月收入情况, ,并根据所得数据画出并根据所得数据画出了样本的频率分布直方图了样本的频率分布直方图, ,下面三个结论下面三个结论:
34、:估计样本的中位数为估计样本的中位数为4 8004 800元元; ;如果个税起征点调整至如果个税起征点调整至5 0005 000元元, ,估计有估计有50%50%的当地职的当地职工会被征税工会被征税; ;根据此次调查根据此次调查, ,为使为使60%60%以上的职工不用缴纳个人所以上的职工不用缴纳个人所得税得税, ,起征点应调整至起征点应调整至5 2005 200元元. .其中正确结论的个数有其中正确结论的个数有 ( () )A.0A.0B.1B.1C.2C.2D.3D.3【解析解析】选选C.C.由已知中的频率分布直方图可得由已知中的频率分布直方图可得: :前两组的累积频率为前两组的累积频率为(
35、0.000 1+0.000 2)(0.000 1+0.000 2)1 000=0.31 000=0.30.5,0.5,1 000=0.550.5,故估计样本的中位数为故估计样本的中位数为4 000+1 0004 000+1 000 =4 800 =4 800元元; ;故故正确正确; ;由由得得: :如果个税起征点调整如果个税起征点调整0.20.25至至5 0005 000元元, ,估计有估计有45%45%的当地职工会被征税的当地职工会被征税; ;故故错误错误, ,根据此次调查根据此次调查, ,为使为使60%60%以上的职工不用缴纳个人所得税以上的职工不用缴纳个人所得税, ,起征点应调整至起征点
36、应调整至5 000+1 0005 000+1 000 =5 200( =5 200(元元).).故故正确正确. .0.050.25【状元笔记状元笔记】利用频率分布直方图求数字特征利用频率分布直方图求数字特征. .(1)(1)明确众数明确众数, ,中位数中位数, ,平均数的定义是关键平均数的定义是关键. .(2)(2)准确计算准确计算: :其中中位数其中中位数, ,平均数的计算较为复杂平均数的计算较为复杂, ,要要掌握其常见的运算技巧掌握其常见的运算技巧. .命题角度命题角度3 3频率分布直方图的综合应用频率分布直方图的综合应用【典例典例】从某食品厂生产的面包中抽取从某食品厂生产的面包中抽取10
37、0100个个, ,测量这测量这些面包的一项质量指标值些面包的一项质量指标值, ,由测量结果得如下频数分布由测量结果得如下频数分布表表: :质量指标值质量指标值分组分组75,85)75,85) 85,95)85,95) 95,105)95,105) 105,115)105,115) 115,125)115,125)频数频数8 82222373728285 5(1)(1)在相应位置上作出这些数据的频率分布直方图在相应位置上作出这些数据的频率分布直方图; ;(2)(2)估计这种面包质量指标值的平均数估计这种面包质量指标值的平均数 ( (同一组中的同一组中的数据用该组区间的中点值作代表数据用该组区间的
38、中点值作代表););x(3)(3)根据以上抽样调查数据根据以上抽样调查数据, ,能否认为该食品厂生产的能否认为该食品厂生产的这种面包符合这种面包符合“质量指标值不低于质量指标值不低于8585的面包至少要占的面包至少要占全部面包全部面包90%90%的规定的规定”? ? 【解析解析】(1)(1)由频率分布表画出频率分布直方图由频率分布表画出频率分布直方图: :(2)(2)质量指标值的样本平均数为质量指标值的样本平均数为 =80=800.08+900.08+900.220.22+100+1000.37+1100.37+1100.28+1200.28+1200.05=100,0.05=100,所以这种
39、面包质量指标值的平均数的估计值为所以这种面包质量指标值的平均数的估计值为100.100.x(3)(3)质量指标值不低于质量指标值不低于8585的面包所占比例的估计值为的面包所占比例的估计值为0.22+0.37+0.28+0.05=0.920.22+0.37+0.28+0.05=0.92由于该估计值大于由于该估计值大于0.9,0.9,故故可以认为该食品厂生产的这种面包符合可以认为该食品厂生产的这种面包符合“质量指标值质量指标值不低于不低于8585的面包至少要占全部面包的的面包至少要占全部面包的90%90%的规定的规定”. . 【状元笔记状元笔记】关于统计综合性题目关于统计综合性题目(1)(1)掌
40、握频率分布直方图和茎叶图的绘制掌握频率分布直方图和茎叶图的绘制(2)(2)综合利用频率分布直方图和茎叶图的相关性质综合利用频率分布直方图和茎叶图的相关性质. .【对点练对点练找规律找规律】 1.1.为了解学生在课外活动方面的支出情况为了解学生在课外活动方面的支出情况, ,抽取了抽取了n n个个同学进行调查同学进行调查, ,结果显示这些学生的支出金额结果显示这些学生的支出金额( (单位单位: :元元) )都在都在10,50,10,50,其中支出金额在其中支出金额在30,5030,50的学生有的学生有117117人人, ,频率分布直方图如图所示频率分布直方图如图所示, ,则则n=n=( () )A
41、.180A.180B.160B.160C.150C.150D.200D.200【解析解析】选选A.30,50A.30,50对应的频率为对应的频率为1-(0.01+0.025)1-(0.01+0.025)10=0.65,10=0.65,所以所以n= =180.n= =180.1170.652.2.某学校随机抽查了本校某学校随机抽查了本校2020名同学名同学, ,调查他们平均每天调查他们平均每天在课外从事体育锻炼的时间在课外从事体育锻炼的时间( (分钟分钟),),根据所得数据的茎根据所得数据的茎叶图叶图, ,以以5 5为组距将数据分为八组为组距将数据分为八组, ,分别是分别是0,5),5,10),
42、0,5),5,10),35,40,35,40,作出的频率分布直方图如图所示作出的频率分布直方图如图所示, ,则原始的则原始的茎叶图可能是茎叶图可能是( () )【解析解析】选选C.C.由频率分布直方图可得由频率分布直方图可得,25,30),30,35),25,30),30,35)的频率相同的频率相同, ,频数为频数为3.3.3.3.供电部门对某社区供电部门对某社区1 0001 000位居民位居民20162016年年1111月份人均月份人均用电情况进行统用电情况进行统 计后计后, ,按人均用电量分为按人均用电量分为0,10), 0,10), 10,20),20,30),30,40),40,501
43、0,20),20,30),30,40),40,50五组五组, ,整理得到如整理得到如图的频率分布直方图图的频率分布直方图, ,则下列说法错误的是则下列说法错误的是( () )A.11A.11月份人均用电量人数最多的一组有月份人均用电量人数最多的一组有400400人人B.11B.11月份人均用电量不低于月份人均用电量不低于2020度的有度的有500500人人C.11C.11月份人均用电量为月份人均用电量为2525度度D.D.在这在这1 0001 000位居民中任选位居民中任选1 1位协助收费位协助收费, ,选到的居民用选到的居民用电量在电量在30,40)30,40)一组的概率为一组的概率为 11
44、0【解析解析】选选C.C.根据频率分布直方图知根据频率分布直方图知, ,1111月份人均用电量人数最多的一组是月份人均用电量人数最多的一组是10,20),10,20),有有1 0001 0000.040.0410=40010=400人人,A,A正确正确;11;11月份人均用电量不低于月份人均用电量不低于2020度的频率是度的频率是(0.03+0.01+0.01)(0.03+0.01+0.01)10=0.5,10=0.5,有有1 0001 0000.50.5=500=500人人, ,所以所以B B正确正确;11;11月份人均用电量为月份人均用电量为5 50.1+150.1+15 0.4+250.
45、4+250.3+350.3+350.1+450.1+450.1=22,0.1=22,所以所以C C错误错误; ;在这在这1 0001 000位居民中任选位居民中任选1 1位协助收费位协助收费, ,用电量在用电量在30,40)30,40)一一组的频率为组的频率为0.1,0.1,估计所求的概率为估计所求的概率为 , ,所以所以D D正确正确. . 110数学能力系列数学能力系列2626计算数字特征过程中的数学运算、计算数字特征过程中的数学运算、数据分析能力数据分析能力【能力诠释能力诠释】 数据分析、数学运算是数学的核心素养数据分析、数学运算是数学的核心素养, ,也是数学也是数学应用于实际生活问题的
46、核心应用于实际生活问题的核心, ,提取提取- -计算计算- -应用数据是数应用数据是数学能力的重要体现学能力的重要体现. .【典例典例】对某小区对某小区100100户居民的月均用水量进行统计户居民的月均用水量进行统计, ,得到样本的频率分布直方图得到样本的频率分布直方图, ,则估计此样本的众数、中则估计此样本的众数、中位数分别为位数分别为( () )A.2.25,2.5A.2.25,2.5 B.2.25,2.02B.2.25,2.02C.2,2.5C.2,2.5D.2.5,2.25D.2.5,2.25【解析解析】选选B.B.由频率分布直方图可知由频率分布直方图可知, ,数据在数据在2,2.52
47、,2.5之间的面积最大之间的面积最大, ,因此众数集中在因此众数集中在2,2.52,2.5内内, ,用区间用区间2,2.52,2.5的中点值来表示的中点值来表示, ,所以众数为所以众数为2.25.2.25.第一组的频率为第一组的频率为0.080.080.5=0.04,0.5=0.04,对应的频数为对应的频数为0.040.04100=4,100=4,第二组的频率为第二组的频率为0.160.160.5=0.08,0.5=0.08,对应的频数对应的频数为为0.080.08100=8,100=8,第三组的频率为第三组的频率为0.300.300.5=0.15,0.5=0.15,对应对应的频数为的频数为0
48、.150.15100=15,100=15,第四组的频率为第四组的频率为0.440.440.5 0.5 =0.22,=0.22,对应的频数为对应的频数为0.220.22100=22,100=22,第五组的频率为第五组的频率为0.500.500.5=0.25,0.5=0.25,对应的频数为对应的频数为0.250.25100=25,100=25,前四组前四组的频数之和为的频数之和为4+8+15+22=49,4+8+15+22=49,所以中位数为第所以中位数为第5 5组的第组的第一个数据与第二个数据的平均数一个数据与第二个数据的平均数, ,则对应的中位数在则对应的中位数在5 5组内且比组内且比2 2大
49、一点大一点, ,故故2.022.02比较适合比较适合. .【技法点拨技法点拨】 关于样本数字特征的计算和分析关于样本数字特征的计算和分析(1)(1)要掌握各种数字特征要掌握各种数字特征, ,特别是在频率分布直方图中特别是在频率分布直方图中的定义的定义, ,其中中位数和平均数的定义容易混淆其中中位数和平均数的定义容易混淆, ,可以通可以通过训练加深理解过训练加深理解. .(2)(2)此类题目往往运算量比较大此类题目往往运算量比较大, ,可以通过提取公因式可以通过提取公因式, ,合并相同数据等运算技巧简化运算合并相同数据等运算技巧简化运算, ,提高运算的准确性提高运算的准确性. .【即时训练即时训
50、练】20192019年某企业员工有年某企业员工有500500人参加人参加“学雷锋学雷锋”志愿活动志愿活动, ,按年龄分组按年龄分组: :第第1 1组组25,30),25,30),第第2 2组组30,35),30,35),第第3 3组组35,40),35,40),第第4 4组组40,45),40,45),第第5 5组组45,50),45,50),得到的频率分得到的频率分布直方图如图所示布直方图如图所示. .现在要从年龄较小的第现在要从年龄较小的第1,3,41,3,4组中组中用分层抽样的方法抽取用分层抽样的方法抽取1616人人, ,则在第则在第4 4组抽取的人数为组抽取的人数为( () )A.3A