《2021版新高考数学一轮复习第9单元统计与统计案例9.2用样本估计总体课件新人教A版.pptx》由会员分享,可在线阅读,更多相关《2021版新高考数学一轮复习第9单元统计与统计案例9.2用样本估计总体课件新人教A版.pptx(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、9.29.2用样本估计总体用样本估计总体-2-知识梳理考点自诊1.统计图表(1)频率分布直方图的画法步骤求极差(即一组数据中与的差);决定与;将数据;列;画 .(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.总体密度曲线:随着样本容量的增加,作图时增加,减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息.最大值 最小值组距组数分组频率分布表频率分布直方图中点所分组数组距-3-知识梳理考点自诊(3)茎叶图:茎叶图中茎是指的一列数,
2、叶是从茎的_生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.(4)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.中间旁边-4-知识梳理考点自诊2.样本的数字特征 最多中间平均数相等-5-知识梳理考点自诊3.标准差、方差的实际意义:标准差和方差都反映了样本数据的离散程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.-6-知
3、识梳理考点自诊1.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.-7-知识梳理考点自诊1.判断下列结论是否正确,正确的画“”,错误的画“”.(1)平均数、众数与中位数都可以描述数据的集中趋势. ()(2)一组数据的方差越大,说明这组数据的波动越大. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大. ()(4)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只
4、记一次. ()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. ()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数. () -8-知识梳理考点自诊2.(2018全国1,文3)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:-9-知识梳理考点自诊则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了
5、经济收入的一半A解析解析:设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为20.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B、C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,故D正确,故选A.-10-知识梳理考点自诊3.(2019安徽联考,4)如图给出的是2017年11月2018年11月某工厂工业原油产量的月度走势图,则以下说法正确的是()A.2018年11月份原油产量约为51.8万吨B.2018年11月份原油产量相对2017年11月增加1.0%C.2018年11月份原油
6、产量比上月减少54.9万吨D.2018年111月份原油的总产量不足15 000万吨C-11-知识梳理考点自诊解析:由题意得,2018年11月份原油的日均产量为51.8吨,则11月份原油产量为51.830=1 554万吨.10月份原油产量为51.931=1 608.9万吨,故A错误;2018年11月份原油产量的同比增速为-1.0%,原油产量相对2017年11月份减少1.0%,故B错误;又11月份原油产量比上月减少1 608.9-1 554=54.9万吨,则C正确;111月份共334天,而111月份日均原油产量都超过50万吨,故111月份原油产量的总产量会超过15 000万吨,故D错误.故选C.-
7、12-知识梳理考点自诊4.(2019辽宁沈阳八模,6)在某次数学测验后,将参加考试的500名学生的数学成绩制成频率分布直方图(如图),则在该次测验中成绩不低于100分的学生数是()A.210B.205C.200D.195C解析:由频率分布直方图可知,低于100分的人数的频率为(0.012+0.018+0.030)10=0.6,所以低于100分的人数为5000.6=300,则不低于100分的人数为500-300=200,故选C.-13-知识梳理考点自诊5.(2019江苏盐城市一中、建湖高中、阜宁中学、滨海中学四校联考,5)某校连续5天对同学们穿校服的情况进行统计,没有穿校服的人数用茎叶图表示,如
8、图,若该组数据的平均数为18,则x=.8-14-考点1考点2考点3频率分布直方图及其应用例1(2019河南信阳联考,19)如图是某单位职工的月收入情况画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息,解答下列问题.(1)为了分析职工的收入与年龄、学历等方面的关系,必须从样本中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在1 500,2 000)的这组中应抽取多少人?(2)试估计样本数据的中位数与平均数.-15-考点1考点2考点3-16-考点1考点2考点3解题心得频率分布直方图的性质.-17-考点1考点2考点3对点训练1(1)(2019河北衡水质检,5
9、)某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在40,90之间,其得分的频率分布直方图如图所示,则下列结论错误的是()A.得分在40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在60,80)的概率为0.5C.估计得分的众数为55D.这100名参赛者得分的中位数为65D-18-考点1考点2考点3(2)(多选)某地某所高中2019年的高考考生人数是2016年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2016年和2019年的高考升学情况,得到如下柱状图:则下列结论正确的是()A.与2016年相比,2019年一本
10、达线人数有所增加B.与2016年相比,2019年二本达线人数增加了0.5倍C.与2016年相比,2019年艺体达线人数相同D.与2016年相比,2019年不上线的人数有所增加AD-19-考点1考点2考点3-20-考点1考点2考点3茎叶图的应用例2(1)(2019四川泸州高三三诊,5)军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图,并给出下列4个结论:(1)甲的平均成绩比乙的平均成绩高;(2)甲的成绩的极差是29;(3)乙的成绩的众数是21;(4)乙的成绩的中位数是18.则
11、这4个结论中,正确结论的个数为()A.1B.2C.3D.4C -21-考点1考点2考点3(2)(2019湖北孝感二模,5)从A,B两种玉米苗中各抽25株,分别测得它们的株高如图所示(单位:mm).根据数据估计()A.A种玉米比B种玉米不仅长得高而且长得整齐B.B种玉米比A种玉米不仅长得高而且长得整齐C.A种玉米比B种玉米长得高但长势没有B整齐D.B种玉米比A种玉米长得高但长势没有A整齐C -22-考点1考点2考点3解析:(1)根据茎叶图知甲的平均成绩为21.4,乙的平均成绩为16.9,因此(1)对;甲的成绩的极差是37-8=29,(2)对;乙的成绩的众数是21,(3)对;乙的成绩的中位数是 =
12、18.5,(4)错,故选C.(2)根据茎叶图中的数据分布情况,得A种玉米的株高数据大部分分布在下方,所以平均数大;但B种玉米数据的分布集中在中间位置,说明方差小,所以A种玉米比B种玉米长得高但长势没有B整齐,故选C.-23-考点1考点2考点3思考如何制作茎叶图?使用茎叶图统计数据有什么优缺点?如何用茎叶图估计样本数据特征?解题心得1.一般制作茎叶图的方法是将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序由上到下列出.2.茎叶图的优缺点如下:(1)优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况.(2)缺点
13、:样本数据较多或数据位数较多时,不方便表示数据.3.对于给定两组数据的茎叶图,可根据“重心”下移者平均数较大,数据集中者方差较小来估计数字特征.-24-考点1考点2考点3对点训练2(1)(2019广东东莞二调,4)有24名投资者想到某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为124号,再用系统抽样方法抽出6名投资者,邀请他们到实地进行考察.其中年龄不超过55岁的人数为()A.1B.2C.3D.4B -25-考点1考点2考点3(2)(2019山东质检,6)某中学数学竞赛培训班共有10人,分为甲,乙两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,已知甲组5名同学成绩的平
14、均数为81,乙组5名同学成绩的中位数为73,则x-y的值为()A.2B.-2C.3D.-3D-26-考点1考点2考点3解析:(1)样本间隔为246=4,年龄不超过55岁的有8人,则需要抽取84=2人,故选B.(2)根据茎叶图中的数据,得甲班5名同学成绩的平均数为 (72+77+80+x+86+90)=81,解得x=0;又乙班5名同学的中位数为73,则y=3;x-y=0-3=-3.故选D.-27-考点1考点2考点3样本的数字特征及其应用例3(1)(2019全国2,5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7
15、个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差A-28-考点1考点2考点3(2)(2019江西上饶二模,3)甲、乙两人在相同的条件下投篮5轮,每轮甲、乙各投篮10次,投篮命中次数的情况如图所示(实线为甲的折线图,虚线为乙的折线图),则以下说法错误的是 ()A.甲投篮命中次数的众数比乙的小B.甲投篮命中次数的平均数比乙的小C.甲投篮命中次数的中位数比乙的大D.甲投篮命中的成绩比乙的稳定B-29-考点1考点2考点3-30-考点1考点2考点3(2)由折线图可知,甲投篮5轮,命中的次数分别为5,8,6,8,8,乙投篮5轮,命中的次数分别为3,7,9,5,9,则甲
16、投篮命中次数的众数为8,乙投篮命中的众数为9,所以A正确;甲投篮命中次数的平均数为7,乙投篮命中的平均数为6.6,所以B不正确;甲投篮命中次数的中位数为8,乙投篮命中的中位数为7,所以C正确;甲投篮命中次数的数据集中在平均数的左右,方差较小,乙投篮命中的次数数据比较分散,方差较大,所以甲的成绩更稳定一些,所以D正确,故选B.-31-考点1考点2考点3思考众数、中位数、平均数及方差的意义有什么不同?解题心得1.众数、中位数、平均数及方差的意义:(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述;(2)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.2.平均数、方差的公式
17、推广:数据x1+b,x2+b,xn+b的方差也为s2;数据ax1,ax2,axn的方差为a2s2.-32-考点1考点2考点3对点训练3(1)若x1,x2,x2 021的平均数为3,方差为4,且yi=-2(xi-2),i=1,2,2 021,则新数据y1,y2,y2 021的平均数和标准差分别为()A.-4-4B.-416C.28D.-24(2)(2019河南郑州质检,7)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是()A.12B.14C.16D.18DA-33-考点1考点2考点3-34-考点1考点2考点3-35-考点1考点2考点31.
18、两个易误点(1)易忽视频率分布直方图中纵轴表示的应为 .(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中“茎”与“叶”的含义.2.众数、中位数和平均数的异同-36-考点1考点2考点33.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.4.频率与频率比-37-考点1考点2考点3不要搞混直方图与条形图:(1)条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示
19、各组的组距,因此其高度与宽度均有意义.(2)由于分组数据具有连续性,因此直方图的各矩形通常是连续排列,而条形图则是分开排列.-38-数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,并形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型,对信息进行分析、推断,获得结论.在数据分析核心素养的形成过程中,学生能够提升数据处理的能力,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯,积累依托数据探索事物本质、关联和规律的活动经验.-39-角度一对生产、生活中的问题的分析例1(2019广东天河二模,5)为保证树苗的质量,林业管理部门在每年3月12
20、日植树节前都对树苗进行检测,现从甲、乙两种树苗中各抽测了10株树苗的高度(单位长度:cm),其茎叶图如图所示,则下列描述正确的是()A.甲种树苗的平均高度大于乙种树苗的平均高度,甲种树苗比乙种树苗长得整齐B.甲种树苗的平均高度大于乙种树苗的平均高度,乙种树苗比甲种树苗长得整齐C.乙种树苗的平均高度大于甲种树苗的平均高度,乙种树苗比甲种树苗长得整齐D.乙种树苗的平均高度大于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐-40-答案:D解析:由茎叶图中的数据,我们可得甲、乙两种树苗抽取的样本高度分别为:甲:19,20,21,23,25,29,31,32,33,37;乙:10,10,14,26,27
21、,30,44,46,46,47.由已知易得故乙种树苗的平均高度大于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐.故选D.-41-思考茎叶图的特征数字与生活、生产中的优劣关系是什么?如何解此类问题?解题心得1.茎叶图中两组数据的平均数和稳定程度,平均数要进行计算,稳定程度可通过计算方差或通过数据排布形状作出比较.数据的离散程度与茎叶图形状的关系具体如下:茎叶图中各组数据越往中间集中,表示数据离散度越小,其标准差越小;茎叶图中各组数据越往两边离散,表示数据离散度越大,其标准差越大.2.解此类应用题的关键在于读懂题意,并从统计图表中得到解题的条件和信息,然后再根据要求进行求解.-42-对点训练1(
22、2019黑龙江哈尔滨模拟,19)某校高三文科500名学生参加了3月份的高考模拟考试,学校为了了解高三文科学生的历史、地理学习情况,从500名学生中抽取100名学生的成绩进行统计分析,抽出的100名学生的地理、历史成绩如下表:-43-若历史成绩在80,100区间的占30%,(1)求m,n的值;(2)请根据上面抽出的100名学生地理、历史成绩,填写下面地理、历史成绩的频数分布表:根据频数分布表中的数据估计历史和地理的平均成绩及方差(同一组数据用该组区间的中点值作代表),并估计哪个学科成绩更稳定.-44-45-角度二对生产、生活做出估计例2(2018全国1,19)某家庭记录了未使用节水龙头50天的日
23、用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:-46-(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图: (2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)-47-解 (1)-48-49-解题心得该题考查的是有关统计的问题,涉及的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,只要认真审题,细心运算,仔细求解,就可以得出正确结果.-50-
24、对点训练2(2019广西桂林三模,19)2019年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1 000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:(1)求频率分布直方图中a的值;(2)以频率作为概率,试求消费者月饼购买量在600 g1 400 g的概率;-51-(3)已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1 000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?-52-解: (1)由(0.000
25、2+0.000 55+a+0.000 5+0.000 25)400=1,解得a=0.001.(2)消费者月饼购买量在600 g1 400 g的频率为(0.000 55+0.001)400=0.62,消费者月饼购买量在600 g1 400 g 的概率为0.62.(3)由频率分布直方图得人均月饼购买量为(4000.000 2+8000.000 55+1 2000.001+1 6000.000 5+2 0000.000 25)400=1 208 g,201 2085%=1 208(万克)=12.08(吨),该超市应准备12.08吨月饼恰好能满足市场需求.-53-反思提升1.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.频率分布表在数量表示上比较准确,频率分布直方图比较直观.2.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以所有小长方形的面积的和等于1.