《黄冈名师2020版高考数学大一轮复习11.2用样本估计总体课件理新人教A版.ppt》由会员分享,可在线阅读,更多相关《黄冈名师2020版高考数学大一轮复习11.2用样本估计总体课件理新人教A版.ppt(104页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二节用样本估计总体(全国卷5年2考),【知识梳理】1.常用统计图表(1)频率分布表的画法:第一步:求_,决定组数和组距,组距=_;,极差,第二步:_,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.,分组,(2)频率分布直方图:反映样本频率分布的直方图.如图:,2.样本的数字特征如果有n个数据x1,x2,xn,那么这n个数的(1)平均数=_.(2)标准差s=_.,(3)方差s2=_,【常用结论】1.必记结论(1)众数的估计值是最高矩形底边中点的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.,
2、(3)中位数的估计值的左边和右边小矩形的面积和是相等的.,2.常用公式(1)若数据x1,x2,xn的平均数是,则mx1+a,mx2+a,mxn+a的平均数是m+a.(2)若数据x1,x2,xn的方差为s2,则ax1+b,ax2+b,axn+b的方差为a2s2,标准差为as.,【基础自测】题组一:走出误区1.判断正误(正确的打“”,错误的打“”)(1)作频率分布直方图时,组数越多越能准确反映样本的频率分布.(),(2)利用频率分布直方图计算的样本数字特征是样本数字特征的估计值.()(3)在众数、中位数、平均数中,众数可以反映更多的关于样本数据全体的信息.(),提示:(1).组数太多或太少都不能准
3、确反映样本的频率分布.(2).由频率分布直方图的制作和特征可知正确.(3).任何一个样本数据的改变都会引起平均数的改变,因此平均数反映更多的关于样本数据全体的信息.,2.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则()A.=4,s22C.4,s24,s22,【解析】选A.由题意知平均数为没变,方差s2变小.,3.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为123,第1小组的频数为6,则报考飞行员的学生人数是(),A.36B.40C.48D.50,【解析
4、】选C.设报考飞行员的人数为n,根据前3个小组的频率之比为123,可设前三小组的频率分别为x,2x,3x;由题意可知所求频率和为1,即x+2x+3x+(0.037+0.013)5=1,解得x=0.125,则0.125=,解得n=48.,题组二:走进教材1.(必修3P76例1改编)甲乙两名同学在高三的6次测试的成绩统计如图,甲乙两组数据的平均数分别为、,标准差分别为甲、乙,则(),A.乙C.,甲,甲乙,【解析】选C.由图可知,甲同学除第二次考试成绩略低于乙同学,其他次考试都远高于乙同学,可知,图中数据显示甲同学的成绩比乙同学稳定,故甲”连接).,【解析】根据频率分布直方图知,甲的数据的两端的数字
5、较多,离平均值较远,表现的最分散,标准差最大;乙的数据,分布均匀,没有甲组偏离平均值的程度大,标准差比甲组中的小;丙的数据绝大部分都集中在平均值左右,数据表现的最集中,标准差最小.故s1s2s3.答案:s1s2s3,2.在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为()A.92,2.8B.92,2C.93,2D.93,2.8,【解析】选A.由题意所剩数据:90,90,93,94,93.所以平均数=方差s2=(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)
6、2=2.8.,3.贵阳地铁1号线12月28日开通运营,某机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数、平均数、中位数的和为()A.170B.165C.160D.150,【解析】选D.数据70,60,60,50,60,40,40,30,30,10的众数是60、中位数是45、平均数是45,故众数、中位数、平均数的和为150.,4.AQI是表示空气质量的指数,AQI指数值越小,表明空气质量越好,当AQI指数值不大于100时,称空气质量为“优良”,如图是某市4月1日到12日AQI指数值的统计数据,图
7、中点A表示4月1日的AQI指数值为201,则下列叙述不正确的是(),A.这12天中有6天空气质量为“良”B.这12天中有空气质量最好的是4月9日C.这12天的AQI指数值的中位数是90D.从4日到9日,空气质量越来越好,【解析】选C.其中不大于100的共有6个,所以A正确;从4日到9日AQI指数值逐渐降低,即空气质量越来越好,9号最低,所以B、D正确;把12个数据从小到大重新排列,即67,72,77,85,92,95,104,111,135,138,144,201,可得中位数为所以C错误.,5.已知数据x1,x2,x10,2的平均值为2,方差为1,则数据x1,x2,x10相对于原数据()A.一
8、样稳定B.变得比较稳定C.变得比较不稳定D.稳定性不可以判断,【解析】选C.数据x1,x2,x10,2的平均值为2,方差为1,所以(x1-2)2+(x2-2)2+(x10-2)2+(2-2)2=1,数据x1,x2,x10的方差s2=(x1-2)2+(x2-2)2+(x10-2)21,所以数据x1,x2,x10相对于原数据变得比较不稳定.,【规律方法】众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.,(2)方差的简化计算公式:s2=或写成s2
9、=即方差等于原数据平方的平均数减去平均数的平方.,考点二茎叶图及其应用【典例】(1)某学校A、B两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两个班数学兴趣小组成绩的平均值及方差,A班数学兴趣小组的平均成绩高于B班的平均成绩B班数学兴趣小组的平均成绩高于A班的平均成绩A班数学兴趣小组成绩的标准差大于B班成绩的标准差A班数学兴趣小组成绩的标准差小于B班成绩的标准差,其中正确结论的编号为()A.B.C.D.,(2)某公司16个销售店某月销售产品数量(单位:台)的茎叶图如图,已知数据落在18,22中的频率为0.25,则这组数据的中位数为_.,【解析】(1)选D.因为由已知
10、中的茎叶图可得:=(40+53+62+64+76+74+78+78+76+81+85+86+88+82+92+95)=75.625,=(40-75.625)2+(53-75.625)2+(62-75.625)2+(64-75.625)2+(76-75.625)2+(74-75.625)2+(78-75.625)2+(78-75.625)2+(76-75.625)2+(81-75.625)2+(85-75.625)2+(86-75.625)2+(88-75.625)2+(82-75.625)2+(92-75.625)2+(95-75.625)2198.6094,=(45+48+51+53+56+
11、62+64+65+73+73+74+70+83+82+91)=66,=(45-66)2+(48-66)2+(51-66)2+(53-66)2+(56-66)2+(62-66)2+(64-66)2+(65-66)2+(73-66)2+(73-66)2+(74-66)2+(70-66)2+(83-66)2+(82-66)2+(91-66)2=175.2,所以,正确.,(2)根据茎叶图中的数据知,数据落在18,22中的频率为0.25,则频数为160.25=4,所以a2,所以这组数据的中位数为(26+28)=27.答案:27,【误区警示】本题容易出现未能判断a的大小的错误,应利用题目条件中的频率确定a
12、的大小.,【互动探究】本例(2)中,若中位数为27.5,试求a的值.【解析】因为一共有16个数据,故中位数为第8、9个数字的平均数,因为第9个数为28,又中位数为27.5,故第8个数为27,故a=7.,【规律方法】茎叶图的使用策略(1)茎叶图的绘制需注意:“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.,(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.,【对点训练】1.甲、乙两位射击
13、运动员的5次比赛成绩(单位:环)如茎叶图所示,若两位运动员平均成绩相同,则成绩较稳定(方差最小)的那位运动员的方差为(),A.2B.4C.6D.8,【解析】选A.根据茎叶图中的数据知,甲、乙二人的平均成绩相同,即(87+89+90+91+93)=(88+89+90+91+90+x).解得x=2,所以平均数为=90;根据茎叶图中的数据知甲的成绩波动性小,较为稳定(方差较小).,甲成绩的方差为s2=(88-90)2+(89-90)2+(91-90)2+(90-90)2+(92-90)2=2.,2.某校开展“爱我家乡”演讲比赛,9位评委给小明同学打分的分数如茎叶图所示,记分员去掉一个最高分和一个最低
14、分后,算得平均分为91,复核员在复核时,发现有一个数字在茎叶图中的却无法看清,若记分员计算无误,则数字x=_.,【解析】由题意知去掉一个最低分88,若最高分为94,去掉最高分94,余下的7个分数平均值是91,即(89+89+92+93+90+x+92+91)=91,解得x=1.,若最高分为(90+x)分,去掉最高分90+x,则余下的7个分数平均值是:(89+89+92+93+92+91+94)91,不满足题意.答案:1,考点三频率分布直方图及其应用【明考点知考法】频率分布直方图是高考考查的重点,试题在选择、填空、解答题中均有体现,考查利用频率分布直方图估计样本的数字特征,考查学生数据分析、数学
15、运算的能力.,命题角度1利用频率分布直方图求频率、频数【典例】通常,满分为100分的试卷,60分为及格线.若某次满分为100分的测试卷,100人参加测试,将这100人的卷面分数按照24,36),36,48),84,96)分组后绘制的频率分布直方图如图所示.由于及格人数较少,某位老师准备将每位学生的卷面得分采用“开方乘以10取整”的方法进行换算以提高及格率(实数a的取整等于不超过a的最大整数),如:某位学生卷面49分,则换算成70分作为他的最终考试成绩,则按照这种方式,这次测试的及格率将变为_.,【解析】由题意可知低于36分的为不及格,若某位学生卷面36分,则换算成60分作为最终成绩,由频率分布
16、直方图可得24,36)组的频率为0.01512=0.18,所以这次测试的及格率为1-0.18=0.82.答案:0.82,【状元笔记】频数,频率的求法(1)明确公式:频率为小矩形面积,频数等于样本数量乘以频率.(2)灵活运用:频率和等于1常作为隐含条件,注意应用.,命题角度2利用频率分布直方图估计数字特征【典例】为征求个人所得税法修改建议,某机构调查了10000名当地职工的月收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:估计样本的中位数为4800元;如果个税起征点调整至5000元,估计有50%的当地职工会被征税;根据此次调查,为使60%以上的职工不用缴纳个人所得税,起征点应调
17、整至5200元.,其中正确结论的个数有()A.0B.1C.2D.3,【解析】选C.由已知中的频率分布直方图可得:前两组的累积频率为(0.0001+0.0002)1000=0.30.5,故估计样本的中位数为4000+1000=4800元;故正确;由得:如果个税起征点调整,至5000元,估计有45%的当地职工会被征税;故错误,根据此次调查,为使60%以上的职工不用缴纳个人所得税,起征点应调整至5000+1000=5200(元).故正确.,【状元笔记】利用频率分布直方图求数字特征.(1)明确众数,中位数,平均数的定义是关键.(2)准确计算:其中中位数,平均数的计算较为复杂,要掌握其常见的运算技巧.,
18、命题角度3频率分布直方图的综合应用【典例】从某食品厂生产的面包中抽取100个,测量这些面包的一项质量指标值,由测量结果得如下频数分布表:,(1)在相应位置上作出这些数据的频率分布直方图;(2)估计这种面包质量指标值的平均数(同一组中的数据用该组区间的中点值作代表);,(3)根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包90%的规定”?,【解析】(1)由频率分布表画出频率分布直方图:,(2)质量指标值的样本平均数为=800.08+900.22+1000.37+1100.28+1200.05=100,所以这种面包质量指标值的平均数的估计值为10
19、0.,(3)质量指标值不低于85的面包所占比例的估计值为0.22+0.37+0.28+0.05=0.92由于该估计值大于0.9,故可以认为该食品厂生产的这种面包符合“质量指标值不低于85的面包至少要占全部面包的90%的规定”.,【状元笔记】关于统计综合性题目(1)掌握频率分布直方图和茎叶图的绘制(2)综合利用频率分布直方图和茎叶图的相关性质.,【对点练找规律】1.为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在10,50,其中支出金额在30,50的学生有117人,频率分布直方图如图所示,则n=(),A.180B.160C.150D.200,
20、【解析】选A.30,50对应的频率为1-(0.01+0.025)10=0.65,所以n=180.,2.某学校随机抽查了本校20名同学,调查他们平均每天在课外从事体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是0,5),5,10),35,40,作出的频率分布直方图如图所示,则原始的茎叶图可能是(),【解析】选C.由频率分布直方图可得,25,30),30,35)的频率相同,频数为3.,3.供电部门对某社区1000位居民2016年11月份人均用电情况进行统计后,按人均用电量分为0,10),10,20),20,30),30,40),40,50五组,整理得到如图的频率分布直
21、方图,则下列说法错误的是(),A.11月份人均用电量人数最多的一组有400人B.11月份人均用电量不低于20度的有500人C.11月份人均用电量为25度D.在这1000位居民中任选1位协助收费,选到的居民用电量在30,40)一组的概率为,【解析】选C.根据频率分布直方图知,11月份人均用电量人数最多的一组是10,20),有10000.0410=400人,A正确;11月份人均用电量不低于20度的频率是(0.03+0.01+0.01)10=0.5,有10000.5=500人,所以B正确;11月份人均用电量为50.1+150.4+250.3+350.1+450.1=22,所以C错误;在这,1000位
22、居民中任选1位协助收费,用电量在30,40)一组的频率为0.1,估计所求的概率为,所以D正确.,数学能力系列26计算数字特征过程中的数学运算、数据分析能力,【能力诠释】数据分析、数学运算是数学的核心素养,也是数学应用于实际生活问题的核心,提取-计算-应用数据是数学能力的重要体现.,【典例】对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图,则估计此样本的众数、中位数分别为()A.2.25,2.5B.2.25,2.02C.2,2.5D.2.5,2.25,【解析】选B.由频率分布直方图可知,数据在2,2.5之间的面积最大,因此众数集中在2,2.5内,用区间2,2.5的中点值来表示,
23、所以众数为2.25.第一组的频率为0.080.5=0.04,对应的频数为0.04100=4,第二组的频率为0.160.5=0.08,对应的频数,为0.08100=8,第三组的频率为0.300.5=0.15,对应的频数为0.15100=15,第四组的频率为0.440.5=0.22,对应的频数为0.22100=22,第五组的频率为0.500.5=0.25,对应的频数为0.25100=25,前四组的频数之和为4+8+15+22=49,所以中位数为第5组的第,一个数据与第二个数据的平均数,则对应的中位数在5组内且比2大一点,故2.02比较适合.,【技法点拨】关于样本数字特征的计算和分析(1)要掌握各种
24、数字特征,特别是在频率分布直方图中的定义,其中中位数和平均数的定义容易混淆,可以通过训练加深理解.(2)此类题目往往运算量比较大,可以通过提取公因式,合并相同数据等运算技巧简化运算,提高运算的准确性.,【即时训练】2019年某企业员工有500人参加“学雷锋”志愿活动,按年龄分组:第1组25,30),第2组30,35),第3组35,40),第4组40,45),第5组45,50),得到的频率分布直方图如图所示.现在要从年龄较小的第1,3,4组中用分层抽样的方法抽取16人,则在第4组抽取的人数为(),A.3B.6C.4D.8,【解析】选B.根据频率分布直方图,得第1,3,4组的频率之比为0.020.080.06=143,所以用分层抽样的方法抽取16人时,在第4组应抽取的人数为16=6.,