《2024版新教材高考数学一轮复习第9章统计与统计案例第1节随机抽样学案含解析新人教A版20230519179.doc》由会员分享,可在线阅读,更多相关《2024版新教材高考数学一轮复习第9章统计与统计案例第1节随机抽样学案含解析新人教A版20230519179.doc(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2024版新教材高考数学一轮复习第9章统计与统计案例第1节随机抽样学案含解析新人教A版20230519179第9章 统计与统计案例课程标准命题解读1.理解随机抽样的必要性和重要性2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样的方法3.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点4.理解样本数据标准差的意义和作用,会计算数据标准差,并给出合理解释5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题7.会作两个有关联变
2、量的数据的散点图,会利用散点图认识变量间的相关关系8.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程9.通过典型案例了解独立性检验(只要求22列联表)的思想、方法,并能初步应用独立性检验的思想、方法解决一些简单的实际问题.考查形式:一般为一个选择题或填空题和一个解答题,或与概率交汇命题考查内容:随机抽样及应用,众数、中位数、百分位数、平均数(期望)、方差与标准差的计算,用样本估计总体,统计图表,独立性检验、回归分析等备考策略:(1)从核心素养的高度把握核心知识,掌握样本频率分布图表的识图和用图,会计算样本的数字特征,掌握独立性检验与回归分析的一般步骤同时也要从对应的数学
3、学科素养角度进行整体把握(2)用思维导图理清知识之间的关系,将零散的知识合成一个系统,理解知识点之间的相互关系(3)注重与概率知识的交互应用,不要把二者人为地割裂开来,总体把握二者的应用和联系(4)解决相关问题注重通法通性,注重数学本质,强调基础性、综合性,淡化解题技巧,融入数学文化,实际生产生活的应用核心素养:数据分析、数学运算.第一节 随机抽样一、教材概念结论性质重现1简单随机抽样(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽
4、取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(2)最常用的简单随机抽样方法有两种抽签法和随机数法(3)应用范围:总体个体数较少2分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配(2)如果总体分为两层,两
5、层包含的个体数分别为M和N,抽取的样本量分别为m和n,两层的样本平均数分别为,两层的总体平均数分别为,总体平均数为,样本平均数为.则,.(3)在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数.两种抽样方法的特点、联系及适用范围类别简单随机抽样分层随机抽样共同点抽样过程中每个个体被抽到的可能性相等.各自特点从总体中逐个抽取将总体分成几层,分层进行抽取联系各层抽样时,采用简单随机抽样适用范围总体个数较少总体由差异明显的几部分组成二、基本技能思想活动体验1判断下列说法的正误,对的打“”,错的打“”(1)简单随机抽样是一种不放回抽样()(2)简单随机抽样的每个个体被抽到的机会不一样,与先
6、后有关()(3)抽签法中,先抽的人抽中的可能性大()(4)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关()2某公司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人为调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取的人数为()A33,34,33 B25,56,19 C20,40,30 D30,50,20B解析:因为12528095255619,所以抽取的人数分别为25,56,19.3在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析在这个问题中,5 000名居民的
7、阅读时间的全体是()A总体 B个体C样本容量 D从总体中抽取的一个样本A解析:由题目条件知,5 000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.4某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和分层随机抽样,则最合适的抽样方法是_分层随机抽样解析:因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层随机抽样,才能了解到不同年龄段的客户对公司服务的客观评价5一个公司共有
8、N名员工,下设一些部门,要采用等比例分层随机抽样的方法,从全体员工中抽取样本容量为n的样本已知某部门有m名员工,那么从该部门抽取的员工人数是_解析:每个个体被抽到的概率是,设这个部门抽取了x个员工,则,故x.考点1统计中的基本概念、数据获取基础性1为了了解某省高考数学考试的情况,抽取2 000名考生的数学试卷进行分析,2 000叫做(C)A个体 B样本 C样本容量 D总体2为了考查某班学生的身高情况,从中抽取20名学生进行身高测算,下列说法正确的是(D)A这个班级的学生是总体B抽测的20名学生是样本C抽测的20名学生的身高的全体就是总体D样本容量是20要考查的对象的全体叫做总体,每一个考查对象
9、叫做个体,抽取的考查对象的集体叫做样本所有的个体构成了总体,样本取决于总体,样本是总体的一部分,没有个体就没有总体,样本的特征反映了总体的相应特征考点2简单随机抽样及其应用综合性(1)下列抽取样本的方式属于简单随机抽样的个数为()从无限多个个体中抽取100个个体作为样本;从20件玩具中一次性抽取3件进行质量检验;某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛A0 B1 C2 D3A解析:不是简单随机抽样因为被抽取样本的总体的个数是无限的,而不是有限的不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取不是简单随机抽样因为不是等可能抽样故选A(2)总体由编号为01,02,19
10、,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始,由左到右依次选取两个数字,则选出来的第5个个体的编号为()A08 B07 C02 D01D解析:从第1行第5列和第6列组成的数65开始,由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.(1)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;等可能抽取(2)简单随机抽样一般有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况)假设要考查某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机
11、数表抽取样本时,将800袋牛奶按000,001,799进行编号若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是_(下面摘取了随机数表第7行至第9行)第7行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 第8行:63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 第9行:33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00
12、 13 42 99 66 02 79 54068解析:由随机数表知,前4个样本的个体编号分别是331,572,455,068.考点3分层随机抽样综合性考向1求总体或样本容量(1)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层随机抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A12 B18 C24 D36D解析:根据分层随机抽样方法知,解得n36.(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层随机抽样的方法从中抽取一个容量为80的样本进行质量检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为_件1 800解析:由
13、题设,抽样比为.设甲设备生产的产品为x件,则50,所以x3 000.故乙设备生产的产品总数为4 8003 0001 800.考向2分层随机抽样的均值某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为235.现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况(1)试写出抽样过程;(2)若样本中3个区的高中学生的平均视力分别为4.8,4.8,4.6,试估计该市高中学生的平均视力解:(1)由于该市高中学生的视力有差异,按3个区分成三层,用分层随机抽样法抽取样本确定每层抽取的个体数,在3个区分别抽取的学生人数之比也是235,所以抽取的学生人数分别是20040,20
14、060,200100.在各层分别按简单随机抽样法抽取样本综合每层抽样,组成容量为200的样本(2)样本中高中学生的平均视力为4.84.84.64.7.所以估计该市高中学生的平均视力约为4.7.分层随机抽样均值的计算如果总体分为两层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,两层的总体平均数分别为,总体平均数为,样本平均数为,那么,.某校高二年级“化生史”组合只有2个班,且每班50人在一次数学测试中,从两个班抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为_分1
15、08解析:样本中40名学生的平均分为110106108(分),所以估计该组合学生的平均分为108分第二节 用样本估计总体一、教材概念结论性质重现1频率分布直方图(1)频率分布表的画法第一步:求极差,决定组数和组距,组距;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率2频率分布折线图频率分布折线图:用线段连接频率分布直方图中各个矩形上面一边的中点,就得到频率分布折线图频率分布直方图中的常见结论(1)众数的估计值
16、为最高矩形的中点对应的横坐标(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和(3)中位数的估计值的左边和右边的小矩形的面积和是相等的3中位数、众数、平均数、百分位数(1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(2)众数一组数据中出现次数最多的数据称为这组数据的众数(3)平均数一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,xn的平均数(x1x2xn)(4)百分位数第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至
17、少有(100p)%的数据大于或等于这个值计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据第2步,计算inp%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数4样本的数字特征如果有n个数据x1,x2,xn,那么平均数为(x1x2xn),标准差为s,方差为s2(x1)2(x2)2(xn)2(1)若数据x1,x2,xn的平均数为,则mx1a,mx2a,mx3a,mxna的平均数是ma.(2)若数据x1,x2,xn的方差为s2,则数据ax1b,ax2b,axnb的方差为a2s2.二、基本技能思想
18、活动体验1判断下列说法的正误,对的打“”,错的打“”(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的方差越大,说明这组数据越集中()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大()2一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A4 B8 C12 D16B解析:设频数为n,则0.25,所以n328.3数据12,14,15,17,19,23,27,30的第70百分位数是()A14 B17 C19 D23D解析:因为870%5.6,所以第70百分位数是第六项数据23.4若某校高一年级8个班参加合唱比赛的得分
19、分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()A91.5和91.5 B91.5和92C91和91.5 D92和92A解析:因为这组数据为87,89,90,91,92,93,94,96,所以中位数是91.5,平均数91.5.故选A5已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形若中间一个小矩形的面积等于其余(n1)个小矩形面积和的,则该组的频数为_50解析:设除中间一个小矩形外的(n1)个小矩形面积的和为p,则中间一个小矩形面积为p.由题意,得pp1,所以p,则中间一个小矩形的面积为p,20050,即该组的频数为50.考点1频率分布直方
20、图综合性某市为了了解人们对“经济内循环”的认知程度,对不同年龄和不同职业的人举办了一次“经济内循环”知识竞赛,满分为100分(90分及以上为认知程度高)现从参赛者中抽取了x人,按年龄分成5组,第一组:20,25),第二组:25,30),第三组:30,35),第四组:35,40),第五组:40,45,得到如图所示的频率分布直方图,已知第一组有6人(1)求x.(2)求抽取的x人的年龄的中位数(结果保留整数)(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为15组从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加
21、知识竞赛,分别代表相应组的成绩,年龄组中15组的成绩分别为93,96,97,94,90,职业组中15组的成绩分别为93,98,94,95,90.()分别求5个年龄组和5个职业组成绩的平均数和方差;()以上述数据为依据,评价5个年龄组和5个职业组对“经济内循环”的认知程度,并谈谈你的感想解:(1)根据频率分布直方图,得第一组的频率为0.0150.05,所以0.05,所以x120.(2)设中位数为a,则0.0150.075(a30)0.060.5,解得a32,则中位数为32.(3)()5个年龄组成绩的平均数为1(9396979490)94,方差为s(1)2223202(4)26.5个职业组成绩的平
22、均数为2(9398949590)94,方差为s(1)2420212(4)26.8.()从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可)1频率分布直方图的性质(1)小长方形的面积组距频率;(2)各小长方形的面积之和等于1;(3)小长方形的高,所有小长方形的高的和为.2要理解并记准频率分布直方图与众数、中位数、百分位数及平均数的关系1(多选题)(2020嘉祥县第一中学高三模拟)在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为40,50),50,60),60,70),70,80),80,90),90,10
23、0),60分以下视为不及格若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是()A成绩在70,80)的考生人数最多B不及格的考生人数为1 000C考生竞赛成绩的平均分约为70.5分D考生竞赛成绩的中位数为75分ABC解析:由频率分布直方图可得,成绩在70,80)的频率最高,因此考生人数最多,故A正确;成绩在40,60)的频率为0.01100.015100.25,因此,不及格的人数为4 0000.251 000,故B正确;考生竞赛成绩的平均分约为450.1550.15650.2750.3850.15950.170.5,故C正确;因为成绩在40,70)的频率为0.45,在70,80)的频
24、率为0.3,所以中位数为701071.67,故D错误2某车间加工零件的数量x与加工时间y的统计数据如表:零件数x(个)911141516加工时间y(分钟)3032364042该车间的负责人作出散点图,发现x,y是线性相关的,并求出y关于x的线性回归方程x(其中b是常数)据此回归模型可以预测,加工20个零件所需要的加工时间约为()A45分钟 B46分钟 C47分钟 D48分钟D解析:由题意,根据表中的数据,可得(911141516)13,(3032364042)36,即样本中心点为(13,36)将样本中心点(13,36)代入回归方程,可得3613,解得,所以回归方程为x,当x20时,2047.9
25、448(分钟)考点2统计图表综合性(1)(多选题)(2020德州一模)某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表,则下面叙述正确的是() A样本中女生人数多于男生人数B样本中B层人数最多C样本中E层男生人数为6D样本中D层男生人数多于女生人数ABC解析:样本中女生人数为924159360,男生人数为1006040,A正确样本中A层人数为94010%13;样本中B层人数为244030%36;样本中C层人数为154025%25;样本中D层人数为94020%17;样本中E层人数为34015%9,B正确
26、样本中E层次男生人数为4015%6,C正确样本中D层次男生人数为4020%8,女生人数为9,女生人数多于男生人数,D错误(2)(多选题)(2020临沂一模)某同学在微信上查询到近十年全国高考报名人数、录取人数和山东夏季高考报名人数的折线图,其中2019年的录取人数被遮挡了他又查询到近十年全国高考录取率的散点图,结合图表中的信息判定下列说法正确的是()A全国高考报名人数逐年增加B2018年全国高考录取率最高C2019年高考录取人数约为820万D2019年山东高考报名人数在全国的占比最小BCD解析:2016年的人数少于2015年人数,A错误;2018年的录取率为81.1%,为最高,B正确;2019
27、年高考录取人数为1 03179.5%820,C正确;从20102019年山东高考报名人数在全国的占比分别为6.9%,6.3%,5.6%,5.5%,5.9%,7.4%,6.4%,6.2%,6.1%,5.4%,D正确统计图表问题的解决方法(1)首先要准确地识图,即要明确统计图表中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等;(2)其次要准确地用图,会根据统计图表中的数字计算样本的数字特征,会用统计图表估计总体1(2020鹤壁二模)中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的.下图是2014年到
28、2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是()A每相邻两年相比较,2014年到2015年铁路运营里程增加最显著B从2014年到2018年这5年,高铁运营里程与年份正相关C2018年高铁运营里程比2014年高铁运营里程增长80%以上D从2014年到2018年这5年,高铁运营里程数依次成等差数列D解析:选项A,B显然正确;对于C,0.8,选项C正确;1.6,1.9,2.2,2.5,2.9不是等差数列,故D错误故选D2甲、乙、丙三家企业产品的成本分别为10 000,12 000,15 000,其成本构成如图所示,则关于这三家企业下列说法错误的是()A成本最大的企业是丙企
29、业B费用支出最高的企业是丙企业C支付工资最少的企业是乙企业D材料成本最高的企业是丙企业C解析:甲企业的成本为10 000;乙企业的成本为12 000;丙企业的成本为15 000.故成本最大的是丙企业,故A正确甲企业费用支出为10 0005%500;乙企业费用支出为12 00017%2 040;丙企业费用支出为15 00015%2 250.故费用支出最高的企业是丙企业,故B正确甲企业支付工资为10 00035%3 500;乙企业支付工资为12 00030%3 600;丙企业支付工资为15 00025%3 750.故甲企业支付的工资最少,故C错误甲企业材料成本为10 00060%6 000;乙企业
30、材料成本为12 00053%6 360;丙企业材料成本为15 00060%9 000.故材料成本最高的企业是丙企业,故D正确故选C考点3样本的数字特征综合性(1)(2020德州一模)某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是() A甲得分的极差是11B乙得分的中位数是18.5C甲运动员得分有一半在区间20,30上D甲运动员得分的平均值比乙运动员得分的平均值高D解析:甲得分的极差是28919,A错误;乙得分的中位数是16.5,B错误;甲运动员得分在区间20,30上有3个,C错误;甲运动员得分的平均值为17,乙
31、运动员得分的平均值为16,故D正确(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_2解析:甲(8791908993)90,乙(8990918892)90,s甲(8790)2(9190)2(9090)2(8990)2(9390)24,s乙(8990)2(9090)2(9190)2(8890)2(9290)22.因为42,所以乙的成绩较为稳定,其方差为2.1平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差
32、、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定2用样本估计总体,就是利用样本的数字特征来描述总体的数字特征1已知某7个数的平均数为4,方差为2.现加入一个新数据4,此时这8个数的平均数为,方差为s2,则()A4,s22C4,s24,s22A解析:因为某7个数的平均数为4,所以这7个数的和为4728.因为加入一个新数据4,所以4.又因为这7个数的方差为2,且加入一个新数据4,所以这8个数的方差s22.故选A2已知甲、乙两组数据:甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.若这两组数据的第30百分位数、第80百分位数分别相等,则等于()A B C DA解析:因为30%61.8,80%64.8,所以第30百分位数为n28,第80百分位数为m48,所以.