《考点55 随机抽样、用样本估计总体-备战2021年新高考数学一轮复习考点一遍过.docx》由会员分享,可在线阅读,更多相关《考点55 随机抽样、用样本估计总体-备战2021年新高考数学一轮复习考点一遍过.docx(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、考点55随机抽样、用样本估计总体【命题解读】 随机抽样、用样本估计总体在高考中是出题频率比较高,其中抽样方法容易出选择题,频率分布直方图考的比较多,常结合样本的数字特征出题,这部分出题比较灵活,多结合目前的实际问题出题,考查分析问题的能力,以及处理数据的能力。【命题预测】预计2021年的高考随机抽样还会出题,出题形式可以是选择、填空,也可以是解答,在解答题中常与概率等联合出题,考查分析问题能力和计算能力。【复习建议】 1.掌握各种抽样方法,理解频率分布直方图;2.理解样本的数字特征,并会计算数字特征。考向一随机抽样的方法1.简单随机抽样(1)抽取方式:逐个不放回抽取; (2)每个个体
2、被抽到的概率相等; (3)常用方法: 抽签法和随机数法. 2.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样. 1. 【2020全国高三专题练习】某人从一鱼池中捕得120条鱼,做了记号后再放回池中,经过一段时间后,再从该鱼池中捕得100,经过发现有记号的鱼有10条(假定该鱼池中鱼的数量既不减少也不增加)则池中大约有鱼( )A120B1000条C130条D1200条【答
3、案】D【解析】设池中有大鱼约x条,则由题意可知,解得,故池中大鱼约有1200条故选:D.2. 【2020全国高三专题练习】某地区有高中生人,初中生有人,小学生人,此地区教育部门为了了解本地区中小学生的近视情况及形成原因,要从本地区的中小学生中抽取部分学生进行调查,已知抽取的高中生人数为人,则该地区教育部门共抽取了人进行调查( )ABCD【答案】D【解析】由地区高中生人,初中生有人,小学生人,设共抽取了人,若抽取的高中生人数为人,根据分层抽样知:,解之得,故选:D考向二 样本的数字特征1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数;
4、160;(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加, 组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.样本的数字特征(1)众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数 众数通常用于描述变量的值出现次数最多的数,但它对其他数据信息的忽视比较明显,使它
5、无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,xn,那么这n个数的平均数x=x1+x2+xnn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低(2)标准差、方差标准差:样本数据到平均数的一种平均距离,一般用s表示,s= 1n(x1-x)2+(x2-x)2+(xn-x)2,其中xi(i=1,2,3,
6、n)是样本数据,n是样本容量,x是样本平均数. 方差:标准差的平方s2.s2=1n(x1-x)2+(x2-x)2+(xn-x)2.1.【2020全国高三专题练习】为了评估某家快递公司的服务质量,某评估小组进行了客户满意度调查,从该公司参与调查的客户中随机抽取500名客户的评分,评分均在区间上,分组为,其频率分布直方图如图所示.规定评分在60分以下表示对该公司的服务质量不满意,则这500名客户中对该公司的服务质量不满意的客户的人数为( )A15B16C17D18【答案】A【解析】由频率分布直方图可知,评分在区间上的频率为,所以评分在区间上的客户有(人),即对该公司的服务质量不满意的客户
7、有15人.故选:A2. 【2020天津耀华中学高一期末】已知一组数据的频率分布直方图如图所示,则众数、中位数、平均数分别为( )ABCD【答案】B【解析】由频率分布直方图可知,众数为;由,所以面积相等的分界线为65,即中位数为65;平均数为故选:B3. 【2020全国高三专题练习】演讲比赛共有10位评委分别给出某选手的原始评分,评定该选手的成绩时,从10个原始评分中去掉1个最高分、1个最低分,得到8个有效评分8个有效评分与10个原始评分相比,不变的数字特征是( )A中位数B平均数C方差D极差【答案】A【解析】设10位评委评分按从小到大排列为,则原始中位数为,去掉最低分,最高分,后剩余,中位数仍
8、为,A正确原始平均数,后来平均数,平均数受极端值影响较大,与不一定相同,B不正确;,由易知,C不正确原极差,后来极差可能相等可能变小,D不正确故选:A.题组一(真题在线)1. 【2020年高考全国卷文数】设一组样本数据x1,x2,xn的方差为0.01,则数据10x1,10x2,10xn的方差为A0.01B0.1C1D102. 【2020年高考江苏】已知一组数据的平均数为4,则的值是 3. 【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为A10 B18 C20 D364. 【2020
9、年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是ABCD5. 【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球从盒中随机取球,每次取1个,不放回,直到取出红球为止设此过程中取到黄球的个数为,则_,_6. 【2019年高考全国卷文数】西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共有80位,阅读过西游记且阅读过红楼梦的学生共有60位,则该校阅读过西游记
10、的学生人数与该校学生总数比值的估计值为A0.5B0.6C0.7 D0.87. 【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是_8. 【2019年高考全国卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70(1)求乙离子残留百分比直
11、方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)9. 【2020年高考全国卷文数】某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级ABCD频数40
12、202020乙分厂产品等级的频数分布表等级ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?10. 【2019年高考浙江卷】复数(为虚数单位),则=_11. 【2019年高考江苏卷】已知复数的实部为0,其中为虚数单位,则实数a的值是_题组二1. 【2020四川内江市高三三模】为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组有关数据见表(单位:人)高校相关人数抽取人数A18xB362C54y若从高校B、C抽取的
13、人中选2人作专题发言,则这二人都来自高校C的概率为( )ABCD2. 【2020河北沧州市高三期中】2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在内,按通行时间分为,五组,频率分布直方图如图所示,其中通行时间在内的车辆有235台,则通行时间在内的车辆台数是( )A450B325C470D5003. 【2020全国高二某校】高二年级共有800名学生参加了数学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生
14、的数学成绩分组如:,得到的频率分布直方图如图所示,则下列说法中正确的是( );这800名学生中数学成绩在110分以下的人数为160; 这800名学生数学成绩的中位数约为121.4;这800名学生数学成绩的平均数为125.ABCD4. 【2020全国高三专题练习】某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2019年1月至2019年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的折线图根据折线图,下列结论正确的是( )A月跑步平均里程的中位数为6月份对应的里程数B月跑步平均里程逐月增加C月跑步平均里程高峰期大致在89月份D1月至5月的月跑步平均里程相对于6月至
15、11月,波动性更小,变化比较平稳5. 【2020全国高三专题练习(理)】设样本数据,的均值和方差分别为和,若 (为非零常数,),则,的均值和标准差为( )A,B,C,D,6. 【2020全国高三专题练习(理)】甲、乙、丙、丁四名同学在某次军训射击测试中,各射击10次四人测试成绩对应的条形图如下:以下关于四名同学射击成绩的数字特征判断不正确的是( )A平均数相同B中位数相同C众数不完全相同D丁的方差最大 7. 【2020吉林市第二中学高三期中】已知样本方差,则样本的方差为_.8. 【2020全国高三专题练习】为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的认
16、为作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为 .9. 【2020齐齐哈尔市第八中学校高二期中(理)】如表是某位同学连续5次周考的数学、物理的成绩,结果如下:周次12345数学(x分)7981838587物理(y分)7779798283参考公式:,表示样本均值.(1)求该生5次月考数学成绩的平均分和物理成绩的方差;(2)一般来说,学生的数学成绩与物理成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程.10. 【2020全国高三月考】从某市的一次高三模拟考试中,抽取3000名考生的数学成绩(单位:分),并按, , , ,
17、,分成7组,制成频率分布直方图,如图所示()估计这3000名考生数学成绩的平均数和方差 (同一组中的数据用该组区间的中点值作代表);()由直方图可认为该市考生数学成绩服从正态分布,其中,分别为()估中的和方差,据此估计该市10000名考生中数学成绩不低于122分的人数(结果精确到整数)附:若,则题组一1.C【解析】因为数据的方差是数据的方差的倍,所以所求数据方差为故选:C2. 2【解析】数据的平均数为4,即.故答案为:2.3. B【解析】根据直方图,直径落在区间之间的零件频率为:,则区间内零件的个数为:.故选:B.4. B【解析】对于A选项,该组数据的平均数为,方差为;对于B选项,该组数据的平
18、均数为,方差为;对于C选项,该组数据的平均数为,方差为;对于D选项,该组数据的平均数为,方差为.因此,B选项这一组标准差最大.故选:B.5. 【解析】因为对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,所以,随机变量,所以.故答案为:.6. C【解析】由题意得,阅读过西游记的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7故选C7. 【解析】由题意,该组数据的平均数为,所以该组数据的方差是8. 见解析【解析】(1)由已知得,故(2)甲离子残留百分比的平均值的估计值为乙离子残留百分比的平均值的估计值为9. 见解析【解析】(1)由试加工产品等级的频数分布
19、表知,甲分厂加工出来的一件产品为A级品的概率的估计值为;乙分厂加工出来的一件产品为A级品的概率的估计值为.(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润6525575频数40202020因此甲分厂加工出来的100件产品的平均利润为.由数据知乙分厂加工出来的100件产品利润的频数分布表为利润7030070频数28173421因此乙分厂加工出来的100件产品的平均利润为.比较甲乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.题组二1.B【解析】由题意可得,解得,所以从高校中抽取3人,记从高校抽取的2人为,从高校抽取的3人为,则从高校,抽取的5人中选2人作专题发言的基本事件有
20、:,,共10种,选中的2人都来自高校的基本事件有,共3种,故所求概率.故选:B.2.C【解析】因为,四组通行时间的频率分别是0.1,0.25,0.4,0.05,所以通行时间在内的频率是,通过的车辆台数是故选:C3.B【解析】由题意,解得,错;110分以下的人数为,正确;120分以下的频率是,设中位数为,则,正确;总均分为,错故选:B4. D【解析】由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,低的有1,2,3,4,5,7,8共7个月,故6月份对应里程数不是中位数,因此A不正确 ;月跑步平均里程在1月到2月,7月到8月,10月到11都是减少的,故不是逐月增加,因此B不正确;
21、月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,因此C不正确;从折线图来看,1月至5月的跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,因此D正确.故选:D.5.B【解析】设样本数据的均值为,方程为,标准差为s,则新样本的均值为,方差为,标准差为,所以,所以标准差为,所以,故选:B.6.D【解析】由图的对称性可知,平均数都为;由图易知,四组数据的众数不完全相同,中位数相同;记甲、乙、丙、丁图所对应的方差分别为,则, ,所以丙的方差最大故选:D7. 4【解析】由题意,样本数据的方差,设样本的方差为,则.故答案为:4.8. 10【解析】设样本数据为:若样本数据中的最大值为11,不妨设,由于样本数据互不相同,与这是不可能成立的,若样本数据为4,6,7,8,10,代入验证知两式均成立,此时样本数据中的最大值为 109. 见解析【解析】(1)数学成绩的平均分为,因为物理成绩的平均分为,所以物理成绩的方差;(2)由已知数据得,所以,所以,所以两个变量x、y的线性回归方程为.10. 见解析【解析】()由题意知:,()由()可知,所以,而,所以,因此估计该市10000名考生中数学成绩不低于122分的人数为