《高考专题概率和统计【理】(解析版).pdf》由会员分享,可在线阅读,更多相关《高考专题概率和统计【理】(解析版).pdf(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、专题3 2概率和统计【理】十年大数据*全景展示年 份题号考 点考 查 内 容2011理2概率古典概型的概率计算理19频数分布表频数分布表,频率与概率2012理15正态分布正态分布的应用理19离散型随机变量及其分布列频数分布表,频率与概率,离散型随机变量及其分布列2013卷1理3抽样方法随机抽样方法的简单应用理19离散型随机变量分布列、期望独立重复事件发生的概率,离散型随机变量分布列、期望卷2理14概率古典概型的概率计算理19概率古典概型的概率计算2014卷1理5概率古典概型的概率计算理18频率分布直方图,正态分布频率分布直方图,正态分布的3 b原则,二项分布的期望卷2理5概率条件概率的计算理1
2、9变量间的相关关系线性回归方程及其应用2015卷1理4概率独立重复事件概率的计算,互斥事件的概率理19变量间的相关关系非线性拟合;线性回归方程卷2理3统计统计知识,柱形图理18茎叶图茎叶图及其应用,互斥事件和独立事件的概率计算2016卷1理4概率几何概型概率的计算理19离散型随机变量分布列、期望条形统计图及其应用,离散型随机变量分布列、期望卷2理10概率几何概型概率的计算理19离散型随机变量的分布列、期望条件概率、离散型随机变量的分布列、期望卷3理4统计平均数的计算,统计图及其应用理18变量间的相关关系线性相关与线性回归方程的求法与应用2017卷1理2概率古典概型的概率计算理19离散性随机变量
3、的分布列、期望离散性随机变量的分布列、期望,正态分布卷2理13离散性随机变量的分布列、期望离散性随机变量的分布列、期望,正态分布理18频率分布直方图,统计案例频率分布直方图及其应用,统计案例及其应用卷3理3统计折线图统计图的应用理18离散型随机变量的分布列、期望频数分布表,离散型随机变量的分布列、数学期望2018卷1理3统计扇形统计图及其应用理10概率几何概型概率的计算,数学文化理2。离散性随机变量的数学期望次独立重复试验恰好发生攵次的概率及其最值问题,二项分布,离散性随机变量的数学期望卷2理8概率古典概型的概率计算理18变量间的相关关系线性回归方程及其应用卷3理8二项分布二项分布分布列及期望
4、理18茎叶图和独立性检验茎叶图的应用,统计案例及其应用2019卷1理6概率古典概型的概率计算理15概率独立重复事件的概率卷2理5统计中位数、平均数、方差、极差理13概率利用统计数据进行概率的估计理18概率独立事件、互斥事件的概率计算卷3理3统计抽样数据的统计理17频率分布直方图频率分布直方图,用样本平均数估计总体的平均数2020卷1理5变量间的相关关系由散点图选择合适的回归模型理19概率独立事件、互斥事件及独立重复事件概率的计算卷2理14排列与组合计数原理的应用,排列与组合应用题的解法理18变量间的相关关系平均数的估计,相关系数的计算,抽样方法的选取卷3理3统计标准差的计算理18独立性检验统计
5、案例及其应用大数据分析*预测高考考 点出现频率2021年预测考 点107随机抽样23次 考1次2021年在选择题和填空题中仍会重点考查各种统计图表、古典概型或儿何概型及其概率计算,在解答题中重点考查频率分布直方图及其应用(与概率相结合),离散性随机变量的分布列与均值,二项分布及其应用,统计案例及其应用.考 点108用样本估计总体23次 考10次考 点109变量间的相关关系2 3次考7次考 点110随机事件的概率、古典概型、几何概型2 3次考2 0次考 点111离散型随机变量及其分布列、均值与方差、正态分布、二项分布2 3次考14次考 点112独立性检验2 3次考4次十年试题分类*探求规律考点1
6、 0 7随机抽样1.(2 0 1 7 江苏理)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为2 0 0,4 0 0,3 0 0,1 0 0 件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取6 0 件进行检验,则应从丙种型号的产品中抽取 件.【答案】1 8【解析】应从内种型号的产品中抽取6 0 x 二丫匕=1 8 件.1 0 0 02.(2 0 1 4 广东理)为了解1 0 0 0 名学生的学习情况,采用系统抽样的方法,从中抽取容量为4 0 的样本,则分段的间隔为()A.5 0 B.4 0 C.2 5 D.2 0【答案】C【解析】i l l =2 5,可得分段的间隔为2 5
7、.故选C.4 03.(2 0 1 4 湖南理)对一个容器为N 的总体抽取容量为的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为由,色,2 3,则()A.P|=P 2,=1,/=1则下面四种情形中,对应样本的标准差最大的一组是()A.P=P4=0.1,=“3=0.4 B.P P4=0.4,P2=P3=01C.P=P4=0.2,“2 二 ”3=0.3 D.P P4=0.3,p?=P3=0.2【答案】B【解析】对于A选 项,该组数据的平均数为X =(l+4)x0.1+(2+3)x0.4=2.5,方差为=(1 -2.5)2 x 0.1+(2-2.5
8、)2 x0.4+(3-2.5)2 x0.4+(4-2.5)2 x0.1 =0.65;对于 B 选项,该组数据的平均数 为 司=(l+4)x0.4+(2+3)x0.1=2.5,方差为s:=(1 2.5)2 x0.4+(2 2.5x0.1 +(32.5)2 x0.1 +(4 2.5)2 x0.4=1.85;对于 C 选项,该组数据的平均数 为 五=(1+4)X0.2+(2+3)X0.3=2.5,方差为s;=(1 -2.5)2 x 0.2 +(2-2.5)2 x 0 3 +(3-2.5)2 x 0.3+(4-2.5 x 0.2 =1.0 5 ;对于 D 选项,该组数据的平均数 为,=(1 +4)X0
9、.3+(2+3)X0.2=2.5,方差为.若=(1 2.5)2 x 0.3+(2-2.5)2 x().2+(3 2.5 x().2 +(4-2.5 x 0.3 =1.4 5,因此 B 选项这一组的标准差最大,故选B.1 1.(2 0 2 0 天津4)从一批零件中抽取8 0 个,测量其直径(单位:m m),将所得数据分为9组:5.3 1,5.3 3),5.3 3,5.3 5),.,5.4 5,5.4 7 ,5.4 7,5.4 9 ,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间 5.4 3,5.4 7)内的个数为()A.1 0 B.1 8 C.2 0 D.3 6【答案】B【解析】
10、由题意可得,直径落在区间 5.4 3,5.4 7)之间的零件频率为:(6.2 5 +5.0 0)x 0.0 2 =0.2 2 5 ,则区间 5.4 3,5.4 7)内零件的个数为:8 0 x 0.2 2 5 =18,故选B.1 2.(2 0 1 9 全国I I 理 5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9个原始评分中去掉1 个最高分、1 个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A.中位数 B.平均数C.方差D.极差【答案】A【解析】根据题意,从 9个原始评分中去掉1 个最高分、1 个最低分,得到7个有效评分,7个有效评分与
11、9个原始评分相比,最中间的一个数不变,即中位数不变.故选A.1 3.(2 0 1 9 全国I I 理 1 3)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有 10 个车次的正点率为0.9 7,有 20 个车次的正点率为0.9 8,有 10 个车次的正点率为0.9 9,则经停该站高铁列车 所 有 车 次 的 平 均 正 点 率 的 估 计 值 为.【答案】0.9 8【解析】经停该站高铁列车所有车次的平均正点率的估计值为:-10 X 0.9 7 +20 X 0.9 8 +10 x 0.9 9x=-=0.9 8 .10 +20 +1014.(20 20 上海8)已知有四个数1,2,4
12、 ,这四个数的中位数为3,平均数为4,则 而=.【答案】36【解析】设aWb,则2=3,解得:。=4,1 +2+_/7 4,解得:h=9,所以a h =36.2 4故答案为:36。15.(20 20 江苏3)己知一组数据-4,20,3 2a,5,6 的平均数为4,则。的值是.【答案】2【解析】由题意得4+2+一 )+5+6=4,解得。=2.516.(2019江苏5)已知一组数据6,7,8,8,9,1 0,则 该 组 数 据 的 方 差 是.5-1【答案】-【解析】一组数据6,1,8,8,9,10的平均数为=:(6+7+8+8+9+10)=8,3 6所以该组数据的方差为$2=。(6-8)2+(7
13、-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2=2.6 317.(2020新高考山东海南9)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()A.这 11天复工指数和复产指数均逐日增加B.这 11天期间,复产指数增量大于复工指数的增量C.第 3 天至第11天复工复产指数均超过80%D.第 9 天至第11天复产指数增量大于复工指数的增量【答案】C D【解析】由图可知,第 I 天到第2 天复工指数减少,第 7 天到第8 天复工指数减少,第 1()天到第 11复工指数减少,第 8 天到第9 天复产指数减少,故 A 错误;
14、由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故 B错误;由图可知,第 3 天至第11天复工复产指数均超过8 0%,故 C 正确;由图可知,第 9 天至第11天复产指数增量大于复工指数的增量,故 D 正确.18.(2018全 国 I 理)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建
15、设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】通解设建设前经济收入为则建设后经济收入为2 a,则由饼图可得建设前种植收入为0.6 a,其他收入为0.0 4 a,养殖收入为0.3 a.建设后种植收入为0.74a,其他收入为0.1 a,养殖收入为0.6 a,养殖收入与第三产业收入的总和为1.1 6 a,所以新农村建设后,种植收入减少是错误的.故选A.优解 因为0.6 0.37 x 2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.故选A.19.(20 17 新课标I I I 理)某城
16、市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 20 14年 1月至20 16年 12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各 年 1 月至6 月的月接待游客量相对7月 至 12月,波动性更小,变化比较平稳【答案】A【解析】由折线图,7月份后月接待游客量减少,A错误,故选A.20.(20 16年山东理)某高校调查了 20 0 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是 17.5,30,样本数
17、据分组为 17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这 200名学生中每周的自习时间不少于22.5 小时的人数是A.56 B.6 0 C.120 D.140【答案】D【解析】由频率分布直方图可知,这 200名学生卷周的自习时间不少于22.5 小时的频率为(0.16+0.08+0.04)X 2.5=0.7,故这200名学生中每周的自习时间不少于22.5 小时的人数为200X0.7=140.故选 D.21.(2016 年全国I I I 理)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表
18、示十月的平均最高气温约为15,B点表示四月的平均最低气温约为5 C.下面叙述不正确的是A.各月的平均最低气温都在0以上 B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同 D.平均气温高于20的月份有5 个【答案】D【解析】由图可知0 C 在虚线框内,所以各月的平均最低气温都在0 C 以 匕 A 正确;由图可知七月的平均温差比一月的平均温差大,B正确;由图可知三月和卜一月的平均最高气温都约为i(rc,基本相同,C 正确;由图可知平均最高气温高于20的月份不是5 个,D 不正确,故选D.22.(2015陕西理)某中学初中部共有110名教师,高中部共有150名教师,其性别比
19、例如图所示,则该校女教师的人数为A.16 7 B.137 C.123 D.9 3【答案】C【解析】由扇形统计图可得,该校女教师人数为110 x 7 0+150 x(1-6 0%)=137.23.(2015新课标I 理理I 理)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是.A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【答案】D【解析】根据柱形图易得选项A,B,C正确,2006年以来我国二氧化碳年排
20、放量与年份负相关,选项D错误.24.(2015安徽理)若 样 本 数 据 不x2,%的标准差为8,则数据2玉一1,2一1,2%。一1的标准差为A.8 B.15 C.16 D.【答案】C【解析】设样本数据用,$0的标准差为J欣,则J 5 1=8,即方差D X=6 4,而数据2%-1,2 1 ,2%-1的方差。(2乂-1)=22。*=22*64,所 以 其 标 准 差 为/?彘 =16,故选C.25.(2014广东理)己知某地区中小学生人数和近视情况分别如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别是A.200,2
21、0 B.100,20 C.200,10 D.100,10 答案A解析】所抽人数为(3500+2000+4500)x 2%=200,近视人数分别为小学生3500 x10%=3 5 0,初中生4 5 0 0 x 3 0%=1 3 5 0,高中生200 0 x 5 0%=1000,二抽取的高中生近视人数为1000 x 2%=2 0,故选A.26.(2013福建理)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试
22、成绩不少于6 0分的学生人数为()A.588 B.480 C.450 D.120【答案】B【解析】由图知道60分以上人员的频率为后4项频率的和,由图知道P =(0.03+0.025+0.015+0.01)*10=0.8,故分数在 60 以上的人数为 600 x0.8=480 人.27.(2013山东理)将某选手的9个得分去掉1个最高分,去 掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以X表示:则7个剩余分数的方差为()A.116936B.7C.3665【答案】B【解析】由图可知去掉的两个数是87,9 9,所以87+90 x 2+91x2
23、+94+90+x=91x7,x=4.?=1 (87-91)2+(90-91)2X2+(91-91)2X2+(94-91)2X2 =.7 728.(2012陕西理)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,5345+47【答案】A【解析】由概念知中位数是中间两数的平均数,即 =4 6,众数是4 5,极差为68-12=56,2故选A.29.(2018江苏理)已知5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这5 位裁判打出的分数的平均数为.【答
24、案】9 0【解析】由茎叶图可得分数的平均数为?=9 0.529.(2015湖南理)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1 35号,再用系统抽样方法从中抽取7 人,则其中成绩在区间 139,151上的运动员人数是.7【答案皿解析】由茎叶图可知,在区间 139,151 的人数为2 0,再由系统抽样的性质可知人数为20 x七=4人.30.(2014江苏理)为了 了解一片经济的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间 80,130 上,其频率分布直方图如图所示,则在抽测的60株树木中,有一株树木的底部周长
25、小于100cm.【答案】2 4【解析】由频率分布直方图可得树木底部周长小于100cm的频率是(0.025+0.015)x10=0.4,又样本容量是6 0,所以频数是0.4 X 60=24.31.(2013辽宁理)为了考察某校各班参加课外书法小组的人数,在全校随机抽取5 个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.【答案】10【解析】设五个班级的数据分别为a 8 c d 0 恒成立,因此判别式(),得。4,所以fV 3,即eW I O.3 2.(2 0 1 2 山东理)右图是根据部分城市某年6月份的平均气温(单位:
26、)数据得到的样本频率分布直方图,其中平均气温的范围是 2 0.5,2 6.5 ,样本数据的分组为 2 0.5,2 1.5),2 1.5,2 2.5),2 2.5,2 3.5),1 2 3.5,2 4.5),2 4.5,2 5.5),2 5.5,2 6.5 1 .已知样本中平均气温低于2 2.5 的城市个数为1 1,则样本中平均气温不低于2 5.5 的 城 市 个 数 为.【答案】9【解析】最左边两个矩形面积之和为0.1 0 x 1+0.1 2 x 1=0.2 2,总城市数为1 1 9 0.2 2=5 0,最右面矩形面积为 0.1 8 x 1=0.1 8,5 0 x 0.1 8=9.3 3.(2
27、 0 1 9 全国I H理 1 7)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 2 0 0 只小鼠随机分成A、B两组,每 组 1 0 0 只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记 C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C)的估计值为0.7 0.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解析】(1)由已知得
28、0.7 0 =4+0.2 0+0.1 5 ,故 a =0.3 5,b=l-0.0 5-0.1 5-0.7 0=0.1 0.(2)甲离子残留百分比的平均值的估计值为2 x 0.1 5+3 x 0 .2 0+4 x 0 .3 0+5 x 0 .2 0+6 x 0.1 0+7 x 0 .0 5=4.0 5.乙离子残留百分比的平均值的估计值为3 x 0.0 5+4 x 0.1 0+5 x 0.1 5+6 x 0.3 5+7 x 0.2 0+8 x 0.1 5=6.0 0.3 4.(2 0 1 6 年四川理)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一
29、个合理的月用水量标准X (吨)、一位居民的月用水量不超过X的部分按平价收费,超出x的部分按议价收费.为了 了解居民用水情况,通过抽样,获得了某年1 0 0 位居民每人的月均用水量(单位:吨),将数据按照 0,0.5),0.5,1),,4,4.5)分成9组,制成了如图所示的频率分布直方图.(I)求直方图中a的值;(I I)设该市有3 0 万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(I I I)若该市政府希望使8 5%的居民每月的用水量不超过标准x (吨),估计X的值,并说明理由.【解析】(I)由概率统计相关知识,各组频率之和的值为L.频率=(频率/组距)*组距,0.5 x (
30、0.0 8 +0.1 6 +0.4 +0.5 2 +0.1 2 +0.0 8 +0.0 4 +2 a)=1 ,得&=0.3 .(I I)由图,不低于3 吨人数所占百分比为0.5X(0.12+0.08+0.04)=12%,全市月均用水量不低于3 吨的人数为:3 0 x 1 2*3.6(万).(I I I)由图可知,月均用水量小于2.5 吨的居民人数所占百分比为:0.5 x(0.08 +0.1 6+0.3 +0.4 +0.5 2)=0.7 3 ,即 7 3%的居民月均用水量小于2.5 吨,同理,8 8%的居民月均用水量小于3 吨,故2.5 x 0,b 0,b 0 C.av O,b 0【答案】A【解
31、析】画出散点图知力0,故选A.4 3.(2 0 1 2 新课标理)在一组样本数据(x i,y i),(X 2,y 2),(xn,yn)(n 2,x i,X 2,X n不全相等)的散点图中,若所有样本点(X i,y i)(i=l,2,,n)都在直线y =;x +l上,则这组样本数据的样本相关系数为A.-1 B.0 C.1 D.1【答案】D【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为1,故故选D.4 4.(2 0 1 4江西理)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变
32、量是【答案】D【解析】因为52 x(6 x 2 2-1 4 x l Q)21 6 x 36 x 32 x 2 052 x 821 6 x 36 x 32 x 2 02 _ 52 x(4 x 2 0-1 6 x 1 2)2 _ 52 x 1 1 2?2 1 6 x 36 x 32 x 2 0-1 6 x 36 x 32 x 2 02 _ 52 x(8x 2 4-1 2 x 8)2 _ 52 x 9 6?1 6 x 36 x 32 x 2 0 1 6 x 36 x 32 x 2 02 52 x(1 4 x 30 -6 x 2)2 52 x 4 0 827.=-=-4 1 6 x 36 x 32 x
33、 2 0 1 6 x 36 x 32 x 2 0则有力:公 公 力:,所以阅读量与性别关联的可能性最大,故选D.4 5.(2 0 1 2湖南理)设某大学的女生体重y (单位:k g)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(相,y i)(i=l,2,,n),用最小二乘法建立的回归方程为y=0.8 5 x-8 5.7 1,则下列结论中不正确的是A.y与x具有正的线性相关关系B.回归直线过样本点的中心(7,)C.若该大学某女生身高增加1 c m,则其体重约增加0.8 5 k gD.若该大学某女生身高为1 7 0 c m,则可断定其体重必为5 8.7 9 k g【答案】D【解析】由
34、回归方程为y=0.8 5 X-8 5.7 1知y随x的增大而增大,所以y与x具有正的线性相关关系,由最小二乘法建立的回归方程得过程知y-bx+a-bx+y bx(a=y-bx),所以回归直线过样本点的中心(嚏,7),利用回归方程可以预测估计总体,所以D不正确.4 6.(2 0 1 1 山东理)某产品的广告费用x与销售额y的统计数据如下表广告费用X (万元)4235销售额y (万元)4 92 63 95 4根据上表可得回归方程9 =浪+4中的5为 9.4,据此模型预报广告费用为6 万元时销售额为A.63.6 万元 B.65.5万元 C.67.7万元 D.7 2.0万元【答案】B【解析】样本中心点
35、是(3.5,4 2),则4 一宸=4 2 9.4 x 3.5 =9.1,所以回归方程是y=9.4 x+9 A,把尤=6 代入得 =65.5 .4 7.(2 0 1 8 全国JI理)下图是某地区2 0 0 0 年至2 0 1 6年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2 0 1 8 年的环境基础设施投资额,建立了 y与时间变量/的两个线性回归模型.根据2 0 0 0 年至 2 0 1 6年的数据(时间变量,的值依次为1,2,,1 7)建立模型:y =-3 0.4+1 3.5/;根据2 0 1 0 年至2 0 1 6年的数据(时间变量,的值依次为1,2,,7)建立模型:y=9
36、9+U.5t.(1)分别利用这两个模型,求该地区2 0 1 8 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】(1)利用模型,该地区2 0 1 8 年的环境基础设施投资额的预测值为e =-3 0.4+1 3.5 x 1 9 =2 2 6.1(亿元).利用模型,该地区2 0 1 8 年的环境基础设施投资额的预测值为3 =9 9 +1 7.5 x 9 =2 5 6.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:(i)从折线图可以看出,2 0 0 0 年至2 0 1 6年的数据对应的点没有随机散布在直线y =-3 0.4 +1 3.5 f 上
37、下.这说明利用2 0 0 0 年至2 0 1 6年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2 0 1 0年相对2 0 0 9 年的环境基础设施投资额有明显增加,2 0 1 0 年至2 0 1 6年的数据对应的点位于一条宜线的附近,这说明从2 0 1 0 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2 0 1 0 年至2 0 1 6年的数据建立的线性模型 =9 9 +1 7.5,可以较好地描述2 0 1 0 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.(ii)从计算结果看,相对于2 0 1 6年的环境基础设施投资额2 2 0 亿元,由模
38、型得到的预测值2 2 6.1 亿兀的增幅明显偏低,而利用模型得到的预测值的增幅比较合理.说明利用模型得到的预测值更可靠.以上给出了 2种理由,考生答出其中任意一种或其他合理理由均可得分.4 8.(2 0 1 6新课标I理H)下图是我国2 0 0 8年至2 0 1 4年生活垃圾无害化处理量(单位:亿吨)的折线图(I)由折线图看出,可用线性回归模型拟合y与f的关系,请用相关系数加以说明;(I I)建立y关于r的回归方程(系数精确到0.0 1),预测20 1 6年我国生活垃圾无害化处理量.7 7 7附注:参考数据:=9 3 2,2立=40 1 7,-=0 5 5,币%2.6 46.;=1i=V i=
39、Ea,-D(x-7)参考公式:相关系数厂=了 “_J Ea-O2S(y,-y)2V i=l z=lX-力(/-9)回归方程y =&+而 中斜率和截距的最小二乘估计公式分别为:方=J-,a=y-bT.i=l【解析】(I)由折线图这数据和附注中参考数据得7 =4,)2=28,(y )2=0.55,/=1 V i=l一a(y -丁)=,%一=40.1 7-4x 9.32=2.89,/=1因为y与/的相关系数近似为0.99,说明y与的线性相关相当高,从而可以用线性回归模型拟合y与7的关系._ 9 32 八 X年-)(%)2 89(I I)由 y =a l.3 3 1 及(I )得b=-=0.1 0 3
40、,7 5 2 8i=i6 =5后 a1.331 0.1 0 3x 4之0.92.所以,y关于/的回归方程为:9=0.92+0.1 0/.将20 1 6年对应的f =9代入回归方程得:y=0.92+0.1 0 x 9=1.82.所以预测20 1 6年我国生活垃圾无害化处理量将约1.82亿吨.49.(20 1 5新课标I理)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对 近8年的年宣传费占和年销售量(i =l,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.846.6 56 36.8289.81.
41、61 46 91 0 8.8表中卬,=,市=G Z wi-o /=!(I)根据散点图判断,y =a+版 与y =c+6哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(I I)根 据(I )的判断结果及表中数据,建立y关于x的回归方程;(I I I)已知这种产品的年利率z与x、y的关系为z =0.2y x.根 据(I I)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(i i)年宣传费x为何值时,年利率的预报值最大?附:对于一组数据(4,匕),(内,彩),其回归线v =a +”的斜率和截距的最小二乘估计分(%一 )(%一 )别
42、为6 -,a=v-p u.才(产/=1【解析】(I )由散点图可以判断,y =c+d 4适宜作为年销售量y关于年宣传费x的回归方程类型.8Z(吗 一记)(必一切(I I)令w =,先建立y关于VV的线性回归方程,由于2=-=6 8.Z(w,一沔 2 L6i=了一 加=56 3-6 8x 6.8=1 0 0.6,所以y关于w的线性回归方程为夕=1 0 0.6+6 8卬,因此y关于x的回归方程为y =1 0 0.6 +68 .(H D (i )由(H)知,当x =49时,年销售量y的预报值亍=1 0 0.6+6 8如=57 6.6,年利润 z 的预报值 2=57 6.6 x 0.2-49=6 6.
43、32.(i i)根 据(H)得结果知,年利润z的预报值2=0.2(1 0 0.6 +68 4)x =x +1 3.6 +20.1 2,所以当 =股=6.8,即x =46.24时,2取得最大值,故年宣传费为4 6.2 4千元时,年利润的预报值最大.25 0.(2 0 1 4新课标I I理)某地区2 0 0 7年至2 0 1 3年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2 0 0 72 0 0 82 0 0 92 0 1 02 0 1 12 0 1 22 0 1 3年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(I )求 y 关于t 的线性回归方程;(I
44、 I)利 用(I)中的回归方程,分析2 0 0 7 年至2 0 1 3 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2 0 1 5 年农村居民家庭人均纯收入.A(一)(%-方附:回归直线的斜率和截距的最小二乘估计公式分别为:人=上.,a=y-b T/=1-1 -1【解析】(I)由所给数据计算得 =一 (1+2+3+4+5 4-6+7)=4,y=-(2.9+3.3+3.6+4.4+4.8+5.2+5.9)7 7=4.37 _Z(4 -f )2 =9+4+1+0+1+4+9=2 8,r=l7 _ _Z&-r)(y-y)=(-3)x(-1.4)+(-2)x(-1)+(_ 1)x(0.7)+
45、0 x0.1+1 x0.5 +2 x0.9+3 x1.6 =1 4 ./=17 _ _-1 4_ .匕=0-=0.5,a =y 4=4.3 o.5 x4 =2.3,所求回归方程为y=0.5 r +2.3.)2 2 8/=15 1.(2 0 2 0 全国H文 理 1 8)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的2 0 0 个地块,从这些地块中用简单随机抽样的方法抽取 2 0 个作为样区,调查得到样本数据(七,y,)(/=1,2,,2 0),其中毛和弘分别表示第,个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算
46、得=6 0,y,=1 2 0 0,1-朗=8 0,i=i=i=lXU _)J =9 0001 L -d%-J=800-/=1 f=l(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(,%)0 =1,2,,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数厂=()女 4 1 4.1 20【解析】(1)样区野生动物平均数 为 右Z%=7;xl200=60,2U j=2X
47、)地块数为200,该地区这种野生动物的估计值为200 x 60=12000.(2)样本(七,乃)的相关系数为=20 为一如巴一歹)i=l20 20-(x(.-x)2(;-y)2/=|/=1/80。=逑皿94780 x9000 3(3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样法抽取样本即可.考点1 1 0随机事件的概率、古典概型 几何概型52.(2020全 国I文4)设。为正方形ABCD的中心,在O,A,6,C,。中任取3点,则取到的3点共线的概率为()12 14A.-B.-C.-D
48、.一5 5 2 5【答案】A【解析】如图,从O,A,B,C,Z)5个点中任取3个有。,43,O,A,C,O,。,。,O,B,C ,O,B,D ,O,C,D ,A,B,C ,A,B,D ,A,C,D ,B,C,D ,共 10种不同取法,3点共线只有O,A,C 与 0,3,0 共2种情况,由古典概型的概率计算公式知,取到3点共线的概率为=故选A.10 553.(2020全国I 文理4)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超
49、过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A.10名 B.18名 C.24名 D.32名【答案】B【解析】由题意,第二天新增订单数为500+16001200=9 0 0,故需要志愿昔 婴 =18名,故选B.54.(2020新高考山东海南5)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A.62%-B.56%C.46%D.42%【答案】C【解析】记“该中学学生喜欢足球”
50、为事件A,“该中学学生喜欢游泳”为事件8,则“该中学学生喜欢足球或游泳”为事件A+B,“该中学学生既喜欢足球又喜欢游泳”为事件4 5,则P(A)=0.6,P(B)=0.82,P(A+B)=0.96,所以 P(A 8)=尸(A)+P(8)P(A+8)=0.6+0.82 0.96=0.46,所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为4 6%,故选:C.55.(2019全国I理6)我国古代典籍 周易用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是()5 11 21 11A.