《备战2024年高考数学二轮复习热点题型归纳专题10-1统计大题-线性和非线性回归与残差(全国通用)(解析版).docx》由会员分享,可在线阅读,更多相关《备战2024年高考数学二轮复习热点题型归纳专题10-1统计大题-线性和非线性回归与残差(全国通用)(解析版).docx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、专题10-1统计:线性和非线性回归与残差 热点题型归纳【题型一】 线性回归【典例分析】如图是某地2014年至2020年生活垃圾无害化处理量(单位:万吨)的折线图.注:年份代码17分别对应年份20142020.(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以证明;(2)建立关于的回归方程(系数精确到0.01),预测2022年某地生活垃圾无害化处理量.附注:参考数据:,.参考公式:相关系数,回归方程中斜率和截距的最小二乘法估计公式分别为,.【答案】(1)存在较强的正相关关系,理由见解析(2),1.82万吨【分析】(1)、结合参考数据及参考公式求出相关系数,进而可以得出结论;(2)
2、、根据参考公式求出回归直线方程,进而可以根据回归直线方程进行数据统计.(1)由折线图看出,与之间存在较强的正相关关系,理由如下:,.,故与之间存在较强的正相关关系.(2)由(1)结合题中数据可得,关于的回归方程,2022年对应的值为9,故,预测2022年该地生活垃圾无害化处理量为1.82万吨.【提分秘籍】基本规律1.直线型回归常规;2.相关系数应用。【变式演练】1.2020年全面建成小康社会取得伟大历史成就,决战脱贫攻坚取得决定性胜利某市积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收,某商家统计了7个月的月广告投入(单位:万元)与月销量
3、(单位:万件)的数据如表所示:月广告投入/万元1234567月销量/万件28323545495260(1)已知可用线性回归模型拟合与的关系,请用相关系数加以说明,并求关于的线性回归方程;(2)根据(1)的结论,预计月广告投入大于多少万元时,月销量能突破70万件参考数据:,参考公式:相关系数;回归直线的斜率和截距的最小二乘估计分别为,【答案】(1)相关系数,线性回归模型能够很好地拟合与的关系;(2)9.04万元【分析】(1)现根据题中数据求得相关系数,从而说明线性回归模型能够很好地拟合与的关系,再根据题中数据求得和,进而求得回归方程;(2)解不等式即可求出结果.【详解】(1)由题意,知,结合,可
4、得,相关系数,显然与的线性相关程度相当高,从而线性回归模型能够很好地拟合与的关系易知,关于的线性回归方程为(2)若月销量突破70万件,则,解得故当月广告投入大于9.04万元时,月销量能突破70万件2.根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种疫苗的情况,得如下统计表:第天12345新接种人数10
5、15192328(1)建立关于的线性回归方程;(2)预测该村居民接种新冠疫苗需要几天?参考公式:回归方程中斜率和截距的最小二乘估计公式分别为: ,【答案】(1);(2).【分析】(1)本题首先可以求出、,然后求出、,即可求出关于的线性回归方程;(2)本题可设,数列的前项和为,然后根据等差数列求和公式得出,最后求出、,即可得出结果.(1),则,故关于的线性回归方程.(2),设,数列的前项和为,易知数列是等差数列,则,因为,所以预测该村居民接种新冠疫苗需要天.【题型二】 残差【典例分析】2018年9月17日,世界公众科学素质促进大会在北京召开,国家主席习近平向大会致贺信中指出,科学技术是第一生产力
6、,创新是引领发展的第一动力某企业积极响应国家“科技创新”的号召,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据xi,yi)(i1,2,3,4,5,6),如表试销单价x(百元)123456产品销量y(件)9186p787370(1)求出p的值;(2)已知变量x,y具有线性相关关系,求产品销量y(件)关于试销单价:x(百元)的线性国归方程(计算结果精确到整数位);(3)用表示用正确的线性回归方程得到的与x对应的产品销的估计值当销售数据(xi,yi)的残差的绝对值|yiy|1时,则将销售数据称为一个“有效数据”现从这6组销售数中任取2组,求抽取
7、的2组销售数据都是“有效数据”的概率参考公式及数据yi80,1606,91,.【答案】(1)p82;(2);(3)【分析】(1)由题意可列方程,解方程即可得解;(2)把数据代入公式,求得,后即可得解;(3)由题意找出有效数据,把所有的情况列举出来后,找到符合要求的个数即可得解.(1)由yi80,得,求得p82;(2),所求的线性回归方程为;(3)当x11时,y190;当x22时,y286;当x33时,y382;当x44时,y478;当x55时,y574;当x66时,y670与销售数据对比可知满足|yiy|1(i1,2,6)的共有4个“有效数据”:(2,86)、(3,82)、(8,78)、(6,
8、70)给6组销售数据编号,则从6组销售数中任取2组有:(1,2)、(1,3)、(1,4)、(1,5)、(1,6)、(2,3)、(2,4)、(2,5)、(2,6)、(3,4)、(3,5)、(3,6)、(4,5)、(4,6)、(5,6)共15种情况,其中两组都是有效数据的情况有6种.抽取的2组销售数据都是“有效数据”的概率为【提分秘籍】基本规律残差计算:【变式演练】1.“大众创业,万众创新”是李克强总理在本届政府工作报告中向全国人民发出的口号.某生产企业积极响应号召,大力研发新产品.为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据,如下表所示:已知.(1)求出
9、的值;(2)已知变量,具有线性相关关系,求产品销量(件)关于试销单价(元)的线性回归方程;(3)用表示用正确的线性回归方程得到的与对应的产品销量的估计值.当销售数据的残差的绝对值时,则将销售数据称为一个“好数据”.现从6个销售数据中任取2个,求抽取的2个销售数据中至少有1个是“好数据”的概率.【答案】(I);(II);(III).试题分析:(1)借助题设条件直接求解;(2)运用相关系数公式求解;(3)依据题设条件及新定义的概念和概率公式求解:试题解析:解:(),可求得(),所以所求的线性回归方程为()当时,;当时,;当时,;当时,;当时,;当时,与销售数据对比可知满足(1,2,6)的共有3个“
10、好数据”:、从6个销售数据中任意抽取2个的所有可能结果有种,其中2个数据中至少有一个是“好数据”的结果有种,于是从抽得2个数据中至少有一个销售数据中的产品销量不超过80的概率为2.医学中判断男生的体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重比如身高175cm的人,其标准体重为175-105=70公斤,一个人实际体重超过了标准体重,我们就说该人体重超标了已知某班共有30名男生,从这30名男生中随机选取6名,其身高和体重的数据如表所示:编号123456身高(cm)165171160173178167体重(kg)606362707158(1)从这6人中任选
11、2人,求恰有1人体重超标的概率;(2)依据上述表格信息,用最小二乘法求出了体重y对身高x的线性回归方程:,但在用回归方程预报其他同学的体重时,预报值与实际值吻合不好,需要对上述数据进行残差分析按经验,对残差在区间之外的同学要重新采集数据问上述随机抽取的编号为3,4,5,6的四人中,有哪几位同学要重新采集数据?参考公式:残差【答案】(1);(2)3号和6号需要重新采集数据.【分析】(1)求出6人中体重超标的人数,再由古典概型概率计算公式即可求解;(2)先根据回归直线方程必过样本中心求出,进而求出残差,即可判断出哪些同学需要重新采集数据.(1)由表可知:1号同学的标准体重为;2号同学的标准体重为;
12、3号同学的标准体重为;4号同学的标准体重为;5号同学的标准体重为;6号同学的标准体重为;故3号、4号同学体重超标,所以恰有1人体重超标的概率;(2)因为,回归直线方程必过样本中心,得,即,所以回归直线方程为,残差分析:,故3号和6号同学需要重新采集数据.【题型三】 剔除数据重新计算【典例分析】习近平总书记在党的十九大报告中指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进展,保证全体人民在共建共享发展中有更多获得感现S市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表:敬老院ABCDEFGHIK满意度x(%)2034251
13、9262019241913投资原y(万元)80898978757165626052(1)求投资额关于满意度的相关系数;(2)我们约定:投资额关于满意度的相关系数的绝对值在0.75以上(含0.75)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额关于满意度的线性回归方程(系数精确到0.1)参考数据:,.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:.线性相关系数.【答案】(1)0.72;(2) 【分析】(1)由题意,根据相关系数的公式,可得的值
14、,即可求解;(2)由(1)可知,得投资额关于满意度没有达到较强线性相关,利用公式求得的值,即可得出回归直线的方程.(1)由题意,根据相关系数的公式,可得.(2)由(1)可知,因为,所以投资额关于满意度没有达到较强线性相关,所以要“末位淘汰”掉K敬老院.重新计算得,所以,.所以所求线性回归方程为.【提分秘籍】基本规律剔除数据时,要注意平均值和公式数据的相关计算,参考典例分析【变式演练】1.BMI指数是用体重公斤数除以身高米数的平方得出的数值,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当BMI数值大于或等于20.5时,我们说体重较重,当BMI数值小于20.5时
15、,我们说体重较轻,身高大于或等于170cm时,我们说身高较高,身高小于170cm时,我们说身高较矮.某中小学生成长与发展机构从某市的320名高中男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号12345678身高(cm)166167160173178169158173体重(kg)5758536166575066(1)根据最小二乘法的思想与公式求得线性回归方程.利用已经求得的线性回归方程,请完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字);编号12345678身高(cm)166167160173178169158173体重(kg)5758536
16、166575066残差 0.10.30.91.50.5(2)通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误.已知通过重新采集发现,该组数据的体重应该为58(kg).请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.参考公式: ,.参考数据:,.【答案】(1)填表见解析;(2).(1)由表中的数据可求出线性回归方程为,进而可完善所给表格,求出所有残差值.由即可求出贡献值.(2)计算修订后以及,代入到,进而可求出线性回归方程.解:(1)由题意知线性回归方程为,计算,.完善下列残差表如下,编号12345678身高(cm)xi16
17、6167160173178169158173体重(kg)yi5758536166575066残差0.10.30.91.50.52.30.53.5计算 ,所以解释变量(身高)对于预报变量(体重)变化的贡献值.(2)通过残差分析知,残差的最大(绝对值)的那组数据为第8组,且 由,计算修订后又,修订后.所以,.所以关于的线性回归方程是.2.某手机公司生产某款手机,如果年返修率不超过千分之一,则生产部门当年考核优秀,现获得该公司2010-2018年的相关数据如下表所示:年份201020112012201320142015201620172018年生产量(万台)34567791012产品年利润(千万元)
18、3.64.14.45.26.27.87.57.99.1年返修量(台)474248509283728790(1)(理)从该公司2010-2018年的相关数据中任意选取3年的数据,以表示3年中生产部门获得考核优秀的次数,求的分布列和数学期望;(2)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润(千万元)关于年生产量(万台)的线性回归方程(精确到0.01).部分计算结果:,.附:;线性回归方程中,.【答案】(1)见解析(2)【分析】(1)由题可得有五个年份考核优秀,即可求出可能的取值以及对应的概率,得出的分布列及其数学期望(2)计算出去掉2015年数据之后的,将数
19、据代入计算,再由计算出,即可得到线性回归方程解:(1)由数据可知,2012,2013,2016,2017,2018五个年份考核优秀,所以的所有可能取值为0,1,2,3,故的分布列为:0123(2)因为,所以去掉2015年的数据后不影响的值,所以,去掉2015年数据后,所以,故回归方程为:.【题型四】 非线性回归1:指数型【典例分析】从集市上买回来的蔬菜仍存有残留农药,食用时需要清洗数次,统计表中的表示清洗的次数,表示清洗次后千克该蔬菜残留的农药量(单位:微克)x12345y4.52.21.41.30.6(1)在如图的坐标系中,描出散点图,并根据散点图判断,与哪一个适宜作为清洗次后千克该蔬菜残留
20、的农药量的回归方程类型;(给出判断即可,不必说明理由)(2)根据判断及下面表格中的数据,建立关于的回归方程;表中,320.12100.09-8.70.9(3)对所求的回归方程进行残差分析附:线性回归方程中系数计算公式分别为,;,说明模拟效果非常好;,【答案】(1)见解析;(2);(3)拟合效果非常好【分析】(1)先根据数据作出散点图,结合散点图给出判断;(2)根据,及相关公式可求关于的回归方程;(3)先求解估计值与真实数据间的差,根据公式求出,然后进行判断.(1)散点图如图,根据散点图可知用作为清洗次后千克该蔬菜残留的农药量的回归方程类型(2)由题知,故所求的回归方程为(3)列表如下:000.
21、10.3-0.32.50.2-0.6-0.7-1.4所以,所以回归模拟的拟合效果非常好【提分秘籍】基本规律1.直接设指数求解;2.取对数化简,再设对数求解【变式演练】1.为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并做出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型与模型;作为产卵数y和温度x的回归方程来建立两个变量之间的关系.温度x/20222426283032产卵数y/个61021246411332240048457667678490010241.792.303.043.184.164.735.7726692803
22、.571157.540.430.320.00012其中,.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.(1)根据表中数据,模型、的相关指数计算分别为,请根据相关指数判断哪个模型的拟合效果更好.(2)根据(1)中的判断,在拟合效果更好的模型下求y关于x的回归方程;并估计温度为30时的产卵数.(,与估计值均精确到小数点后两位)(参考数据:,)【答案】(1)模型的拟合效果更好;(2),当时,估计产卵数为.【分析】(1)根据相关指数的大小,即可比较模型拟合效果的优劣,相关指数越大,拟合效果越好;(2)由(1)可知选模型,两边取对数得,再令,则,所以先利用最小二乘法求的回归系数,再
23、代换回去即可.解:(1)因为,所以模型的拟合效果更好.(2)由(1)知模型的拟合效果更好,对于模型:设,则,其中,.所以y关于x的回归方程为,当时,估计产卵数为.2.近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势一方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染的重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解决的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了10组化肥施用量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值化肥施用量为(单位:
24、公斤),粮食亩产量为(单位:百公斤)参考数据:65091.552.51478.630.5151546.5表中(1)根据散点图判断,与,哪一个适宜作为粮食亩产量关于化肥施用量的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立关于的回归方程;(3)根据(2)的回归方程,并预测化肥施用量为27公斤时,粮食亩产量的值;附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为;取【答案】(1)更适合作为关于的回归方程类型;(2);(3)810公斤.【分析】(1)根据散点图即可判断,更适合作为关于的回归方程类型;(2)对两边取对数,得,即,根据表中数据求出,再根据
25、最小二乘法求出和的值,从而得出关于的回归方程;(3)由(2)得,当时,即可预测粮食亩产量的值.(1)解:根据散点图可判断,更适合作为关于的回归方程类型.(2)解:对两边取对数,得,即,由表中数据得:, ,所以,所以关于的回归方程为.(3)解:由(2)得,当时,所以当化肥施用量为27公斤时,粮食亩产量约为810公斤.【题型五】 非线性回归2:反比例型【典例分析】为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值(表中,)697.900.21600.1414.1226.131.40(1
26、)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?(2)根据(1)的结果回答下列问题:(i)建立关于的回归方程;(ii)样本对原点的距离时,金属含量的预报值是多少?(iii)已知该金属在距离原点时的平均开采成本(单位:元)与,关系为,根据(2)的结果回答,为何值时,开采成本最大?附:对于一组数据,其线性相关系数,其回归直线的斜率和截距的最小二乘估计分别为:,【答案】(1)更适宜;(2)(i);(ii);(iii)为10时,开采成本最大【分析】(1)计算出的线性相关系数和的线性相关系数可得答案;(2)(i)计算出和,可得关于的回归方程;(ii)代入可
27、得答案;(iii)求出,令,判断的单调性可得答案(1)的线性相关系数,的线性相关系数,更适宜作为平均金属含量关于样本对原点的距离的回归方程类型(2)(i),关于的回归方程为(ii)当时,金属含量的预报值为(iii),令,则,当时,单调递增;当时,单调递减,在处取得极大值,也是最大值,此时取得最大值,故为10时,开采成本最大【提分秘籍】基本规律反比例型,一般可直接设【变式演练】1.近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分析,得到两个回归摸型:模型:,模型: ,
28、对以上两个回归方程进行残差分析,得到下表:种植面积(亩)234579每亩种植管理成本(百元)252421221614模型估计值25.2723.6221.9717.0213.72残差-0.270.38-0.97-1.020.28模型26.8420.1718.8317.3116.46-1.840.833.17-1.31-2.46(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;(2)视残差的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.附:, ;【答案】(1)表格答案见解析,模型拟合效果比较好.(2)【分析】(1)令时,求得,
29、令时,求得,填入表格即可.根据残差平方和公式,分别求得模型的残差平方和,模型的残差平方和,再比较下结论.(2)根据视残差的绝对值超过1.5的数据视为异常数据,应剔除第四组数据,分别求得,利用公式进而求得,写出回归方程.(1)当时,当时,完成表格如下:种植面积(亩)234579每亩种植管理成本(百元)252421221614模型估计值25.2723.6221.9720.3217.0213.72残差-0.270.38-0.971.68-1.020.28模型26.8422.3920.1718.8317.3116.46-1.841.610.833.17-1.31-2.46模型的残差平方和为,模型的残差
30、平方和为,所以模型的残差平方和比模型的残差平方和小,所以模型拟合效果比较好.(2)由题意知,应剔除第四组数据,所求回归方程为.2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金现该企业为了了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近年年研发资金投入额和年盈利额的数据通过对比分析,建立了两个函数模型:;,若对于任意一点,过点作与轴垂直的直线,交函数的图象于点,交函数的图象于点,定义:,若则用函数来拟合与之间的关系更合适,否则用函数来拟
31、合与之间的关系(1)给定一组变量,对于函数与函数,试利用定义求,的值,并判断哪一个更适合作为点中的与之间的拟合函数;(2)若一组变量的散点图符合图象,试利用下表中的有关数据与公式求与的回归方程,并预测当时,的值为多少表中的,附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为,【答案】(1);函数更适合;(2);【分析】(1)由分别取时对应的函数值,再根据变量,分别求得,比较下结论;(2)在中,令,得到,然后利用最小二乘法求得,写出关于的线性回归方程,进而得到关于的回归方程即可.(1)对于函数,当分别取时对应的函数值为,此时对于函数,当分别取时对应的函数值为,此时从而有,因此由定义
32、得选用函数更适合作为点中的与之间的拟合函数(2)在中,令,所以有,于是可建立关于的线性回归方程为,所以,所以关于的线性回归方程为,因此关于的回归方程为,当时,即可预测当时,的值为【题型六】 非线性回归3:对数型【典例分析】某投资公司2012年至2021年每年的投资金额(单位:万元)与年利润增量(单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,建立了关于的两个回归模型;模型:由最小二乘公式可求得与的线性回归方程:;模型:由图中样本点的分布,可以认为样本点集中在由线:的附近,对投资金额做换元,令,则,且有,(1)根据所给的统计量,求模型中关于的回归方程;(2
33、)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);附:样本的最小乘估计公式为;参考数据:.【答案】(1)(2)模型的年利润增量的预测值为(万元),模型的年利润增量的预测值为(万元)【分析】(1)结合已知数据和公式求出这两个系数即可得回归方程;(2)把代入模型、的回归方程,算出即可(1)由题意,知,可得,又由,则所以,模型中关于的回归方程.(2)当时,模型的年利润增量的预测值为(万元),当时,模型的年利润增量的预测值为万元【提分秘籍】基本规律1,对指数型取对数;2.直接设对数。【变式演练】1.有一种速度叫中国速度,有一种骄傲叫中国高铁.中国高铁经过十几年的发展,
34、取得了举世瞩目的成就,使我国完成了从较落后向先进铁路国的跨越式转变.中国的高铁技术不但越来越成熟,而且还走向国外,帮助不少国家修建了高铁.高铁可以说是中国一张行走的名片.截至到2020年,中国高铁运营里程已经达到3.9万公里.下表是2013年至2020年中国高铁每年的运营里程统计表,它反映了中国高铁近几年的飞速发展:年份20132014201520162017201820192020年份代码12345678运营里程万公里1.31.61.92.22.52.93.53.9根据以上数据,回答下面问题.(1)甲同学用曲线y=bx+a来拟合,并算得相关系数r1=0.97,乙同学用曲线y=cedx来拟合,
35、并算得转化为线性回归方程所对应的相关系数r2=0.99,试问哪一个更适合作为y关于x的回归方程类型,并说明理由;(2)根据(1)的判断结果及表中数据,求y关于x的回归方程(系数精确到0.01).参考公式:用最小二乘法求线性回归方程的系数公式:;参考数据:令【答案】(1)答案见解析;(2).【分析】(1)比较已知的相关系数大小关系即可得出正确答案;(2)由已知数据求出,结合回归方程变形为,求出和,从而可求出回归方程.解:(1),更适合作为y关于x的回归方程类型.(2),由得,即,则,所以.2.某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如
36、下处理:令,得到相关数据如表所示:1515(1)从;三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由;(2)根据(1)中选择的回归类型,求出与的回归方程;(3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?结果保留到万元参考数据:参考公式:回归方程中斜率和截距的最小二乘估计公式分别为湖北省荆州中学2021-2022学年高三上学期期末数学试题【答案】(1)选择回归类型更好;(2);(3)下一年应至少投入万元广告费用【分析】(1)根据散点图形状可确定回归类型;(2)对两边取对数,利用最小二乘法可求得,由此可得回归方程;(3)令可解出的范围,进而确定结果.
37、(1)由散点图知,年广告费用和年利润额的回归类型并不是直线型的,而是曲线型的,所以选择回归类型更好(1)对两边取对数,得:,即,由表中数据得:,年广告费用和年利润额的回归方程为(3)由(2)知:,令得:,解得:,(十万元),十万元万元下一年应至少投入万元广告费用【题型七】 非线性回归4:其他函数型【典例分析】光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:年份2011年2012年2013年2014年2015年2016年2017年2018年年份代码12345678新增光伏装机量兆瓦0.40.81.63.1
38、5.17.19.712.2某位同学分别用两种模型:,进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于): 经过计算得,其中,.(1)根据残差图,比较模型,的拟合效果,应该选择哪个模型?并简要说明理由.(2)根据(1)的判断结果及表中数据建立关于的回归方程,并预测该地区2020年新增光伏装机量是多少.(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为:,.【答案】(1)模型的拟合效果相对较好;详见解析(2)回归方程为;预测该地区2020年新增光伏装机量为(兆瓦)【分析】(1)根据残差图的带状区域越窄,其模型的拟合效果越好即可判断;(2)利用换元
39、的思想,令,把非线性的回归方程转化为线性的回归方程,结合题中的数据和公式求出,再由回归直线经过样本中心点,求出即可求出回归方程;把代入回归方程求出即为所求的预测值.(1)选择模型.理由如下:根据残差图可以看出,模型的估计值和真实值相对比较接近,模型的残差相对较大一些,所以模型的拟合效果相对较好.(2)由(1),知关于的回归方程为,令,则.由所给数据可得,所以,由线性回归方程经过样本中心点可得,.所以关于的回归方程为.预测该地区2020年新增光伏装机量为(兆瓦).【提分秘籍】基本规律幂函数型等其他类型,可类比前几种【变式演练】1.年月日,第四届中国国际进口博览会在上海开幕,共计多家参展商参展,多
40、项新产品,新技术,新服务在本届进博会上亮相某投资公司现从中选出种新产品进行投资为给下一年度投资提供决策依据,需了解年研发经费对年销售额的影响,该公司甲、乙两部门分别从这种新产品中随机地选取种产品,每种产品被甲、乙两部门是否选中相互独立(1)求种新产品中产品被甲部门或乙部门选中的概率;(2)甲部门对选取的种产品的年研发经费(单位:万元)和年销售额(单位:十万元)数据作了初步处理,得到下面的散点图及一些统计量的值根据散点图现拟定关于的回归方程为.求、的值(结果精确到);(3)甲、乙两部门同时选中了新产品,现用掷骰子的方式确定投资金额若每次掷骰子点数大于,则甲部门增加投资万元,乙部门不增加投资;若点
41、数小于,则乙部门增加投资万元,甲部门不增加投资,求两部门投资资金总和恰好为万元的概率附:对于一组数据、,其回归直线的斜率和截距的最小二乘估计分别为,.【答案】(1);(2),;(3).【分析】(1)利用组合计数原理、古典概型的概率公式以及对立事件的概率公式可求得所求事件的概率;(2)令,计算出、的值,利用最小二乘法公式结合表格中的数据可求得、的值;(3)设投资资金总和恰好为万元的概率为,则投资资金总和恰好为万元的概率为,推导出数列是首项为,公比为的等比数列,利用累加法可求得的值.,(1)解:种新产品中产品没有被甲部门和乙部门同时选中的概率,所以产品被甲部门或乙部门选中的概率为(2)解:令,由题中数据得,(3)解:由题意知,掷骰子时甲部门增加投资万元发生的概率为,乙部门增加投资万元发生的概率为设投资资金总和恰好为万元的概率为,则投资资金总和恰好为万元的概率为所以,因为,所以数列是首项为,公比为的等比数列,所以,所以,所以投资资金总和恰好为万元的概率是2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:吨)的影响,对近年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.46.65636.8289.81.61469108.8表中:,