《线性回归换元题型-解析版.docx》由会员分享,可在线阅读,更多相关《线性回归换元题型-解析版.docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、线性回归换元题型一、例题讲解1某新能源汽车公司对其产品研发投资额x(单位:百万元)与其月销售量y(单位:千辆)的数据进行统计,得到如下统计表和散点图.x12345y0.691.611.792.082.20(1)通过分析散点图的特征后,计划用作为月销售量y关于产品研发投资额x的回归分析模型,根据统计表和参考数据,求出y关于x的回归方程;(2)公司决策层预测当投资额为11百万元时,决定停止产品研发,转为投资产品促销.根据以往的经验,当投资11百万元进行产品促销后,月销售量的分布列为:345Pp结合回归方程和的分布列,试问公司的决策是否合理.参考公式及参考数据:,.y0.691.611.792.08
2、2.20(保留整数)25689【答案】(1);(2)公司的决策合理.【分析】(1)令,可得,根据公式求出关于x的回归方程,从而可得y关于x的回归方程;(2)当时,根据分布列的性质求出,从而可得,与比较即可得结论.【详解】(1)因为,令,所以.由题可得,则,所以,所以回归方程为.(2)当时,.因为且,所以,所以,所以公司的决策合理.2某高科技公司对其产品研发年投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表1和散点图表1:x12345y0.511.535.5(1)该公司科研团队通过分析散点图的特征后,计划分别用和两种方案作为年销售量y关于年投资额x的回归分
3、析模型,经计算方案为,请根据表2的数据,确定方案的回归模型;表2:x12345-0.700.41.11.7(2)根据下表中数据,用决定系数比较两种模型的拟合效果哪个更好,并选择拟合精度更高、更可靠的模型,预测当研发年投资额为7百万元时的年销售量经验回归方程1.90.1122参考公式及数据:,【答案】(1);(2)选择方案,理由见详解,17.5(千件).【分析】(1)两边取对数,求出,代入公式求出,求出回归方程;(2)求出,计算出,得到案的回归模型精度更高、更可靠,并代入求出预测当研发年投资额为7百万元时的年销售量为17.5(千件).【详解】(1)对两边取对数得:,令,其中,则,所以,即;(2)
4、方案中,方案中,同理可得:,显然,故方案的回归模型精度更高、更可靠,令中得:,所以预测当研发年投资额为7百万元时的年销售量为17.5(千件).3某地新能源汽车保有量符合阻沛型增长模型,其中为自统计之日起,经过t年后该地新能源汽车保有量、和r为增长系数、M为饱和量下表是该地近6年年底的新能源汽车的保有量(万辆)的统计数据:年份20182019202020212022t01234保有量9.612.917.123.231.4假设该地新能源汽车饱和量万辆(1)若,假设2018年数据满足公式,计算的值(精确到0.01)并估算2023年年底该地新能源汽车保有量(精确到0.1万辆);(2)设,则与t线性相关
5、请依据以上表格中相关数据,利用线性回归分析确定和r的值(精确到0.01)附:线性回归方程中回归系数计算公式如下:.【答案】(1),万辆(2),【分析】(1)根据题意代入即可求出,代入利用公式估算即可得解;(2)设设,转化为关于的线性回归问题,利用公式求出即可.【详解】(1)由题意可知,2018年对应,满足,所以,解得,因为年对应的,所以所以估计2023年底该地新能源汽车保有量为40.3万辆.(2),设,则,t012349.612.917.123.231.43.373.072.772.442.11,所以,因为,所以.(该题无参考数据,需要计算器计算)二、实战演练1某公司对某产品进行市场调研,获得
6、了该产品的定价x(单位:万元/吨)和一天的销售量y(单位:吨)的一组数据,制作了如下的数据统计表,并作出了散点图0.331030.16410068350表中,(1)根据散点图判断,与哪一个更适合作为y关于x的经验回归方程模型:(给出判断即可,不必说明理由)(2)根据(1)的判断结果,试建立y关于x的经验回归方程;(3)若生产1吨该产品的成本为0.20万元,依据(2)的经验回归方程,预计定价为多少时,该产品一天的利润最大,并求此时的月利润(每月按30天计算,计算结果保留两位小数)参考公式:经验回归方程,其中,【答案】(1);(2);(3)定价为0.45万元/吨时,一天的利润最大,月利润最大为45
7、.00万元【详解】(1)根据散点图知更适合作为y关于x的回归方程(2)令,则,则,关于x的回归方程为(3)一天利润为(当且仅当即时取等号)每月的利润为(万元)预计定价为0.45万元/吨时,该产品一天的利润最大,此时的月利润为45.00万元2某公司近年来特别注重创新产品的研发,为了研究年研发经费(单位:万元)对年创新产品销售额(单位:十万元)的影响,对近10年的研发经费与年创新产品销售额(其中)的数据作了初步处理,得到如图的散点图及一些统计量的值.其中,.现拟定关于的回归方程为.(1)求,的值(结果精确到);(2)根据拟定的回归方程,预测当研发经费为万元时,年创新产品销售额是多少?参考公式:求线
8、性回归方程系数公式 :,.【答案】(1)(2)155【分析】(1)先求均值,再代入公式求以及,(2)令得销售额.【详解】解:(1)令,则由,得 , , , ; ; (2)由(1)知,关于的回归方程为当时, (十万元)(万元)故可预测当研发经费为13万元时,年创新产品销售额是155万元.3沙漠治理能使沙漠变成一片适宜居住的地方,不让沙漠扩大化.近30年来,我国高度重视防沙治沙工作,相继采取了一系列重大举措加快防沙治沙步伐,推动我国防沙治沙事业.我国某沙漠地区采取防风固沙、植树造林等多措并举的方式,让沙漠变绿洲,通过统计发现,该地区沙漠面积(单位:公顷)与时间(单位:年)近似地符合)回归方程模型(
9、以2016年作为初始年份,的值为1),计算2016年至2022年近7年来的与的相关数据,得,(其中表示第年,年份2016201720182019202020212022年数x1234567沙漠面积891888351220200138112(1)求关于的回归方程;(2)从2016年起开始计算,判断第24年该地区所剩的沙漠面积是否会小于75公顷.附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.【答案】(1)(2)第24年该地区所剩的沙漠面积会小于75公顷.【分析】(1)根据题意,由最小二乘法计算公式,代入计算即可得到结果;(2)根据题意,由(1)中的线性回归方程,代入计算即可得到
10、结果.【详解】(1)由表中数据可得,因为,设关于的线性回归方程为,则,则,故关于的回归方程为.(2)由回归方程可知,随着的增大,逐渐减小,当时,故第24年该地区所剩的沙漠面积会小于75公顷.三、课后练习1数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为20182022年中国车载音乐市场规模(单位:十亿元),其中年份20182022对应的代码分别为15年份代码x12345车载音乐市场规模y2.83.97.312.017.0(1)由上表数据知,可用指数函数模型拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);(2)综合考虑2023
11、年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模参考数据:1.9433.821.71.6其中,参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式分别为【答案】(1);(2)十亿元【详解】(1)解:因为,所以两边同时取常用对数,得,设,所以,设,因为,所以,所以;所以 ;所以(2)由(1)知2023年与2024年这两年的年平均增长率,2022年中国车载音乐市场规模为17,故预测20
12、24年的中国车载音乐市场规模(十亿元).2随着全球新能源汽车市场蓬勃增长,在政策推动下,中国新能源汽车企业在10余年间实现了“弯道超车”,一跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国某新能源汽车企业基于领先技术的支持,改进并生产纯电动车、插电混合式电动车、氢燃料电池车三种车型,生产效益在短期内逐月攀升,该企业在1月份至6月份的生产利润y(单位,百万元)关于月份的数据如下表所示,并根据数据绘制了如图所示的散点图月份123456收入(百万元)6.88.616.119.628.140.0(1)根据散点图判断,与(,d均为常数)哪一个更适宜作为利润关于月份的回归方程类型?(给出判断即可
13、,不必说明理由)(2)根据(1)的结果及表中的数据,求出y关于的回归方程;(3)该车企为提高新能源汽车的安全性,近期配合中国汽车技术研究中心进行了包括跌落、追尾、多车碰撞等一系列安全试验项目,其中在实验场进行了一项甲、乙、丙三车同时去碰撞实验车的多车碰撞实验,测得实验车报废的概率为0.188,并且当只有一车碰撞实验车发生,实验车报废的概率为0.1,当有两车碰撞实验车发生,实验车报废的概率为0.2,由于各种因素,实验中甲乙丙三车碰撞实验车发生概率分别为0.7,0.5,0.4,且互不影响,求当三车同时碰撞实验车发生时实验车报废的概率参考数据:19.872.8017.50113.756.30其中,设
14、,参考公式:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为,【详解】(1)散点图中的点的分布不是一条直线,相邻两点在轴上的差距是增大的趋势故选用作为利润关于月份的回归方程更合适(2)由,取对数可得,设,所以,所以,所以,即(3)设事件为“实验车报废”,事件为“只有一车碰撞实验车”,事件为“恰有两车碰撞实验车”,事件为“三车碰撞实验车”,则由已知得,;利用全概率公式得解得;所以当三车同时碰撞实验车发生时实验车报废的概率为0.53随着科技的发展,手机的功能已经非常强大,各类APP让用户的生活质量得到极大的提升的同时,也带来了一些问题,如有不少青少年沉迷于手机游戏,对
15、青少年健康成长带来不小的影响为了引导青少年抵制不良游戏,适度参与益智游戏,某游戏公司开发了一款益智游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡x123456平均过关时间y(秒)5179121130237353(1)通过散点图分析,可用模型拟合y与x的关系,试求y关于x的回归方程(系数a,b精确到0.01);(2)从表中6关过关时间中随机抽取2个,求这两个过关时间均低于6关的过关时间的平均数的概率参考公式:对于一组数据(,2,3,n),其经验回归直线的斜率和截距的最小二乘估计公式分别为,参考数据:y51791211302373533.9324.3694.7964.8685.4685.866,其中【答案】(1);(2)【分析】(1)根据最小二乘法即可求解线性回归方程,进而可得回归方程,(2)根据古典概型的概率计算公式,列举法即可求解.【详解】(1)令,由,得,即,所以,所以,故,所以,所以(2),由题意知,过关时间低于161.8秒的为第1,2,3,4关,记作a,b,c,d,超过161.8秒的为第5,6关,记作A,B,从中任取两个的基本事件有ab,ac,ad,aA,aB,bc,bd,bA,bB,cd,cA,cB,dA,dB,AB,共15个;其中均低于161.8秒的有ab,ac,ad,bc,bd,cd,共6个,故所求概率试卷第11页,共12页学科网(北京)股份有限公司