《2019秋 金版学案 数学·选修2-3(人教A版)练习:第三章3.1第2课时线性回归分析 .doc》由会员分享,可在线阅读,更多相关《2019秋 金版学案 数学·选修2-3(人教A版)练习:第三章3.1第2课时线性回归分析 .doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 统计案例3.1 回归分析的基本思想及其初步应用第2课时 线性回归分析A级基础巩固一、选择题1甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A甲B乙C丙 D丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确答案:D2已知回归方程2x1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A0.01 B0.02 C0.03 D0.0
2、4解析:因为残差iyii,所以残差的平方和为(4.95)2(7.17)2(9.19)20.03.答案:C3若某地财政收入x与支出y满足线性回归模型ybxae(单位:亿元),其中b0.8,a2,|e|0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A10亿元 B9亿元 C10.5亿元 D9.5亿元解析:x10时,0.810210.因为|e|0.5,所以年支出预计不会超过10.5亿元答案:C4下列说法中正确的是()相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;回归直线x一定经过样本点的中心(x,y);随机误差e满足E(e)0,其方差D(e)的大小用来衡量
3、预报的精确度;相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好A B C D解析:线性相关关系r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,错误;回归直线x一定通过样本点的中心(x,y),正确;随机误差e是衡量预报精确度的一个量,它满足E(e)0,正确;用相关指数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,错误答案:D5如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A相关系数r变大B残差平方和变大C相关指数R2变大D解释变量x与预报变量y的相关性变强解析:由散点图知
4、,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小答案:B二、填空题6若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足yibxiaei(i1,2,n),且ei恒为0,则R2为_解析:由ei恒为0,知yii,即yii0,答案:17根据如下样本数据得到的回归方程为x,若5.4,则x每增加1个单位,估计y_个单位x34567y42.50.50.52解析:由题意可得,x5,y(42.50.50.52)0.9,因为回归方程为x,若5.4,且回归直线过点(5,0.9),所以0.955.4,解得0.9,所以x每增加一个单位,估计y减少0.9个单位答案:减少0.
5、98已知方程0.85x82.71是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是_解析:将x160代入0.85x82.71,得0.8516082.7153.29,所以残差y5353.290.29.答案:0.29三、解答题9(2018全国卷)下图是某地区2000年到2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(
6、时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解:(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:方法一从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投
7、资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠方法二从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理说明利用模型得到的预测值更可靠10关于x与y有以下数据:x24568y3040605070已知x与y线性
8、相关,由最小二乘法得6.5.(1)求y与x的线性回归方程;(2)现有第二个线性模型:7x17,且R20.82.若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由解:(1)依题意设y与x的线性回归方程为6.5x.5,50,因为6.5x经过(,),所以y与x的线性回归方程为6.5x17.5 .所以506.55.所以17.5.(2)由(1)的线性模型得yiyi与yi的关系如下表所示:yiyi0.53.5106.50.5yi201010020由于R0.845,R20.82知RR2,所以(1)的线性模型拟合效果比较好B级能力提升1根据如下样本数据:x34567y4.02.50.50.52
9、.0得到的回归方程为bxa,若a7.9,则x每增加 1个单位,y就()A增加1.4个单位 B减少1.4个单位C增加1.2个单位 D减少1.2个单位解析:易知(34567)5,(42.50.50.52)0.9,所以样本点中心为(5,0.9),所以0.95b7.9,所以b1.4,所以x每增加1个单位,y就减少1.4个单位故选B.答案:B2若某函数型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为_,回归平方和为_解析:因为R21,0951,所以总偏差平方和为1 780;回归平方和总偏差平方和残差平方和1 780891 691.答案:1 7801 6913某运动员训练次数与成绩
10、之间的数据关系如下:次数x3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数R2;(5)试预测该运动员训练47次及55次的成绩解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)39.25,40.875, 13 180,0.003 88.所以回归方程为1.0415x0.003 88.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适(4)计算得相关指数R20.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的(5)由上述分析可知,我们可用回归方程1.041 5x0.003 88作为该运动员成绩的预报值将x47和x55分别代入该方程可得y49和y57.故预测该运动员训练47次和55次的成绩分别为49和57.