《人教A版选择性必修第三册8.2一元线性回归模型及其应用作业.docx》由会员分享,可在线阅读,更多相关《人教A版选择性必修第三册8.2一元线性回归模型及其应用作业.docx(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一元线性回归模型及其应用L基硼通关一水平一(15分钟35分)1 ,关于残差图的描述错误的是(A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或响应变量C.残差点分布的带状区域的宽度越窄决定系数越小D.残差点分布的带状区域的宽度越窄残差平方和越小【解析】选C.残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,决定系数R2的值越大,故描述错误的是选项C.已知方程 二 0.85% - 82.71是根据女大学生的身高预报她的体重的回 归方程,其中的单位是cm ,少的单位是kg ,那么针对某个体(160 , 53)的残差是.【解析】将160代入二0.85%
2、- 82.71 ,得3 = 0.85x160 - 82.71 =53.29 ,所以残差y -夕=53 - 53.29 = - 0.29.答案:-0.292 .若某地财政收入x与支出y满足回归方程3=版+ 3 +以单位:亿元)(i=1,2,),其中方二0.8 , a = 2 , e =-1.5x+ 1 ,将x= - 4代入回归直线方程求得修的估计值-1.5x( - 4) + 1=7.答案:7四、解答题(每小题10分,共20分)9.假定小麦基本苗数l与成熟期有效穗y之间存在相关关系,今测 得5组数据如下:X15.025.8y39.442.930.036.644.442.943.149.2以x为解释
3、变量,y为响应变量,作出散点图;求y与1之间的回归方程,对于基本苗数56.7预测有效穗;计算各组残差,并计算残差平方和;(4)求R2 ,并说明残差变量对有效穗的影响占百分之几?【解析】(1)散点图如下.由中散点图看出,样本点大致分布在一条直线的附近,有比较 好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.一一55设回归方程为少= hx + a . x = 30.36 , y = 43.5 ,= 5 101.56 z Zyi= 1i= 12 _ I9 511.43.x y = I 320.66 ,一5x 2 = 921.729 6 ,二 6 746.76. i= 15_ 5 x yz
4、 = 1贝疗二-0.29 ,5 一5 X 2i= 1a = y - ST-34.70.故所求的回归直线方程为5=0.29X + 34.70.当x = 56.7时,5 = 0.29x56.7+ 34.70 = 51.143估计成熟期有效穗为51.143.(3)由于我二胡+ 3 ,可以算得a尸- %分别为 31 =0.35 , 02 = 0.718 , 03 二-0.5 ,e4= - 2.214 , 05= L624 ,残差平方和:58.43250.188.43250.18-0.832 .所以解释变量小麦基Z$x8.43.(4)士 (-7)2 = 50.18,故依=1 -Z = 1本苗数对总效应约
5、贡献了 83.2% , 残差变量贡献了约1 - 83.2% = 16.8%.10 .菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害, 但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干 净,下表是用清水M单位:千克)清洗该蔬菜1千克后,蔬菜上残留 的农药y(单位:微克)的统计表:X12345y5854392910令心炉,利用给出的参考数据求出y关于的回归方程北加+3.(3,3精确到0.1)55 参考数据:Zwi =55 , Z (小-卬)8 - y)= - 751 , i=li=l5 5 (由-w )2 二 374 ,其中%二君,wi=li=l(2)对于某种残留在蔬菜上的农
6、药,当它的残留量不高于20微克时对 人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水 清洗1千克蔬菜?(精确到0.1 ,参考数据由=2.24)附:对于一组数据(两,Vi) ,(U2 , V2),(斯,Vn),其回归直线令二6 + M的斜率和截距的最小二乘估计分别为n E ( % - )( Vi - 口)i= 1八八八P =7 a = v - B u .n (出-)2i= 1【解析】(1)由题意得,W =11 r y =38.5Z (力-w ) ( M - y )751371 = 1人b = 5y ( wz - w)2z = 13 二 y - bw = 60.0 ,所以,=-2.0w
7、 + 60.0.(2)由(1)得夕二-2.0w + 60.0 ,所以/ = - 2.QX2 + 60.0 ,当先20时,即-2.0X2 + 60.020 ,解得正2邛=4.5 ,所以为了放心食用该蔬菜,估计需要用4.5千克的清水清洗1千克蔬菜.【加练固】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费M单 位:千元)对年销售量M单位:0和年利润z(单位:千元)的影响.对 近8年的年宣传费无和年销售量(i= l , 2 ,,8)数据作了初步处 理,得到下面的散点图及一些统计量的值.一 8表中 Wi= xi , w = gSw z = 1(1)根据散点图判断,y=。+法与y=c + d出哪
8、一个适宜作为年销售 量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理 由)根据的判断结果及表中数据,建立y关于K的回归方程;已知这种产品的年利润z与x , y的关系为z=0.2y - x根据的结果回答下列问题:年宣传费x二49时,年销售量及年利润的预测值是多少?年宣传费x为何值时,年利润的预测值最大?附:对于一组数据(两,V1) , (2 , V2),,,力),其回归直线口 二。+例的斜率和截距的最小二乘估计分别为n Z (%-)(Vi - V )i= 1 _3 二,6二 v - 3 w .n ( %. - )2i = 1【解析】(1)由散点图可以判断,产C +八区适宜作为年销售量
9、y关于年宣传费X的回归方程类型.令w二疝,先建立y关于w的线性回归方程.由于8Z (出-w ) ( M - y )108.81.6i= 18E (明-.)2i= 1c= y - 3 w = 563 - 68x6.8 = 100.6 ,所以y关于w的线性回归方程为100.6+ 68w ,因此y关于x的回归方程为3= 100.6 + 68也.(3)由(2)知,当 = 49时,年销售量y的预报值3 = 100.6 + 68 49 =576.6 ,年利润 z 的预测值2 = 576.6x0.2 - 49 = 66.32.根据的结果知,年利润z的预测值a az = 0.2(100.6 + 68 yfx)
10、 - x= -x+13.6 5 + 20.12.所以当=6.8 ,得最大值.故年宣传费为46.24千元时,年利润的预测值最大.1 .若一函数模型为 了 =sin2a + 2sina + 1 ,为将y转化为t的经验回归 方程,则需作变换/等于()A . sin2aB . (sina + I)2( M2C . sin a +之D .以上都不对【解析】选B.因为y是关于z的经验回归方程,实际上就是y是关于 才的一次函数,又因为y = (sin a + 1)2 ,若令. = (sin a + I)2 , 则可得y与t的函数关系式为此时变量y与变量t是线性相关 关系.2 .为了研究某种细菌随时间x的变化
11、繁殖个数 ) 的变化,收集数据 如下:时间力天123456(1)将天数做解释变量,繁殖个数做响应变量,作出这些数据的散点 图;繁殖个数y612254995190(2)描述解释变量与响应变量之间的关系并说明回归模型拟合的效 果.【解析】由表中数据作散点图如图所示.由散点图看出样本点分布在一条指数函数y = ciec2x的图象的周围,其中口和C2是待定系数.于是令z = 1ny ,贝(J z=+ a(a = In ci , b-ci),因此变换后的样本点应该分布在直线z=区+。的周围,因此可以用 线性回归模型来拟合z与x的关系,则变换后的样本数据如下表:X123456Z1.792.483.223.
12、894.555.25由表中数据得到线性回归方程令=0.69x + 1.16因此细菌繁殖个数关于时间的回归方程为= e0-69- 15列出残差表:编号,1234566.0812.1224.1748.1896.06191.52612254995190-0.08-0.120.830.82-1.06-1.52666Z 蕾二Z8-均2 = 4.816 1 , E8- *24642.8,i 1iz = 1R2 = 1 - T0-999 8.故解释变量天数对预报变量繁殖个数解释了 99.98% , 说明该回归模型拟合效果非常好.关闭Word文档返回原板块政收入10亿元,年支出预计不会超过()A . 10亿元
13、 B . 9亿元C . 10.5亿元 D . 9.5亿元【解析】选 CJ = 0.8x1。+ 2 +10 + 6,因为同 0.5所以9.5 7 = 0.25x- 2.58 ,所以/ = e-25% - 258 ,故该模型的回归方程为3二e25x - 258.答案 y - e25x - 2.58.某城市理论预测2016年到2020年人口总数(单位:十万)与年份的 关系如下表所示:年份2016 +x01234人口总数y5781119请画出上表数据的散点图;请根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程 3 = bx+ a ;据此估计2021年该城市人口总数.(参考数据:0x5 + 1
14、x7 + 2x8 + 3x11 +4x19= 132,02 + I2 + 22 + 32 + 42= 30)【解析】根据题中数表画出数据的散点图如图所示:(2)由题中数表,知三=|(0+1+2 + 3 + 4) = 2 , 7 =,(5 + 7 + 8 + 11 + 19) = 10 ,52沙-5 x yi= 1所以为二二3.25- 5 X 2i 1a=y -hx =3.6所以经验回归方程为y = 3.2x + 3.6 ;(3)当 x = 5 时夕=3.2x5 + 3.6 = 19.6(十万)=196(万).估计2021年该城市人口总数约为196万.01能力进阶一水平二(30分钟60分)一、单
15、选题(每小题5分,共20分)1 .对变量x ,y进行回归分析时,依据得到的4个不同的回归模型画 出残差图,则下列模型拟合精度最高的是()【解析】选A.用残差图判断模型的拟合效果,残差点比较均匀地落 在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越 窄,说明模型的拟合精度越高.2 .在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg , 他的曾祖父、祖父、父亲、儿子的体重分别为58 kg、64 kg、58 kg、60 kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与响应变量用勺回归方程为标+。,其中方=0.5 ,据此模型预 测他的孙子的体重约为()A.
16、58 kg B . 61 kg C . 65 kg D . 68 kg【解析】选B.由于体重是隔代遗传,且呈线性相关,则取数据(58 ,58) , (64 , 62) , (58 , 60),_ 58 + 64 + 58_ 58 + 62 + 60得 x = 60 , y = 60 ,即样本点的中心为(60 , 60),代入版+金,得3 = 60 - 0.5x60 = 30 ,贝口 = 0.5% + 30 ,取 X = 62 ,可得0.5x62 + 30 = 61 kg.故预测他的孙子的体重约为61 kg.【加练固】5 G网络是一种先进的高频传输技术,我国的5 G技术发展迅速,已 位居世界前列
17、.华为公司2019年8月初推出了一款5 G手机,现调 查得到该款5 G手机上市时间x和市场占有率丫(单位:)的几组相 关对应数据.如图所示的折线图中,横轴1代表2019年8月,2代 表2019年9月,5代表2019年12月,根据数据得出丫关于大 的经验回归方程为3 = 0.042% - a.若用此方程分析并预测该款手机市 场占有率的变化趋势,则最早何时该款5 G手机市场占有率能超过 0.5%(精确到月)()A.2020 年 6 月 B . 2020 年 7 月C.2020 年 8 月 D . 2020 年 9 月一 1+2+3+4+5【解析】选C.根据表中数据,得X =5= 3 , 1y =(
18、0.02 + 0.05 + 0.1 +0.15 + 0.18) = 0.1 ,所以0.1 =0.042x3 - a , a = 0.026 ,所以经验回归方程为0.042%-0.026 ,由 0.042% - 0.026 0,5,得 x13 ,预计上市13个月时,即最早在2020年8月,市场占有率能超过0.5%.3.各地医疗机构针对某种疾病采取了各种的治疗方法,取得了不错 的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表 所示:周数(无)12345治愈人数(D21736103142由表格可得丫关于x的非线性经验回归方程为少=+ a ,则此回归 模型第4周的残差(实际值与预测值之差)
19、为()A . 5 B . - 13C . 13 D . 0 1【解析】选 C.因为 = 5(1+4 + 9 + 16 + 25) = 11 ,7 =1(2+ 17 + 36+ 103 + 142) = 60 ,所以二60 - 6x11=-6 ,则丫关于工的非线性经验回归方程为-6.取工=4,得/=6x42 - 6 = 90 ,所以此回归模型第4周的预报值为90 ,则此回归模型第4周的残差为103 - 90 = 13.4 .已知x与)之间的几组数据如下表:X123456y021334假设根据上表数据所得线性回归直线方程为$=标+ 3,若某同学根据 上表中的前两组数据(1 , 0)和(2,2)求得
20、的直线方程为/ = bx +火则 以下结论正确的是()A . bbf , aarB . bbf , aafC . baD . bb , a b , a a.二、多选题(每小题5分,共10分,全部选对得5分,选对但不全的 得2分,有选错的得0分).对于回归分析,下列说法正确的是()A.在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线9=-3%+ 2的图象上,则相关 系数r = 1C.若残差平方和越小,则决定系数代越大D.在回归分析中,变量间的关系若是非确定关系,那么因变量不能 由自变量唯一确定【解析】选ACD.对于A,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或
21、体重的估计值等,所以A正确;对于B,散点图中的一组点全部位于直线3 = - 3x + 2的图象上 厕犯 y成负相关,目相关关系最强,此时相关系数-1 ,所以B错误; 对于C,若残差平方和越小,则残差点分布的带状区域的宽度越窄,其相关性越强,决定系数R2 越大,所以C正确;对于D,回归分析中,变量间的关系若是非确定关系,即变量间的关 系不是函数关系,因变量不能由自变量唯一确定,所以D正确.5 .对两个变量y和x进行回归分析,得到一组样本数据:(xi , y), 3 ,丝),(法,%),则正确的说法是()A .若求得的回归方程为/ = 0.9x - 0.3 ,则变量y和之间具有正的线 性相关关系B
22、 .若这组样本数据分别是(1 , 1) , (2 , 1.5) , (4 , 3) , (5,4.5)则其回 归方程= bx + a必过点(3 ,2.5)C若同学甲根据这组数据得到的回归模型1的残差平方和为尸08 同学乙根据这组数据得到的回归模型2的残差平方和为52 = 2.1 ,则 模型1的拟合效果更好D .若用决定系数底来刻画回归效果,回归模型3的决定系数Rl = 0.32 ,回归模型4的决定系数盾=0.91 ,则模型3的拟合效果更好【解析】选ABC.对于A :根据求得的回归方程为f = 0.9x - 0.3 ,中的斜率为正,得出变量y和x之间具有正的线性相关关系;故A正确, 对于B :样
23、本中心点在直线上,故B正确,对于C:残差平方和越小的模型,拟合效果越好,故C正确,对于D :决定系数代用来衡量两个变量之间线性关系的强弱,K越 接近于1 ,说明相关性越强,相反,相关性越小,因此肥越大拟合效 果越好,故D不正确.给出下列四个命题,正确的是()A .由样本数据得到的回归方程标必过样本点的中心(二,了)B .用相关指数配来刻画回归效果,肥的值越小,说明模型的拟合效 果越好C.若线性回归方程为3 - 2.5x,则变量x每增加1个单位时,y平 均减少2.5个单位D.在残差图中,残差点分布的带状区域的宽度越窄,残差平方和越 小【解析】选ACD.对于A,由样本数据得到的回归方程修二标+。必过 样本点的中心(三,亍),命题正确;对于B ,用相关指数K来刻画回归效果,配的值越大,说明模型的 拟合效果越好,命题错误;对于C ,在线性回归方程3=3 - 2.5%中,变量x每增加1个单位时,y平均减少2.5个单位,命题正确;