《【高中数学】第2课时 一元线性回归模型的综合问题课件 高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【高中数学】第2课时 一元线性回归模型的综合问题课件 高二下学期数学人教A版(2019)选择性必修第三册.pptx(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第2课时一元线性回归模型的综合问题8.2 一元线性回归回归模型及其应用 1一元线性回归模型2对数函数模型yc1c2ln x3残差平方和与决定系数R201一 元 线 性 回 归 模 型问题1上节课中我们知道儿子身高 Y关于父亲身高 x的经验回归方程 为 0.839x 28.957,那 么 当 x 172时,0.839172 28.957173.265(cm),如果一位父亲的身高为172 cm,他儿子长大成人后的身高一定是173 cm吗?为什么?提示不一定,因为还有其他影响他儿子身高的因素,父亲的身高不能完全决定儿子身高.问题2对于课本105页表8.21中的第6个观测,我们发现当父亲身高为172
2、cm时,儿子的身高实际为176 cm,实际身高与预测的身高相差了多少?提示176173.2652.735(cm).知识梳理1.残差:对于响应变量Y,通过观测得到的数据称为_,通过经验回归方程得到的 称为_,_减去_称为残差.2.残差分析:_是随机误差的估计结果,通过对_的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为_.观测值预测值观测值预测值残差残差残差分析(1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是例1用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区
3、域的宽度越窄,说明模型的拟合精度越高.(2)已知一系列样本点(xi,yi)(i1,2,3,n)的经验回归方程为 2xa,若样本点(r,1)与(1,s)的残差相同,则有A.rs B.s2rC.s2r3 D.s2r1样本点(r,1)的残差为12ra,样本点(1,s)的残差为sa2,依题意得12rasa2,故s2r3.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.反思感悟练习1 (1)已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第_个.原始数据中的可疑数据往往是残差绝对值过大的那个数据
4、,即偏离平衡位置过大.6(2)某种产品的广告支出x与销售额y(单位:万元)之间有如表关系,y与x的经验回归方程为 6.5x17.5,当广告支出为5万元时,随机误差的残差为A.10 B.20 C.30 D.40由表格知当广告支出5万元时,销售额为60万元,所以随机误差的残差为605010.x24568y304060507002对数函数模型yc1c2ln x噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:dB)与声音能量I(单位:W/cm2)之间的关系,将测量得到的声音强度Di和声音能量Ii(i1,2,10)数据作了初步处理,得到右面的散点图及一些统计量的值.例21
5、.04101145.7 11.51.5610210.516.8810115.1由Wilg Ii,先建立D关于W的经验回归方程,(2)当声音强度大于 60 dB时属于噪音,会产生噪声污染,城市中某点 P共受到两个声源的影响,这两个声源的声音能量分别是 I1和I2,且 已 知 点 P的 声 音 能 量 等 于 声 音能量I1与I2之和,请根据(1)中的经验回归方程,判断P点是否受到噪声污染的干扰,并说明理由.点P的声音能量II1I2,点P会受到噪声污染的干扰.对数函数模型yc1c2ln x的求法(1)确定变量,作出散点图.(2)根据散点图,做出yc1c2ln x的函数选择.反思感悟练习2生物学家认
6、为,睡眠中的恒温动物依然会消耗体内能量,主要是为了保持体温.脉搏率f是单位时间心跳的次数,医学研究发现,动物的体重W(单位:g)与脉搏f存在着一定的关系.如表给出一些动物体重与脉搏率对应的数据,图1画出了体重W与脉搏率f的散点图,图2画出了lg W与lg f的散点图.动物名鼠大鼠豚鼠兔小狗大狗羊体重252003002 0005 00030 00050 000脉搏率6704203002001208570为了较好地描述体重和脉搏率的关系,现有以下两种模型供选择:fkWb;lg fklg Wb.(1)选出你认为最符合实际的函数模型,并说明理由;图图1图图2模型lg fklg Wb最符合实际.根据散点
7、图的特征,图2基本上呈直线形式,所以可选择一次函数来刻画lg W和lg f的关系.(2)不妨取表中豚鼠和兔的体重脉搏率数据代入所选函数模型,求出f关于W的函数解析式.参考数据:lg 20.3,lg 30.5.lg 2002lg 22.3,lg 2 0003lg 23.3,lg 3002lg 32.5.所以f关于W的函数解析式为f .03残差平方和与决定系数R2问题3例2中给出了两个模型,那么如何比较这两个模型的拟合效果?提示残差平方和、决定系数.1.残差平方和法残差平方和 (yi )2越_,模型的拟合效果越_.2.决定系数R2 可以用 来比较两个模型的拟合效果,R2越_,模型的拟合效果越_,R
8、2越_,模型的拟合效果越_.小好大好小差知识梳理假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下表:例3x15.025.830.036.644.4y39.442.942.943.149.2并由最小二乘法计算得经验回归方程为 0.29x34.7.(1)计算各组残差,并计算残差平方和;(2)求R2.刻画回归效果的三种方法(1)残差图法:残差点比较均匀地落在水平带状区域内说明选用的模型比较合适.(2)残差平方和法:残差平方和 越小,模型的拟合效果越好.反思感悟(3)决定系数R2法:越接近1,表明模型的拟合效果越好.反思感悟练习3已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并借助残差平方和及R2说明回归模型拟合效果的好坏.列出残差表为00.30.40.10.24.62.60.42.44.4所以回归模型的拟合效果很好.课堂小结1.知识清单:(1)残差的概念.(2)对模型刻画数据效果的分析:残差图法、残差平方和法和R2法.2.方法归纳:数形结合、转化化归.3.常见误区:混淆残差图法、残差平方和法和R2法的概念,导致刻画回归效果出错.