《【数学课件】一元线性回归模型参数的最小二乘估计2课件 高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【数学课件】一元线性回归模型参数的最小二乘估计2课件 高二下学期数学人教A版(2019)选择性必修第三册.pptx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、8.2.2 一元线性回归模型参数的最小二乘估计2n引引n01结构导图结构导图n引引n01学习目标学习目标1.经历刻画散点与直线接近的程度的过程,体会一元线性回归模型参数的最小二乘估计原理2.体会对残差和残差图的分析,能用残差判断一元线性回归模型的有效性,发展数据分析能力.核心素养:直观想象,数学运算,数据分析,数学建模.重点:能根据实例,通过分析变量间的关系建立一元线性回归模型难点:参数估计值公式的推导,利用残差分析回归模型n引引n01复习巩固复习巩固称式为一元线性回归模型2.最小二乘法称为Y 关于x 的经验回归方程,其图形称为经验回归直线。n引引n02问题情境问题情境前面我们已经知道:儿子身
2、高Y关于父亲身高x的经验回归方程是如何判断上面的函数模型 刻画样本数据的效果呢?n评评n03建构新知建构新知前面我们已经知道:儿子身高Y关于父亲身高x的经验回归方程是对于课本中表8.2-1中的第6组数据,父亲身高是172cm,其儿子的身高的观测值观测值 y6=176cm.而通过经验回归方程得到的预测值 通过经验回归方程得到的因变量的值 称为由实际观测得到的因变量的值 称为n评评n03建构新知建构新知一、残差一、残差残差和误差什么关系?残差的作用是什么?残差和误差什么关系?残差的作用是什么?1.残差的本质:随机误差的估计结果;残差的本质:随机误差的估计结果;2.残差的作用:残差的作用:通过对残差
3、的分析可以判断模型刻画数据的效果;通过对残差的分析可以判断模型刻画数据的效果;如何如何通过对残差的分析可以判断模型刻画数据的效果通过对残差的分析可以判断模型刻画数据的效果?发现:发现:两侧两侧为对称轴的水平带状区域内为对称轴的水平带状区域内则则 该模型模该模型模拟的比较有效。拟的比较有效。若残差不是比较均匀的分布在若残差不是比较均匀的分布在x轴的两侧?轴的两侧?需要改进模型需要改进模型 计算残差、计算残差、画出残差画出残差散点图,散点图,判断模型判断模型的模拟效的模拟效果的果的 这个这个过程:过程:n评评n03建构新知建构新知练习:练习:P112的课本探究的课本探究n评评n03建构新知建构新知
4、n评评n04巩固应用巩固应用x23456y42.5-0.5-2-3变式变式.根据以下数据,求根据以下数据,求y关于关于x的经验回归方程的经验回归方程,并预测并预测x=10时,对于的时,对于的y的预测值。的预测值。n评评n04巩固应用巩固应用例2.经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程,并作残差分析.编号123456胸径/cm18.120.122.224.426.028.3
5、树高/m18.819.221.021.022.122.1编号789101112胸径/cm29.632.433.735.738.340.2树高/m22.422.623.024.323.924.7分析:你解这个问题有哪些关键步骤?散点图散点图经验回经验回归方程归方程残差表残差表残差图残差图调整模型调整模型n评评n04巩固应用巩固应用求成对数据的经验线性回归方程的一般步骤:求成对数据的经验线性回归方程的一般步骤:2.2.选择合适的经验回归方程模型选择合适的经验回归方程模型1.1.散点图散点图3.3.估计相关参数(如斜率参数、截距参数)估计相关参数(如斜率参数、截距参数)判断具有怎样的相关关系判断具有
6、怎样的相关关系判断是线性判断是线性/非线性相关?非线性相关?得出经验回归方程得出经验回归方程.n评评n04巩固应用巩固应用编号12345678年份18961912192119301936195619601968记录/s 11.8010.6010.4010.3010.2010.1010.009.95例3.人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程。思考:你准备分几步解决这个问题?第一步做什么?你准备分几步解决这个问题?第一步做什么
7、?n评评n04巩固应用巩固应用解:以成对数据中的世界纪录产生年份为横坐标以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图世界纪录为纵坐标作散点图,得到下图。得到下图。编号12345678年份18961912192119301936195619601968记录/s 11.8010.6010.4010.3010.2010.1010.009.95直观:散点看上去大致分布在一散点看上去大致分布在一条直线附近;条直线附近;分析:似乎可用一元线性回归模型似乎可用一元线性回归模型建立经验回归方程;建立经验回归方程;n评评n04巩固应用巩固应用追问1:有不同的想法吗?追问2:再观察图像的特征,
8、再观察图像的特征,可以用以前学的那个函数模型来刻画?追问3:这是一个非线性的经验回归函数,该如何估计?这是一个非线性的经验回归函数,该如何估计?线性的经验回归函数线性的经验回归函数n评评n04巩固应用巩固应用编号2345678年份/t1912192119301936195619601968x2.833.263.563.714.114.174.29记录/s10.60 10.40 10.30 10.20 10.10 10.009.95将原将原 年份变量数据进行转换得表:年份变量数据进行转换得表:得散点图:得散点图:8.2-148.2-14(课本(课本P117P117)由上表中的数据利用最小二乘法得
9、:由上表中的数据利用最小二乘法得:n评评n04巩固应用巩固应用现在观察散点图:现在观察散点图:8.2-148.2-14(课本(课本P117P117)现观察图:现观察图:8.2-168.2-16(课本(课本P118P118)直观:直观:非线性经验回归方程非线性经验回归方程对原始数据的拟合效果大大好于对原始数据的拟合效果大大好于量化:?量化:?残差分析:表残差分析:表8.2-78.2-7(课本(课本P118P118)n评评n04巩固应用巩固应用法二:法二:拟合系数拟合系数R R2 2法一:法一:残差平方和残差平方和越小越好越小越好R2越大,表示残差平方和越R2越小,表示残差平方和越小,即模型的拟合
10、效果越好;大,即模型拟合效果越差.追问:R2 的取值在什么范围呢?0R21,R2越接近1,拟合效果越好。n评评n04巩固应用巩固应用小结:判断模型模拟的效果好的方法法一:法一:残差平方和残差平方和越小越好越小越好法二:法二:拟合系数拟合系数R R2 20R21,R2越接近1,拟合效果越好。n评评n04巩固应用巩固应用注:在使用经验回归方程进行预测时,需注意以下问题1.回归方程只适用于我们所研究的样本的总体;2.我们所建立的回归方程一般都 有 时效性;3.解释变量的取值范围不能 离 样本数据的范围太远;4.不能期望回归方程得到的 预值测 就是响应变量的精确值.事实上,它是响应变量的可取值的平均值.n评评n04巩固应用巩固应用n结结n05课堂小结课堂小结1.1.本节课我们尽力怎样的学习过程?本节课我们尽力怎样的学习过程?2.2.学习了哪些新知识、方法?学习了哪些新知识、方法?