《【课件】一元线性回归模型与应用+课件高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【课件】一元线性回归模型与应用+课件高二下学期数学人教A版(2019)选择性必修第三册.pptx(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第八八章章 成对数据的统计分析成对数据的统计分析8.2.1一元线性回归模型与应用复习回顾复习回顾为了研究两个了研究两个变量之量之间的相关关系,我的相关关系,我们建立了建立了一元一元线性回性回归模型达式模型达式刻画的是刻画的是变量量Y与与变量量x之之间的的线性相关关系性相关关系残差平方和:残差:实际值与估计值之间的差值,即建模复习回顾复习回顾对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),记,其回归直线Ybx+a的斜率和截距的最小二乘估计分别为 我们将我们将 称为称为Y 关于关于x 的的经验回归方程经验回归方程,也称,也称经验回归函数经验回归函数或或经验回归公式经
2、验回归公式,其图形称为,其图形称为经验回归直线经验回归直线,这种求经验回归方程的方法叫,这种求经验回归方程的方法叫最小二乘法,最小二乘法,求得的求得的 ,叫做叫做b,a的的最小二乘估计最小二乘估计算模课堂探究课堂探究编编号号1234567891011121314父父亲亲身高身高/cm174170173169182172180172168166182173164180儿子身高儿子身高/cm176176170170185176178174170168178172165182对对于上表中的数据,利用公式于上表中的数据,利用公式(2)可以可以计计算出算出 得到得到儿子身高儿子身高Y关于父关于父亲亲身高
3、身高x的的经验经验回回归归方程方程为为 相相应应的的经验经验回回归归直直线线如下如下图图所示所示.课堂探究课堂探究问题1:当x=176时,,如果一位父亲身高为176cm,他儿子长大后身高一定能长到177cm吗?为什么?儿子的身高不一定会是177cm,这是因为还有其他影响儿子身高的因素,回归模型中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高,不过,我们可以作出推测,当父亲的身高为176cm时,儿子身高一般在177cm左右.如果把父亲身高为176cm的所有儿子身高作为一个子总体,那么177cm是这个子总体均值的估计值.课堂探究课堂探究问题2:根据:根据经验回回归方程中斜率的具体
4、含方程中斜率的具体含义,高个子的父,高个子的父亲一定生高个子的一定生高个子的儿子儿子吗?同?同样,矮个子,矮个子的父的父亲一定一定生矮个子生矮个子的儿子的儿子吗?问题3:建立经验回归方程后建立经验回归方程后,通常需要对模型刻画通常需要对模型刻画数据数据的效果进行的效果进行分析分析,如何,如何分析?分析?验模残差分析课堂探究课堂探究对于右表中的第6个观测,父亲身高为172cm,其儿子身高的观测值为y=176(cm),预测值为96=0.839172+28.957=173.265(cm),残差为176-173.265=2.735(cm).类似地,可以得到其他的残差,如表所示.为为了使数据更加直了使数
5、据更加直观观,用父,用父亲亲身高作身高作为为横坐横坐标标,残差作,残差作为纵为纵坐坐标标,可以画出残差,可以画出残差图图,如,如图图下所示下所示.残差图:012345-1-2-3-4-5160165170175180185残差残差/cm父父亲亲身高身高/cm观观察残差的散点察残差的散点图图可以可以发现发现,残差比,残差比较较均匀地分布在横均匀地分布在横轴轴的的两两边边.说说明明残差比残差比较较符符合一元合一元线线性回性回归归模型模型的的假定假定.对数据刻画效果比较好的残差图特征:残差点比较均匀的集中在水平带状区域内 思考思考 观察下列四幅残差图,你认为哪一个残差满足一元线性回归模型观察下列四幅
6、残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定中对随机误差的假定?通通过观过观察察发现发现,图图(4)的残差比的残差比较较均匀地均匀地分布在以取分布在以取值为值为0的的横横轴为对轴为对称称轴轴的水平的水平带带状区域内状区域内.所以在所以在四幅残差四幅残差图图中,只有中,只有图图(4)满满足一元足一元线线性回性回归归模型模型对对随机随机误误差的差的假假设设.课堂探究课堂探究 问问.在回归分析中,分析残差能够帮助我们解决哪些问题在回归分析中,分析残差能够帮助我们解决哪些问题?解:解:分析残差可以帮助我分析残差可以帮助我们们解决以下几个解决以下几个问题问题:(1)寻寻找残差明找残差明
7、显显比其他残差大很多的异常点,如果有,比其他残差大很多的异常点,如果有,检查检查相相应应的的样样本数据是否有本数据是否有错错.(2)分析残差分析残差图图可以可以诊诊断断选择选择的模型是否合适,如果不合适,可以参考的模型是否合适,如果不合适,可以参考残差残差图图提出修改模型的思路提出修改模型的思路.课堂探究课堂探究【例】如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图可以看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明(2)建立y关于关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量课堂探究课堂探究解:(1)由折线
8、图中数据和附注中参考数据得t=4,因为y与t的相关系数近似为0.99,所以y与t的线性相关程度相当高,从而可以用经验回归模型拟合y与t的关系.(2)由 及(1)得所以y与t的回归方程为将2016年对应的t=9代入回归方程得所以预测2016年我国生活垃圾无害化处理量为1.82亿吨课堂小结课堂小结建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量(2)画出解释变量与响应变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)计算r的值,评估变量间的线性相关程度(4)由经验确定回归方程的类型(5)按一定规则(如最小二乘法)估计经验回归方程中的参数.课堂探究课
9、堂探究 例 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表,试根据这些数据建立树高关于胸径的经验回归方程.编号编号123456胸径胸径/cm18.120.122.224.426.028.3树高树高/m18.819.221.021.022.122.1编号编号789101112胸径胸径/cm29.632.433.735.738.340.2树高树高/m22.422.623.024.323.924.7课堂探究课堂探究 例例 根据下面数据建立树高关于胸
10、径的经验回归方程根据下面数据建立树高关于胸径的经验回归方程.编号编号123456胸径胸径/cm18.120.122.224.426.028.3树高树高/m18.819.221.021.022.122.1编号编号789101112胸径胸径/cm29.632.433.735.738.340.2树高树高/m22.422.623.024.323.924.7解解:以胸径为横坐标,树高为纵坐标作散点图如下:以胸径为横坐标,树高为纵坐标作散点图如下:在右图中,散点大致分布在在右图中,散点大致分布在一条从左下角到右上角的直线附一条从左下角到右上角的直线附近,表明两个变量线性相关,并近,表明两个变量线性相关,并
11、且是正相关,因此可以用一元线且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间性回归模型刻画树高与胸径之间的关系的关系.用用d表示胸径表示胸径,h表示树高表示树高,根据据最小二乘法根据据最小二乘法,计算可计算可得经验回归方程为得经验回归方程为相应的经验回归直线如图所示相应的经验回归直线如图所示.编号编号胸径胸径/cm树高观测值树高观测值/m树高预测值树高预测值/m残差残差/m118.1 18.8 19.4-0.6 220.1 19.2 19.9-0.7 322.2 21.0 20.4 0.6 424.4 21.0 20.9 0.1 526.0 22.1 21.3 0.8 628.3 22
12、.1 21.9 0.2 729.6 22.4 22.2 0.2 832.4 22.6 22.9-0.3 933.7 23.0 23.2-0.2 1035.7 24.3 23.7 0.6 1138.3 23.9 24.4-0.5 1240.2 24.7 24.9-0.2 根据经验回归方程,由胸径的数据可以计算出树高的预测值根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到精确到0.1)以及相应的残差,如以及相应的残差,如下表所示下表所示.以胸径为横坐标以胸径为横坐标,残差为纵坐标残差为纵坐标,作残差图作残差图,得到得到下下图图.观察残差表和残差图,可以看到,残差的绝对值最大是观察残差表
13、和残差图,可以看到,残差的绝对值最大是观察残差表和残差图,可以看到,残差的绝对值最大是观察残差表和残差图,可以看到,残差的绝对值最大是0.80.8,所有残差,所有残差,所有残差,所有残差分布在以横轴为对称轴、宽度小于分布在以横轴为对称轴、宽度小于分布在以横轴为对称轴、宽度小于分布在以横轴为对称轴、宽度小于2 2的带状区域内的带状区域内的带状区域内的带状区域内.可见经验回归方程较好地可见经验回归方程较好地可见经验回归方程较好地可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高刻画了树高与胸径的关系,我
14、们可以根据经验回归方程由胸径预测树高刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.00.51.0-0.5-1.0152025303540残差残差/m胸径胸径/cm45(2)决定系数决定系数R2:通通过过前面的前面的讨论讨论我我们们知道,当知道,当残差的平方和越小残差的平方和越小,经验经验回回归归模型的模型的拟拟合效果就越好合效果就越好,故我,故我们们可以用可以用决定系数决定系数R2来来验证验证模型的模型的拟拟合效果合效果.决定系数决定系数R2的的计计算公式算公式为为在在R2表达式中,由于表达式中,由于 与与经验经验回回归归方程无关方程无关,残差平方和,残差平方和与与经验经验回
15、回归归方程有关方程有关,因此,因此R2越大越大,表示,表示残差平方和越小残差平方和越小,即,即模型的拟合效果模型的拟合效果越好越好;R2越小越小,表示,表示残差平方和越大残差平方和越大,即,即模型的拟合效果越差模型的拟合效果越差.决定系数决定系数R2:决定系数是决定系数是总总偏差平方和偏差平方和中中回回归归平方和平方和所占的比重所占的比重.显显然然0R21,R2越接近越接近1,则线则线性回性回归归刻画的效果越好刻画的效果越好.还还可以可以证证明,在一元明,在一元线线性回性回归归模型中模型中R2=r2,即决定系数,即决定系数R2等于响等于响应变应变量与解量与解释变释变量的量的样样本相关系数本相关系数r的平方的平方.回归回归平方平方和和总偏差平总偏差平方和方和课堂小结课堂小结2.残差平方和:残差平方和:1.最小二乘法最小二乘法将将 称为称为Y 关于关于x 的的经验回归方程经验回归方程.3.判断模型拟合的效果判断模型拟合的效果:残差分析残差分析R2越大,模型的拟合效果越好越大,模型的拟合效果越好,R2越小,模型拟合效果越小,模型拟合效果越差越差.