《31回归分析的基本思想及其初步应用(一).ppt》由会员分享,可在线阅读,更多相关《31回归分析的基本思想及其初步应用(一).ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、3.1回归分析的基回归分析的基本思想及其初步本思想及其初步应用(一)应用(一)高二数学高二数学 选修选修2-3城阳一中城阳一中 毛世勤毛世勤1/5/2023郑平正 制作(一)回顾:数学(一)回顾:数学线性回归分线性回归分析的步骤析的步骤 :温故知新温故知新1、画散点图、画散点图4、用回归直线方程进行预报、用回归直线方程进行预报3、求回归直线方程、求回归直线方程 2、求、求 (二)最小二乘估计公式(二)最小二乘估计公式:称为样本点的中心称为样本点的中心。(三)描述两个变量之间线性相关关系的强(三)描述两个变量之间线性相关关系的强弱的相关系数弱的相关系数r课前检测:课前检测:假设关于某设备的使用年
2、限假设关于某设备的使用年限x和所支出的维修费和所支出的维修费用用 y(万元),有如下的统计资料。万元),有如下的统计资料。使用年限使用年限x 23456维修费用维修费用y 2.23.85.56.57.0若由资料知若由资料知,y对对x呈线性相关关系。试求:呈线性相关关系。试求:(1)线性回归方程)线性回归方程 的回归系数的回归系数 ;()估计使用年限为()估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?使用年限为使用年限为10年时,维修费用是年时,维修费用是:12.38万元万元 2008年年5月,中共中央国务院关于加月,中共中央国务院关于加强青少年体育、增强青少年体质的意强青少年体
3、育、增强青少年体质的意见指出城市超重和肥胖青少年的比例见指出城市超重和肥胖青少年的比例明显增加明显增加.“身高标准体重身高标准体重”该指标该指标对于学生形成正确的身体形态观具有对于学生形成正确的身体形态观具有非常直观的教育作用非常直观的教育作用.“身高标准体身高标准体重重”从何而来?我们怎样去研究从何而来?我们怎样去研究?创设情境:创设情境:例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号12345678身高/cm 165165 157 170 175 165 155 170体重/kg4857505464614
4、359求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。的女大学生的体重。问题呈现:女大学生的身高与体重问题呈现:女大学生的身高与体重解;解;1.由于问题中由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量高为自变量x,体,体重为因变量重为因变量y3.3.回归方程:回归方程:2.散点图;散点图;4.本例中本例中,r=0.7980.75这表明体重与身高有很强的线性相关这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。关系,从而也表明我们建
5、立的回归模型是有意义的。探究探究:身高为身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗吗?如果不是,你能解析一下原因吗?如果不是,你能解析一下原因吗?答:身高为答:身高为172cm的女大学生的体重不一定是的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于但一般可以认为她的体重接近于60.316kg。例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号12345678身高/cm 165165 157 170 175 165 155 170体重/kg485750546
6、4614359女大学生的身高与体重女大学生的身高与体重解;解;1.由于问题中由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量高为自变量x,体,体重为因变量重为因变量y3.3.回归方程:回归方程:2.散点图;散点图;4.本例中本例中,r=0.7980.75这表明体重与身高有很强的线性相关这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。关系,从而也表明我们建立的回归模型是有意义的。例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号12345678身高/
7、cm 165165 157 170 175 165 155 170体重/kg4857505464614359女大学生的身高与体重女大学生的身高与体重我们可以用下面的我们可以用下面的线性回归模型线性回归模型来表示:来表示:y=bx+a+e,(3)其中其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差称为随机误差。y=bx+a+e,E(e)=0,D(e)=(4)在线性回归模型在线性回归模型(4)中,随机误差中,随机误差e的方差的方差 越小,通过越小,通过回归直线回归直线 (5)预报真实值预报真实值y的精度越高。的精度越高。例例1 从某大学中随机选取从某大学中随机选取8名女大学生,其身高
8、和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号12345678身高/cm 165165 157 170 175 165 155 170体重/kg4857505464614359女大学生的身高与体重女大学生的身高与体重我们可以用下面的我们可以用下面的线性回归模型线性回归模型来表示:来表示:y=bx+a+e,(3)其中其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差称为随机误差。y=bx+a+e,E(e)=0,D(e)=(4)在线性回归模型在线性回归模型(4)中,随机误差中,随机误差e的方差的方差 越小,通过越小,通过回归直线回归直线 (5)预报真实值预报真实值
9、y的精度越高。的精度越高。随机误差是引起预报值随机误差是引起预报值 与真实值与真实值y之间的误差的原因之一,之间的误差的原因之一,其大小取决于随机误差的方差。其大小取决于随机误差的方差。另一方面,由于公式另一方面,由于公式(1)和和(2)中中 和和 为截距和斜率的估计值,为截距和斜率的估计值,它们与真实值它们与真实值a和和b之间也存在误差,这种误差是引起预报值之间也存在误差,这种误差是引起预报值与真实值与真实值y之间误差的另一个原因。之间误差的另一个原因。假设假设 1:身高和随机误差的不同不会对体重产生任何影响,身高和随机误差的不同不会对体重产生任何影响,54.554.554.554.554.
10、554.554.554.5体重/kg170155165175170157165165身高/cm87654321编号54.5kg怎样研究随即误差?怎样研究随即误差?5943616454505748体重/kg170155165175170157165165身高/cm87654321编号 例如,编号为例如,编号为6的女大学生的体重并没有落在水平直线上,她的的女大学生的体重并没有落在水平直线上,她的体重为体重为61kg。解释变量(身高)和随机误差共同把这名学生的体解释变量(身高)和随机误差共同把这名学生的体重从重从54.5kg“推推”到了到了61kg,相差相差6.5kg,所以,所以6.5kg是解释变量
11、是解释变量和随机误差的和随机误差的组合效应组合效应。用这种方法可以对所有预报变量计算组合效应。用这种方法可以对所有预报变量计算组合效应。数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用表示总的效应,称为表示总的效应,称为总偏差平方和总偏差平方和。5943616454505748体重/kg170155165175170157165165身高/cm87654321编号 假设假设2:随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在
12、回归直线上。中所有的点将完全落在回归直线上。怎样研究随即误差?怎样研究随即误差?因此,数据点和它在回归直线上相应位置的差异因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,是随机误差的效应,称称 为为残差残差。例如,编号为例如,编号为6的女大学生,计算随机误差的效应(残差)为:的女大学生,计算随机误差的效应(残差)为:对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号称为称为残差平方和残差平方和,它代表了随机误差的效应。它代表了随机误差的效应。表示为:表示为:我们可以用我们可以用相关指数相关指
13、数R2来刻画回归的效果,其计算公式是来刻画回归的效果,其计算公式是如何衡量预报的精度?如何衡量预报的精度?显然,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。的值越大,说明残差平方和越小,也就是说模型拟合效果越好。如果某组数据可能采取几种不同回如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比归方程进行回归分析,则可以通过比较较R2的值来做出选择,即选取的值来做出选择,即选取R2较大较大的模型作为这组数据的模型。的模型作为这组数据的模型。学以致用:学以致用:1、在对两个变量,进行线性回归分析时有、在对两个变量,进行线性回归分析时有下列步骤:下列步骤:对所求出的回
14、归方程作出解释,对所求出的回归方程作出解释,收集数据(,)收集数据(,)求线性回归方程,求线性回归方程,求相关系数,求相关系数,根据所搜集的数据绘根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量,具有线制散点图如果根据可靠性要求能够作出变量,具有线性相关结论,则在下列操作顺序中正确的是()性相关结论,则在下列操作顺序中正确的是()学以致用:学以致用:2、对于相关指数,下列说法正确的是()、对于相关指数,下列说法正确的是()、的取植越小,模型拟合效果越好、的取植越小,模型拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值越接近,模
15、型拟合效果越好、的取值越接近,模型拟合效果越好、以上答案都不对、以上答案都不对学以致用:学以致用:3、甲、乙、丙,丁四位同学各自对,两变量、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得的线性相关性做实验,并用回归分析方法分别求得相关系数相关系数r与残差平方和与残差平方和m如下表:如下表:甲甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的实验结果体现,两变量有更强的线性相关性则哪位同学的实验结果体现,两变量有更强的线性相关性甲乙丙丁甲乙丙丁学以致用:学以致用:4、已知两个变量已知两个变量x和和y之间有线性相关性,次实之间有线性相关性,次实验得到样本如下:验得到样本如下:6.13.920y3210 x()则()则y对对x的线性回归方程是的线性回归方程是()相应于各样本点的残差()相应于各样本点的残差(i=1,2,3,4)分别是,分别是,残差平方和是残差平方和是课堂总结:课堂总结:1、线性回归分析的步骤、线性回归分析的步骤2、回归模型的建立、回归模型的建立3、随机误差的研究、随机误差的研究知识小节知识小节:数学思想小结数学思想小结:1、最小二乘法思想、最小二乘法思想2、函数与方程的思想、函数与方程的思想3、数形结合、数形结合