《《1.1回归分析的基本思想及其初步应用》ppt课件.ppt》由会员分享,可在线阅读,更多相关《《1.1回归分析的基本思想及其初步应用》ppt课件.ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、11回归分析的基本思想及其初步应用【课标要求】1了解随机误差、残差、残差分析的概念;2会用残差分析判断线性回归模型的拟合效果;3掌握建立回归模型的步骤;4通过对典型案例的探究,了解回归分析的基本思想方法 和初步应用【核心扫描】1利用散点图分析两个变量是否存在相关关系,求线性回归方程(重点)2回归模型的选择,特别是非线性回归模型非线性回归模型(难点、易错点难点、易错点)自学导引1回归分析 回归分析是对具有 的两个变量进行统计分析的一种常用方法2线性回归模型 (1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数ybxa描述它们之间的关系,因此用线性回归模型ybxae来
2、表示,其中a、b为未知参数,e为 相关关系随机误差(3)解释变量和预报变量线性回归模型与一次函数模型的不同之处是增加了随机误差项e,因变量y由 和 共同确定,即自变量x只解释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量自变量x随机误差e试一试:下表是x和y之间的一组数据,则y关于x的线性回归方程必过().A点(2,3) B点(1.5,4)C点(2.5,4) D点(2.5,5)x 1 2 3 4y 1 3 5 73刻画回归效果的方式残差 样本编号 身高数据 体重估计值 越小 解释 预报 想一想:回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示不一
3、定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等4非线性回归分析 (1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近我们就称这两个变量之间不具有线性相关关系而是非线性相关关系(2)非线性回归方程线性化yaxn(其中a,x,y均为正值)(幂函数型函数)lg ylg an lg x,令ulg y,vlg x,blg a,则unvb,图象为一直线ycax(a0,c0)(指数型函数)lg yx lg alg c,令ulg y,blg c,dlg a,则udxb,图象
4、为一直线2线性回归分析(1)由线性回归方程给出的是一个预报值而非精确值(2)随机误差的主要来源线性回归模型与真实情况引起的误差;省略了一些因素的影响产生的误差;观测与计算产生的误差(3)残差分析是回归分析的一种方法(4)用相关指数R2来刻画回归效果R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如最
5、小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大或残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等3建立回归模型的基本步骤题型一求线性回归方程【例1】 某班5名学生的数学和物理成绩如下表:学生学科ABCDE数学成绩(x) 88 76 73 66 63物理成绩(y) 78 65 71 64 61(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩思路探索 先利用散点图分析物理成绩与数学成绩是否线性相关,若相关再利用线性回归模型求解规律方法(1)散点图是定义在具有相关关
6、系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据: (1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格房屋面积/m211511080135 105销售价格/万元 24.8 21.6 18.4 29.222题型二线性回归分析【例2】 为研究重量x(
7、单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析x51015202530y 7.25 8.12 8.95 9.90 10.9 11.8思路探索 作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄(2)列表如下:(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水
8、平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面【变式2】 已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏x 14 16 18 20 22y 12 10753题型三非线性回归分析【例3】 下表为收集到的一组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值x 21 23 25 27 293235y71
9、1 21 24 66 115 325 (1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关由散点图得x、y之间的回归模型(2)进行拟合,预报回归模型,求回归方程规范解答 (1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1、c2为待定的参数(4分)(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z 1.946
10、2.398 3.045 3.178 4.190 4.745 5.784求得回归直线方程为0.272x3.849,e0.272x3.849. (8分)残差yi711212466115325i6.44311.10119.12532.95056.770128.381290.325i0.557 0.1011.8758.9509.2313.38134.675【题后反思】 解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性问题转化为线
11、性回归问题;(4)分析拟合效果:通过计算相关指数等来判断拟合效果;(5)写出非线性回归方程【变式3】 为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数天数x/天123456繁殖个数y/个 6 12 25 49 95 190解(1)所作散点图如图所示(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x123456z 1.79 2.48 3.22 3.89 4.55 5.25用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果更好