《五章回归分析方法.ppt》由会员分享,可在线阅读,更多相关《五章回归分析方法.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1五章回归分析方法 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望251 一元线性回归一、什么叫回归分析一、什么叫回归分析(一)两种不同类型的变量关系、函数与相关(一)两种不同类型的变量关系、函数与相关简单的说,回归分析就是一种处理变量与变量之间关系的简单的说,回归分析就是一种处理变量与变量之间关系的数学方法。数学方法。例:自由落体运动中,物体下落的举例例:自由落体运动中,物体下落的举例S与所需时间与所需时间t之间,有之间,有如下关系如下关系 3变量变量S的值随的
2、值随t而定,这就是说,如果而定,这就是说,如果t去了固定值,去了固定值,那么那么S的值就完全确定了的值就完全确定了这种关系就是所谓的函数关系或确定性关系这种关系就是所谓的函数关系或确定性关系回归分析方法是处理变量之间相关关系的有力工具,回归分析方法是处理变量之间相关关系的有力工具,它不仅提供建立变量间关系的数学表达式它不仅提供建立变量间关系的数学表达式经验公经验公式,而且利用概率统计知识进行了分析讨论,从而判式,而且利用概率统计知识进行了分析讨论,从而判断经验公式的正确性断经验公式的正确性4二、回归分析所能解决的问题二、回归分析所能解决的问题回归分析主要解决以下几方面的问题:回归分析主要解决以
3、下几方面的问题:(1)确定几个特定变量之间是否存在相关关系,如果)确定几个特定变量之间是否存在相关关系,如果存在的话,找出她们之间合适的数学表达式存在的话,找出她们之间合适的数学表达式(2)根据一个或几个变量的值,预报或控制另一个变)根据一个或几个变量的值,预报或控制另一个变量的取值,并且要知道这种预报或控制的精确度量的取值,并且要知道这种预报或控制的精确度(3)进行因素分析,确定因素的主次以及因素之间的)进行因素分析,确定因素的主次以及因素之间的相互关系等等相互关系等等5一元线性回归分析,只要解决:一元线性回归分析,只要解决:(1)求变量)求变量x与与y之间的回归直线方程之间的回归直线方程(
4、2)判断变量)判断变量x和和y之间是否确为线性关系之间是否确为线性关系(3)根据一个变量的值,预测或控制另一变量的)根据一个变量的值,预测或控制另一变量的取值取值6二、一元线性回归方程的确定二、一元线性回归方程的确定789101112三、回归方程检验方法三、回归方程检验方法(一)方差分析法(一)方差分析法回顾方差分析的基本特点:回顾方差分析的基本特点:把所给数据的总波动分解为两部分,一部分反映水平变化把所给数据的总波动分解为两部分,一部分反映水平变化引起的波动,另一部分反映由于存在试验误差而引起的波动。引起的波动,另一部分反映由于存在试验误差而引起的波动。然后把各因素水平变化引起的波动与试验误
5、差引起的波动大小然后把各因素水平变化引起的波动与试验误差引起的波动大小进行比较,而达到检验因素显著性的目的进行比较,而达到检验因素显著性的目的.1314151617(二)相关系数检验法(二)相关系数检验法18192021222324n-2123456789100.05 0.010.9970.9500.8780.8110.7540.7070.6660.6320.6020.5761.0000.9900.9590.9170.8740.8340.7980.7650.7350.708n-2111213141516171819200.05 0.010.5530.5320.5140.4790.4820.46
6、80.4560.4440.4330.4130.6840.6610.6410.6230.6060.5900.5750.5610.5490.537n-2212223242526272829300.05 0.010.4130.4040.3960.3880.3810.3740.3670.3640.3550.3490.5260.5150.5050.4960.4870.4780.4700.4630.4560.449相关系数临界值表25四、预报与控制四、预报与控制当我们求得变量当我们求得变量x、y之间的回归直线方程后,之间的回归直线方程后,往往通过回归方程回答这样两方面的问题:往往通过回归方程回答这样两方面
7、的问题:(1)对任何一个给定的观测点)对任何一个给定的观测点x0,推断,推断y0大致落的范围大致落的范围(2)若要求观测值)若要求观测值y在一定的范围在一定的范围y1yy2内取值,应将变内取值,应将变量控制在什么地方量控制在什么地方前者就是所谓的预报问题,后者称为控制问题。前者就是所谓的预报问题,后者称为控制问题。262728293031五、应用举例五、应用举例例例61 在某产品表明腐蚀刻线,下表是试验活在某产品表明腐蚀刻线,下表是试验活得的腐蚀时间(得的腐蚀时间(x)与腐蚀深度()与腐蚀深度(y)间的一组数)间的一组数据。试研究两变量(据。试研究两变量(x,y)之间的关系。)之间的关系。腐蚀
8、时间腐蚀时间x(秒)(秒)腐蚀深度腐蚀深度y()5 5 10 20 30 40 50 60 65 90 1204 6 8 13 16 17 19 25 25 29 463240302010yx10 20 30 40 50 60 70 80 90 100 110 1203334序号1234567891011551020304050606590120495468131617192525294620825251004009001600250036004225810014400358751636641692562893616256258412116539820308026048068095015001
9、6252610552013755353637383952 多元回归分析方法多元回归分析方法一、多元回归分析概述一、多元回归分析概述 上节讨论的只是两个变量的回归问题,其中因变上节讨论的只是两个变量的回归问题,其中因变量只与一个自变量相关。但这只是最简单的情况,在量只与一个自变量相关。但这只是最简单的情况,在大多数的实际问题中,影响因变量的因素不是一个而大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。是多个,我们称这类回问题为多元回归分析。我们这里着重讨论简单而又最一般的线性回归问我们这里着重讨论简单而又最一般的线性回归问题,这是因为许多非线性的情形可以化为
10、线性回归来题,这是因为许多非线性的情形可以化为线性回归来做。多元线性回归分析的原理与一元线性回归分析完做。多元线性回归分析的原理与一元线性回归分析完全相同,但在计算上却要复杂得多。不过,应用计算全相同,但在计算上却要复杂得多。不过,应用计算机多元回归的计算量是很小的,一般的计算机都有多机多元回归的计算量是很小的,一般的计算机都有多元回归(以及逐步回归方法)的专门程序元回归(以及逐步回归方法)的专门程序。4041424344454647多元线性回归方差分析表484偏回归平方和与因素主次的差别偏回归平方和与因素主次的差别 前面讲的有关多元线性回归的内容,纯属一元情形的推广,前面讲的有关多元线性回归
11、的内容,纯属一元情形的推广,只是形式上复杂一些而已,而偏回归平方和与因素主次的差别则只是形式上复杂一些而已,而偏回归平方和与因素主次的差别则是多元回归问题所特有的。是多元回归问题所特有的。先从判别因素的主次说起。在实际工作中先从判别因素的主次说起。在实际工作中,我们还关心我们还关心Y对对x1,x2,xk的线性回归中的线性回归中,哪些因素哪些因素(即自变量即自变量)更重要些更重要些,哪些哪些不重要不重要,怎栏来衡量某个特定因素(,怎栏来衡量某个特定因素(,)的影响呢)的影响呢?我们知道我们知道,回归平方和回归平方和U这个量这个量,刻划了全体自变量刻划了全体自变量x1,x2,xk对于对于Y总的线性
12、影响总的线性影响,为了研究为了研究xk的作用的作用,可以这样可以这样来考虑来考虑:从原来的个自变量中扣除从原来的个自变量中扣除xk,我们知道这个自变我们知道这个自变量量x1,x2,xxk-1k-1对于对于Y的总的线性影响也是一个回归平方和的总的线性影响也是一个回归平方和,记作记作U U(k)(k);我们称;我们称 P Pk k=U-U=U-U(k)(k)49 为为x1,x2,xk中中xk的偏回归平方和。这个偏回归平的偏回归平方和。这个偏回归平方和也可看作方和也可看作xk产生的作用产生的作用,类似地类似地,可定义为可定义为U U(i).(i).一般地一般地,称称 P Pi i=U-U=U-U(i
13、)(i)为为x1,x2,xk 中中i的偏回归平方和。用它来衡量的偏回归平方和。用它来衡量i在在Y对对x1,x2,xk的线性回归中的作用的大小。的线性回归中的作用的大小。50 51 从偏回归平方和的意义可以看出从偏回归平方和的意义可以看出,凡是对凡是对Y作用显著的因素作用显著的因素一般具有较大的一般具有较大的i值。值。i愈大愈大,该因素对该因素对Y的作用也就愈大的作用也就愈大,这样这样通过比较各个因素的通过比较各个因素的P值就可以大致看出各个因素对因素变量作值就可以大致看出各个因素对因素变量作用的重要性。用的重要性。在实用上在实用上,在计算了偏回归平方和后在计算了偏回归平方和后,对各因素的对各因
14、素的分析可以按下面步骤进行分析可以按下面步骤进行:凡是偏回归平方和大的凡是偏回归平方和大的,也就是显著性的那些因素也就是显著性的那些因素,一定是对一定是对Y有重要影响有重要影响的因素。至于偏回归平方和大到什么程度才算显著的因素。至于偏回归平方和大到什么程度才算显著,要对它作检验要对它作检验,检验检验的方法与本节中对总回归的检验法类似。的方法与本节中对总回归的检验法类似。为此为此,我们要先计算我们要先计算 52 其中其中S即是方差分析计算中的剩余方差即是方差分析计算中的剩余方差,F自由度为(,自由度为(,),于是在给定的显著性水平于是在给定的显著性水平,按前面的,按前面的F检验法检验法,检验该因
15、素的偏回检验该因素的偏回归平和的显著性。归平和的显著性。凡是偏回归平方和小的凡是偏回归平方和小的,即不显著的变量即不显著的变量;则可肯定偏回归平方和最小的则可肯定偏回归平方和最小的那个因素必然是在这些因素中对那个因素必然是在这些因素中对Y作用最小的一个作用最小的一个,此时应该从回归方程此时应该从回归方程中将变量剔除。剔除一个变量后中将变量剔除。剔除一个变量后,各因素的偏回归平方和的大小一般的都各因素的偏回归平方和的大小一般的都会有所改变会有所改变,这时应该对它们重新作出检验。这时应该对它们重新作出检验。另外需要说明一下就是另外需要说明一下就是,在通常情况下在通常情况下,各因素的偏回归平方和相加并各因素的偏回归平方和相加并不等于回归平方和。不等于回归平方和。只有当正规方程的系数矩阵为对角型只有当正规方程的系数矩阵为对角型53