《一元线性回归分析预测法与多元回归分析44540.docx》由会员分享,可在线阅读,更多相关《一元线性回归分析预测法与多元回归分析44540.docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节 一元线性回归分析预测法一、 概念(思路路)根据预测变变量(因变变量)Y和和影响因素素(自变量量)X的历历史统计数数据,建立立一元线性性回归方程程,然后代代入X的预预测值,求求出Y的预预测值的方方法。基本公式:y=a+bx其中:a、bb为回归系系数,是未未知参数。基本思路:1、 利用X,YY的历史统统计数据,求求出合理的的回归系数数:a、bb,确定出出回归方程程2、 根据预计的的自变量xx的取值,求求出因变量量y的预测测值。二、 一元线性回回归方程的的建立1、 使用散点图图定性判断断变量间是是否存在线线性关系例:某地区区民航运输输总周转量量和该地区区社会总产产值由密切切相关关系系。年份总
2、周转量(亿亿吨公里)Y社会总产值值(百亿元)XX112.530214.536314.738415.141515.548616.852717.553818.253.5918.8552、 使用最小二二乘法确定定回归系数数使实际值与与理论值误误差平方和和最小的参参数取值。对应于自变变量xi,预测值值(理论值值)为b+m*xi,实际值值yi,min(yi-b-mxi)2,求a、bb的值。使用微积分分中求极值值的方法,得得:由下列方程程代表的直直线的最小小二乘拟合合直线的参参数公式:其中 m 代表斜率率 ,b 代表截距距。一元线性回回归.xls三、 回归方程的的显著性检检验判断X、YY之间是否否确有线性
3、性关系,判判定回归方方程是否有有意义。有两类检验验方法:相相关系数检检验法和方方差分析法法1、 相关系数检检验法构造统计量量r相关系数的的取值范围围为:-1,1,|r|的大小反反映了两个个变量间线线性关系的的密切程度度,利用它它可以判断断两个变量量间的关系系是否可以以用直线方方程表示。r值两变量之间间的关系r=1完全正相关关1r00正相关,越越接近1,相相关性越强强。越接近近0,相关关性越弱r=0不线性相关关0r-1负相关,越越接近-11,相关性性越强;越越接近0,相相关性越弱弱r=-1完全负相关关两个变量是是否存在线线性相关关关系的定量量判断规则则: 对于给定的的置信水平平,从相关关系数临界
4、界值表中查查出r临(n-22),把其其与用样本本计算出来来的统计量量r0比较:若|r0|r临(n-22)成立,则则认为X、YY之间存在在线性关系系,回归方方程在水平上显显著。差异异越大,线线性关系越越好。反之之则认为不不显著,回回归方程无无意义,变变量间不存存在线性关关系。其中:n为为样本数。2、 方差分析法法:方差分析的的基本特点点是把因变变量的总变变动平方和和分为两部部分,一部部分反映因因变量的实实际值与用用回归方程程计算出的的理论值之之差,一部部分反映理理论值与实实际值的平平均值之差差。Y的总变差差=Y的残残余变差+Y的说明明变差,SSST=SSSE+SSSR或:总离差差平方和=剩余平方
5、方和+回归归平方和回归平方和和U与剩余余平方和QQ相比越大大,说明回回归效果越越好。注:在方差差分析中,已已被解释的的和未被解解释的变差差除以相应应的自由度度的个数即即变为方差差。Y的方方差是Y的的总偏差平平方和除以以n-1,被被解释的方方差等于被被解释的变变差(因为为回归只比比估计Y的的均值多用用一个约束束条件),残残余方差等等于残差偏偏差平方和和除以n-2,残差差的方差SS2是误差方方差的无偏偏且一致的的估计(SS叫做回归归标准差)SS2=Q/(n-m)定量判断回回归有效性性有两种方方法:(1) 可决系数检检验法拟合优度统统计量;判判定系数 :r2=SSRR/SSTT=U/SSyy 调整的
6、r22 =1-Q/(nn-m)/Syyy/(nn-1)复相关系数数检验法:构造统计计量R=SSQRT1-Q/Syy=SSQRT(UU/Syyy)判断规则:对于给定的的置信度,从相关关系数r分分布表中查查出r临(n-mm),把其其与用样本本计算出来来的统计量量R0比较:若R0rr临(n-mm)成立,则则认为回归归方程在水平上显显著。反之之则认为不不显著,回回归方程无无意义,变变量间不存存在线性关关系。(2) F检验法:构造统计计量F=(UU/m-11)/QQ/(n-m)其中:m为为变量个数数(总数);n为样本本数。统计量F服服从第一自自由度为mm-1、第第二自由度度为n-mm的F(m-11,n-
7、mm)分布。F=r2/(1-rr2)*(nn-m)/(m-11)判断规则:对于给定的的置信度,从F分分布表中查查出F(m-11,n-mm),把其其与用样本本计算出来来的统计量量F0比较:若F0FF(m-11,n-mm)成立,则则认为回归归方程在水平上显显著。反之之则认为不不显著,回回归方程无无意义,变变量间不存存在线性关关系。四、 回归方程没没有通过检检验的原因因1、 定性分析选选择的各变变量间,本本来不存在在因果关系系。定性分分析设想不不准确。2、 选择的变量量间存在因因果关系,但但还存在其其它起着更更重要作用用的变量尚尚未列入模模型之中。3、 选择变量之之间的关系系是非线性性关系。五、 利
8、用检验通通过的回归归方程进行行预测y=6.334+0.213xx点估计值:若给定xx值,则yy的预测值值为6.334+0.213*58=118.699区间估计:标准误差:S=sqqrt(e2)/(n-m)第二节 一元非线性性回归分析析预测法思路:与一一元线性回回归分析基基本相同。即即通过变量量替换将非非线性方程程转化为线线性方程;使用最小小二乘法建建立线性回回归方程;在通过逆逆变换将线线性方程转转化为非线线性方程。函数的线性性变换及逆逆变换是个个数学问题题,不讲了了。例题,参见见160页页:航空货货物周转量量=a*(社社会总产值值)196页页,SB机机场空运需需求预测202页页,利雅得得国际机
9、场场业务量预预测第三节 多元回归分分析一、 思路多元非线性性回归分析析转换为为多元线性性回归分析析,多元线线性回归分分析,与一一元线性回回归分析基基本相同,只只是在自变变量的选定定上、求解解回归方程程及统计检检验等方面面比一元回回归要复杂杂一些。设多元线性性回归模型型为:y=b0+b1*x1+b2*x2+bm*xm二、 参数求法为为最小二乘乘法:min(yyi-(b0+b1*x1i+b2*x2i+bm*xmi)2分别对bjj求偏导数数,偏导数数等于0时时,上式取取得最小值值。可以得到mm+1个关关于bj的的标准方程程,使用线线性代数中中的行列式式解法,可可以求出回回归系数bbj。以二元回归归分
10、析为例例,说明多多元回归方方程的建立立1、 定性判断得得知,因变变量Y与自自变量X11, X22存在线性性相关关系系。模型形形式为:yy=b0+b1*x1+b2*x22、 确定回归系系数b0、b1、b2,最小二二乘法。分分别对b00、b1、b2求偏导,令令偏导数=0,构成成如下方程程组:手工列表计计算:三、 回归方程的的统计检验验1、 回归方程的的显著性检检验,检验验回归方程程的有效性性检验方法有有:F检验验法、复相相关系数检检验法2、 回归系数的的显著性检检验,检验验回归系数数的有效性性,检验方法有有:t检验验法构造统计量量t其中:m为为变量个数数;n为样样本数。统计量t服服从自由度度为n-
11、mm的t(nn-m)分分布。判断规则:对于给定的的置信度,从t分分布表中查查出t/2(n-m),把把其与用样样本计算出出来的统计计量t0比较:若t0tt(n-mm)成立,则则认为回归归方程在水平上显显著。反之之则认为不不显著,回回归系数无无意义,变变量间不存存在线性相相关关系。统计假设检检验总结:对于一元元回归,四四种检验方方法选一即即可;对于于多元回归归必须进行行t检验和和R、F间间严重的一一种。检验目的检验方法统计量判断规则检验回归方方程的有效效性相关系数检检验法r复相关系数数检验法RF检验 F检验回归系系数的有效效性t检验t四、 例题:国外预测模模型简介全行业运量量预测五、 几个基本问问
12、题及内在在假设1、 自变量的选选择(回归归分析测法法的程序)1) 确定预测变变量2) 确定影响预预测变量的的因素定性分析析,具有经济济上的意义义和内在的的因果关系系。3) 收集整理预预测变量及及其影响因因素的历史史统计资料料4) 分析因变量量和自变量量的关系,确确定回归模模型定量分分析,因变变量与自变变量、自变变量之间的的相关系数数,判别因因变量和自自变量是否否显著相关关,显著相相关的影响响因素作为为自变量;同时与因因变量不相相关或与某某个自变量量高度线性性相关的自自变量,应应予剔除。实践经验确确定散点图分析析确定理论试算(计计算拟和误误差(预测测误差),选选出拟和程程度最好的的模型5) 求解
13、模型参参数,建立立回归方程程6) 检验回归方方程的有效效性7) 利用检验通通过的回归归方程进行行预测,并并确定预测测值的置信信区间2、 多元共线性性(多重共共线性)1) 概念:回归归分析中,自自变量之间间存在着相相关关系,称称这种关系系为多元共共线性。多元回归分分析的假设设是自变量量之间是独独立的。得得出的参数数估计值是是不可靠的的。例如:某省省宏观经济济模型中,建筑业产值值=2.11684+0.16601*工工业总产值值-0.00795*上年工业业总产值+0.56651*上上年建筑业业产值负号的出现现很难解释释,上年工工业总产值值和上年建建筑业产值值存在共线线性。2) 检验多元共共线性的方方
14、法:U22(m-11)分布Q22(n-mm)分布Syy2(n-11)分布拟和优度判判定系数: 判定系数法法:把某自自变量用其其它自变量量进行回归归计算,计计算相应的的判定系数数R2,若R2较大,说说明本自变变量可以用用其它自变变量的线性性组合替代代,存在多多重共线性性。或者用用因变量分分别与含有有本自变量量或不含有有本自变量量的自变量量组合进行行回归计算算,若两者者计算的判判定系数差差不多,则则说明本自自变量与其其它自变量量间存在多多元共线性性。 逐步回归法法:逐个引引进自变量量,根据RR2的变化情情况判断是是否存在多多重共线性性。若R22变化显著著,则不存存在多重共共线性,应应引入;若若R2
15、无显著变变化,则无无需引入。 偏相关系数数检验法,计计算两两变变量间的相相关系数,进进行分析检检验。3、 自相关(序序列相关)概念:若随随机误差项项在不同样样本之间存存在相关性性,ei与ej相关,则则称为序列列相关;较较多的是eei与eI+1之间序序列相关,称称为自相关关自相关的检检验: 达宾沃尔尔森检验计算出D.W值后,查查达宾沃尔森检检验表判定定是否存在在自相关。 冯诺曼比检检验 回归检验4、 线性假设回归的另一一假设是线线性假设,因因变量和自自变量间的的关系可以以用线性表表示出来。无无法将其转转化为线性性的回归方方程,不能能采用回归归分析方法法,而要采采取别的方方法,如仿仿真方法。5、 样本数据样本数据的的多少,影影响变量个个数的选择择。5个数数据,一个个自变量;三十个数数据,最多多只能有55个自变量量。有20个到到30个样样本数据,预预测精度较较高。第四节 自回归分析析实质是是时间序列列分析法利用预测变变量本身的的时间序列列在不同时时期取值之之间存在的的依存关系系,即自身身相关,建建立起回归归方程进行行预测的方方法。预测模型:yt=b0+b1yt-1+ b2yt-2+ +bnyt-n+ee AR(nn)n=1时,称称为一阶自自回归分析析例题见书上上。