《一元线性回归分析预测法与多元回归分析.docx》由会员分享,可在线阅读,更多相关《一元线性回归分析预测法与多元回归分析.docx(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节 一元线性回归分析预测法一、 概念(思路)根据预测变量(因变量)Y和影响因素(自变量)X的历史统计数据,建立一元线性回归方程,然后代入X的预测值,求出Y的预测值的方法。基本公式:y=a+bx其中:aa、b为为回归系系数,是是未知参参数。基本思路路:1、 利用X,Y的历历史统计计数据,求出合合理的回回归系数数:a、b,确确定出回回归方程程2、 根据预计计的自变变量x的的取值,求出因因变量yy的预测测值。二、 一元线性性回归方方程的建建立1、 使用散点点图定性性判断变变量间是是否存在在线性关关系例:某地地区民航航运输总总周转量量和该地地区社会会总产值值由密切切相关关关系。年份总周转量量(亿吨
2、吨公里)Y社会总产产值(百亿元元)X112.5530214.5536314.7738415.1141515.5548616.8852717.5553818.2253.55918.88552、 使用最小小二乘法法确定回回归系数数使实际值值与理论论值误差差平方和和最小的的参数取取值。对应于自自变量xxi,预测测值(理理论值)为b+m*xi,实际际值yii,min(yi-b-mxi)2,求aa、b的的值。使用微积积分中求求极值的的方法,得:由下列方方程代表表的直线线的最小小二乘拟拟合直线线的参数数公式:其中 mm 代表表斜率 ,b 代表截截距。一元线性性回归.xlss三、 回归方程程的显著著性检验验
3、判断X、Y之间间是否确确有线性性关系,判定回回归方程程是否有有意义。有两类检检验方法法:相关关系数检检验法和和方差分分析法1、 相关系数数检验法法构造统计计量r相关系数数的取值值范围为为:-1,11,|rr|的大大小反映映了两个个变量间间线性关关系的密密切程度度,利用用它可以以判断两两个变量量间的关关系是否否可以用用直线方方程表示示。r值两变量之之间的关关系r=1完全正相相关1r0正相关,越接近近1,相相关性越越强。越越接近00,相关关性越弱弱r=0不线性相相关0r-1负相关,越接近近-1,相关性性越强;越接近近0,相相关性越越弱r=-11完全负相相关两个变量量是否存存在线性性相关关关系的定定
4、量判断断规则: 对于给定定的置信信水平,从相相关系数数临界值值表中查查出r临临(n-2),把其与与用样本本计算出出来的统统计量rr0比较:若|r00|rr临(n-2)成成立,则则认为XX、Y之之间存在在线性关关系,回回归方程程在水平上上显著。差异越越大,线线性关系系越好。反之则则认为不不显著,回归方方程无意意义,变变量间不不存在线线性关系系。其中:nn为样本本数。2、 方差分析析法:方差分析析的基本本特点是是把因变变量的总总变动平平方和分分为两部部分,一一部分反反映因变变量的实实际值与与用回归归方程计计算出的的理论值值之差,一部分分反映理理论值与与实际值值的平均均值之差差。Y的总变变差=YY的
5、残余余变差+Y的说说明变差差,SSST=SSSE+SSRR或:总离离差平方方和=剩剩余平方方和+回回归平方方和回归平方方和U与与剩余平平方和QQ相比越越大,说说明回归归效果越越好。注:在方方差分析析中,已已被解释释的和未未被解释释的变差差除以相相应的自自由度的的个数即即变为方方差。YY的方差差是Y的的总偏差差平方和和除以nn-1,被解释释的方差差等于被被解释的的变差(因为回回归只比比估计YY的均值值多用一一个约束束条件),残余余方差等等于残差差偏差平平方和除除以n-2,残残差的方方差S22是误差差方差的的无偏且且一致的的估计(S叫做做回归标标准差)S2=Q/(n-m)定量判断断回归有有效性有有
6、两种方方法:(1) 可决系数数检验法法拟合优度度统计量量;判定定系数 :r22=SSSR/SSST=U/SSyy调整的rr2 =11-QQ/(nn-m)/Syyy/(nn-1)复相关系系数检验验法:构构造统计计量R=SQRRT11-Q/Syyy=SSQRTT(U/Syyy)判断规则则:对于给定定的置信信度,从相相关系数数r分布布表中查查出r临临(n-m),把其与与用样本本计算出出来的统统计量RR0比较:若R0r临(n-m)成成立,则则认为回回归方程程在水平上上显著。反之则则认为不不显著,回归方方程无意意义,变变量间不不存在线线性关系系。(2) F检验法法:构造造统计量量F=(U/mm-1)/Q
7、Q/(nn-m)其中:mm为变量量个数(总数);n为为样本数数。统计量FF服从第第一自由由度为mm-1、第二自自由度为为n-mm的F(m-1,nn-m)分布。F=r22/(11-r22)*(n-mm)/(m-11)判断规则则:对于给定定的置信信度,从FF分布表表中查出出F(m-1,nn-m),把其其与用样样本计算算出来的的统计量量F0比较:若F0F(m-1,nn-m)成立,则认为为回归方方程在水平上上显著。反之则则认为不不显著,回归方方程无意意义,变变量间不不存在线线性关系系。四、 回归方程程没有通通过检验验的原因因1、 定性分析析选择的的各变量量间,本本来不存存在因果果关系。定性分分析设想想
8、不准确确。2、 选择的变变量间存存在因果果关系,但还存存在其它它起着更更重要作作用的变变量尚未未列入模模型之中中。3、 选择变量量之间的的关系是是非线性性关系。五、 利用检验验通过的的回归方方程进行行预测y=6.34+0.2213xx点估计值值:若给给定x值值,则yy的预测测值为66.344+0.2133*588=188.699区间估计计:标准误差差:S=sqrrt(e22)/(n-mm)第二节 一元非线线性回归归分析预预测法思路:与与一元线线性回归归分析基基本相同同。即通通过变量量替换将将非线性性方程转转化为线线性方程程;使用用最小二二乘法建建立线性性回归方方程;在在通过逆逆变换将将线性方方
9、程转化化为非线线性方程程。函数的线线性变换换及逆变变换是个个数学问问题,不不讲了。例题,参参见1660页:航空货货物周转转量=aa*(社社会总产产值)1966页,SSB机场场空运需需求预测测2022页,利利雅得国国际机场场业务量量预测第三节 多元回归归分析一、 思路多元非线线性回归归分析转换换为多元元线性回回归分析析,多元元线性回回归分析析,与一一元线性性回归分分析基本本相同,只是在在自变量量的选定定上、求求解回归归方程及及统计检检验等方方面比一一元回归归要复杂杂一些。设多元线线性回归归模型为为:y=b0+b1*x1+b2*x2+bbm*xm二、 参数求法法为最小小二乘法法:min(yi-(b
10、b0+b1*x1ii+b2*x2ii+bbm*xmii)2分别对bbj求偏偏导数,偏导数数等于00时,上上式取得得最小值值。可以得到到m+11个关于于bj的的标准方方程,使使用线性性代数中中的行列列式解法法,可以以求出回回归系数数bj。以二元回回归分析析为例,说明多多元回归归方程的的建立1、 定性判断断得知,因变量量Y与自自变量XX1, X2存存在线性性相关关关系。模模型形式式为:yy=b00+b1*x1+b2*x22、 确定回归归系数bb0、b1、b2,最小小二乘法法。分别别对b00、b1、b2求偏导导,令偏偏导数=0,构构成如下下方程组组:手工列表表计算:三、 回归方程程的统计计检验1、
11、回归方程程的显著著性检验验,检验验回归方方程的有有效性检验方法法有:FF检验法法、复相相关系数数检验法法2、 回归系数数的显著著性检验验,检验验回归系系数的有有效性,检验方法法有:tt检验法法构造统计计量t其中:mm为变量量个数;n为样样本数。统计量tt服从自自由度为为n-mm的t(n-mm)分布布。判断规则则:对于给定定的置信信度,从tt分布表表中查出出t/2(nn-m),把其其与用样样本计算算出来的的统计量量t0比较:若t0t(n-m)成成立,则则认为回回归方程程在水平上上显著。反之则则认为不不显著,回归系系数无意意义,变变量间不不存在线线性相关关关系。统计假设设检验总总结:对对于一元元回
12、归,四种检检验方法法选一即即可;对对于多元元回归必必须进行行t检验验和R、F间严严重的一一种。检验目的的检验方法法统计量判断规则则检验回归归方程的的有效性性相关系数数检验法法r复相关系系数检验验法RF检验 F检验回归归系数的的有效性性t检验t四、 例题:国外预测测模型简简介全行业运运量预测测五、 几个基本本问题及及内在假假设1、 自变量的的选择(回回归分析析测法的的程序)1) 确定预测测变量2) 确定影响响预测变变量的因因素定性分分析,具有经经济上的的意义和和内在的的因果关关系。3) 收集整理理预测变变量及其其影响因因素的历历史统计计资料4) 分析因变变量和自自变量的的关系,确定回回归模型型定
13、量量分析,因变量量与自变变量、自自变量之之间的相相关系数数,判别别因变量量和自变变量是否否显著相相关,显显著相关关的影响响因素作作为自变变量;同同时与因因变量不不相关或或与某个个自变量量高度线线性相关关的自变变量,应应予剔除除。实践经验验确定散点图分分析确定定理论试算算(计算算拟和误误差(预预测误差差),选出拟拟和程度度最好的的模型5) 求解模型型参数,建立回回归方程程6) 检验回归归方程的的有效性性7) 利用检验验通过的的回归方方程进行行预测,并确定定预测值值的置信信区间2、 多元共线线性(多多重共线线性)1) 概念:回回归分析析中,自自变量之之间存在在着相关关关系,称这种种关系为为多元共共
14、线性。多元回归归分析的的假设是是自变量量之间是是独立的的。得出出的参数数估计值值是不可可靠的。例如:某某省宏观观经济模模型中,建筑业产产值=22.16684+0.116011*工业业总产值值-0.07995*上上年工业业总产值值+0.56551*上上年建筑筑业产值值负号的出出现很难难解释,上年工工业总产产值和上上年建筑筑业产值值存在共共线性。2) 检验多元元共线性性的方法法:U2(m-1)分分布Q2(n-m)分分布Syy22(n-1)分分布拟和优度度判定系系数: 判定系数数法:把把某自变变量用其其它自变变量进行行回归计计算,计计算相应应的判定定系数RR2,若RR2较大,说明本本自变量量可以用用
15、其它自自变量的的线性组组合替代代,存在在多重共共线性。或者用用因变量量分别与与含有本本自变量量或不含含有本自自变量的的自变量量组合进进行回归归计算,若两者者计算的的判定系系数差不不多,则则说明本本自变量量与其它它自变量量间存在在多元共共线性。 逐步回归归法:逐逐个引进进自变量量,根据据R2的变化化情况判判断是否否存在多多重共线线性。若若R2变化显显著,则则不存在在多重共共线性,应引入入;若RR2无显著著变化,则无需需引入。 偏相关系系数检验验法,计计算两两两变量间间的相关关系数,进行分分析检验验。3、 自相关(序列相相关)概念:若若随机误误差项在在不同样样本之间间存在相相关性,ei与ej相关,
16、则称为为序列相相关;较较多的是是ei与eI+1之间间序列相相关,称称为自相相关自相关的的检验: 达宾沃沃尔森检检验计算出DD.W值值后,查查达宾沃尔森森检验表表判定是是否存在在自相关关。 冯诺曼比比检验 回归检验验4、 线性假设设回归的另另一假设设是线性性假设,因变量量和自变变量间的的关系可可以用线线性表示示出来。无法将将其转化化为线性性的回归归方程,不能采采用回归归分析方方法,而而要采取取别的方方法,如如仿真方方法。5、 样本数据据样本数据据的多少少,影响响变量个个数的选选择。55个数据据,一个个自变量量;三十十个数据据,最多多只能有有5个自自变量。有20个个到300个样本本数据,预测精精度较高高。第四节 自回归分分析实质是是时间序序列分析析法利用预测测变量本本身的时时间序列列在不同同时期取取值之间间存在的的依存关关系,即即自身相相关,建建立起回回归方程程进行预预测的方方法。预测模型型:ytt=b0+b1yt-11+ bb2yt-22+ +bnyt-nn+e ARR(n)n=1时时,称为为一阶自自回归分分析例题见书书上。