《多元线性回归多重共线性异方差综合实验报告一(共17页).doc》由会员分享,可在线阅读,更多相关《多元线性回归多重共线性异方差综合实验报告一(共17页).doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上多元线性回归、多重共线性、异方差综合实验报告一、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化了产业结构,而且可以增加国家外汇收入,促进国际收支平
2、衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要因素,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。二、模型设定根据以上的分析,建立以下模型:Y=+1X+2X+X+X+Ut参数说明:Y
3、 旅游景区营业收入/万元X旅游业从业人员/人X旅游景区固定资产/万元X旅游外汇收入/万美元X城镇居民可支配收入/元收集到的数据如下(见表2-1):表2-1 2011年全国旅游景区营业收入及相关数据(按地区分)地 区营业收入从业人数固定资产外汇收入可支配收入北 京.01.3032903.03天 津48712.372478793529.6726920.86河 北.8779643.744476518292.23山 西29465.0357719.745671918123.87内蒙古70313.0736264.126709720407.57辽 宁25665.306481646573.2720466.84
4、吉 林20389.302906687827.163852817796.57黑龙江38367.8130341.279176215696.18上 海.391106.4436230.48江 苏.65.6026340.73浙 江.92.2030970.68安 徽79562.7555840.0218606.13福 建.9580303.6924907.40江 西54961.664179185528.054150017494.87山 东.67.2922791.84河 南.3370164.325490318194.80湖 北.5862767.629401818373.87湖 南.8780615.718844.
5、05广 东.50.426897.48广 西66195.5549876.0318854.06海 南29081.603075970386.553761518368.95重 庆86713.6750160.009680620249.70四 川.0370756.525938317899.12贵 州42214.142768362415.211350716495.01云 南.9762679.0418575.62西 藏30406.736023.031296316195.56陕 西48692.1757077.1918245.23甘 肃30949.003128056684.68174014988.68青 海638
6、.4387419851.28265915603.31宁 夏49509.861219623149.9062017578.92新 疆28993.114045152280.364651915513.62 数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。三、参数估计(一)操作步骤利用Eviews6.0做多元线性回归分析步骤如下:1创建工作文件双击Eviews6.0图标,进入其主页。在主菜单中依次点击“FileNewWorkfile”,出现对话框“Workfile Range”。本例中是截面数据,在workfile structure type中选择“Unstructured/Undate
7、d”,在Date range中填入observations 31,点击ok键,完成工作文件的创建。2输入数据在命令栏中输入 DATA Y X1 X2 X3 X4, 回车出现“Group”窗口数据编辑框,在对应的Y X1 X2 X3 X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。对数据进行存盘,点击“File/Save As”,出现“Save As”对话框,选择存入路径,并将文件命名,再点“ok”。3参数估计在Eviews6.0命令栏中键入“LS Y C X1 X2 X3 X4”,按回车键,即出现回归结果。利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:表
8、3-1 回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:14Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticProb.C32390.8339569.490.0.4205X10.0.1.0.1112X20.0.5.0.0000X30.0.0.0.4691X4-1.2.-0.0.3700R-squared0.Mean dependent var.2Adjusted R-squared0.S.D. dependent v
9、ar.1S.E. of regression41995.55Akaike info criterion24.27520Sum squared resid4.59E+10Schwarz criterion24.50649Log likelihood-371.2657Hannan-Quinn criter.24.35060F-statistic47.54049Durbin-Watson stat2.Prob(F-statistic)0.根据表中的样本数据,模型估计结果为=32390.83+0.X+0.X+0.X-1.X (39569.49)(0.)(0.)(0.)(2.) t = (0.) (1.
10、) (5.) (0.) (-0.)R2=0. =0. F=47.54049 DW=2.可以看出,可决系数R2=0.,修正的可决系数=0.。说明模型的拟合程度还可以。但是当=0.05时,X、 X、X系数均不能通过检验,且X的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。四、模型修正 1多重共线性的检验与修正 (1)检验选中X1 X2 X3 X4数据,点击右键,选择“Open/as Group”,在出现的对话框中选择“View/Covariance Analysis/correlation”,点击ok,得到相关系数矩阵。计算各个解释变量的相关系数,得到相关系数矩阵如下。表4-1 相
11、关系数矩阵变量X1X2X3X4X11.0.0.0.X20.1.0.0.X30.0.1.0.X40.0.0.1.由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。 (2)多重共线性修正采用逐步回归的办法,检验修正多重共线性问题。分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LS Y C X1,LS Y C X2,LS Y C X3,LS Y C X4保存结果,整理如表4.2所示。表4-2 一元回归结果变量X1X2X3X4参数估计值1.0.0.12.54525t统计量8.12.474956.4.R20.0.0.0.0.0.0.0.其中,
12、X2的方程最大,以X2为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LS Y C X2 X1,LS Y C X2 X3, LS Y C X2 X4,并保存结果,整理结果如表4.3所示。表4-3 加入新变量的回归结果(一)变量变量 X1X2X3X4X2,X10. (2.)0. (5.)0.X2,X30. (7.)0. (2.)0.X2,X40. (9.)0.(0.)0.经比较,新加入X1的方程=0.,改进最大,而且各个参数的t检验显著,选择保留X1,再加入其它新变量逐步回归,在命令栏中依次输入:LS Y C X2 X1 X3,LS Y C X2 X1 X4,保存结果,整理结果如表4.4
13、所示。表4-4 加入新变量的回归结果(二) 变量变量X1X2X3X4X2,X1,X30. (1.)0. (5.)0. (0.)0.X2,X1,X40. (2.)0. (5.)-1. (-0.)0.当加入X3或X4时,均没有所增加,且其参数是t检验不显著。从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。当取=0.05时,t/2(n-k-1)=2.048,X1、X2的系数t检验均显著,这是最后消除多重共线性的结果。修正多重共线性影响后的模型为= 0. X+0. X (0.)(0.)t = (2.) (5.)R2=0. =0. F=97.9846
14、0 DW=1.在确定模型以后,进行参数估计表4-5 消除多重共线性后的回归结果Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:47Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticProb.C-4316.82412795.42-0.0.7384X10.0.2.0.0122X20.0.5.0.0000R-squared0.Mean dependent var.2Adjusted R-squared0.S.D. dependen
15、t var.1S.E. of regression41257.10Akaike info criterion24.18480Sum squared resid4.77E+10Schwarz criterion24.32357Log likelihood-371.8644Hannan-Quinn criter.24.23004F-statistic97.98460Durbin-Watson stat1.Prob(F-statistic)0.五、异方差检验在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。 (一)检验异方差 由表4.5的结
16、果,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。表5-1 White检验结果Heteroskedasticity Test: WhiteF-statistic3.Prob. F(5,25)0.0125Obs*R-squared13.13613Prob. Chi-Square(5)0.0221Scaled explained SS15.97891Prob. Chi-Square(5)0.0069Test Equation:Dependent V
17、ariable: RESID2Method: Least SquaresDate: 11/14/13 Time: 21:48Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticProb.C-1.10E+091.11E+09-0.0.3303X1-12789.3630151.30-0.0.6751X120.0.1.0.1653X1*X2-0.0.-1.0.2345X214604.525047.7012.0.0078X22-0.0.-0.0.7592R-squared0.Mean dependent var1.5
18、4E+09Adjusted R-squared0.S.D. dependent var2.70E+09S.E. of regression2.24E+09Akaike info criterion46.07313Sum squared resid1.26E+20Schwarz criterion46.35068Log likelihood-708.1335Hannan-Quinn criter.46.16360F-statistic3.Durbin-Watson stat1.Prob(F-statistic)0.从上表可以看出,nR=13.13613,由White检验可知,在=0.05下,查分
19、布表,得临界值 (5)=11.0705,比较计算的统计量与临界值,因为nR=13.13613 (5)=11.0705,所以拒绝原假设,表明模型存在异方差。 (二)异方差的修正1.用WLS估计:选择权重w=1/e12,其中e1=resid。在命令窗口中输入 genr e1= resid,点回车键。在消除多重共线性后的回归结果(表4.5的回归结果)对话框中点击Estimate/Options/Weithted LS/TSLS,并在Weight中输入1/e12,点确定,得到如下回归结果。 表5-2 用权数1/e12的回归结果Dependent Variable: YMethod: Least Squ
20、aresDate: 11/14/13 Time: 21:49Sample: 1 31Included observations: 31Weighting series: 1/E12CoefficientStd. Errort-StatisticProb.C-7074.873389.4944-18.164250.0000X10.0.57.570990.0000X20.0.243.67860.0000Weighted StatisticsR-squared0.Mean dependent var31056.56Adjusted R-squared0.S.D. dependent var.4S.E.
21、 of regression4.Akaike info criterion5.Sum squared resid507.9857Schwarz criterion5.Log likelihood-87.33232Hannan-Quinn criter.5.F-statistic92014.78Durbin-Watson stat1.Prob(F-statistic)0.Unweighted StatisticsR-squared0.Mean dependent var.2Adjusted R-squared0.S.D. dependent var.1S.E. of regression4183
22、2.86Sum squared resid4.90E+10Durbin-Watson stat1.2.修正后的White检验为在表5.2的回归结果中,按路径“View/Residual Tests/Heteroskedasticity Tests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。 表5-3 修正后的White 检验结果Heteroskedasticity Test: WhiteF-statistic0.Prob. F(2,28)0.8113Obs*R-squared0.Prob. Chi-Square(2)0.7946Scal
23、ed explained SS0.Prob. Chi-Square(2)0.7423Test Equation:Dependent Variable: WGT_RESID2Method: Least SquaresDate: 11/15/13 Time: 20:29Sample: 1 31Included observations: 31Collinear test regressors dropped from specificationCoefficientStd. Errort-StatisticProb.C17.639915.2.0.0059WGT-256.0052728.8280-0
24、.0.7280WGT28.23.571550.0.7286R-squared0.Mean dependent var16.38664Adjusted R-squared-0.S.D. dependent var29.69485S.E. of regression30.50832Akaike info criterion9.Sum squared resid26061.21Schwarz criterion9.Log likelihood-148.3674Hannan-Quinn criter.9.F-statistic0.Durbin-Watson stat2.Prob(F-statistic
25、)0.从上表可知nR=0. (5)=11.0705,证明模型中的异方差已经被消除了。异方差修正后的模型为= -7074.873+0.X1*+0. X2*389.4944 0. 0.t = (-18.16425) ( 57.57099) ( 243.6786)R2=0. =0. F=92014.78 DW=1. 其中X1*= 1/e12* X1, X2*=1/e12*X2, e1=resid。六、自相关检验与修正 (一)DW检验在显著性水平=0.05,查DW表,当n=31,k=2时,得上临界值d=1.57,下临界值d=1.30,DW= 1.608。因为dDW4- d,所以模型不存在序列自相关。由
26、图示法也可以看出随机误差项i不存在自相关。下图是残差及一阶滞后残差相关图。图6-1 残差与其滞后一阶残差图 (二)LM检验 在表5.2的回归结果中,按路径“View/Residual Tests/Serial Correlation LM Tests”,在出现的对话框中选择Lags to include:1,点击ok.得到LM检验结果如下。表6-1 LM检验结果Breusch-Godfrey Serial Correlation LM Test:F-statistic0.Prob. F(1,27)0.3761Obs*R-squared0.Prob. Chi-Square(1)0.3420Tes
27、t Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 11/14/13 Time: 21:50Sample: 1 31Included observations: 31Presample missing value lagged residuals set to zero.Weight series: 1/E12CoefficientStd. Errort-StatisticProb.C-766.3965937.0314-0.0.4206X10.0.0.0.4448X2-0.0.-0.0.4645RESID(-1)-0.0
28、.-0.0.3761Weighted StatisticsR-squared0.Mean dependent var-0.Adjusted R-squared-0.S.D. dependent var4.S.E. of regression4.Akaike info criterion5.Sum squared resid493.1929Schwarz criterion6.Log likelihood-86.87425Hannan-Quinn criter.5.F-statistic0.Durbin-Watson stat1.Prob(F-statistic)0.Unweighted Sta
29、tisticsR-squared-0.Mean dependent var-4021.722Adjusted R-squared-0.S.D. dependent var40207.07S.E. of regression42689.59Sum squared resid4.92E+10Durbin-Watson stat1.69E-08从上表可以看出,nR=0.,由LM检验可知,在=0.05下,查分布表,得临界值 (5)=11.0705,比较计算的统计量与临界值,因为nR=0. F( 2,28)=3.34,应拒绝原假设,说明回归方程显著,即“旅游景区固定资产”、“旅游从业人员”等变量联合起来
30、确实对“旅游景区营业收入”有显著影响。3t检验:分别对H0:j=0(j=1,2),给定显著性水平=0.05,查t分布表得自由度为n-k-1=28临界值t/2(n-k-1)=2.048。由表中数据可得,、对应的t统计量分别为57.57099、243.6786,其绝对值均大于t/2(n-k-1)=2.048,这说明应该分别拒绝H0:j =0(j=1,2),也就是说,当在其他解释变量不变的情况下,解释变量“旅游景区固定资产”(X1) 、“旅游从业人数”(X2)分别对被解释变量“旅游景区营业收入”(Y)影响显著。八、附录以下是多重共线性参数估计 备表1 对X回归分析Dependent Variable
31、: YMethod: Least SquaresDate: 11/14/13 Time: 21:14Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticProb.C-15595.6118604.86-0.0.4087X11.0.8.0.0000R-squared0.Mean dependent var.2Adjusted R-squared0.S.D. dependent var.1S.E. of regression60671.69Akaike info criterion24.92668Sum squar
32、ed resid1.07E+11Schwarz criterion25.01920Log likelihood-384.3636Hannan-Quinn criter.24.95684F-statistic74.56515Durbin-Watson stat2.Prob(F-statistic)0. 备表2 对X回归分析Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:15Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticPr
33、ob.C15958.7311364.711.0.1709X20.0.12.474950.0000R-squared0.Mean dependent var.2Adjusted R-squared0.S.D. dependent var.1S.E. of regression45441.05Akaike info criterion24.34856Sum squared resid5.99E+10Schwarz criterion24.44108Log likelihood-375.4027Hannan-Quinn criter.24.37872F-statistic155.6243Durbin
34、-Watson stat1.Prob(F-statistic)0. 备表3 对X回归分析Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:15Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticProb.C53599.9515413.413.0.0016X30.0.6.0.0000R-squared0.Mean dependent var.2Adjusted R-squared0.S.D. dependent var.1S.E.
35、 of regression70399.77Akaike info criterion25.22411Sum squared resid1.44E+11Schwarz criterion25.31662Log likelihood-388.9737Hannan-Quinn criter.25.25427F-statistic47.92072Durbin-Watson stat1.Prob(F-statistic)0. 备表4 对X回归分析Dependent Variable: YMethod: Least SquaresDate: 11/14/13 Time: 21:15Sample: 1 31Included observations: 31CoefficientStd. Errort-StatisticProb.