《2023年实验六多元线性回归和多重共线性.pdf》由会员分享,可在线阅读,更多相关《2023年实验六多元线性回归和多重共线性.pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、实验六-多元线性回归和多重共线性实验六多元线性回归和多重共线性姓名:何健华学号:201330110203 班级:13金融数学 2班一 实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。二 实验要求:应用教材 P140例子4.3.1 案例做多元线性回归模型,并识别和修正多重共线性。三 实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。四 预备知识:最小二乘法估计的原理、t 检验、F检验、R2值。五 实验步骤:有关的研究分析表明,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出外,还可能与基础设施有关。因此考虑影响国内旅游收入Y(单位为亿元)的
2、以下几个因素:国内旅游人数X1、城镇居民人均旅游支出X2(单位为元)、农村居民人均旅游支出X3(单位为元)、并以公路里程X4(单位为万公里)和铁路里程X5(单位为万公里)作为相关设施的代表,根据这些变量建立如下的计量经济模型:01122334455yxxxxx为了估计上述模型,从中国统计年鉴收集到1994 年到 2003 年的有关统计数据。Year Y X1 X2 X3 X4 X5 1994 1023.5 52400 414.7 54.9 111.78 5.9 1995 1375.7 62900 464 61.5 115.7 5.97 1996 1638.4 63900 534.1 70.5
3、118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.6 1998 2391.2 69450 607 197 127.85 6.64 模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74
4、400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.8 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200 180.98 7.3 1、请用普通最小二乘方法估计模型参数;2、检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内
5、旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计1.用普通最小二乘方法估计模型参数1.1 设定并估计多元线性回归模型01122334455yxxxxx -(1-1)1.2 建立工作工作文件并录入数据,得到图1.1。图 1.1 点击主界面菜单 QuickEstimate Equation,在弹出的对话框中输入Y C X1 X2 X3 X4 X5,点击确定即可得到回归结果图1.2。模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响
6、国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 1.2 由图 1.2 数据结果,可得到模型(1-1)的估计结果为12345274.37730.0130885.4381933.27177312.98624563.1077yxxxxx(-0.208384)(1.031172)(3.939591)(3.465073)(3.108296)(-1.752685)220.995406,0.989664,.2.311565,173.3525,5,4RRDWFdf其中,括号内的数为相应的t检验值。
7、从以上回归结果可以看出,拟合优度很高,整体效果的F 检验通过,但有重要变量X1、X5 的 t 检验不显著,而且符合的经济意义也不合理,故认为解释变量之间存在多重共线性。2检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。2.1 多重共线性模型的识别2.1.1综合判断法由模型(1-1)的估计结果可以看出,220.995406,0.989664RR,可决系模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些
8、变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计数很高,说明模型对样本的拟合很好;173.3525F检验值很大,相应的0.00092p,说明回归方程显著,即各自变量联合起来确实对因变量“国内旅游收入”有显著影响;给定显著性水平0.05,但变量 X1、X5系数的 t 统计量分别为 1.031172、-1.752685,相应的 p 值分别为 0.8451、0.1545,说明变量X1、X5对因变量影响不显著,而且符号的经济意义也不合理。综合上述分析,表明模型(1-1)存在严重的多重共线性。2.1.2简单相关系数检验法计算解释变量 X1、X2、X3、X4、X5 的简单
9、相关系数矩阵。将解释变量 X1、X2、X3、X4、X5选中,双击 Open Group(或点击右键,选择Openas Group),然 后 再 点 击ViewCovariance 仅 勾 选Correlation,点击 OK即可得出相关系数矩阵(图 2.1.1)。再点击顶部的 Freeze按钮,可以得到一个Table 类型独立的 Object(图 2.1.2)。图 2.1.1 模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据
10、这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 2.1.2由图 2.1.1相关系数矩阵可以看出,各解释变量之间的相关系数较高,特别是 X2 和 X5之间的高度相关,证实解释变量之间存在多重共线性。根据综合判别法与简单相关系数法分析的结果可以知道,回归变量间确实存在多重共线性。注意,多重共线性是一个程度问题而不是存在与否的问题。下面我们将采用逐步回归法来减少共线性的严重程度而不是彻底地消除它。2.2 多重共线性模型的修正这里仅用向前逐步回归法,来减少共线性的严重程度。第一步:运用 OLS方法分别求 Y对各解释变量 X1、X2、X3、X4、X5进行一元回归
11、。五个方程的回归结果详见图2.2.1 图 2.2.5,再结合经济意义和统计检验选出拟合效果好的一元线性回归方程。图 2.2.1 图 2.2.2 图 2.2.3 图 2.2.4 模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 2.2.5通过一元回归结果图2.2.1 2.2.5进行对比分析,依据调整可决系数2R最大原则,选择 X2作为进入回
12、归模型的第一个解释变量,形成一元回归模型。第二步:逐步回归。将剩余解释变量分别加入模型,得到分别如图2.2.6图 2.2.9所示的二元回归结果。图 2.2.6 图 2.2.7模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 2.2.8 图 2.2.9 通过观察比较图 2.2.6 图 2.2.9所示结果,并根据逐步回归的思想,我们可以看到,
13、新加入变量X4 的二元回归方程971751.02R最大,并且各参数的检验显著,参数符号也符合经济意义,因此,保留变量X4。第三步:在保留变量 X2、X4的基础上,继续进行逐步回归,分别得到图 2.2.102.2.12所示的回归结果。图 2.2.10 图 2.2.11模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 2.2.12 结果分析:
14、观察图2.2.11,我们可以看到,在X2、X4 的基础上加入X3 后的方程987168.02R明显增大,F 统计量也很大,说明模型对样本的拟合很好并且回归方程显著;同时各解释变量的系数所对应的t 值较大,相应的p0.05,说明各解释变量对因变量的影响显著,并且参数的符号也符合经济意义,只是DW 值落入了无法判断的区域,但由LM检验知仍不存在一阶自相关性。因此,根据逐步回归的思想,模型应保留自变量X2、X3、X4。进行拉格朗日乘数检验(LM检验):在图 6.14 中,点击:ViewResidual DiagnosticsSerial Correlation LM Test,在弹出对话框中输入:1
15、,点击 OK,得到图 2.2.11.2所示结果。模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 2.2.11.2 由 图2.2.11.2中 数 据 得 到123212.02nR其 所 对 应 的 伴 随 概 率 为7256.0P说明在 5%的显著性水平下不存在1 阶序列相关性。但通过图 2.2.10,我们可以看到,在X2、X4 基础上加
16、入 X1 后,方程的修正拟合优度971751.0957998.02R,度略有提下降,但变量X1 系数的 t 值很小,相应的 p 值大于显著性水平0.05,没有通过显著性检验,说明自变量X1对因变量的影响不显著;同样,由图 2.2.12可知,加入 X5 后拟合优度虽有所提高,但X5 参数的 t值很小,相应的p 值远大于显著性水平0.05,说明 X5 对因变量的影响不显著。因此,根据逐步回归的思想,说明X1、X5 的出现引起严重的多重共线性。第四步:在保留变量X2、X3、X4 的基础上,继续进行逐步回归,分别得到如图 2.2.13、图 2.2.14所示的回归结果。模型并识别和修正多重共线性三实验原
17、理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计图 2.2.13 图 2.2.14 类似第三步的结果分析,由图2.2.13,我们可以看到,在X2、X3、X4 的基础上加入 X1 后2R 略有降低,而且 X1参数的 t 检验变得不显著。由图2.2.14,我们可以看到,在X2、X3、X4的基础上加入 X5 后2R 略有改进,但 X5 参数的 t检验变得不显著,而且参数符号不符合
18、经济意义。这说明X1、X5 引起多重共线性,应当予以剔除。因此,本案例最后应保留的变量是X2、X3、X4,相应的回归结果为:43262909.13221965.3215884.4161.2441xxxy(-8.246086)(3.944983)(3.06767)(4.692961)991445.02R987168.02R7935.231F952587.1.WD由综合判断法知,上述回归结果基本上消除了多重共线性。此题存在的问题是样本容量过小,其可靠性受到影响,如果增大样本容量,效果将会好一些。模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数
19、和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计对计量经济学的感想与建议:经过快一个学期对计量经济学的学习,我收获了很多,也懂得了很多。最初接触计量经济学时,一点头绪也没有,随着学习的深入,联系其他学科如统计学,数学,经济学等学,以及对一些软件的应用,我对计量经济学有了更深刻的认识。计量经济学是一门涉及很多学科的科学,但并不晦涩难懂,相反运用它可以分析很多经济现象,而这些经济现象就在我们身边。比如计量经济学可以分析学校数量与经济发展的关系,私
20、家车拥有量与国民收入的关系。这种神奇的经济分析方法有助于我们更好的了解一些现象并进行预测。学习计量经济学给我印象和帮助最大的就是对Eviews 软件的熟练操作与应用,Eviews软件是属于那种有价无市的软件,如果没有老师的传授我不可能从市场上或是从思想上认识到它;虽然这个课堂已经让人向往了,但是美中不足的地方也还有。我的建议就是在以后的讲课中间更多的是要着手分析案例,给大家的运用指点一下;应该分组进行实验汇报,让大家在聆听与汇报中发现自己的不足,并加以学习进步。模型并识别和修正多重共线性三实验原理普通最小二乘法简单相关系数检验法综合判断法逐步回归法四预备知识最小数和旅游支出外还可能与基础设施有关因此考虑影响国内旅游收入单位为亿元的以下几因素国内旅游人数城镇居民人关设施的代表根据这些变量建立如下的计量经济模型为了估计上述模型从中国统计年鉴收集到数据年到年的有关统计