《eviews多元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《eviews多元线性回归模型.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3讲 多元线性回归模型 3.1 多元线性回归模型的估计 3.1.1 多元线性回归模型及其矩阵表示 在计量经济学中,将含有两个以上解释变量的回归模型叫做多元回归模型,相应地,在此基础上进行的回归分析就叫多元回归分析。,它是解释变量的多元线性函数,称为多元线性总体回归方程。 假定通过适当的方法可估计出未知参数的值,用参数估计值替换总体回归函数的未知参数,就得到多元线性样本回归方程:,它代表了总体变量间的依存规律。,3.1.2 多元线性回归模型的基本假定,假设6: 解释变量之间不存在多重共线性,假设1用矩阵形式表示:,3.1.3 多元线性回归模型的估计 1参数的最小二乘估计,上述(k+1)个方程称
2、为正规方程。用矩阵表示就是:,即 :,将上述过程用矩阵表示如下:,根据矩阵求导法则可得:,例 3.1.1 经过研究,发现家庭书刊消费水平受家庭收入及户主受教育年数的影响。现对某地区的家庭进行抽样调查,得到样本数据如表3.1.1所示,其中y表示家庭书刊消费水平(元/年),x表示家庭收入(元月),T 表示户主受教育年数。下面我们估计家庭书刊消费水平同家庭收入、户主受教育年数之间的线性关系。,表3.1.1 某地区家庭书刊消费水平及影响因素的调查数据表,借助于计量经济软件EViews对表3.1.1进行分析,具体步骤为 (1)建立工作文件;(2)输入数据;(3)回归分析 表3.1.2 回归结果,2最小二
3、乘估计量的性质 用最小二乘法得到的多元线性回归的参数估计量具有线性、无偏性、最小方差性。,3.1.4 随机误差项方差的估计 若记,3.2 多元线性回归模型的检验 3.2.1 拟合优度检验 拟合优度是指样本回归直线与观测值之间的拟合程度。 1多重决定系数,总离差平方和=残差平方和+ 回归平方和 自由度: (n-1)= (n-k-1)+ k ESS:由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。 RSS:是未被回归直线解释的部分,由解释变量x对y影响以外的因素而造成的。,多重决定系数或决定系数是指解释变差占总变差的比重,用来表述解释变量对被解释变量的解释程度:,2修正的决定系数,(1
4、)用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响; (2)对于包含的解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低。,修正的决定系数与未经修正的多重决定系数之间有如下关系:,3.2.2 赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有赤池信息准则(Akaike information criterion,AIC)和施瓦茨准则(Schwarz criterion,SC),其定义分别为,这两个准则均要求仅当所增加的解释变量能够减少AIC或SC值时才能在原模型中增加该解释变量。,3.2.3 偏相关系数
5、3.2.3 回归模型的总体显著性检验:F检验 回归模型的总体显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立,即是检验方程:,图3.2.1 阴影部分为F检验的否定区域,F 检验的具体步骤为:,借助于计量经济软件EViews对表3.1.1中的样本回归方程作F检验。 F 统计量的值:F =146.2973,n =18,n-k-1=18-2-1=15,在5%的显著性水平下,查自由度为(2,15)的F分布表,得临界值,3.2.4 回归参数的显著性检验:t检验 回归参数的显著性检验,目的在于检验当其
6、他解释变量不变时,该回归系数对应的解释变量是否对因变量有显著影响。 由参数估计量的分布性质可知,回归系数的估计量服从如下正态分布:,用t统计量进行回归参数的显著性检验,其具体过程如下:,借助于计量经济软件EViews对表3.1.1中的样本回归方程的系数作显著性检验:,至此,我们已全面分析了例3.1.1所提出的问题。现将从例3.1.1的回归分析结果整理如下:,3.3 多元线性回归模型的预测,3.3.1 点预测 点预测就是根据给定解释变量的值,预测相应的被解释变量的一个可能值。设多元线性回归模型为:,3.3.2 区间预测,3.4 非线性回归模型 3.4.1 可线性化模型 在非线性回归模型中,有一些
7、模型经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。 1对数模型 模型形式:,模型适用对象:对观测值取对数,将取对数后的观测值(lnx,lny)描成散点图,如果近似为一条直线,则适合于对数线性模型来描述x与y的变量关系。 容易推广到模型中存在多个解释变量的情形。例如,柯布道格拉斯生产函数形式:,例3.4.1 根据表3.4.1给出的1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),劳动投入L(用从业人员度量,单位为万人),以及资本投入K(用全社会固定投资度量,单位:亿元)。 表3.
8、4.1 1980-2003年中国GDP、劳动投入与资本投入数据,利用EViews软件解题如下:首先建立工作文件,其次输入样本数据Q、L、K,再次,在EViews软件的命令窗口,依次键入: GENR lnGDP=LOG(GDP) GENR lnL=LOG(L) GENR lnK=LOG(K) LS lnGDP C lnL lnK 输出结果如下(表3.4.2): 表3.4.2 回归结果,2半对数模型 在对经济变量的变动规律研究中,测定其增长率或衰减率是一个重要方面。在回归分析中,我们可以用半对数模型来测度这些增长率。 模型形式:,3倒数模型,4多项式模型 多项式回归模型在生产与成本函数这个领域中被
9、广泛地使用。多项式回归模型可表示为,3.4.2 非线性化模型的处理方法 无论通过什么变换都不可能实现线性化,这样的模型称为非线性化模型。对于非线性化模型,一般采用高斯牛顿迭代法进行估计,即将其展开成泰勒级数之后,再利用迭代估计方法进行估计。 3.4.3 回归模型的比较 1图形观察分析 (1)观察被解释变量和解释变量的趋势图。 (2)观察被解释变量与解释变量的相关图。 2模型估计结果观察分析 对于每个模型的估计结果,可以依次观察以下内容: (1)回归系数的符号和值的大小是否符合经济意义,这是对所估计模型的最基本要求。 (2)改变模型形式之后是否使判定系数的值明显提高。 (3)各个解释变量t检验的
10、显著性。 (4)系数的估计误差较小。,3残差分布观察分析 模型的残差反映了模型未能解释部分的变化情况,在方程窗口点击ViewActual,Fitted,ResidualTable(或Graph),可以观察分析以下内容: (1)残差分布表中,各期残差是否大都落在的虚线框内,这直观地反映了模型拟合误差的大小及变化情况。 (2)残差分布是否具有某种规律性,即是否存在着系统误差。 (3)近期残差的分布情况。 另外,利用判定系数比较模型的拟合优度时,如果两个模型包含的解释变量个数不同,则应采用“调整的判定系数”。 除了调整的判定系数之外,人们还使用另外两个指标SC(Schwarz Criterion,施
11、瓦兹准则)和AIC(Akaike lnformation Criterion,赤池信息准则)来比较含有不同解释变量个数模型的拟合优度。,3.5 受约束回归 在建立回归模型时,有时根据经济理论需要对模型中变量的参数施加一定的约束条件。对模型施加约束条件后进行回归,称为受约束回归(restricted regresslon),与此对应,不加任何约束的回归称为无约束回归(unrestricted regression)。 3.5.1 模型参数的线性约束 一般地,估计线性模型时可对模型参数施加若干个线性约束条件。例如,对模型,其中,式中第二项为一非负标量,于是,式(3.5.9)表明受约束样本回归模型的
12、残差平方和大于无约束样本回归模型的残差平方和,这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。,约束条件的个数。,表3.5.1 无约束条件的C-D生产函数估计结果,表3.5.2 有约束条件的C-D生产函数估计结果,在EViews软件中,当估计完C-D生产函数后,在方程结果输出窗口,点击View按钮,然后在下拉菜单中选择Coefficient TestWald Coefficient Restrictions,屏幕出现图3.5.1对话框。,图3.5.1 Wald检验定义对话框 在对话框中输入系数的约束条件,若有多个,则用逗号分开。本例中输入:C(2)+C(3)=1,得检验结果见表3
13、.5.3。 表3.5.3 Wald检验输出结果,由表3.5.3可知,在0.05显著性水平下,两个检验均仍然不能拒绝和为1的原假设,原假设为真。这个结果与直观判断差异明显,主要是因为变量LOG(L)的回归系数标准误差较大。 需要指出的是,这里介绍的F检验适合所有关于参数线性约束的检验,32节中对回归模型总体的线性检验,可以归结到这里的F检验上来。,3.5.2 解释变量的选择 在实际建模时,选取哪些变量作为解释变量引入模型,对模型的优劣有直接的影响作用。模型中,既不能遗漏重要的解释变量,又要防止过多的变量带来的多重共线性问题或对因变量没有什么影响的不必要的解释变量。这里介绍两种有用的用于选择解释变
14、量的检验。 考虑如下两个回归模型:,在EViews软件中,要检验冗余变量,选择Equation工具栏中的ViewCoefficient TestRedundant Variable功能。在对话框中输入需要检验的变量。 Testadd 检验用于在方程中检验引入新的解释变量,检验引入引入新的解释变量是否对模型有利。要检验缺失变量,选择Equation工具栏中的ViewCoefficient TestOmitted Variable功能。在对话框中输入需要检验的变量。,在例3.4.1的方程窗口(表3.4.2)输出结果中选择ViewCoefficient TestRedundant Variable-
15、Likelihood Ratio,屏幕出现对话图3.5.2框。,图3.5.2 多余变量检验定义对话框 在话框中输入希望减少的序列名。在本例,输入LOG(L),点击OK,计算结果如表3.5.4所示。 表3.5.4 Testdrop检验输出结果,与Wald检验类似,EViews也给出F统计量和相伴概率。这里,在0.05显著性水平下,两个检验均拒绝变量LOG(L)不显著的假设,LOG(L)不是多余的变量,说明劳动投入量对GDP有显著影响。,3.5.3 参数的稳定性检验:邹氏检验 建立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。然而,经济结构的变化往往导致计量经济
16、模型结构也发生变化。例如,例3.4.1我国C-D生产函数例子中,从GDP、L、K散点图的变化上容易判断1992年前后这种结构的变化。下面给出一个结构变化的检验。,图3.5.3 中国1980-2003年GDP、L、K散点图,这两个回归方程是否显著的不同?如果这两个回归方程的差别并不显著,说明模型所反映的经济结构在时间上(或截面上)是稳定的。否则是不稳定的。邹至庄(Chow)提出了如下的Chow检验。,因此,对参数稳定性的原假设(3.5.22)的检验步骤为: 首先,分别以两个连续的时间序列作为两个样本运用式(3.5.18)进行回归,得到相应的残差平方和 RSS1与 RSS2; 其次,将两序列并为一
17、个大样本后运用式(3.5.18)进行回归,得到大样本下的残差平方和 RSSR; 最后,通过式(3.5.25)的F统计量,在事先给定的显著性水平下进行假设检验。如果F大于相应的临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。该检验方法也被称为邹氏参数稳定性检验(Chow test for parameter stability)。,本例利用EViews软件进行Chow检验。在操作上,首先根据表3.4.1,利用EViews软件可得如下结果(见表3.5.5)。 表3.5.5 回归结果,在方程窗口按View/Stability Tests/Chow Breakpoint Test顺序逐一单击
18、鼠标键,打开Chow Test对话框(图3.5.4)。,图3.5.4 打开Chow Test对话框 然后在对话框内输入转折点年份,1992(图3.5.5)。,图3.5.5 Chow Test 对话框,计算结果如表3.5.6所示。 表3.5.6 计算结果,根据F分布表,可得在5的显著性水平下,F临界值为3.55(分子自由度为3,分母自由度为18)。因此,得到F值2.9355小于临界值为3.55,接受原假设。由此可知中国GDP和L、K间的关系(即C-D生产函数),在不同时期(1980-1991与1992-2003)没有什么不同,即中国C-D生产函数结构是稳定的。 在运用Chow检验时,需要注意以下
19、一些限制条件: (1)必须满足上面讲到的古典假定条件。 (2)Chow检验的结果仅仅告诉我们是否存在结构差异,而无法得知导致这种差异的原因。 (3)Chow检验假定知道结构发生变化的时间点。,3.6 案例分析中国经济增长影响因素分析 根据表3.6.1给出的1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),最终消费CS(单位:亿元),投资总额I(用固定资产投资总额度量,单位:亿元),出口总额(单位:亿元)统计数据,试对中国经济增长影响因素进行回归分析。 表3.6.1 1980-2003年中国GDP、最终消费、投资与出口总额(单位:亿元),从1980-2003年中国GDP、最终
20、消费、投资总额与出口总额时序图及其对数时序图(图3.6.1)可以看出,这几个变量存在快速、稳定增长的趋势。可建立如下多元回归模型:,其具体步骤为: 首先建立工作文件; 其次输入样本数据GDP、CS、I、EX; 再次,在EViews软件的命令窗口,依次键入: GENR lnGDP=LOG(GDP) GENR lnCS=LOG(CS) GENR lnI=LOG(I) GENR lnEX=LOG(EX) 生成新的序列 第四,回归分析。在主窗口命令行输入 LS LN(GDP) C LN(CS) LN(I) LN(EX) AR(1) AR(2) ,按回车键后,可得回归结果(表3.6.2)。,表3.6.2 回归结果,=(0.046534-2.0740.026485,0.046534+2.0740.026485) =(-0.00840, 0.10146) 4检验模型 (1)模型的经济意义检验:,说明GDP与消费需求、投资需求、出口同方向变动,当其它条件不变时,消费需求每增加一个百分点,平均产出将增加0.81%,投资需求每增加一个百分点,产出将平均增加0.14%,出口每增加一个百分点,平均产出将增加0.04%。 (2)回归方程的标准误差的评价:=0.014783说明,回归方程与各观测点(或估计值与观测值)的平均误差为0.014783。 (3)拟合优度检验:,