《计量经济学中的各种检验课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学中的各种检验课件.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学线性回归模型的各种检验1计量经济学线性回归模型的各种检验v对计量经济学模型的检验包括对回归模型的理论检验(经济意义检验)、统计检验、计量经济学检验、预测检验等。v理论检验(经济意义检验)指的是依据经济理论来判断估计参数的正负号是否合理、大小是否适当。v经济意义检验是第一位的。如果模型不能够通过经济意义检验,则必须找出原因,在找出原因的基础上对模型进行修正或重新估计模型。如果通过了经济意义检验,则可进行下一步的统计检验。2线性回归模型的各种检验v理论检验(经济意义检验)v统计检验v计量经济学检验v预测检验v这一节主要讨论各种统计检验3回归模型的统计检验v统计检验指的是根据统计学的理论,
2、确定回归参数估计值的统计可靠性。v统计检验主要包括:回归方程估计标准误差的评价、拟合优度检验、回归模型的总体显著性检验和回归系数的显著性检验等。v这里主要讨论拟合优度检验、回归模型的总体显著性检验、回归系数的显著性检验等。4回归模型的统计检验v拟合优度检验v回归模型的总体显著性检验v回归系数的显著性检验v正态性检验v检验回归的函数形式:MWD检验v假设检验三联体v模型的结构稳定性检验v缺失变量检验和多余变量检验5拟合优度检验v总平方和、回归平方和、残差平方和v平方和的分解v拟合优度的定义v拟合优度与F统计量之间的联系v拟合优度等于实际值与拟合值之间简单相关系数的平方6拟合优度检验v如果所有的观
3、测值都落在回归直线上,就称为完全拟合。但这种情况很少见。一般情况下,回归后总会出现正的或负的残差,它们围绕在回归直线的周围。通过对这些残差的分析,有助于衡量回归直线拟合样本点的程度。v拟合优度指样本回归直线与观测值之间的拟合程度。v在简单线性回归中,用决定系数衡量估计模型对观测值的拟合程度。在多元回归中,用多重决定系数和修正的多重决定系数来衡量。7拟合优度检验v要说明多元回归模型对观测值的拟合情况,可以考察在Y的总变差中能够由解释变量解释的那部分变差的比重,即回归平方和与总离差平方和的比值。这一比值就称为多重决定系数,它一般用表示。8总平方和、回归平方和、残差平方和9总平方和、回归平方和、残差
4、平方和vTSS即总离差平方和,它度量被解释变量Y的观测值自身的差异程度。vRSS即回归平方和,即总变差中可由回归直线(即解释变量)解释的部分,表示解释变量对被解释变量的线性影响,因此也称为解释变差。它度量因变量Y的拟合值自身的差异程度。vESS即残差平方和,是总变差中不能够由回归直线解释的部分,是由解释变量对被解释变量的影响之外的因素所造成的,它度量实际值与拟合值之间的差异程度。10总平方和、回归平方和、残差平方和v显然,回归平方和RSS越大,残差平方和ESS越小,从而被解释变量总变差中能够由解释变量解释的那部分变差就越大,模型对观测数据的拟合程度就越高。v因此定义多重决定系数为解释变差占总变
5、差的比重,用来表述解释变量对被解释变量的解释程度。11拟合优度的定义v拟合优度的定义:v含义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比越高,观察点在回归直线附近越密集。v取值范围:0-1。当拟合优度为1时,被解释变量的变化完全由回归直线解释,所有观测点都落在回归直线上;当它取值为0时,解释变量与被解释变量之间没有任何线性关系。12平方和的分解13平方和分解的意义vTSS=RSS+ESSv被解释变量Y总的变动(差异)=解释变量X引起的变动(差异)+除X以外的因素引起的变动(差异)v如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好
6、地解释Y。14相应自由度的分解v总自由度:dfT=n-1v回归自由度:dfR=k(自变量的个数)v残差自由度:dfE=n-k-1v自由度分解:dfT=dfR+dfE15拟合优度等于实际值与拟合值之间简单相关系数的平方16修正的决定系数v在应用过程中人们发现,随着模型中解释变量的增多,多重决定系数的值往往会变大,从而增加模型的解释功能。这给人一个错觉,即要使模型拟合得好,就必须增加解释变量。但是另一方面,在样本容量一定的情况下,增加解释变量必然会使得待估参数的个数增加,从而损失自由度;而且在实际中,有些解释变量的增加根本就是不必要的。对于这些不必要的解释变量的引入不仅对于估计结果无益,同时还意味
7、着预测的精确度的降低。也就是说,不应该仅根据决定系数是否增大来决定某解释变量是否应引入模型。v事实上,研究模型的拟合优度时,常常并不简单地仅依靠多重决定系数,更常考虑的是修正的决定系数。17修正的决定系数v修正的决定系数对决定系数进行调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。18修正的决定系数19修正的决定系数引入修正的决定系数的作用:v用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;v对于包含的解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能直接用未调整的决定系数来比较。20修正的决
8、定系数21需要说明的问题v在实际应用中,我们往往希望所建立模型的决定系数或修正的决定系数越大越好。但应注意,决定系数只是对模型拟合优度的度量,决定系数或修正的决定系数越大,只能说明列入模型的解释变量对被解释变量整体的影响程度很大,并不能说明模型中各个解释变量对被解释变量的影响程度显著。因此在选择模型时,不能单纯地凭决定系数的高低来断定模型的优劣,有时从模型的经济意义和整体可靠程度的角度出发,可以适当降低对决定系数的要求。22需要说明的问题v在消费模型中,R20.28F3.80该线性模型在0.99的水平下显著成立。有许多著名的模型,R2小于 0.5,支持了重要的结论,例如收入差距的倒U型规律。不
9、要片面追求拟合优度23什么时候增加新的解释变量v在实际中,为了解释某一现象,研究者往往面对如何取舍若干解释变量的问题。通常的做法是,只要修正的判定系数值增加(即使修正的判定系数可能小于非修正的判定系数的值),就可以增加解释变量。但是什么时候修正的判定系数值开始增加呢?可以证明,如果增加变量的系数的t的绝对值大于1,修正的判定系数就会增加。24在Eviews中的实现v许多的计量经济学软件可以给出决定系数和修正的决定系数,从而实现拟合优度检验。Eviews中同样可以实现这一目的。估计完回归方程后的结果中自动会包含决定系数和修正的决定系数。v例。25决定系数的值多大合适?决定系数的值越高,拟合得越好
10、。但什么是高?回归中使用时间序列数据还是横截面数据有不同的标准。对时间序列数据来说,决定系数的值在0.8、0.9 以上是很常见的事,而在横截面数据的情况下,0.4、0.5的决定系数值有时也不能算低。26赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则v为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:v赤池信息准则(Akaike information criterion,AIC)v施瓦茨准则(Schwarz criterion,SC)v这两准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才在原模型中增加该解释变量。27回归模型的总体显著性检验v拟合优度检验可以说明
11、模型对样本数据的近似情况。模型的总体显著性检验则一般用来检验全部解释变量对被解释变量的共同影响是否显著。28回归模型的总体显著性检验29回归模型的总体显著性检验v大部分的计量经济学软件可以实现回归模型的总体显著性检验。Eviews中也可以轻松地实现。估计完方程后的结果中自动会给出F统计量的值与伴随概率。30拟合优度检验和F检验的关系vF检验和拟合优度检验都是把总变差TSS分解为回归平方和与残差平方和,并在这一分解的基础上构造统计量进行的检验。区别在于前者有精确的分布而后者没有。一般来说,模型对观测值的拟合程度越高,模型总体线性关系的显著性越强。31拟合优度检验和F检验的关系vF显著=拟合优度必
12、然显著32拟合优度检验和F检验的关系v反过来有v可以看出,随着决定系数和修正的决定系数的增加,F统计量的值也不断增大;反过来也是如此。这说明二者之间具有一致性。但是,决定系数和修正的决定系数只能提供一个模糊的推测,它们的值要达到多少才算模型通过了检验并没有确定的界限;而F检验则不同,它可以在给定显著性水平下,给出统计意义上严格的结论。33拟合优度检验和F检验的关系34回归参数的显著性检验v模型通过F检验,可以说明模型中所有解释变量对被解释变量的“总体影响”是显著的,但并不意味着模型中的每一个解释变量对被解释变量都有重要的影响,或者说,并不说明每个解释变量的单独影响都是显著的。v要确定每一个解释
13、变量对被解释变量的具体影响是否显著,需要进行单个回归系数的显著性检验即t检验。35变量的显著性检验(变量的显著性检验(t检验)检验)v方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的v必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。v这一检验是由对变量的t检验完成的。v检验目的:回归模型中是否存在线性关系?这种关系是显著的吗?36t检验37回归参数的t检验38回归参数的t检验39一元线性回归中,t检验与F检验一致v 一方面一方面,t检验与F检验都是对相同的原假设H0:1=0 进行检验;v 另一方面另一方面,两个统计量之间有如下关系:40正态性检验:Jarq
14、ue-Bera检验v统计检验过程是建立在假设随机误差项服从正态分布的基础上的。由于不能直接观察真实的误差项,但能够得到其近似值即残差,因此可通过对残差的研究来研究误差项的正态性。v一种常用的正态性检验方法是Jarque-Bera(雅克贝拉)检验,简称JB检验。v许多统计软件可以实现这一检验,Eviews也可以实现。41正态性检验:Jarque-Bera检验42正态性检验:Jarque-Bera检验43正态性检验:Jarque-Bera检验v在Eviews中的实现v选择并打开要检验的变量,点击descriptive stats/common sample项,得到的结果中即包含JB统计量。vP值将
15、近0,表明序列不服从正态分布。44检验回归的函数形式:MWD检验v选择线性回归模型或对数线性回归模型是经验分析中由来已久的一个问题。v麦金农(MacKinnon)、怀持(white)和戴维森(Davidson)提出一种检验方法,可用于在两个模型之间进行选择,简称为MWD检验。45检验回归的函数形式:MWD检验46检验回归的函数形式:MWD检验47检验回归的函数形式:MWD检验vMWD检验虽然看似复杂,其实这个检验的逻辑很简单。如果线性模型是事实上正确的模型,第4步的构造变量就不会是统计上显著的,因为这时从线性模型估计来的y值和从对数线性模型估计出来的(为了比较而取反对数之后的)就不会有什么差别
16、,同样的评语也适用于对立假设Hl。48模型的结构稳定性检验:chow检验v当回归模型涉及时间序列数据时,被解释变量和解释变量之间的关系可能会发生结构变化,模型中会存在转折点。v转折点的出现可能是由于社会制度、经济政策的变化、社会动荡等原因。v如何发现模型中是否确实发生了结构变化?邹志庄检验是一个有效的检验工具。49模型的结构稳定性检验:chow检验v邹氏转折点检验的目的是检验在整个样本的各个子样中模型的系数是否相等。如果模型在不同子样中的系数不同,则说明模型中存在着转折点。50模型的结构稳定性检验:chow检验v邹氏转折点检验应用的限制条件:v必须满足古典假定条件v邹氏检验的结果仅告诉我们是否
17、存在结构差异,而无法得知导致这种差异的原因。v邹检验假定知道结构发生变化的时间点。如果不清楚这一信息,则需要采用其它方法。51模型的结构稳定性检验:chow检验52模型的结构稳定性检验:chow检验53模型的结构稳定性检验:chow检验54模型的结构稳定性检验:chow检验vchow检验Eviews中的实现v利用全部数据进行ols估计v在方程窗口点击viewstability testchow breakpoint test,打开chow test对话框。在对话框内输入转折点年份,点击ok。vp0.01(0.05),则表明回归方程在两个时期显著不同,存在结构变化。55回归结果中常给出的几个其它
18、统计量v回归结果中常给出的统计量包括:样本决定系数;调整后的样本决定系数;回归标准误差(S.E.of regression);残差平方和(sum squared resid);对数似然比(log likelihood);DW统计量;因变量的均值(mean dependent var);因变量的标准差(S.D.dependent var);赤池信息标准和施瓦茨标准(Akaike info criterion,AIC;Schwarz criterion);F检验及其伴随概率。56回归结果中常给出的几个其它统计量v对数似然比是基于极大似然法估计法得到的统计量,也即对数似然函数所取的最大值。在线性回归
19、中一般有v可以看出,残差越小,L取值越大,从而L取值越大反映模型越精确。残差的大小和自变量数目有关,变量越多残差越小,因此一般来说变量越多L越大。57回归结果中常给出的几个其它统计量58回归结果中常给出的几个其它统计量59假设检验三联体v当我们的研究超出线性回归模型的范围时,我们常常需要借助于所谓的假设检验三联体对模型进行检验。v著名的三位一体是指似然比(likelihood ratio)、瓦尔德(Wald)和拉格朗日乘数(Lagrange Multiplier)检验。这三种检验在渐近(即大样本)意义下都是等价的。因为每一种检验的检验统计量都遵循卡方分布。60假设检验三联体v常用于动态模型的检
20、验v戴维森(Davidson)和麦金农(MacKinnon):对于线性回归模型,不管它的误差是不是正态分布,当然都不需要过问LM、W和LR。因为我们不能从这些统计量得到任何不为F所合有的信息。61假设检验三联体v三个检验统计量都是渐近等价的。如果样本容量可以无限制地增大的话,它们将得出同样的检验结果。但是,一般来说,对于同样的样本,三个检验的确是不同的检验,它们通常会给出不同的、甚至有时是相互矛盾的检验结果。v对于线性模型,如果对同样的样本,检验的统计量不同的话,Wald统计量是最大的,而LM检验统计量总是最小的。因此,只要LM检验拒绝有条件模型成立的原假设,那么所有其它的检验也都拒绝。62假
21、设检验三联体v对于线性模型,Wald检验是最容易用的,因为有条件模型和无条件模型的估计都很容易。但是,对于更一般的模型,LM检验是一个不错的选择。因为这个检验只依赖于对有条件模型的估计,而且因为它以有条件模型的残差为基础,因此可以用来作为检验模型对各种选择方案的刚性。vLM检验还可以用来检验异方差、联立方程偏误、或非线性是否存在。63缺失变量检验和多余变量检验v实证中常常会遇到需要决定某个变量是否应当包括在模型中的问题。v缺失变量检验通过在现有方程中加入一系列变量,并考察这些变量是否对因变量的解释作出了显著贡献。v多余变量检验则是缺失变量检验的逆过程,可以检验方程中所包含的变量是否有些有零系数
22、而需要从方程中删除。64缺失变量检验和多余变量检验在Eviews中的实现:vEquation工具栏中的view/coefficient tests,在打开的对话框中输入需要检验的变量。vEquation工具栏中的view/coefficient tests/Redundant variables,在打开的对话框中输入需要检验的变量v输出结果给出Wald统计量、似然比统计量和相应的概率。65以回归分析为工具的实证分析文章的以回归分析为工具的实证分析文章的结构结构v一、研究的来源和基础:对研究的经济现象的描述;研究该现象的意义;相同或相似的代表性研究的方法、结论,并作总结评价;本研究的出发点;文章
23、的结构介绍。v 二、理论分析:选择合适的经济理论,利用理论对要研究的经济想象做定性分析,得到大致的结果;建立理论模型。v三、建立回归模型:根据理论模型,建立合理、可分析的回归模型。回归模型的形式、解释变量的个数和选择,不一定与数理模型完全相同。v四、对所使用的数据做出说明:数据的来源;数据加工的原因和处理方式;替代数据的说明等。v五、回归结果及对结果的分析:列出回归的结果(包括参数的估计值和统计检验结果);结合理论分析回归结果v六、结论/总结/应用66两个实际例子v一元线性回归模型案例:用回归模型预测木材剩余物v多元线性回归模型案例分析:国旅游外汇收入的计量模型 v数据输入(导入);散点图;回归;残差图;残差分析;表示;存储;预测;67邹检验的例子68