《计量经济学中的统计检验.pptx》由会员分享,可在线阅读,更多相关《计量经济学中的统计检验.pptx(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、线性回归模型的统计检验计量经济学线性回归模型的各种检验v对计量经济学模型的检验包括对回归模型的理论检验(经济意义检验)、统计检验、计量经济学检验、预测检验等。v理论检验(经济意义检验)指的是依据经济理论来判断估计参数的正负号是否合理、大小是否适当。v经济意义检验是第一位的。如果模型不能够通过经济意义检验,则必须找出原因,在找出原因的基础上对模型进行修正或重新估计模型。如果通过了经济意义检验,则可进行下一步的统计检验。线性回归模型的各种检验v理论检验(经济意义检验)v统计检验v计量经济学检验v预测检验v这一节主要讨论各种统计检验回归模型的统计检验v统计检验指的是根据统计学的理论,确定回归参数估计
2、值的统计可靠性。v统计检验主要包括:回归方程估计标准误差的评价、拟合优度检验、回归模型的总体显著性检验和回归系数的显著性检验等。v这里主要讨论拟合优度检验、回归模型的总体显著性检验、回归系数的显著性检验等。回归模型的统计检验v拟合优度检验v回归模型的总体显著性检验v回归系数的显著性检验v正态性检验v检验回归的函数形式:MWD检验v假设检验三联体v模型的结构稳定性检验v缺失变量检验和多余变量检验拟合优度检验v总平方和、回归平方和、残差平方和v平方和的分解v拟合优度的定义v拟合优度与F统计量之间的联系v拟合优度等于实际值与拟合值之间简单相关系数的平方拟合优度检验v如果所有的观测值都落在回归直线上,
3、就称为完全拟合。但这种情况很少见。一般情况下,回归后总会出现正的或负的残差,它们围绕在回归直线的周围。通过对这些残差的分析,有助于衡量回归直线拟合样本点的程度。v拟合优度指样本回归直线与观测值之间的拟合程度。v在简单线性回归中,用决定系数衡量估计模型对观测值的拟合程度。在多元回归中,用多重决定系数和修正的多重决定系数来衡量。拟合优度检验v要说明多元回归模型对观测值的拟合情况,可以考察在Y的总变差中能够由解释变量解释的那部分变差的比重,即回归平方和与总离差平方和的比值。这一比值就称为多重决定系数,它一般用表示。2R总平方和、回归平方和、残差平方和2222TSSiRSSiESSiiiyyyyyyu
4、总平方和、回归平方和、残差平方和vTSS即总离差平方和,它度量被解释变量Y的观测值自身的差异程度。vRSS即回归平方和,即总变差中可由回归直线(即解释变量)解释的部分,表示解释变量对被解释变量的线性影响,因此也称为解释变差。它度量因变量Y的拟合值自身的差异程度。vESS即残差平方和,是总变差中不能够由回归直线解释的部分,是由解释变量对被解释变量的影响之外的因素所造成的,它度量实际值与拟合值之间的差异程度。总平方和、回归平方和、残差平方和v显然,回归平方和RSS越大,残差平方和ESS越小,从而被解释变量总变差中能够由解释变量解释的那部分变差就越大,模型对观测数据的拟合程度就越高。v因此定义多重决
5、定系数为解释变差占总变差的比重,用来表述解释变量对被解释变量的解释程度。拟合优度的定义v拟合优度的定义:v含义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比越高,观察点在回归直线附近越密集。v取值范围:0-1。当拟合优度为1时,被解释变量的变化完全由回归直线解释,所有观测点都落在回归直线上;当它取值为0时,解释变量与被解释变量之间没有任何线性关系。TSSESSTSSRSSTSSESSTSSRSSESSRSSTSSR112平方和的分解 ESSRSSTSSyyyyyyRSSESSyiiiiyiiiiiiTSSuyuuyuyuyyyyyyyyyyyyyyyyyyyyy
6、yyyyyiiiiiiiiiiiiiiiiiiii000222222222平方和分解的意义vTSS=RSS+ESSv被解释变量Y总的变动(差异)=解释变量X引起的变动(差异)+除X以外的因素引起的变动(差异)v如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好地解释Y。相应自由度的分解v总自由度:dfT=n-1v回归自由度:dfR=k(自变量的个数)v残差自由度:dfE=n-k-1v自由度分解:dfT=dfR+dfE拟合优度等于实际值与拟合值之间简单相关系数的平方拟合得约好。说明的相关程度的,与实际的一样,也是说明拟合的和分母分子分子分子中的分母yyyRRRSSn
7、RSSnyuyyyuyyyuyyuyyyyyyyyyyyniiiyyyyiiiiiiiiiiiiiiyyTSSRSSRSSnTSSnRSSyiyyyyyyyyyRSSnTSSnininii11122,222,222222,1101111修正的决定系数v在应用过程中人们发现,随着模型中解释变量的增多,多重决定系数的值往往会变大,从而增加模型的解释功能。这给人一个错觉,即要使模型拟合得好,就必须增加解释变量。但是另一方面,在样本容量一定的情况下,增加解释变量必然会使得待估参数的个数增加,从而损失自由度;而且在实际中,有些解释变量的增加根本就是不必要的。对于这些不必要的解释变量的引入不仅对于估计结果
8、无益,同时还意味着预测的精确度的降低。也就是说,不应该仅根据决定系数是否增大来决定某解释变量是否应引入模型。v事实上,研究模型的拟合优度时,常常并不简单地仅依靠多重决定系数,更常考虑的是修正的决定系数。修正的决定系数v修正的决定系数对决定系数进行调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。修正的决定系数222222222111111iiiiiienkRyynnkenyyenkRenkR修正的决定系数的公式为:1其中为的自由度,为的自由度。当增加一个对解释变量有较大影响的解释变量时,残差平方和减小比减小更显著,从而修正的决定系数就会增加。如果增加
9、的解释变量对被解释变量没有多大影响,残差平方和减小得不如减小得明显,从而会减小,表明不应该引入这个不重要的解释变量。修正的决定系数引入修正的决定系数的作用:v用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;v对于包含的解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能直接用未调整的决定系数来比较。修正的决定系数22222222211kRRRnkRRRRnRR修正的多重决定系数与未经修正的决定系数之间的关系如下:推导过程略,可自己推导可以看出,即修正的决定系数不大于未经修正的决定系数。随着解释变量的增加,将越来越小于。如果 很大,则与相差很
10、小。修正的决定系数比一般的决定更准确地反映了解释变量对被解释变量的影响程度,因此一般情况下,修正的决定系数比一般的决定系数应用更广泛。修正的决定系数还有一个22210kRnkRR特点,即它可能为负。当时,修正的决定系数为负(推导过程略,可自己推导)。此时修正的决定系数将失去意义,作 处理。事实上,只适用于被解释变量与解释变量的整体相关程度比较高的情况。需要说明的问题v在实际应用中,我们往往希望所建立模型的决定系数或修正的决定系数越大越好。但应注意,决定系数只是对模型拟合优度的度量,决定系数或修正的决定系数越大,只能说明列入模型的解释变量对被解释变量整体的影响程度很大,并不能说明模型中各个解释变
11、量对被解释变量的影响程度显著。因此在选择模型时,不能单纯地凭决定系数的高低来断定模型的优劣,有时从模型的经济意义和整体可靠程度的角度出发,可以适当降低对决定系数的要求。需要说明的问题v在消费模型中, R20.28F3.80该线性模型在0.99的水平下显著成立。 有许多著名的模型, R2小于 0.5,支持了重要的结论,例如收入差距的倒U型规律。 不要片面追求拟合优度什么时候增加新的解释变量v在实际中,为了解释某一现象,研究者往往面对如何取舍若干解释变量的问题。通常的做法是,只要修正的判定系数值增加(即使修正的判定系数可能小于非修正的判定系数的值),就可以增加解释变量。但是什么时候修正的判定系数值
12、开始增加呢?可以证明,如果增加变量的系数的t的绝对值大于1,修正的判定系数就会增加。在Eviews中的实现v许多的计量经济学软件可以给出决定系数和修正的决定系数,从而实现拟合优度检验。 Eviews中同样可以实现这一目的。估计完回归方程后的结果中自动会包含决定系数和修正的决定系数。v例。决定系数的值多大合适? 决定系数的值越高,拟合得越好。但什么是高?回归中使用时间序列数据还是横截面数据有不同的标准。对时间序列数据来说,决定系数的值在0.8、0.9 以上是很常见的事,而在横截面数据的情况下,0.4、0.5的决定系数值有时也不能算低。赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则v为了比较所含
13、解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:v赤池信息准则(Akaike information criterion, AIC)v施瓦茨准则(Schwarz criterion,SC)v这两准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才在原模型中增加该解释变量。nknAIC) 1(2lneennknAClnlnee回归模型的总体显著性检验v拟合优度检验可以说明模型对样本数据的近似情况。模型的总体显著性检验则一般用来检验全部解释变量对被解释变量的共同影响是否显著。回归模型的总体显著性检验012112overall significance:0;:0/F( ,1),/(1
14、),kkHHESS kF k nkRSS nkn kFF检验全部解释变量对被解释变量的共同影响是否显著,或者说,检验回归的总体显著性(),检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立,也就是检验模型中的参数是否显著不为0:、 、至少有一个不为构造统计量对于给定的和 ,如果00( ,1)k nkHH ,可以拒绝,即回归是总体显著的;反之则不能拒绝,即回归显示的线性关系不显著。回归模型的总体显著性检验v大部分的计量经济学软件可以实现回归模型的总体显著性检验。Eviews中也可以轻松地实现。估计完方程后的结果中自动会给出F统计量的值与伴随概率。拟合优度检验和F检验的关系vF检验和
15、拟合优度检验都是把总变差TSS分解为回归平方和与残差平方和,并在这一分解的基础上构造统计量进行的检验。区别在于前者有精确的分布而后者没有。一般来说,模型对观测值的拟合程度越高,模型总体线性关系的显著性越强。拟合优度检验和F检验的关系vF显著=拟合优度必然显著RRsskknFTSSRSSTSSkTSSRSSknRSSTSSkRSSknkESSRSSknFknESSkRSSFer2222111)(111拟合优度检验和F检验的关系v反过来有v可以看出,随着决定系数和修正的决定系数的增加,F统计量的值也不断增大;反过来也是如此。这说明二者之间具有一致性。但是,决定系数和修正的决定系数只能提供一个模糊的
16、推测,它们的值要达到多少才算模型通过了检验并没有确定的界限;而F检验则不同,它可以在给定显著性水平下,给出统计意义上严格的结论。221111kFRnkkFnRnkkF 拟合优度检验和F检验的关系回归参数的显著性检验v模型通过F检验,可以说明模型中所有解释变量对被解释变量的“总体影响”是显著的,但并不意味着模型中的每一个解释变量对被解释变量都有重要的影响,或者说,并不说明每个解释变量的单独影响都是显著的。v要确定每一个解释变量对被解释变量的具体影响是否显著,需要进行单个回归系数的显著性检验即t检验。变量的显著性检验(变量的显著性检验(t检验)检验)v方程的总体线性关系显著每个解释变量对被解释变量
17、的影响都是显著的v必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。v这一检验是由对变量的t检验完成的。v检验目的:回归模型中是否存在线性关系?这种关系是显著的吗?t检验)1(:;:.)1(:;:.)1(|)1(|)(,)1()(), 1 , 0(:;:.*1*0*1*002/02/*1*0 knttHHcknttHHbHknttHknttnSEtkntSEkjHHajjjjjjjjjjjjjjjjjj ,拒绝域为,拒绝域为若若,拒绝域为,拒绝域为若若,可以拒绝,可以拒绝如果如果,不能拒绝,不能拒绝如果如果,和和对于给定的对于给定的计算计算,因此,因此易知易知对于对于回归
18、参数的t检验22101/ 2(0,)( ,() ) ()():0;:0 (k-1)t()| |(iiijjjjNNtt nkSeHHtt nt statistictt ratioSEttnk uIX X根据假定,因此。以 代替 ,则统计量检验 的显著性,即在一定显著水平下,检验 是否显著不为0。计量经济学中经常检验以下假设:,此时,称为 统计量()或 比率()。如果01)tjjjHsignificantstatisticallyp ,说明可以拒绝,即显著地异于零,说明解释变量对被解释变量有显著影响,称是统计上显著的()。这个检验过程称为 检验。一般地,统计软件会给出每个的 值,研究者可根据需要
19、确定可以接受的显著性水平。回归参数的t检验0111110.0250:0;:0 (2)t()0.05402t|t|2H|t|22HHtt nSEdft计量经济学中经常检验以下假设:,即根据进行检验,称为 检验。如果原假设被拒绝,就可以认为两个变量之间存在线性关系。有用的经验规律:分析中经常选择,而当时,。因此,进行 检验时一般只要计算出的,就可以拒绝但是当 接近于 而小于 时,这种经验判断的方法有时不太准确。一元线性回归中,t检验与F检验一致v 一方面一方面,t检验与F检验都是对相同的原假设H0: 1=0 进行检验;v 另一方面另一方面,两个统计量之间有如下关系: 222212221222122
20、212212)2()2()2()2(txnexnexnenexneyFiiiiiiiiii正态性检验:Jarque-Bera检验v统计检验过程是建立在假设随机误差项服从正态分布的基础上的。由于不能直接观察真实的误差项,但能够得到其近似值即残差,因此可通过对残差的研究来研究误差项的正态性。v一种常用的正态性检验方法是Jarque-Bera (雅克贝拉)检验,简称JB检验。v许多统计软件可以实现这一检验,Eviews也可以实现。正态性检验:Jarque-Bera检验222203(3)642(2)asyJBOLSSKJarqeBeranKJBSnSKJarqeBeraJBJB检验是依据残差,对大样本
21、的一种检验方法(或称为渐近检验)。这种方法建立在计算出偏度系数 和峰度系数 的基础上。对于正态分布变更,偏度为 ,峰度为 。和建立的统计量为其中 为样本容量, 为偏度, 为峰度。和证明了在正态性假定下,统计量渐近地服从自由度为 的分布,用符号表示为正态性检验:Jarque-Bera检验030SKJBJBJBJB22对于正态分布变量, 为 , 为 ,从而统计量的值为 。但如果变量不是正态分布,则统计量将是一个逐渐增大的值。在一定显著性水平下,如果统计量的值临界值,则拒绝正态分布的零假设,认为残差不服从正态分布;如果统计量的值临界值,则不能拒绝零假设,即认为残差服从正态分布。正态性检验:Jarqu
22、e-Bera检验v在Eviews中的实现v选择并打开要检验的变量,点击descriptive stats/common sample项,得到的结果中即包含JB统计量。vP值将近0,表明序列不服从正态分布。检验回归的函数形式:MWD检验v选择线性回归模型或对数线性回归模型是经验分析中由来已久的一个问题。v麦金农(MacKinnon)、怀持(white)和戴维森(Davidson)提出一种检验方法,可用于在两个模型之间进行选择,简称为MWD检验。检验回归的函数形式:MWD检验01:lnlnHYXHYX检验的假设:是各解释变量 的线性函数是各解释变量的对数的线性函数。检验回归的函数形式:MWD检验1
23、1102212lnlnln3lnln45ln6MWDYYYfYZYfYXZtZHZfYYXZt检验的步骤:()估计线性模型并得到 的估计值,记为 。( )估计对数线性模型并得到的估计值,记为(目的在于把两个符号区分开。本来应该用的)。( )计算。( )对 关于 和进行回归。如果根据通常的 检验 的系数在统计上是显著的,就拒绝( )计算的反对数。( )对 的对数关于 的对数和进行回归。如果根据通常的 检21ZH验的系数在统计上是显著的,就拒绝。检验回归的函数形式:MWD检验vMWD检验虽然看似复杂,其实这个检验的逻辑很简单。如果线性模型是事实上正确的模型,第4步的构造变量就不会是统计上显著的,因
24、为这时从线性模型估计来的y值和从对数线性模型估计出来的(为了比较而取反对数之后的)就不会有什么差别,同样的评语也适用于对立假设Hl。模型的结构稳定性检验:chow检验v当回归模型涉及时间序列数据时,被解释变量和解释变量之间的关系可能会发生结构变化,模型中会存在转折点。v转折点的出现可能是由于社会制度、经济政策的变化、社会动荡等原因。v如何发现模型中是否确实发生了结构变化?邹志庄检验是一个有效的检验工具。模型的结构稳定性检验:chow检验v邹氏转折点检验的目的是检验在整个样本的各个子样中模型的系数是否相等。如果模型在不同子样中的系数不同,则说明模型中存在着转折点。模型的结构稳定性检验:chow检
25、验v邹氏转折点检验应用的限制条件:v必须满足古典假定条件v邹氏检验的结果仅告诉我们是否存在结构差异,而无法得知导致这种差异的原因。v邹检验假定知道结构发生变化的时间点。如果不清楚这一信息,则需要采用其它方法。模型的结构稳定性检验:chow检验01 12212101 122201 122tttkktttttkkttttybb xb xb xxynnyxxxyxx如果我们在对某一经济问题进行分析时,建立了多元线性回归模型假设我们收集到了关于 和 的两个不同时期(或不同截面)的样本,其中一个样本包含 个观测值,另一个样本包含个观测值。利用这两个样本分别对所建立的模型进行估计,并分别得到回归方程kkt
26、x那么,这两个回归方程是否显著不同?如果显著不同,则说明模型所描述的经济结构由于受到有关因素的影响而发生了变化;反之,如果两个回归方程的差别不显著,则说明模型所反映的经济结构在时间上(或截面上)是稳定的。这里就涉及到检验两个方程是否显著不同的问题,即检验经济结构是否稳定。邹志庄检验的目的就在于此。模型的结构稳定性检验:chow检验1201 122212221212,(1)(1)(tttkkttttnnybb xb xb xennkkeenkn邹检验的步骤:首先,合并两个样本,构成观测值个数为的样本,对初始建立的模型进行回归,得到回归方程求其残差平方和其自由度为,这里 为解释变量个数。其次,利用
27、上面给定的两个小样本,分别对初始所建模型进行回归,得回归方程后分别计算其残差平方和和,其自由度分别为和1)k 。模型的结构稳定性检验:chow检验2221222121201212122:(0,1,2)221122tttttjjeeekFeennkHjknnkkFFknnkFFF然后,根据以上得到的各残差平方和,构造如下统计量利用该统计量检验第二步得到的两个回归方程的异同,即检验假设在给定显著性水平 下,查分母自由度为(),分子自由度为()的 分布表,得临界值 (,)。比较 统计量和临界值,若0FH,则拒绝,即认为第二步得到的两个回归方程存在显著差异,两个样本反映的经济关系显著不同,也就是说,认
28、为经济结构发生了变化;反之,则认为经济结构稳定,没有发生变化。模型的结构稳定性检验:chow检验vchow检验Eviews中的实现v利用全部数据进行ols估计v在方程窗口点击viewstability testchow breakpoint test,打开chow test对话框。在对话框内输入转折点年份,点击ok。vp0.01(0.05),则表明回归方程在两个时期显著不同,存在结构变化。回归结果中常给出的几个其它统计量v回归结果中常给出的统计量包括:样本决定系数;调整后的样本决定系数;回归标准误差(S.E. of regression);残差平方和(sum squared resid);对数
29、似然比(log likelihood);DW统计量;因变量的均值(mean dependent var);因变量的标准差(S.D. dependent var);赤池信息标准和施瓦茨标准(Akaike info criterion, AIC; Schwarz criterion);F检验及其伴随概率。回归结果中常给出的几个其它统计量v对数似然比是基于极大似然法估计法得到的统计量,也即对数似然函数所取的最大值。在线性回归中一般有v可以看出,残差越小,L取值越大,从而L取值越大反映模型越精确。残差的大小和自变量数目有关,变量越多残差越小,因此一般来说变量越多L越大。222log2log222nnn
30、Ln 其中 为样本容量,为未知参数的极大似然估计,它与残差有关。回归结果中常给出的几个其它统计量22AICLkAICnnLnkAICAICAICLkkAICLAICkLAIC 准则是赤池信息准则的简称。这项准则运用如下统计量来评价模型的好坏:其中 为对数似然比, 为观测值数目, 是被估计的参数个数。准则要求取值越小越好。从统计量的公式可以看出,其大小取决于 和 。 越小,值越小; 取值越大,值越小。 越小,模型越简洁; 越大,模型越精确。因此和修正的决定系数相类似,在评价模型优劣时兼顾了简洁性和精确性。该统计量常用于选择变量最优滞后期。回归结果中常给出的几个其它统计量2lnSCLknSCnnL
31、knSCAIC 准则是施瓦茨准则的简称。该准则使用如下统计量来评价模型:其中 , , 的意义同赤池信息准则。的用法和特点与十分相近。使用时一般也要求其值越小越好。该统计量常用于选择变量最优滞后期。假设检验三联体v当我们的研究超出线性回归模型的范围时,我们常常需要借助于所谓的假设检验三联体对模型进行检验。v著名的三位一体是指似然比(likelihood ratio)、瓦尔德(Wald)和拉格朗日乘数(Lagrange Multiplier)检验。这三种检验在渐近(即大样本)意义下都是等价的。因为每一种检验的检验统计量都遵循卡方分布。假设检验三联体v常用于动态模型的检验v戴维森(Davidson)
32、和麦金农(MacKinnon): 对于线性回归模型,不管它的误差是不是正态分布,当然都不需要过问LM、W和LR。因为我们不能从这些统计量得到任何不为F所合有的信息。假设检验三联体v三个检验统计量都是渐近等价的。如果样本容量可以无限制地增大的话,它们将得出同样的检验结果。但是,一般来说,对于同样的样本,三个检验的确是不同的检验,它们通常会给出不同的、甚至有时是相互矛盾的检验结果。v对于线性模型,如果对同样的样本,检验的统计量不同的话,Wald统计量是最大的,而LM检验统计量总是最小的。因此,只要LM检验拒绝有条件模型成立的原假设,那么所有其它的检验也都拒绝。假设检验三联体v对于线性模型,Wald
33、检验是最容易用的,因为有条件模型和无条件模型的估计都很容易。但是,对于更一般的模型,LM检验是一个不错的选择。因为这个检验只依赖于对有条件模型的估计,而且因为它以有条件模型的残差为基础,因此可以用来作为检验模型对各种选择方案的刚性。vLM检验还可以用来检验异方差、联立方程偏误、或非线性是否存在。缺失变量检验和多余变量检验v实证中常常会遇到需要决定某个变量是否应当包括在模型中的问题。v缺失变量检验通过在现有方程中加入一系列变量,并考察这些变量是否对因变量的解释作出了显著贡献。v多余变量检验则是缺失变量检验的逆过程,可以检验方程中所包含的变量是否有些有零系数而需要从方程中删除。缺失变量检验和多余变
34、量检验在Eviews中的实现:vEquation工具栏中的view/coefficient tests,在打开的对话框中输入需要检验的变量。vEquation工具栏中的view/coefficient tests/Redundant variables,在打开的对话框中输入需要检验的变量v输出结果给出Wald统计量、似然比统计量和相应的概率。以回归分析为工具的实证分析文章的以回归分析为工具的实证分析文章的结构结构v一、研究的来源和基础: 对研究的经济现象的描述;研究该现象的意义;相同或相似的代表性研究的方法、结论,并作总结评价;本研究的出发点;文章的结构介绍。v 二、理论分析:选择合适的经济理论,利用理论对要研究的经济想象做定性分析,得到大致的结果;建立理论模型。v三、建立回归模型:根据理论模型,建立合理、可分析的回归模型。回归模型的形式、解释变量的个数和选择,不一定与数理模型完全相同。v四、对所使用的数据做出说明:数据的来源;数据加工的原因和处理方式;替代数据的说明等。v五、回归结果及对结果的分析:列出回归的结果(包括参数的估计值和统计检验结果);结合理论分析回归结果v六、结论/总结/应用