《第十六章-面板数据模型一(共41页).doc》由会员分享,可在线阅读,更多相关《第十六章-面板数据模型一(共41页).doc(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第16章 静态面板数据模型时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。对于面板数据yi
2、t(i=1,2,,N,t=1,2,,T)来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。本章主要讨论静态面板数据模型的相关理论及软件操作,首先从模型的检验开始到介绍变截距模型中的固定影响变截距模型和随机影响变截距模型,然后到变系数模型。本章的流程图如下:静态面板数据模型面板数据模型建模的基本原理固定效应变截距模型平衡数据建模原理固定效应模型分类固定效应模型软件估计非平衡数据建模原理固定效
3、应模型另外两种估计方法广义最小二乘法估计二阶段最小二乘法估计随机效应变截距模型随机效应模型原理模型软件估计Hausman检验变系数模型变系数模型原理模型分类及软件操作似不相关回归模型Swamy模型16.1面板数据模型建模的基本原理在应用多元回归分析建立的计量经济模型时,如果所建的模型中缺失了某些不可观测的重要解释变量,使得回归模型随机误差项常常存在自相关。于是回归参数的最小二乘法OLS估计量不再是无偏估计或有效估计。但是,运用面板数据建立的计量经济模型时,对于一些忽略的解释变量可以不需要其实际观察值,而通过控制该变量对被解释变量的影响的方法获得模型参数的无偏估计。由此可见,面板数据不仅可以同时
4、利用截面数据和时间序列数据建立计量经济模型,而且能更好地识别和度量单纯的时间序列模型和单纯截面数据模型所不能发现的影响因素,它能够构造和检验更复杂的行为模型。例如:在宏观领域,它被广泛用于劳动经济学、国际金融、经济增长、产业结构、技术创新、税收政策等领域。16.1.1面板数据模型基本框架面板数据能更好地识别和度量时间序列或截面数据不可发觉的效应,有助于建立和检验更复杂的行为模型,其基本模型是如下形式的一般回归模型:(16.1.1)其中:是个体在时间时期的观测值,表示模型的常数项,代表固定或者随机的截面效应,代表固定或者随机的时期效应,表示k阶解释变量观测值向量。表示解释变量的系数向量,并且在根
5、据其条件的限制分为三种值,一是对所有截面和时期都是相同的常数,二是在不同的截面是不同的系数,三是在不同的时期是不同的。是独立同分布的误差项,即。在公式(16.1.1)中,如果考虑k个解释变量,自由度远小于参数个数,对于截面成员方程,待估计参数的个数为,对于时间截面方程,待估计参数的个数为,这使得该模型无法估计。为了对模型进行估计,则可以建立以下的两类模型:从个体成员角度考虑,建立含有N个个体成员方程的面板数据模型;在时间点上截面,建立含有T个时间点截面方程的面板数据模型。1)含有N个个体成员方程的面板数据模型模型形式如下: (16.1.2)其中:是个体的观观测值的时间序列。系数向量取值受不同个
6、体的影响,表示个体解释变量观测值时间序列。是T阶的单位行向量,是T阶的单位列向量。,包括所有的时点效应。该式含有N个截面方程。2)含有T个时间截面方程的面板数据。其形式如下: (16.1.3)其中:是某一时间点的各个个体成员的因变量观测值序列。系数向量取值受不同时期的影响,表示某一时间点的各个个体成员的解释变量观测值序列。是N阶行向量,是N阶列向量。,包括所有的截面效应。该式含有T个时间截面方程。(1)为了更好讨论,将这些方程堆积在一起。首先,按照面板数据的截面方程堆积起来的,表示如下: (16.1.4)在截面单位和时期的数据和参数满足经典假设的前提下建立的矩阵和矩阵,其无约束的协方差矩阵如下
7、: (16.1.5)(2)将这些方程看出是一系列的时点方程,通过时点堆积起来的方程组如下: (16.1.6)其协方差矩阵如下: (16.1.7)为了得到模型(16.1.1)的参数的无偏有效估计量,假设模型满足下列条件:误差项均值为0,并且同方差。误差项不存在截面相关。解释变量与误差项相互独立。解释变量之间线性无关。解释变量是非随机的。如果模型满足上面的假设,可以用最小二乘法估计模型的参数。16.1.2面板数据分类在模型(16.1.1)式子中,将和归入截距里,常用的有如下的三种情形:情形1: (16.1.8)情形2: (16.1.9)情形3: (16.1.10)1)对于情形1,假设在横截面既无个
8、体的影响,也没有结构的变化。即对于每个个体成员方程,截距项和系数向量均相同。对于该模型,将各个个体的时间序列数据堆积在一起来作为样本数据,这种模型称为混合回归模型(Pooled Regression Model)。那么可以直接利用普通最小二乘法(OLS)估计参数,则该模型为: (16.1.11)实际上,混合回归模型假设了解释变量对被解释变量的影响与个体无关。这种假设被广泛的应用,但是在很多实际问题的研究中,该模型不是很适用。因此,本书不详细讨论这种模型。2)对于情形2,假设在个体成员上存在个体影响而无结构变化,并且个体影响可以截距项的差别来说明,而系数向量相同,称该模型为变截距模型。从估计方法
9、角度,有书也称之为个体均值修正回归模型(individual-mean corrected regression model)。即模型形式如下: (16.1.12)3)对于情形3,假设在个体成员上既存在个体影响,又存在结构变化,即用变化的截距项来说明的同时,用系数向量依个体成员的不同而变化,来说明个体成员之间的结构变化。这样的模型我们称为变系数模型或无约束模型(unrestricted model)。 (16.1.13)16.1.3模型检验原理在对面板数据进行估计时,使用的样本包含了个体、指标、时间3个方向上的信息。如果模型设定不正确,估计结果将与所要模拟的经济现实偏离很远。因此,建立面板数据
10、模型之前要检验被解释变量的参数是否在所有横截面样本点和时间上都是常数,即检验所研究的问题属于上述3种情况的哪一种,以确定模型的形式。常用的检验是协变分析检验或协方差分析检验(analysis of covariance)。主要检验如下的两个假设: (16.1.14) (16.1.15)如果接受了假设2,可以认为样本数据符合模型(16.1.11),不需要进行进一步的检验了。如果拒绝了假设2,还要进行检验假设1。如果接受假设1,则认为样本数据符合模型(16.1.12)。如果假设1也被拒绝了,才应采用模型(16.1.13)。下面是进行假设检验F统计量的计算方法。记, (16.1.16)模型(11.8
11、)的参数最小二乘法估计后,得到:, (16.1.17)模型(16.1.13)的残差平方和为: (16.1.18)计算模型(16.1.12)的残差平方和,如果记为:,模型(16.1.12)残差平方和为: (16.1.19)计算模型(16.1.11)的残差平方和,如果记, (16.1.20) (16.1.21)其中:,则模型(16.1.11)残差平方和记为 (16.1.22)在假设H2下检验统计量F2服从相应自由度下的F分布,即 (16.1.23)若计算所得到的统计量F2的值不小于给定置信度下的相应临界值,则拒绝假设H2,继续检验假设H1,检验统计量F1服从相应自由度的F分布, (16.1.24)
12、若计算所得的统计量F1的值不小于给定置信度下的相应临界值,则拒绝假设H1,用模型(16.1.13)拟合样本,反之,则用模型(16.1.12)。在实际经济问题的分析中,变截距模型和变系数模型比较常见,因此本章主要介绍这两类模型的相关理论与软件操作。16.1.4模型检验软件操作例如,我们使用Grunfeld(1958)的公司水平的平衡面板数据(后来被Baltagi2001年扩展)。该面板数据是对美国10个大型制造业企业的年投资(I)、公司价值(F)和公司资本(K)观测20年数据(1935-1954) EVviews 6.0 Example Files,Quantitative Micro Soft
13、ware。在后面的面板数据模型中以及下章都将采用本例数据进行示范操作。第一步,假定截距和系数都随截面变化,即为模型(16.1.13),先对模型进行最小二乘估计得到残差平方和为:图16.1.1其结果为:图16.1.2得到S1=.6。第二步,截距随截面变化,系数在每个截面都相同,模型估计设置如下:图16.1.3得到的残差平方和S2=.1。第三步,进行混合模型估计,截距和系数对每个截面都是相同的,模型设定如下:图16.1.4然后从估计结果中得到S3=。为了确定面板数据分析模型,首先利用F检验进行模型设定检验。N=10,T=20,k=2(解释变量个数),则有F2=(-.6)/(9*3)/.6/(200
14、-10*3)=31.,临界值F0.95(27,170)值在1.55左右,拒绝假设H2,则继续检验H1;F1=(.1-.6)/18/.6/170=5.,F0.95(18,170)介于1.66和1.67之间,F1也大于临界值,拒绝H1,选用模型(16.1.13)拟合样本。16.2固定效应变截距模型在日常生活中,变截距模型用的最广泛。根据未观测效应与解释变量是否相关,将模型又分为固定效应模型和随机效应模型。本节主要介绍固定效应模型的相关理论及软件操作,有关随机效应变截距模型将在下节论述。16.2.1固定效应模型原理1)平衡数据如果面板数据遵循以下5个假设:(1)对于个体i,可以用下面的线性模型来表示
15、: (16.2.1)(2)对于每个时期t,在给定非观测效应和解释变量的条件下误差项的期望为零,即 (16.2.2)(3)每个解释变量在时间上有所变化,并且解释变量之间无线性关系。(4) (16.2.3)(5) (16.2.4)则的固定效应估计量是其最优线性无偏估计(Blue),此时可采用两种方法进行估计,固定效应变换法和虚拟变量回归法。(1)固定效应变换法为说明此方法的原理,先考虑最简单的情况,假设仅有一个解释变量的模型,对于个体i,有: (16.2.5)对每个i在时间上求均值,得到 (16.2.6)其中:,因在不同时间固定不变,它同时出现在式子(16.2.5)和式子(16.2.6)中,如果对
16、于每个t,都将式子(16.2.5)从式子(16.2.6)中减去,我们便得到记为: (16.2.7)这里,是的除时间均值数据(time-demeaned data),对,的解释也是类似。固定效应变换又称为组内变换(within transformation)。在方程(16.2.7)中非观测效应已消失,可以使用混合的普通最小二乘法(OLS)对变换后的数据进行估计。基于除时间均值变量的混合OLS估计量被称为固定效应估计量(fixed effects estimator)或组内估计量(within estimator)。后一种是因为估计时使用了解释变量和被解释变量在每个横截面观测之内的时间变异。把模型
17、进行扩展到多个解释变量的形式,原始模型为: (16.2.8)作类似变换,得到消去时间均值的模型为: (16.2.9)使用普通最小二乘法估计,求出各回归系数的估计值,再把估计值代入式子(16.2.8),求出个体对应的截距。(2)虚拟变量回归法对于个体i建立如下回归模型: (16.2.10)其中,考虑k个解释变量,对应就有k个系数组成的向量,是误差项,用来表示个体之间的差别,由于只在第i个个体出现,所以可以考虑构造一个虚拟变量作为的系数。考虑整个面板数据集,可以用下面的模型来表示: (16.2.11)其中,其中,为维单位矩阵。误差项满足上面的假设,用最小二乘法估计得到最优线性无偏估计, (16.2
18、.12) (16.2.13)其中:,在模型(16.2.11)中,的系数的观测值可写成可观测的虚拟变量的形式,该模型通常被称为最小二乘虚拟变量(LSDV)模型。如果N比较小,此模型可以当作具有N+k个参数的多元回归,参数由最小二乘法进行估计。但是若N充分大时,此时的计算量会非常大,则可以采用下面的分块回归方法进行计算。令,因为,所以,则式子(16.2.11)可以写成 (16.2.14)使用普通最小二乘法,得到的估计值为 (16.2.15)截距的估计为 (16.2.16)模型(16.2.11)也被称为协方差分析模型,因此参数的LSDV估计有时也被称为协方差估计。参数的协方差估计是无偏的,且当n或T
19、趋于无穷大时,其是一致估计的。16.2.2固定影响模型类型引进总体均值截距项的固定影响变截距模型主要包括以下几类:(1)包含个体影响的固定影响变截距模型引进了总体均值截距项(),个体影响变截距模型可写成如下形式: (16.2.17)在该形式下,模型中反映个体影响的跨成员方程变化的截距项被分解成两个部分,在各个个体成员方程汇总都相等的总体均值截距项()和跨成员方程变化的表示个体对总体均值偏离的个体截距项()。个体截距项()表示的是个体成员i对总体平均状态的偏离,所有偏离之和应该为零,即 (16.2.18)在该约束下,可以得到模型(11.6)中各参数的最优线性无偏估计 (16.2.19) (16.
20、2.20) (16.2.21)其中:,(2)包含时点固定影响变截距模型Eviews软件中,除了可以单独估计包含个体恒量影响的模型,还可以对时点恒量影响的变截距模型进行估计,实际上是每个时点为一个截面进行一次回归,模型形式可以写为 (16.2.22)同个体固定效应模型一样,注意,计算变截距模型的个体影响时,在不同的软件给出的个体影响形式不同。本书主要应用EViews软件估计,则这里介绍的是EViews里面模型形式。(3)包含时期个体恒量的固定影响变截距模型其他形式包含时期个体恒量的固定影响变截距模型的计算方法,与上面的类似。其模型形式为: (16.2.23)其中:为时期恒量,反映时期特有的影响,
21、也就是反映未观测的随时间变化的变量的影响。类似的,通过引进相应的个体成员和时期虚拟变量,利用普通最小二乘法可以得到该形式下的参数的OLS估计,即 (16.2.24) (16.2.25) (16.2.26) (16.2.27)其中:,16.2.3固定效应模型软件估计1)个体固定效应模型在Eviews软件估计如下:(1)POOL数据形式估计:首先,建立Pool。在打开工作文件的基础上,点击主菜单中的Object/New Object,选择Pool(混合数据库),点击“确定”,从而打开Pool窗口,在窗口中输入10个公司名称标识AR,CH,WH。见图16.2.1。图16.2.1 定义面板数据的个体生
22、成新序列和输入数据。在Pool窗口的工具栏中点击sheet键,从而打开Series List(列写序列名)窗口,定义变量I?、F?和K?,点击OK键,接着点击Pool窗口工具栏中的Edit,输入数据。如图16.2.2和16.2.3。注意,前面截面标识名设定与这里序列名的设置保持一致。如果前面截面标识名设为“_AR”与序列名的“I?”对应,而如果是“AR_”,则与序列名“?I”对应。图16.2.2生成面板数据的时间序列然后点击OK,得到如下的堆积数据:图16.2.3Dependent Variable(相依变量即因变量)选择窗填入Pool面板数据的因变量或被解释变量;在Specificatin页
23、面下,在Regressors and AR() terms下面Common coefficients里填入解释变量,再在cross-section选择fixed,点击“确定”后就可得到包含个体影响的模型参数估计值。图16.2.4估计结果如下:图16.2.5估计结果的上半部分显示了因变量、估计的方法样本相关的基本的信息,下面除了显示一般的解释变量系数的估计外,还以个体的标识名和常数C的合名形式显示了个体固定效应,他们表示的是对总体截距(比如:-58.744)的偏离,并且他们的和为零。(2)当然除了用pool数据形式对面板数据进行估计外,也可以在workfile中的panel structure形
24、式下的面板数据进行估计,以个体固定效应模型为例,其估计过程如下:首先,Eviews中直接建立Panel结构的工作区,具体操作如下:File/New/workfile,然后在Workfile structure type中选择Balanced Panel,得到如图所示的对话框,然后进行相关的面板设定。图16.2.6点击OK,得到如下的面板数据格式的工作区:图16.2.7由图16.2.7可知,系数C,序列Crossid,dateid及resid均由系统自动生成。C与序列resid是系统默认的存放估计系数(包括迭代的初值等)与残差的序列。Crossid,dateid是Panel Data所特有的用于
25、存放截面与时期标号的序列。接着建立新序列I,F,K。图16.2.8对估计方程的设定,在Equation specification处设定依次填入方程的因变量和自变量:如下图所示:图16.2.9选择最小二乘法,即LS(Least Squares),然后再对固定个体设定,即点击Equation Estimation对话框的Panel Options页面,在Cross-section下来菜单中选择Fixed,图16.2.10点击“确定”后,估计结果没有包括个体的固定效应,其结果如下:图16.2.11如果想要查看截面中的固定效应或者随机效应,可以通过估计结果工具栏中的View/Fixed/Random
26、 Effects/Cross-section Effects,图16.2.12比如本例中的截面固定效应如下图:图16.2.13注意:第一,Panel结构的工作区中方程设定估计的时点固定效应以及随机效应,都可通过这样的方式查看。第二,Pooled Data的方法与Panel Data的方法针对同一问题所得到的结果是一致的,但Panel Data模组的功能更加强大,而Pooled Data显得更加直观,读者可以根据自己的需要选择自己喜欢的方法。不过,一般Pool对象侧重分析“窄而长”的数据,即截面成员较少而时期较长的侧重时间序列分析的数据;对于截面成员较多时期较少的“宽而短”的侧重截面分析的数据,
27、一般通过具有面板结构的工作文件进行分析,并且利用面板结构的工作文件可以实现变截距以及动态面板数据模型的估计。时点固定效应模型估计结果显示与个体固定影响模型一样,上半部分显示了因变量、估计的方法样本相关的基本的信息,下面除了显示一般的解释变量系数的估计外,还以时点的标识名和常数C的合名形式显示了时点固定效应,他们表示的是对总体截距的偏离,并且他们的和为零。个体时点固定效应模型的结果也是类似的。16.2.4非平衡数据的固定效应模型前面讨论都是假设在所有使用的面板数据中,各个体成员的观测数据个数相同。然而在实际分析中,经常会遇到各个体成员观测数据个数不等的情况,即在所获得的面板数据中,一些个体成员的
28、数据较多而另一些个体成员的数据较少。这种情况下的面板数据被称为非平衡数据。对于非平衡数据的固定影响模型,只需将上面的方法进行简单修正,便可得到参数的相应的协方差估计。设第i个截面成员的观测数据个数为,则观测数据总数为,变量的总体平均为, (16.2.28)其中:模型的参数的估计量为: (16.2.29)其中:估计出后,根据(16.2.13)可以求出最小二次虚拟变量形式下的固定影响变截距模型的截距项;根据式子(16.2.20)和式子(16.2.21)可以求出引进总体均值截距项形式下的个体固定影响变截距模型中的和;根据式子(16.2.25)、式子(16.2.26)和式子(16.2.27)可以求出包
29、含时期个体恒量的固定影响变截距模型中的和、。比如我们可以2003到2006年的对外贸易TIE与对外直接投资ODI两者的非平衡面板数据作一个类似的操作分析:在POOL estimation的设定如下图:图16.2.14点击“确定”后,软件估计结果如下图:图16.2.15从上面的估计结果可以看出,顶端除了显示一些估计的基本信息外,还报告了数据类型,比如Total pool(unbalanced)都很明显的说明了该数据是个非平衡数据。与平衡面板数据类似,也可以对非平衡数据进行个体固定、时期固定和包含个体时期固定的模型进行估计。16.3固定效应变截距模型另外两种估计方法16.3.1广义最小二乘估计在固
30、定影响变截距模型中,如果随机误差项不满足等方差或相互独立的假设,则需要使用广义最小二乘法(GLS)对模型进行估计。如果误差项的方差有如下结构,个体成员截面异方差、时期异方差、同期相关协方差和时期间相关协方差,则可以采用广义最小二乘法对该模型估计。对应于各种方差结构的GLS估计过程的主要步骤均为:先估计系数,然后计算GLS的转换权重,之后在加权数据基础上重新估计,或者利用迭代的方法,重复上面的步骤直至系数和权重收敛为止。假定参数满足时间一致性,即参数值不随时间的不同而变化,存在个体成员截面异方差和同期相关协方差。假定参数随着时间的不同而变化,而存在时期异方差和时期间相关协方差。1)个体成员截面异
31、方差情形的GLS估计个体成员截面异方差是指个体成员方程的随机误差项之间存在异方差,但个体成员之间和时期之间的协方差为零,对应的假设为: (16.3.1) (16.3.2)该情形用广义最小二乘法估计非常简单,首先对方程进行普通最小二乘估计,然后计算各个体成员的残差向量,并用其来估计个体成员的样本方差: (16.3.3)其中:是OLS的拟合值。个体成员方程截面异方差的协方差矩阵的估计为: (16.3.4)然后,用得到的样本方差估计作为各个个体成员的权重,即加权矩阵为 设,定义A与B的克罗内克积(简称叉积)为显然,是阶矩阵,是分块矩阵,其第(i,j)块。,利用加权最小二乘方法得到相应的GLS估计。类
32、似地,可以得到含有T个时间截面方程情形下的时期异方差的GLS估计。在Eviews软件操作中,设定广义最小二乘法估计面板数据时,在pool estimation对话框中,在weighs处选择cross-section weighs,设定如下:图16.3.1然后点击“确定”,得到的结果如下:图16.3.2从上面的估计结果比较可以看出,广义最小二乘法提高了整个模型的拟合优度,也使变量的系数估计更准确了。 2)同期相关协方差情形的SUR估计同期相关协方差是指不同的个体成员i和j的同一时期的随机误差项是相关的,但其在不同时期之间是不相关的,相应的假设为:(11.8) (16.3.5) (16.3.6)同
33、期相关协方差是允许同一时期即t不变时,不同个体成员之间存在协方差。如果把假设(11.8)中的表达式写成向量的形式: (16.3.7)对于任意的t有 (16.3.8)这种个体成员之间存在协方差的方差结构有些类似于个体成员方程框架下的近似不相关回归(seemingly unrelated regression,SUR),因此将这种结构称为个体成员截面SUR(cross-section SUR)。(1)已知的情形SUR方法适合于方程间的残差可能具有异方差和同期相关,但是单个方程不存在序列相关的情形。如果是是已知的,则参数的SUR估计为 (16.3.9)其中:,其中:是维因变量向量,是维解释变量向量矩
34、阵,。()未知的情形一般的情况下,都是未知的,这时就需要利用普通最小二乘法先估计为加权系统的参数,得到的一致估计矩阵,中的元素的估计值为, (16.3.10)其中:和可由式子(16.2.12)和(16.2.13)计算得到。计算后,再进行广义最小二乘法估计(GLS),此时的SUR估计为(16.3.11)个体成员截面SUR加权最小二乘法简单地说,就是对由各个个体成员方程所构成的系统进行GLS估计,系统中允许存在个体成员异方差和同期相关。估计过程为:先利用第一阶段的普通最小二乘法估计获得的估计,然后在第二阶段获得相应的GLS估计。类似地,可以得到时期近似不相关(period SUR)(时期方程框架下
35、的近似不相关)情形下的GLS估计。其软件操作与前面截面异方差类似,只需pool estimation的设定中在weighs处选择cross-section SUR,点击确定后即可得到GLS估计的结果。图16.3.3该结果显示的模型的拟合优度又比cross-section加权高,证明了面板数据既存在截面异方差又存在同期相关,即同期相关协方差,选用cross-section SUR加权的方式对数据进行广义最小二乘法估计更有效。3)时期异方差与截面异方差类似,时期异方差就是指每个时期有一个不同的残差方差。不同截面的残差和不同时期的残差和为零,即为: (16.3.12) (16.3.13)用广义最小二
36、乘法估计时,先对方程进行普通最小二乘估计,然后计算各个体成员的残差向量, (16.3.14)然后用这些残差向量估计时期协方差,对数据赋予权重,再进行可行性的GLS估计。时期异方差的软件设定与前面类似,在pool estimation的设定中在weighs处选择Period weighs即可。4)时期间相关协方差的SUR估计在给定的截面内,允许存在任意时期序列相关和时期异方差,但不同截面间残差不相关。因此有假设: (16.3.15) (16.3.16)计算某一具体的截面残差向量,我们可以重新写该假设: (16.3.17)类似地,可以得到时期近似不相关(period SUR)(时期方程框架下的近似
37、不相关)情形下的GLS估计。估计过程为:第一阶段,先利用普通最小二乘法估计模型,获得的估计;第二阶段,再进行相应的GLS估计。该方差结构在软件操作时,pool estimation的设定中在weighs处选择Period SUR。但要注意的是,使用广义最小二乘法估计的面板数据,其截面成员的个数必须等于或者超过时期数,才可用此方法。比如本章使用的公司水平面板数据案例中,截面成员只有10个,而时期数有20年,当用此方法进行估计时,便出现警告无效数据的对话框。16.3.2二阶段最小二乘法估计在固定影响变截距模型中,当各个个体成员方程的误差项之间既不存在异方差又不存在同期相关,但是随机误差项与解释变量
38、相关时,无论用OLS还是GLS估计都是有偏非一致估计,此时需要采用二阶段最小二乘方法(two stage least square,TSLS)对模型进行估计。如果矩阵中的q(k)个变量同解释变量相关,但同随机误差项不相关,则可用作为工具变量对模型进行二阶段最小二乘法估计,参数相应的估计结果为 (16.3.18) (16.3.19)其中:,二阶段最小二乘法其实是属于工具变量法,因此二阶段最小二乘法也称为工具变量法。该估计方法在Eviews软件中,操作如下。首先在Specification设定如下:图16.3.4在Instrument list页面填入与估计参数一样多的工具变量,比如此例子中有三个
39、参数需要估计,需要加入三个工具变量。一般常数是默认的一个工具变量,然后就是利用变量的滞后项作为工具变量:图16.3.5然后点击“确定”,得到估计结果如下:图16.3.6估计结果的上半部分显示估计的方法为TSLS或者工具变量法,由于用了滞后一期的自变量作为工具变量,样本数减少了10,并且清楚的显示了设定的三个工具变量。但在下面的估计结果中Instrument rank也显示了工具变量的个数为12,这是因为在该方程估计中,将个体固定效应也作为了工具变量,就是设定的三个工具变量加上9个个体的虚拟变量。图16.3.716.4随机效应变截距模型16.4.1随机效应模型原理当个体成员单位是随机抽自一个大的
40、总体时,固定影响模型便仅仅适用于所抽到个体成员,而不适用于样本之外的其他单位。在这种情形下,如果仅仅对样本自身进行分析,选用固定影响是合适的,但想以样本结果对总体进行分析,则应该选用随机效应模型,即把反映个体差异的特定常数项看作是跨个体成员的随机分布。即未观测效应是随机变量时,即任何一个解释变量任何时期都与未观测到的变量不相关,这也是固定效应与随机效应本质的区别,那么使用固定效应消去的变换会导致非有效估计量。随机影响变截距模型把变截距模型中用来反映个体差异的截距项分为常数项和随机变量两部分,并用其中的随机变量项来表示模型中被忽略的、反映个体差异的变量的影响。模型形式如下: (16.4.1)其中
41、:为截距中的常数项部分,为截距中的随机变量部分,代表个体的随机影响。该模型有如下的假定:与不相关;,为了分析方便,令,则模型可写为 (16.4.2)如果令,则有,与不相关;,;可见,随机影响变截距模型的误差项为两种随机误差之和,方差为各随机误差的方差之和,因此各随机误差的方差有时也被称为成分方差,相应地称该模型为方差成分模型(error component model)。在该模型中,随机误差项与解释变量不相关,但同一个体成员、不同时期的随机误差项之间存在一定的相关性。普通最小二乘法估计虽然是无偏和一致的,但其不再是最有效的估计。因此一般用广义最小二乘法(GLS)对随机影响模型进行估计。1)平衡数据对于广义最小二乘法,主要是求转换矩阵。在NT个观测值的扰动项方差矩阵为:,所以有(1)成分方差和已知的情形由于有 (16.4.3)其中:。因此有 (16.4.4)当成分方差和已知时,可以求出模型(16.4.2)的参数的GLS估计量: (16.4.5)其中:,对应的协方差阵为 (16.4.6)可见,当成分方差和已知时,可以很容易计算参数的GLS估计量。(2)当成分方差和未知时在实际分析中,成分方差几乎是未知的。因此,