《第11章 面板数据模型.pdf》由会员分享,可在线阅读,更多相关《第11章 面板数据模型.pdf(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中级计量经济学 436第 11 章 面板数据模型 11.1 面板数据模型概述 11.1.1 面板数据的含义 面板数据(panel data)也称平行数据,或时间序列截面数据(time series and cross section data)或混合数据(pool data),是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如 yi t,i=1,2,N;t=1,2,T 表示在横截面 i 时间 t 上取值。N 表示面板数据中含有 N 个个体。T 表示时
2、间序列的最大长度。若固定 t 不变,yi.(i=1,2,N)是横截面上的 N 个个体截面数据序列;若固定 i 不变,y.t(t=1,2,T)是纵剖面上的一个时间序列(个体),如图 11.1.1 所示。图 11.1.1 面板数据示意图 例如 1990-2000 年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由 11 年农业总产值数据组成的一个时间序列。面板数据由 30 个个体组成。共有 330 个观测值。对于面板数据 yi t,i=1,2,N;t=1,2,T 来说,如果从横截面上看,每个变量都有观第 11 章 面板数据模型
3、 437测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。例 11.1.1例 11.1.1 1996-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表 11.1.1 和表 11.1.2。数据是 7 年的,每一年都有 15 个数据,共105 组观测值。表 11.1.1 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费数据(不变价格)地区人均消费 19
4、96 1997 1998 1999 2000 2001 2002 CP-AH(安徽)3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364 CP-BJ(北京)5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12 CP-FJ(福建)4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005 CP-HB(河北)3197.339 3868.319 3896.778 4104.281 4361.5
5、55 4457.463 5120.485 CP-HLJ(黑龙江)2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535 CP-JL(吉林)2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874 CP-JS(江苏)3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331 CP-JX(江西)2714.124 3136.873 3234.465 3531.775 3612.722 3914.08
6、0 4544.775 CP-LN(辽宁)3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063 CP-NMG(内蒙古)2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180 CP-SD(山东)3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770 CP-SH(上海)6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94
7、 CP-SX(山西)2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561 CP-TJ(天津)4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843 CP-ZJ(浙江)5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210 资料来源:中国统计年鉴1997-2003。表 11.1.2 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均收入数据(不变价格)地区人均收入
8、 1996 1997 1998 1999 2000 2001 2002 IP-AH(安徽)4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333 IP-BJ(北京)6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38 IP-FJ(福建)4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538 中级计量经济学 438IP-HB(河北)4148.282 4790.986 5167.317 5
9、468.940 5678.195 5955.045 6747.152 IP-HLJ(黑龙江)3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565 IP-JL(吉林)3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618 IP-JS(江苏)4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589 IP-JX(江西)3487.269 3991.490 4209.327 4787.606 50
10、88.315 5533.688 6329.311 IP-LN(辽宁)3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088 IP-NMG(内蒙古)3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922 IP-SD(山东)4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036 IP-SH(上海)7489.451 8209.037 8773.100 10770.09 11432.20 128
11、83.46 13183.88 IP-SX(山西)3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732 IP-TJ(天津)5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060 IP-ZJ(浙江)6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00 资料来源:中国统计年鉴1997-2003。人均消费和收入的面板数据从纵剖面观察分别见图 11.1.2 和图 11.1.3。从横截面观察分别
12、见图 11.1.4 和图 11.1.5。用 CP 表示消费,IP 表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。2000300040005000600070008000900010000110001996199719981999200020012002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ 20004000600080
13、001000012000140001996199719981999200020012002IPAHIPBJIPFJIPHBIPHLJIPJLIPJSIPJXIPLNIPNMGIPSDIPSHIPSXIPTJIPZJ 图 11.1.2 15 个省市人均消费序列(纵剖面)图 11.1.3 15 个省市人均收入序列 第 11 章 面板数据模型 43920004000600080001000012000140002468101214CP1996CP1997CP1998CP1999CP2000CP2001CP200220004000600080001000012000140002468101214IP1
14、996IP1997IP1998IP1999IP2000IP2001IP2002 图 11.1.4 15 个省市人均消费散点图 图 11.1.5 15 个省市人均收入散点图(7 个横截面叠加)(每条连线表示同一年度 15 个地区的消费值)(每条连线表示同一年度 15 个地区的收入值)15 个地区 7 年人均消费对收入的面板数据散点图见图 11.1.6 和图 11.1.7。图 11.1.6 中每一种符号代表一个省级地区的 7 个观测点组成的时间序列。相当于观察 15 个时间序列。图11.1.7 中每一种符号代表一个年度的截面散点图(共 7 个截面)。相当于观察 7 个截面散点图的叠加。200030
15、0040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ 图 11.1.6 用 15 个时间序列表示的人均消费对收入的面板数据 中级计量经济学 440200040006000800010000120002000400060008000100001200014000IP(1996-2002)CP1996CP1997CP1998CP1999CP2000CP2001CP2002 图 11.1.7 用
16、 7 个截面表示的人均消费对收入的面板数据(7 个截面叠加)图 11.1.8 给出北京和内蒙古 1996-2002 年消费对收入散点图。图 11.1.9 给出 15 个省级地2 年的消费对收入散点图。区 1996 和 200 图 11.1.8 北京和内蒙古 1996-2002 年消费对收入时序图 图 11.1.9 1996 和 2002 年地区消费对收入散点图11.1.2 面板数据模型的基本类型 我们把建立在面板数据基础上的计量经济模型称为面板数据模型。设 yit为被解释变量在横截面jitit面 i 和时间 t 上的随机误差项;bji为第 i 截面上的第 j 个解释变量的模型参数;ai为常数项
17、2,N;时间长度为 t=1,2,T。其中,N 表示个体截面成员的个数,T 表示每个截面成员的观测时期总数,k 表示解释变量的个数。则单方程面板数据模型的(分量)一般形式可 i 和时间 t 上的数值,x为第 j 个解释变量在横截面 i 和时间 t 上的数值,u 为横截或截距项,代表第 i 横截面(第 i 个体的影响);解释变量数为 j=l,2,k;截面数为 i=1,写成:(Ni,2,1L=;Tt,2,1L=itkitkiitiitiiituxbxbxbay+=L2211)(11.1.1)若记:为itx=),(21kitititxxxLk1为解释变量,为系数向量,为随机误差项,满足相互独立、零均值
18、、同方差为的假设。式(11.1.1)为单方程面板ib=),(21kiiibbbL1kitu2u第 11 章 面板数据模型 441数据模型的一般形式。则上式也可写成:iitay=+iitbx+itu,NiL,1=,TtL,1=(11.1.2)进一步,若记第 i 截面样本数据为:iTiyyyM2,kiTkikiiTiiiTixxxxxxxxxLLLLLLL2122212121,并记:,则面板数据模型的一般形式也可写为:iy=i1i11ix=iTiixxxM21iu=iTiiuuuM21=NyyyyM21=NxxxxM21=NuuuUM21=kbbbbM21a=NaaaM21 ayUxb+=+(11
19、.1.3)对于平衡的面板数据,即在每一个截面单元上具有 当 N=1 且 T 很大时,就是所熟悉的时间序列数据;当 T=1 而 N 很大时,就只有截面数据。面板数据模型划分为 3 种类型:ai=aj=a,b,bi i=b=bj j=b=b 相同个数的观测值,模型样本观测数据的总数等于 NT。(1)无个体影响的不变系数模型:无个体影响的不变系数模型:ayit=+bxit+itu,NiL,1=,TtL,1=(11.1.4)这种情形意味着模型在横截面上无个体影响、无结构变化,可面数据假设条件,就可以采用 OLS 法进行估计(共有 k+1 个参数需要估计),该模型也被称为联合回 (2)变截距模型:变截距
20、模型:a a,b=b=b,b=b=b,将模型简单地视为是横截堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本归模型(pooled regression model)。ijijijiitay=+bxit+uitNiL,1=,TtL,1=(11.1.5)这种情形意味着模型在横截面上存在个体影响,不存在结构性构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项 a (i1,2,N)的差别来说明,故通常把它称为变截距模型。(3)变系数模型:变系数模型:aiaj,b,bi ib bj j 的变化,即解释变量的结i中级计量经济学 442iitay=+bx+u,iL
21、,1iititNTtL,1=,(11.1.6)在个体影响,又存在结构变化,即在允许个体影响由变化的截距项 ai(i1,2,N)来说明的同时还允许系数向量体成1利用面板数据模型可以解决样本容量不足的问题 关系 11.2 模型形式设定检验 建立面板数据模型首先要检验被解释变量 yit的参数 ai和 b bi i是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述 3 种情况的哪一种面板数据模型形式,从而避免模型这种情形意味着模型在横截面上存b bi i(i1,2,N)依个员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。11.1.3 面板数据模型的优点 2有助于正
22、确地分析经济变量之间的3可以估计某些难以度量的因素对被解释变量的影响设定的偏差,改进参数估计的有效性。主要检验如下两个假设:H:bbb1N=L (11.2.1)21:;Nbbb=L212HNaaa=L21 (11.2.2)如果接受假设 H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设 H1。如果接受1,则认为样本数变截距、不变系则认11.1.6)的残差平方和 S11.1.6)的残差平方和 S1 1。H据符合数模型;反之,为样本数据符合变系数模型。下面介绍假设检验的 F 统计量的计算方法。首先计算变截距、变系数模型(首先计算变截距、变系数模型(如果记 iy=T1
23、T=tity1,ix=T1T=titx1 (11.2.3)则模型(11.1.6)参数的最小二乘估计为 ixyixxiWWb,1,=iiyaiibx (11.2.4)称为群内估计。其中 第 11 章 面板数据模型 443=TtiitiitixxxxxxW1,)()(,=TtiitixyxxW1,)()(iityy =TtiitiyyyyW12,)(11.2.5)第 群残差平方和是,模型(11.1.6)的残差平方和记为,则 (11.2.6)其次计算变截距、不变系数模型(11.1.5)的残差平方和 S其次计算变截距、不变系数模型(11.1.5)的残差平方和 S2 2。,则模型(11.1.5)的最小二
24、乘估计为,iiRSS=ixyixxixyiyyWWWW,1,1S=NiiRSSS11如果记=NiixxxxWW1,=NiixyxyWW1,=NiiyyyyWW1,xyxxwWWb1=iiya wibx (11.2.7)模型(11.1.5)的残差平方和记为,则 (11.2.8)最后计算不变截距、不变系数模(11.1.4)的残差平最后计算不变截距、不变系数模(11.1.4)的残差平2S2S=xyxxxyyyWWWW1型方和 S型方和 S3 3。如果记=NiTtiitiitxxxxxxT11)()(,=NiTtiitiitxyyyxxT11)()(=NiTtiityyyyT112)(11.2.9)其
25、中=NiTtitxNTx111,=NiTtityNTy111 则模型(11.1.4)的最小二乘估计为,xyxxTTb1=ya bx (11.2.10)模型(11.1.4)的残差平方和记为,则 3S中级计量经济学 4443S=(11.2.11)xyxxxyyyTTTT1由此可以得到下列结论:(1);21/uS)1(2kTN(2)在下,和;2H23/uS)1(2+kNT213/)(uSS)1)(1(2+kN(3)与独立。213/)(uSS21/uS所以,在假设下检验统计量服从相应自由度下的分布,即 2H2FF)1(/)1)(1/()(1132+=kNNTSkNSSF)1(),1)(1(+kTNkN
26、F (11.2.12)若统计量的值小于给定显著性水平下的相应临界值,即2FFF2,则接受假设,认为样本数据符合模型(11.1.4)。反之,若,则继续检验假设。2HFF21H同样得到下列结论:(1)在下,和;1H22/uS)(2kNNT+212/)(uSS)1(2kN(2)与独立。212/)(uSS21/uS所以,在假设下检验统计量也服从相应自由度下的分布,即 1HFF)1(/)1/()(1121+=kNNTSkNSSF)1(,)1(kTNkNF (11.2.13)若统计量的值小于给定显著性水平下的相应临界值,即1FFF1,则接受假设1,认为样本数据符合模型(11.1.5)。反之,若,则认为样本
27、数据符合模型(11.1.6)。HFF1 11.3 变截距模型 该模型允许个体成员之间存在个体影响,并用截距项的差别来说明。模型的回归方程形式如下:iitay=+,bxitituNiL,1=,TtL,1=(11.3.1)其中:=为为解释变量,=itx),(21kitititxxxLk1b),(21kbbbL为1k系数向量,表示解释变量的个数,为个体影响,为随机误差项,假设其均值为零,方差为,并假kiaitu2u第 11 章 面板数据模型 445定与不相关。根据个体影响的不同形式,变截距模型又分为固定影响变截距模型和随机影响变截距模型两种。ituitx11.3.1 固定影响变截距模型 1最小二乘虚
28、拟变量模型(LSDV)及其参数估计 令和是第 个个体的iyixiT个观测值向量和矩阵,并令是随机干扰项iu1T向量,模型(11.3.1)对应的向量形式如下:eyi=ia+iiubx+(NiL,1=)(11.3.2)其中 iy=,e=,b=,=,=,iTiiyyyM211111TMkbbbM21ixkiTkikiiTiiiTiixxxxxxxxxLLLLLLL212221212111iTiixxxM21iuiTiiuuuM21式(11.3.2)也可以写成 UxbDay+=(11.3.3)其中 y=,NyyyM21D=,a=,=,=NNTNeeeddd=LLLLLLLL000000),(21Naa
29、aM21xNxxxM21UNuuuM21其中为第 i 个单位的虚拟变量,D D 为 NTN 阶虚拟变量矩阵。所以式(11.3.3)称为最小二乘虚拟变量模型(Least Squares Dummy Variable-LSDV)。利用普通最小二乘法可以得到参数和b的最优线性无偏估计(BLUE)为 idiaCVb=11)()(=Ttiitiitxxxx=Ttiitxx1)()(iityy =iiyaCVibx (11.3.4)其中:iy=T1=Ttity1,ix=T1=Ttitx1,=itx),(21kitititxxxL在模型(11.3.3)中,参数被写为可观测的虚拟变量的系数的形式。因此,式(1
30、1.3.4)ia中级计量经济学 446所表示的 OLS 估计也称为最小二乘虚拟变量(LSDV)估计。模型(11.3.3)可以当作具有(N+k)个参数的多元线性回归模型,参数可由普通最小二乘法进行估计。当 N 很大时,可用下列分块回归的方法进行计算:令eeTIQT=1,因为eeeTeIT=1,所以0=Qe,则由式(11.3.2)有 QeQyi=ia+iiQubQx+=iiQubQx+(NiL,1=)iiiiiiQuxbQxxQyx+=于是 iNiiNiiiNiiiQuxbQxxQyx=+=111=CVb111iNiiNiiiQyxQxx=(11.3.5)截距的估计式为(11.3.5),参数的协方
31、差估计是无偏的,且当 N 或 T 趋于无穷大时,其为一致估计。对应的协方差矩阵为 b=)var(CVb112)(=NiiiuQxx (11.3.6)对应的协方差矩阵为+=Taui/)var(2iCVixbx)var(11.3.7)方差的估计量为 2ukNNTu=12211)(CVitiNiTtitbxay=(11.3.8)例 11.3.1 例 11.3.1 利用 1996-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费(不变价格)和人均收入数据(见表 11.1.1 和表 11.1.2),试研究这些地区的居民家庭消费行为。(1)建立合成数据库(pool)对象或混合数据库对象
32、;(2)定义序列名并输入数据;(3)估计无个体影响的不变系数模型;(4)估计变截距模型。(1)建立合成数据库(pool)对象(1)建立合成数据库(pool)对象 在打开工作文件窗口的基础上,点击主功能菜单中的 Objects 键,选 New Object 功能,从而打开 New Object(新对象)选择窗(见图 11.3.1)。第 11 章 面板数据模型 447 图 11.3.1 Pool 对象定义对话框 在 Type of Object 选择区选择 Pool(混合数据库),在 Name of Object 选择区命名 CS(初始显示为 Untitled),点击 OK,从而打开 Pool 对
33、象说明窗口。在窗口中输入 15 个地区标识AH(安徽)、BJ(北京)、ZJ(浙江)。如图 11.3.2 所示。图 11.3.2 Pool 对象说明窗口(2)定义序列名并输入数据(2)定义序列名并输入数据 在新建立的 Pool(混合数据)窗口的工具栏中点击 Sheet 键,从而打开 Series List(列写序列名)窗口,定义时间序列变量 CP?和 IP?,如图 11.3.3。点击 OK 键,从而打开 Pool(混合数据库)窗口,输入数据,输入完成后的情形见图 11.3.4。中级计量经济学 448 图 11.3.3 序列列表对话框 图 11.3.4 序列的堆栈形式数据表(3)估计无个体影响的不
34、变系数模型(3)估计无个体影响的不变系数模型 模型形式为 ititituIPbaCP+=(15,1L=i,2002,1996L=t)其中:a 为 15 个省市的平均自发消费倾向,b 为边际消费倾向。在 Pool 窗口的工具栏中点击 Estimate 键,打开 Pooled Estimation(混合估计)窗口如图11.3.5。第 11 章 面板数据模型 449 图 11.3.5 合成数据模型定义对话框 在对话框左上部的 Dependent Variable 选择窗填入被解释变量 CP?;在中部的 Common coefficients(系数相同)选择窗填入解释变量 IP?;Cross sect
35、ion specific coefficients(截面系数不同)选择窗保持空白;Intercept 选项代表截距的处理方式。None 代表模型不包含截距,Common 指所有截面单元具有相同截距,Fixed effects 与 Random effectsw 分别表示截距变动的固定效应和随机效应。本例选择窗点击 Common。对话框 Weighting(权数)选项是模型的估计方法。本例选择不加权,点击 No weighting。完成合成数据模型定义对话框后,点击 OK键,得输出结果如表 11.3.1。表 11.3.1 无个体影响的不变系数模型估计结果 中级计量经济学 450 相应表达式是 i
36、tCP=129.6303+0.758726 IPit t=(2.035253)(79.68183)983881.02=R,193.6349=F,48245973=S 表 11.3.1 结果表明,回归系数显著不为 0,调整后的样本决定系数达 0.98,说明模型的拟合优度较高。从结果看,平均消费倾向为 0.76,表明 15 个省级地区的人均消费支出平均占收入的 76%。(4)变截距模型(4)变截距模型 模型形式为 ititiituIPbaCP+=(15,1L=i,2002,1996L=t)其中:ai为 15 个省市的自发消费倾向,用来反映省市间的消费结构差异,b 为边际消费倾向。EViews 估计
37、方法:在 EViews 的 Pooled Estimation 对话框中 Intercept 选项中选 Fixed effects。其余选项同上。得输出结果如表 11.3.2。表 11.3.2 变截距模型估计结果 第 11 章 面板数据模型 451 表 11.3.2 中给出了变截距模型估计结果,表中的系数 0.697561 为边际消费倾向,后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式是 安 徽:CP_AH=479.3076014+0.6975614547*IP_AH 北 京:CP_BJ=1053.179629+0.6975614547*IP_B
38、J 福 建:CP_FJ=467.9678362+0.6975614547*IP_FJ 河 北:CP_HB=361.3764747+0.6975614547*IP_HB 黑龙江:CP_HLJ=345.9120278+0.6975614547*IP_HLJ 吉 林:CP_JL=540.1174754+0.6975614547*IP_JL 江 苏:CP_JS=480.417445+0.6975614547*IP_JS 江 西:CP_JX=195.9175812+0.6975614547*IP_JX 辽 宁:CP_LN=622.0405359+0.6975614547*IP_LN 内蒙古:CP_NMG
39、=306.0650134+0.6975614547*IP_NMG 山 东:CP_SD=381.4986769+0.6975614547*IP_SD 上 海:CP_SH=782.5988793+0.6975614547*IP_SH 陕 西:CP_SX=440.7243659+0.6975614547*IP_SX 天 津:CP_TJ=562.8424811+0.6975614547*IP_TJ 浙 江:CP_ZJ=714.233227+0.6975614547*IP_ZJ 991222.02=R,22703942=S表 11.3.2 结果表明,回归系数显著不为 0,调整后的样本决定系数达 0.99
40、,说明模型的中级计量经济学 452拟合优度较高。从估计结果可以看出,对于本例中的 15 个省市来说,虽然它们的居民消费倾向相同,但是其居民的自发消费存在显著的差异,其中北京、上海、浙江是居民自发消费最高的 3 个地区,而居民自发消费最低的是江西,其次是内蒙古。对于随机效应模型或者变系数模型,用 EViews 建模过程大同小异,只是结果输出窗口中的参数估计格式有所区别。EViews 5.1 版本的面板数据模型估计(Pool Estimation)窗口分成了两个模块:Specification(设定)和 Option(选择),但基本功能与早期版本无本质区别,主要选择都集中在 Specificati
41、on(设定)模块中,见图 11.3.6。熟悉了图 11.3.5 中选择方法对图 11.3.6对话框不难理解。图 11.3.6 EViews5.1 合成数据模型定义对话框 在 Estimation Method(估计方法)选项区内有三个选项框:(1)Crosssection(横跨个体)中包括 None(不选)、Fixed(固定)、Random(随机),分别用来做非个体效应、个体固定效应和个体随机效应的设定(见图 11.3.6)。(2)Period(时点)中也包括 None(不选)、Fixed(固定)、Random(随机)三项选择,分别用来进行非时点效应、时点固定效应或时点随机效应设定。(3)We
42、ight(权数)可以在 5 种加权方法中做选择。在 Estimation Settings(估计方法设定)区包括两种估计方法:一种为 LS(最小二乘)方法;一种为 TSLS(两阶段最小二乘)方法。值得注意的是,在计算变截距模型中的个体影响时,不同的软件给出的个体影响形式不同。Eviews5.0 软件,给出的是不含总体均值的个体影响,即 EViews 给出的个体影响反映的第 11 章 面板数据模型 453是各个体成员对总体平均状态的偏离。EViews5.0 估计结果如表 11.3.3 所示。表 11.3.3 各地区自发消费对平均自发消费偏离的估计结果 从表 11.3.3 可知,515.6133
43、为 15 个省市的平均自发消费水平,表中的系数 0.697561为边际消费倾向,后面第 3 行至第 17 行数据为各地区自发消费对平均自发消费的偏离,用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表 11.3.3 回归结果与表 11.3.2 回归结果本质上是相同的。类似地,如果面板数据模型的解释变量对被解释变量的截距影响只是随着时间变化而不随个体变化(即对不同时点有不同的截距),则可以设定如下面板数据模型(时点变截距模型)itkitkiitiititituxbxbxbay+=L2211 (Ni,2,1L=;Tt,2,1L=)如果面板数据
44、模型的解释变量对被解释变量的截距影响随着个体和时点变化(即对不同中级计量经济学 454时点、不同个体有不同的截距),则可以设定如下面板数据模型(时点个体变截距模型)itkitkiitiitiitituxbxbxbay+=L2211 (Ni,2,1L=;Tt,2,1L=)注:读者可以利用表11.1和表11.2中数据,建立时点变截距模型(时点个体变截距模型)。在 Pool Estimation(EViews5.1)窗 口,在 Dependend variable 项 下 填 写 CP?,Specification/Estimation method 项下,在 Fixed and Random/Cr
45、oss-secti 选择 None(选择 Fixed),在 Fixed and Random/Period 选择 Fixed,在 Common 项下填写 IP?,可以建立时点变截距模型(时点个体变截距模型)。2非平衡数据的固定影响模型 在所获得的面板数据中,一些个体成员的数据较多而另一些个体成员的数据较少。这种情况下的面板数据被称为非平衡数据。如果设第i个截面成员观测数据个数为,则观测数据总数为,变量的总体平均为 iT=NiiT1=NiiiNiiNiTtitxTxxi1111,=NiiiNiiNiTtityTyyi1111 (11.3.9)其中:。模型参数b对应的估计量为=NiiiiTT1/=
46、CVb111iNiiNiiiQyxQxx=,=iiyaCVibx (11.3.10)其中:eeTIQiTi=1,估计出参数b后,根据式(11.3.5)可以求出最小二乘虚拟变量形式下的固定影响变截距模型的截距项。3固定影响变截距模型的广义最小二乘估计 在固定影响变截距模型中,如果随机误差项不满足等方差或相互独立的假设,则需要使用广义最小二乘法(GLS)对模型进行估计。下面只介绍个体成员截面异方差和同期相关协方差两种情形。(1)个体成员截面异方差情形的 GLS 估计 (1)个体成员截面异方差情形的 GLS 估计 个体成员截面异方差是指各个体成员方程的随机误差项之间存在异方差,但个体成员之间和时期之
47、间的协方差为零,对应的假设为:第 11 章 面板数据模型 4552)(iitituuE=0)(=jtisuuE (tsji,)(11.3.11)该情形用广义最小二乘法进行估计非常简单,即先对方程进行普通的最小二乘估计,然后计算各个体成员的残差向量,并用其来估计个体成员的样本方差:2is =TtititiyyTs122)(1 (NiL,2,1=)(11.3.12)其中:是 OLS 的拟合值。个体成员方程截面异方差的协方差矩阵的估计为 ity=22221000000NNsssLLLLLLL (11.3.13)然后,用得到的样本方差估计作为各个体成员的权重,即加权矩阵为NTI,利用加权最小二乘方法得
48、到相应的 GLS 估计。注:A=,mnija)(B=,定义qpijb)(A与B的克罗内克积(交叉积)为 BA=BaBaBaBaBaBaBaBaBanmmmnnLLLLLLL212221212111 显然,是BAmqnp阶矩阵,是分块矩阵,其第块是),(jiijaB。(2)同期相关协方差情形的近似不相关估计(SUR)估计 (2)同期相关协方差情形的近似不相关估计(SUR)估计 同期相关协方差是指不同的个体成员 i 和 j 的同时期的随机误差项是相关的,但其在不同时期之间是不相关的,相应的假设为 ijjtituuE=)(0)(=jtisuuE (ts)(11.3.14)需要指出的是同期相关协方差是
49、允许同一时期即 t 不变时,不同个体成员之间存在协方差。如果把假设式(11.3.14)中的第一个表达式写成向量和矩阵的形式:中级计量经济学 456=)(ttuuE=NNNNNNNLLLLLLL212221212111 此时这种个体成员之间存在协方差的方差结构有些类似于个体成员方程框架下的近似不相关回归(seemingly unrelated regression,SUR),因此将这种结构称为个体成员截面SUR(cross-section SUR)。N已知的情况 如果N已知的,则参数b的 SUR 估计为:)()()()()()(111yyIxxxxIxxbTTSUR=(11.3.15)y=,=,
50、NyyyM21xNxxxM21y=NyyyM21,x=NxxxM21 其中:是 T1 维因变量向量,是 Tk 维解释变量向量矩阵,iyix=TiiTixTx11,=TiiTiyTy11。N未知的情况 在一般的情况下,N是未知的,这时,就需要利用普通最小二乘法先估计未加权系统的参数,计算残差估计值,以此构造协方差矩阵估计量,得到N的一致估计矩阵,N中的元素的估计值为 NTsij1=iiay()CVibxiiay()CVibx(NjiL,2,1,=)其中:和可由式(11.3.4)和式(11.3.5)得到。计算CVbiaN后,再进行广义最小二乘估计(GLS),此时b的 SUR 估计为:)()()()