《面板数据模型经典课件.pptx》由会员分享,可在线阅读,更多相关《面板数据模型经典课件.pptx(158页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、图11.1.1面板数据示意图 例例如如1990-2000年年30个个省省份份的的农农业业总总产产值值数数据据。固固定定在在某某一一年年份份上上,它它是是由由30个个农农业业总总产产值值数数字字组组成成的的截截面面数数据据;固固定定在在某某一一省省份份上上,它它是是由由11年年农农业业总总产产值值数数据据组组成成的的一一个个时时间间序序列列。面面板板数数据据由由30个个个个体体组组成成。共共有有330个观测值。个观测值。对对于于面面板板数数据据yi t,i=1,2,N;t=1,2,T来来说说,如如果果从从横横截截面面上上看看,每每个个变变量量都都有有观观测测值值,从从纵纵剖剖面面上上看看,每每一
2、一期期都都有有观观测测值值,则则称称此此面面板板数数据据为为平平衡衡面面板板数数据据(balanced panel data)。若若在在面面板板数数据据中中丢丢失失若若干干个个观观测值,则称此面板数据为非平衡面板数据(测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。)。例例11.1.1 1996-2002年年中中国国东东北北、华华北北、华华东东15个个省省级级地地区区的的居居民民家家庭庭人人均均消消费费和和人人均均收收入入(不不变变价价格格)数数据据见见表表11.1.1和和表表11.1.2。数数据据是是7年年的的,每每一年都有一年都有15个数据,共个数据,共
3、105组观测值。组观测值。表表11.1.1 11.1.1 1996-20021996-2002年年中中国国东东北北、华华北北、华华东东1515个个省省级级地地区区的的居居民民家家庭庭人人均消费数据(不变价格)均消费数据(不变价格)表11.1.21996-2002年中国15个省级地区的居民家庭人均收入数据(不变价格)人均消费和收入的面板数据从纵剖面观察分别见图11.1.2和图11.1.3。从横截面观察分别见图11.1.4和图11.1.5。用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省
4、、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。图11.1.215个省市人均消费序列(纵剖面)图11.1.315个省市人均收入序列图11.1.415个省市人均消费散点图(每条连线表示同一年度15个地区的消费值)图11.1.515个省市人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的收入值)15个个地地区区7年年人人均均消消费费对对收收入入的的面面板板数数据据散散点点图图见见图图11.1.6和和图图11.1.7。图图11.1.6中中每每一一种种符符号号代代表表一一个个省省级级地地区区的的7个个观观测测点点组组成成的的时时间间序序
5、列列。相相当当于于观观察察15个个时时间间序序列列。图图11.1.7中中每每一一种种符符号号代代表表一一个个年年度的截面散点图(共度的截面散点图(共7个截面)。相当于观察个截面)。相当于观察7个截面散点图的叠加。个截面散点图的叠加。图11.1.6用15个时间序列表示的人均消费对收入的面板数据图11.1.7用7个截面表示的人均消费对收入 的面板数据(7个截面叠加)图图11.1.811.1.8给给出出北北京京和和内内蒙蒙古古1996-20021996-2002年年消消费费对对收收入入散散点点图图。图图11.1.911.1.9给出给出1515个省级地区个省级地区19961996和和20022002年
6、的消费对收入散点图。年的消费对收入散点图。图11.1.8北京和内蒙古1996-2002年消费对收入时序图图11.1.91996和2002年地区消费对收入散点图11.1.2面板数据模型的基本类型设yit为被解释变量在横截面i和时间t上的数值,xjit为第j个解释变量在横截面i和时间t上的数值,uit为横截面i和时间t上的随机误差项;bji为第i截面上的第j个解释变量的模型参数;ai为常数项或截距项,代表第i横截面(第i个体的影响);解释变量数为j=l,2,k;截面数为i=1,2,N;时间长度为t=1,2,T。其中,N表示个体截面成员的个数,T表示每个截面成员的观测时期总数,k表示解释变量的个数。
7、则单方程面板数据模型一般形式可写成:对于平衡的面板数据,即在每一个截面单元上具有相同个数的观测值,模型样本观测数据的总数等于NT。当N=1且T很大时,就是所熟悉的时间序列数据;当T=1而N很大时,就只有截面数据。面板数据模型划分为3种类型:(1)无个体影响的不变系数模型:无个体影响的不变系数模型:ai=aj=a,bi=bj=b这种情形意味着模型在横截面上无个体影响、无结构变化,可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本假设条件,就可以采用OLS法进行估计(共有k+1个参数需要估计),该模型也被称为联合回归模型(pooledregre
8、ssionmodel)。(2)变截距模型:变截距模型:aiaj,bi=bj=b这种情形意味着模型在横截面上存在个体影响,不存在结构性的变化,即解释变量的结构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项ai(i1,2,N)的差别来说明,故通常把它称为变截距模型。(3)(3)变系数模型:变系数模型:aiaj,bibj这种情形意味着模型在横截面上存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项ai(i1,2,N)来说明的同时还允许系数向量bi(i1,2,N)依个体成员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。11.1.3 面板数据模型的
9、优点 1利用面板数据模型可以解决样本容量不足的问题 2有助于正确地分析经济变量之间的关系 3可以估计某些难以度量的因素对被解释变量的影响11.2 模型形式设定检验建立面板数据模型首先要检验被解释变量yit的参数ai和bi是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述3种情况的哪一种面板数据模型形式,从而避免模型设定的偏差,改进参数估计的有效性。主要检验如下两个假设:如果接受假设H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设H1。如果接受H1,则认为样本数据符合变截距、不变系数模型;反之,则认为样本数据符合变系数模型。下面介绍假设检验的F统计量
10、的计算方法。首先计算变截距、变系数模型首先计算变截距、变系数模型(11.1.6)(11.1.6)的残差平方和的残差平方和S1S1。如果记11.3 变截距模型 该模型允许个体成员上存在个体影响,并用截距项的差别来说明。模型的回归方程形式如下:11.3.1固定影响变截距模型1最小二乘虚拟变量模型(LSDV)及其参数估计其中 例例11.3.111.3.1 利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2),试研究这些地区的居民家庭消费行为。(1)建立合成数据库(pool)对象或混合数据库对象;(2)定义序列名并输入数据;(3)估计无
11、个体影响的不变系数模型;(4)估计变截距模型。(1 1)建立合成数据库()建立合成数据库(poolpool)对象)对象 在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗(见图11.3.1)。图11.3.1Pool对象定义对话框在Type of Object选择区选择Pool(混合数据库),在 Name of Object选 择 区 命 名 CS(初 始 显 示 为Untitled),点击OK,从而打开Pool对象说明窗口。在窗口中输入15个地区标识AH(安徽)、BJ(北京)、ZJ(浙江)。如图11.3.2所示。
12、图11.3.2 Pool对象说明窗口(2)定义序列名并输入数据)定义序列名并输入数据在新建立的Pool(混合数据)窗口的工具栏中点击Sheet键,从而打开SeriesList(列出序列名)窗口,定义时间序列变量CP?和IP?,如图11.3.3。点击OK键,从而打开Pool(混合数据库)窗口,输入数据,输入完成后的情形见图11.3.4。图11.3.3 序列列表对话框 图11.3.4序列的堆栈形式数据表 (3 3)估计无个体影响的不变系数模型)估计无个体影响的不变系数模型模型形式为 其中:a为15个省市的平均自发消费倾向,b为边际消费倾向。在 Pool窗 口 的 工 具 栏 中 点 击 Estim
13、ate键,打 开 PooledEstimation(混合估计)窗口如图11.3.5。图11.3.5合成数据模型定义对话框 在对话框左上部的DependentVariable选择窗填入被解释变量CP?;在中部的Commoncoefficients(系数相同)选择窗填入解释变量IP?;Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;Intercept选项代表截距的处理方式。None代表模型不包含截距,Common指所有截面单元具有相同截距,Fixedeffects与Randomeffects分别表示截距变动的固定效应和随机效应。本例选择窗点击Comm
14、on。对话框Weighting(权数)选项是模型的估计方法。本例选择不加权,点击Noweighting。完成合成数据模型定义对话框后,点击OK键,得输出结果如表11.3.1。表11.3.1无个体影响的不变系数模型估计结果 表11.3.1结果表明,回归系数显著不为0,调整后的样本决定系数达0.98,说明模型的拟合优度较高。从结果看,平均消费倾向为0.76,表明15个省级地区的人均消费支出平均占收入的76%。(4)变截距模型)变截距模型 模型形式为其中:ai为15个省市的自发消费倾向,用来反映省市间的消费结构差异,b为边际消费倾向。EViews估计方法:在EViews的Pooled Estimat
15、ion对话框中Intercept选项中选Fixedeffects。其余选项同上。得输出结果如表11.3.2。表11.3.2变截距模型估计结果 表11.3.2中给出了变截距模型估计结果,表中的系数0.697561为边际消费倾向,后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式是安徽:CP_AH=479.3076014+0.6975614547*IP_AH北京:CP_BJ=1053.179629+0.6975614547*IP_BJ福建:CP_FJ=467.9678362+0.6975614547*IP_FJ河北:CP_HB=361.3764747+0
16、.6975614547*IP_HB黑龙江:CP_HLJ=345.9120278+0.6975614547*IP_HLJ吉林:CP_JL=540.1174754+0.6975614547*IP_JL江苏:CP_JS=480.417445+0.6975614547*IP_JS江西:CP_JX=195.9175812+0.6975614547*IP_JX辽宁:CP_LN=622.0405359+0.6975614547*IP_LN内蒙古:CP_NMG=306.0650134+0.6975614547*IP_NMG山东:CP_SD=381.4986769+0.6975614547*IP_SD上海:CP
17、_SH=782.5988793+0.6975614547*IP_SH陕西:CP_SX=440.7243659+0.6975614547*IP_SX天津:CP_TJ=562.8424811+0.6975614547*IP_TJ浙江:CP_ZJ=714.233227+0.6975614547*IP_ZJ表11.3.2结果表明,回归系数显著不为0,调整后的样本决定系数达0.99,说明模型的拟合优度较高。从估计结果可以看出,对于本例中的15个省市来说,虽然居民边际消费倾向相同,但是其居民的自发消费存在显著的差异,其中北京、上海、浙江是居民自发消费最高的3个地区,而居民自发消费最低的是江西,其次是内蒙古
18、。对对于于随随机机效效应应模模型型或或者者变变系系数数模模型型,用用EViews建建模模过过程程大大同同小小异异,只只是是结结果果输输出出窗窗口口中中的的参参数数估估计计格格式式有有所区别。所区别。EViews EViews 5.15.1版版 本本 的的 面面 板板 数数 据据 模模 型型 估估 计计(Pool(Pool Estimation)Estimation)窗窗口口分分成成了了两两个个模模块块:Specification(Specification(设设定定)和和Option(Option(选选择择),但但基基本本功功能能与与早早期期版版本本无无本本质质区区别别,主主要要选选择择都都集
19、集中中在在Specification(Specification(设设定定)模模块块中中,见见图图11.3.611.3.6。熟熟悉悉了了图图11.3.511.3.5中中选选择择方方法法对对图图11.3.611.3.6对对话话框框不难理解。不难理解。图11.3.6 EViews5.1合成数据模型定义对话框 在Estimation Method(估计方法)选项区内有三个选项框:(1)Crosssection(横跨个体)中包括None(不选)、Fixed(固定)、Random(随机),分别用来做非个体效应、个体固定效应和个体随机效应的设定(见图11.3.6)。(2)Period(时点)中也包括Non
20、e(不选)、Fixed(固定)、Random(随机)三项选择,分别用来进行非时点效应、时点固定效应或时点随机效应设定。(3)Weight(权数)可以在5种加权方法中做选择。在Estimation Settings(估计方法设定)区包括两种估计方法:一种为LS(最小二乘)方法;一种为TSLS(两阶段最小二乘)方法。EViews5.1估计结果如表11.3.3所示。表11.3.3 各地区自发消费对平均自发消费偏离的估计结果 从从表表11.3.311.3.3可可知知,515.6133515.6133为为1515个个省省市市的的平平均均自自发发消消费费水水平平,表表中中的的系系数数0.6975610.6
21、97561为为边边际际消消费费倾倾向向,后后面面第第3 3行行至至第第1717行行数数据据为为各各地地区区自自发发消消费费对对平平均均自自发发消消费费的的偏偏离离,用用来来反反映映省省市市间间的的消消费费结结构构差差异异。平平均均自自发发消消费费水水平平与与各各地地区区自自发发消消费费对对平平均均自自发发消消费费的的偏偏离离之之和和为为各各地地区区自自发发消消费费。表表11.3.311.3.3回归结果与表回归结果与表11.3.211.3.2回归结果本质上是相同的。回归结果本质上是相同的。2 2非平衡数据的固定影响模型非平衡数据的固定影响模型 在在所所获获得得的的面面板板数数据据中中,一一些些个
22、个体体成成员员的的数数据据较较多多而而另另一一些些个个体体成成员员的的数据较少。这种情况下的面板数据被称为非平衡数据。数据较少。这种情况下的面板数据被称为非平衡数据。3 3固定影响变截距模型的广义最小二乘估计固定影响变截距模型的广义最小二乘估计 在在固固定定影影响响变变截截距距模模型型中中,如如果果随随机机误误差差项项不不满满足足等等方方差差或或相相互互独独立立的的假设,则需要使用广义最小二乘法假设,则需要使用广义最小二乘法(GLS)(GLS)对模型进行估计。对模型进行估计。下面只介绍个体成员截面异方差和同期相关协方差两种情形。下面只介绍个体成员截面异方差和同期相关协方差两种情形。(1)(1)
23、个体成员截面异方差情形的个体成员截面异方差情形的GLSGLS估计估计 个个体体成成员员截截面面异异方方差差是是指指各各个个体体成成员员方方程程的的随随机机误误差差项项之之间间存存在在异异方方差差,但个体成员之间和时期之间的协方差为零,对应的假设为:但个体成员之间和时期之间的协方差为零,对应的假设为:(2)(2)同期相关协方差情形的同期相关协方差情形的SURSUR估计估计 同同期期相相关关协协方方差差是是指指不不同同的的个个体体成成员员i i和和j j的的同同时时期期的的随随机机误误差差项项是是相相关关的,但其在不同时期之间是不相关的,相应的假设为的,但其在不同时期之间是不相关的,相应的假设为
24、需需要要指指出出的的是是同同期期相相关关协协方方差差是是允允许许同同一一时时期期即即t t不不变变时时,不不同同个个体体成成员员之之间间存存在在协协方方差差。如如果果把把假假设设式式(11.3.14)(11.3.14)中中的的第第一一个个表表达达式式写写成成向向量量和和矩矩阵阵的形式:的形式:此此时时这这种种个个体体成成员员之之间间存存在在协协方方差差的的方方差差结结构构有有些些类类似似于于个个体体成成员员方方程程框框架架下下的的近近似似不不相相关关回回归归(seemingly(seemingly unrelated unrelated regressionregression,SUR)SUR
25、),因因此此将将这这种种结结构称为个体成员截面构称为个体成员截面SUR(cross-section SUR)SUR(cross-section SUR)。4 4固定影响变截距模型的二阶段最小二乘估计固定影响变截距模型的二阶段最小二乘估计11.3.2 11.3.2 随机影响变截距模型随机影响变截距模型 1 1随机影响变截距模型的形式随机影响变截距模型的形式 与与固固定定影影响响模模型型不不同同,随随机机影影响响变变截截距距模模型型把把变变截截距距模模型型中中用用来来反反映映个个体体差差异异的的截截距距项项分分为为常常数数项项和和随随机机变变量量项项两两部部分分,并并用用其其中中的的随随机机变变量
26、量项项来来表示模型中被忽略的、反映个体差异的变量的影响。模型的基本形式为:表示模型中被忽略的、反映个体差异的变量的影响。模型的基本形式为:为了分析方便,可以将模型为了分析方便,可以将模型(11.3.19)(11.3.19)写成如下形式:写成如下形式:可可见见,随随机机影影响响变变截截距距模模型型的的误误差差项项为为两两种种随随机机误误差差之之和和,方方差差为为各随机误差的方差之和。各随机误差的方差之和。2随机影响变截距模型的估计在式在式(11.3.21)中可以看出中可以看出NT个观测值的扰动协方差矩阵为个观测值的扰动协方差矩阵为 在在实实际际分分析析中中,成成分分方方差差几几乎乎都都是是未未知
27、知的的。因因此此,需需要要采采用用可可行行广广义义最最小小二二乘乘估估计计法法(feasible(feasible generalized generalized least least squaredsquared,FGLS)FGLS)对对模模型型进进行行估估计计,即即先利用数据求出未知成分方差的无偏估计,然后再进行广义最小二乘估计。先利用数据求出未知成分方差的无偏估计,然后再进行广义最小二乘估计。例例11.3.211.3.2 利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2),试建立随机影响变截距模型,研究这些地区的居民家
28、庭消费行为。模型形式为 EViews估计方法:在EViews的PooledEstimation对话框中Intercept选项中选Randomeffects(随机效应截距项,见图11.3.6),其余选项同上。图11.3.6合成数据模型定义对话框 随机影响变截距模型输出结果如表11.3.4。表11.3.4随机影响变截距模型估计结果表表11.3.5 各地区随机影响的变截距模型估计结果各地区随机影响的变截距模型估计结果地区随机影响估计值地区随机影响估计值安徽-2.55辽宁112.12北京367.04内蒙古-133.14福建-54.24山东-100.87河北-104.84上海126.18黑龙江-101.
29、77陕西-22.79吉林54.91天津10.09江苏-32.28浙江106.09江西-223.95 从从表表11.3.511.3.5给给出出的的估估计计结结果果可可以以看看出出,在在1515个个省省市市中中,自自发发消消费费最最高高的的为为北北京京,其其次次为为上上海海,最最低低的的是是江江西西,其其次次是是内内蒙蒙古古,该该结结果果与与例例11.3.311.3.3中中所得到的结果基本一致。所得到的结果基本一致。11.3.3随机效应模型的检验 在实际应用中,究竟是采用固定效应模型还是采用随机效应模型,这需在实际应用中,究竟是采用固定效应模型还是采用随机效应模型,这需要进行模型设定检验。要进行模
30、型设定检验。1.LM1.LM检验。检验。BreushBreush和和PaganPagan于于19801980年提出年提出R R 检验方法。其检验原假设和检验方法。其检验原假设和备择假设:备择假设:如果不否定原假设,就意味着没有随机效应,应当采用固定效应模型。如果不否定原假设,就意味着没有随机效应,应当采用固定效应模型。对于原假设,检验的统计量是:对于原假设,检验的统计量是:2.2.豪豪斯斯曼曼(HausmanHausman)检检验验。William H Greene于于1997年年提提出出了了一一种种检检验方法,称为豪斯曼(验方法,称为豪斯曼(Hausman)检验。检验的统计量是:)检验。检验
31、的统计量是:例例11.3.311.3.3 利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据(见表11.1和表11.2)。(1)利用豪斯曼检验选择面板模型,研究居民家庭消费行为。(2)面板单位根检验。(1 1)利用豪斯曼检验选择面板模型:)利用豪斯曼检验选择面板模型:由个体固定效应回归结果(表11.3.3)式知:EViews5.1可以直接进行Hausman检验。在表11.3.4输出结果窗口中点击 View键,选 Fixed Random Effects Testing Correlated RandomEffect-Hausman Test功
32、能,如图11.3.8,可以直接获得如表11.3.6的Hausman检验结果(主要结果)。图11.3.7Hausman检验表11.3.6Hausman检验结果表11.3.6中第1部分给出的是Hausman检验结果。Hausman统计量的值是14.7875,相对应的概率是0.0001,说明检验结果拒绝了随机效应模型原假设,应该建立个体固定效应模型。14.79与上面计算的21.22有差别,是由于两种计算的误差不同所致。表中第2部分给出的是Hausman检验中间结果比较。0.697561是个体固定效应模型对参数的估计,0.724569是随机效应模型对参数的估计。0.000049是相应两个参数估计量的分
33、布方差的差(Var(Diff)。综上分析,19962002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的69.76。随地区不同,自发消费(截距项)存在显著性差异。(2)面板单位根检验在工作文件窗El中打开CP变量的15个数据组,点击View键,选UnitRootTest功能(如图11.3.8),打开GroupUnitRootTest对话框如图11.3.9,共有6个选项区。图11.3.8图11.3.9Testtype选项区共包括6种检验方法,分别是LLC,Breitung,IPS,FisherADF,FisherPP,H
34、adri检验。默认的状态是6种检验结果综合(Summary)。检验方法的下拉菜单见图11.3.10。图11.3.10Testforunitrootin选项区包括3个选项,可以对水平序列(Level)、一次差分序列(1stdifference)、二次差分序列(2nddifference)进行检验,默认的选择是对水平序列检验单位根。Includeintestequation选项区有3个选项。检验式中包括截距项、截距项与趋势项,不包括确定性项。Option(选择)选项区对是否使用平衡面板做出选择。Laglength选项区指单位根检验式中差分项的滞后长度。可以给出6种评价准则。Spectralesti
35、mation选项区中核(Kernel)估计给出3种选择。选择默认值,点击图11.3.9窗口中的OK键,得15个地区的CP序列的单位根检验综合结果如表11.3.7。5种检验方法的结论都认为15个CP序列存在单位根。表11.3.7面板单位根检验结果11.4 11.4 变系数模型变系数模型变系数模型的基本形式如下:11.4.1 固定影响变系数模型 1 1不同个体之间随机误差项不相关的固定影响变系数模型不同个体之间随机误差项不相关的固定影响变系数模型截截面面个个体体的的N N个个单单方方程程,利利用用各各横横截截面面个个体体的的时时间间序序列列数数据据采采用用经经典典的的单单方方程程模模型估计方法分别
36、估计各单方程中的参数。型估计方法分别估计各单方程中的参数。2 2不同个体之间随机误差项相关的固定影响变系数模型不同个体之间随机误差项相关的固定影响变系数模型 例例11.4.111.4.1 利利用用1996-20021996-2002年年中中国国东东北北、华华北北、华华东东1515个个省省级级地地区区的的居居民民家家庭庭人人均均消消费费和和人人均均收收入入数数据据(见见表表11.111.1和和表表11.2)11.2),试试建建立立固固定定影影响响变变系系数数模模型型,研究这些地区的居民家庭消费行为。研究这些地区的居民家庭消费行为。模型形式为模型形式为 其其中中:ai为为15个个省省市市的的自自发
37、发消消费费倾倾向向,bi为为边边际际消消费费倾倾向向,两两者者用用来来反反映映省省市间的消费结构差异。市间的消费结构差异。EViews估估计计方方法法:在在Pooled Estimation(混混合合估估计计)窗窗口口中中的的Dependent Variable(相相依依变变量量)选选择择窗窗填填入入CP?;在在Common coefficients(系系数数相相同同)选选择择窗窗保保持持空空白白;在在Cross section specific coefficients(截截面面系系数数不不同同)选选择择窗窗填填入入IP?;在在Intercept(截截距距项项)选选择择窗窗中中选选Fixed
38、 effects(也也可可以以做做其其他他选选择择);在在Weighting(权权数数)选选择择窗窗点点击击No weighting。点点击击Pooled Estimation(混混合合估计)窗口中的估计)窗口中的OK键。固定影响变系数模型输出结果如表键。固定影响变系数模型输出结果如表11.4.1。表表11.4.1 固定影响变系数模型估计结果固定影响变系数模型估计结果 表11.4.1中给出了变系数模型估计结果,表11.4.1上部第2列是各地区的边际消费倾向估计值,后面3列是估计标准误、检验统计量值和相伴概率。表11.4.1中部是各地区截距估计值。表11.4.1下部是整个回归方程的拟合优度、F统
39、计量、DW统计量等指标。输出结果的方程形式是安 徽:CP_AH=161.6170366+0.7600529617*IP_AH北 京:CP_BJ=36.21736713+0.8065556921*IP_BJ福 建:CP_FJ=1274.326672+0.5830460912*IP_FJ河 北:CP_HB=319.354881+0.705311265*IP_HB黑龙江:CP_HLJ=595.8939202+0.6444699411*IP_HLJ吉 林:CP_JL=117.7833817+0.7875706843*IP_JL江 苏:CP_JS=708.9157069+0.6623656882*IP_
40、JS江 西:CP_JX=652.3219323+0.6019851277*IP_JX辽 宁:CP_LN=195.599025+0.7812790991*IP_LN内蒙古:CP_NMG=-106.6406618+0.7858190681*IP_NMG山 东:CP_SD=502.169392+0.677398964*IP_SD上 海:CP_SH=1051.031432+0.6717297747*IP_SH陕 西:CP_SX=568.1459927+0.669777312*IP_SX天 津:CP_TJ=197.1228368+0.7457127261*IP_TJ浙 江:CP_ZJ=1328.2611
41、49+0.6276611695*IP_ZJ 在计算变系数模型中的个体影响时,不同的软件给出的个体影响形式不同。Eviews5.0软件,给出的个体影响反映的是各个体成员对总体平均状态的偏离。EViews5.0估计结果如表11.4.2所示。表11.4.2 各地区自发消费对平均自发消费偏离的固定影响变系数模型估计结果 从表11.4.1结果表明,回归系数显著不为0,F统计量较大(p值显著),调整后的样本决定系数达0.99,说明模型的拟合优度较高。从估计结果可以看出,15个省级地区的居民家庭消费需求结构具有明显的差异。在15个省市中,边际消费倾向最高是北京,其次是吉林、内蒙古两省区,而边际消费倾向较低的
42、是江西,最低的是福建。从表11.4.2可知,回归系数与表11.4.1中相同。表11.4.2上半部第1行中的常数项506.808为15个省市的平均自发消费水平,表11.4.2下半部数据为各地区自发消费对平均自发消费的偏离,用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表11.4.2回归结果与表11.4.1回归结果本质上是相同的。2不不同同个个体体之之间间随随机机误误差差项项相相关关的的固固定定影影响响变变系系数模型数模型 相对于混合估计模型来说,是否有必要建立变截距、变系数模型,可以通过F检验来完成。即检验样本数据究竟属于哪一种面板数据模
43、型形式。主要检验如下两个假设:3 3含有含有AR(p)AR(p)项的固定影响变系数模型项的固定影响变系数模型 对于含有AR(p)项的固定影响变系数模型,经过适当的变换,可以将其转换成基本的固定影响变系数模型进行估计。例如,含有AR(1)项的固定影响变系数模型的基本形式如下:利用前面所介绍的固定影响变系数模型的估计方法,能够实现对于变形后的模型(11.4.8)的估计。类似,对于含有AR(p)项的固定影响变截距模型,也可以经适当变换转变为基本的固定影响变截距模型进行估计。11.4.2 随机影响变系数模型 1随机影响模型的形式 考虑如下形式的变系数模型:2随机影响模型的估计 在实际分析中,这两项方差
44、几乎都是未知的,因此需要采用可行广义最小二乘估计法(FGLS)对模型进行估计,即先利用数据求出未知方差的无偏估计,然后再进行广义最小二乘估计。11.5 案例分析 根据凯恩斯的绝对收入假说,利用我国29个省市(不包括重庆和西藏)的城镇居民可支配收入、消费数据(见表11.5.1、表11.5.2)建立城镇居民消费函数,对各省市的居民消费结构进行对比分析。模型中的被解释变量CS为城镇居民人均全年消费支出,解释变量YD为城镇居民人均全年可支配收入(单位:元/人),变量均为年度数据,样本区间为1991-2004年。表11.5.1 29个省市地区的城镇居民家庭平均消费支出数据(单位:元/人)利用199120
45、04年29个省级地区城镇居民家庭年人均消费性支出和年人均可支配收入数据,用EViews建立面板数据估计模型步骤如下。11.5.1建立合成数据库(Pool)对象首先建立工作文件。在打开工作文件窗口的基础上,点击EViews主功能菜单上的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗。在TypeofObject选择区选择Pool(合并数据库),并在NameofObject选择区为混合数据库起名CS(初始显示为Untitled)。如图11.5.1,点击OK键,从而打开混合数据库(Pool)窗口。在窗口中输入29个地区的标识AH(安徽)、BJ(北京)、ZJ(浙江
46、),如图11.5.2。图11.5.1Pool对象定义对话框图11.5.2Pool对象说明窗口11.5.2定义序列名并输入数据在新建的混合数据库(Pool)窗口的工具栏中点击Sheet键(第2种路径是,点击View键,选Spreadsheet(stackeddata)功能),从而打开SeriesList(列出序列名)窗口,定义时间序列变量CS?和YD?(?符号表示与CS和YD相连的29个地区标识名)如图11.5.3。点击OK键,从而打开混合数据库(Pool)窗口,(点击Edit+-键,使EViews处于可编辑状态)输入数据。输入完成后的情形见图11.5.4。图11.5.4所示为以截面为序的阵列式
47、排列(stackeddata)。点击Order+-键,还可以变换为以时间为序的阵列式排列。图11.5.3序列列表对话框 图11.5.4序列的堆栈形式数据表 11.5.3估计模型点击Estimation键,随后弹出PooledEstimation(混合估计)对话窗(见图11.5.5)。图11.5.5合成数据模型定义对话框 先对PooledEstimation(混合估计)对话窗中各选项功能给以解释。DependentVariable(被解释变量)选择窗:用于填写被解释变量。Sample(样本范围)选择窗:用于填写样本区间。BalancedSample(平衡样本)选择块:点击打勾后表示用平衡数据估计
48、。Commoncoefficients(系数相同)选择窗:用于填写对于不同横截面斜率相同的解释变量和虚拟变量。Crosssectionspecificcoefficients(截面系数不同)选择窗:用于填写对于不同横截面斜率不同的解释变量。Intercept(截截距距项项)选选择择窗窗:从中可以选None(无截距项)、Common(个体相同截距项)、Fixedeffects(固定效应个体不同截距项)、Randomeffects(随机效应截距项)。Weighting(权权数数)选选择择窗窗:从中可以选Noweighting(等权估计)、Crosssectionweights(按截面取权数)、SU
49、R(似不相关回归)、iteratetoconvergence(迭代至收敛)。“等权估计”的方法是所有的观测值都给以相等的权数;“按截面取权数”的方法是以横截面模型残差的方差为权数,属于广义最小二乘法估计。“似不相关回归”的方法是利用横截面模型残差的协方差进行广义最小二乘法估计,该法将自动修正横截面中出现的异方差和短期自相关;“迭代至收敛”方法当选择广义最小二乘法估计时,点击此键将保证参数估计一直到收敛为止。用EViews可以估计固定效应模型、随机效应模型、带有AR(1)参数的模型、截距不同回归系数也不同的面板数据模型。用EViews可以选择普通最小二乘法、加权最小二乘法(以截面模型的方差为权)
50、、似不相关回归法估计模型参数。可以在Commoncoefficients选择窗和Crosssectionspecificcoefficients选择窗中填入AR(1)项。估计过程中的缺省方法是等权(Noweighting)估计。还可以选择Crosssectionweights(按截面取权数)和SUR(似不相关回归)。下下面面分分别别建建立立无无个个体体影影响响的的不不变变系系数数模模型型、变变截截距距模模型型和和变变系系数数模模型型等等,然然后后从从中中选选择择一一个个比比较较理理想想的的模模型型作作为为我我国国的的城城镇镇居居民民消消费费函函数数,并并对对各各省省市市的的居民消费结构进行对比