《第11章-面板数据模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《第11章-面板数据模型ppt课件.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1第第11 11章章 面板数据模型面板数据模型o一、面板数据模型简介一、面板数据模型简介o二、混合最小二乘回归二、混合最小二乘回归o三、固定效应模型三、固定效应模型o四、随机效应模型四、随机效应模型o五、模型设定检验五、模型设定检验o六、动态面板数据模型六、动态面板数据模型我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2一、面板数据模型简介一、面板数据模型简介o(一)何谓
2、(一)何谓“面板数据面板数据(panel data)”?o时间维度时间维度+截面维度截面维度o如在分析中国各省份经济增长的决定因素时,共如在分析中国各省份经济增长的决定因素时,共有有31个截面,每个截面都取个截面,每个截面都取1979-2008共共30年的数年的数据,则共有据,则共有930个观察值,这就是一个典型的面板个观察值,这就是一个典型的面板数据。数据。o上市公司财务数据,研究一段时期内(上市公司财务数据,研究一段时期内(1998-2008)20家上市公司股利的发放数额与股票账面价值之家上市公司股利的发放数额与股票账面价值之间的关系,共有间的关系,共有20 11=220个观测值。个观测值
3、。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3表1 1996-2002年中国15个省的居民家庭人均消费数据(不变价格)地区人均消费地区人均消费1996199719981999200020012002CP-AH(安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建)
4、4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江苏) 3712.260 4
5、457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775CP-LN(辽宁) 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山东) 3440.684 3930.574 41
6、68.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.
7、749 6950.713 7968.327 8792.210我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物4表2 上市公司的投资与股票账面价值我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物5(二)面板数据模型的优点(二)面板数据模型的优点o面板数据模型(panel data model),即研究和分析面板数据的模型。它的变量取值都带有时间序列和横截面的两重性。一般线性模型只单独处理横截面数据或时间序列数据,而不能同时
8、分析和对比它们。面板数据模型,相对于一般的线性回归模型,其长处在于它既考虑到了横截面数据存在的共性,又能分析模型中横截面因素的个体特殊效应。o当然我们也可以将横截面数据简单堆积起来用当然我们也可以将横截面数据简单堆积起来用OLS回归模型来处理,但这样做就丧失了分析个体特殊回归模型来处理,但这样做就丧失了分析个体特殊效应的机会效应的机会。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物6面板数据模型的优点面板数据模型的优点o第一,第一,Panel Data Model通过对不同横截面单元不通过对不同横截面单元
9、不同时间观察值的结合,增加了自由度,减少了解释同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而得到更为有效的估计量;变量之间的共线性,从而得到更为有效的估计量;o第二,第二,Panel Data Model是对同一截面单元集的重是对同一截面单元集的重复观察,能更好地研究经济行为变化的动态性;复观察,能更好地研究经济行为变化的动态性;o第三,第三,Panel Data Model可以通过设置虚拟变量对可以通过设置虚拟变量对个别差异(个别差异(非观测效应非观测效应)进行控制;即)进行控制;即面板数据模面板数据模型可以用来有效处理遗漏变量(型可以用来有效处理遗漏变量(omitted
10、 varaiable)的模型错误设定问题的模型错误设定问题。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物7遗漏变量遗漏变量o使用面板数据的一个主要原因是,面板数据可以用使用面板数据的一个主要原因是,面板数据可以用来处理某些遗漏变量问题。来处理某些遗漏变量问题。o例如,遗漏变量是不随时间而变化的表示个体异质例如,遗漏变量是不随时间而变化的表示个体异质性的一些变量,如国家的初始技术效率、城市的历性的一些变量,如国家的初始技术效率、城市的历史或个人的一些特征等。史或个人的一些特征等。这些不可观测的不随时间这些
11、不可观测的不随时间变化的变量往往和模型的解释变量相关,从而产生变化的变量往往和模型的解释变量相关,从而产生内生性,导致内生性,导致OLS估计量有偏且不一致估计量有偏且不一致。o面板数据对遗漏变量问题的解决得益于面板数据对面板数据对遗漏变量问题的解决得益于面板数据对同一个个体的重复观测。同一个个体的重复观测。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物8何谓何谓“非观测效应非观测效应”?o非观测效应非观测效应(unobserved effect),是指在面板数据,是指在面板数据分析中,一个不可观测的、因截
12、面个体而异、但不分析中,一个不可观测的、因截面个体而异、但不随时间变化的变量。随时间变化的变量。o非观测效应通常被解释为对截面个体特征的捕捉。非观测效应通常被解释为对截面个体特征的捕捉。o比如研究:比如研究:“交通死亡率与酒后驾车人数的关系交通死亡率与酒后驾车人数的关系”(样本为一段时间内浙江省(样本为一段时间内浙江省11个地级市)个地级市)o非观测因素:汽车本身状况、道路质量、当地的饮非观测因素:汽车本身状况、道路质量、当地的饮酒文化、单位道路的车辆密度。酒文化、单位道路的车辆密度。o非观测效应的存在导致非观测效应的存在导致OLS估计结果不准确,而面估计结果不准确,而面板数据可以控制和估计非
13、观测效应。板数据可以控制和估计非观测效应。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物9(三)面板数据描述的(三)面板数据描述的StataStata操作操作o(1)设定截面变量和时间变量)设定截面变量和时间变量otsset panelvar timevaro(2)描述性统计)描述性统计osum var1 var2 可得到变量的基本统计量可得到变量的基本统计量oxtsum var1 var2 分组内分组内(within)、组间、组间(between)和和样本整体样本整体(overall)计算各变量的基本统
14、计量计算各变量的基本统计量我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物10(四)面板数据模型的一般描述(四)面板数据模型的一般描述我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物11面板数据模型的一般描述(续1)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物12面板数据模型的一般描述(续2)我吓了一跳,蝎子是多么丑恶和恐怖的东西
15、,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物13面板数据模型的一般描述(续3)o 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物14(五)面板数据的估计方法(五)面板数据的估计方法o1、混合最小二乘回归(、混合最小二乘回归(pooled OLS)o2、固定效应模型(、固定效应模型(fixed effects model)o3、随机效应模型(、随机效应模型(random effects model)o4、动态面板模型(、动态面板模型(dynamic pa
16、nel data)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物15二、混合普通最小二乘回归二、混合普通最小二乘回归oWooldridge第第13章章o使用混合横截面数据(pooled cross section,将混合将混合在一起的数据看作是横截面数据在一起的数据看作是横截面数据)的一个理由是要加大样本容量,把在不同时点从同一总体中抽取的多个随机样本混合起来,可以获得更精密的估计量和更有效的检验统计量。o回归所得截距项在不同时期可以有不同的值。可以进行带有时期(年份)虚拟变量多元线性回归。我吓了一跳,蝎
17、子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物16o例例1:不同时期:不同时期的妇女生育率的妇女生育率oFERTIL1.RAWo1972年和1984年社会总调查(General Social Survey)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物17例2:教育回报和工资中性别差异的变化o跨越1978年(基年)和1985年两期的一个混合对数工资方程。oCP78-85.RAW。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放
18、在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物18两时期面板数据分析两时期面板数据分析o比如有关个人、企业或城市、国家的横截面,现有两年的数据,称之为t=1,t=2。oCRIME2.RAW包含1982和1987年若干城市的犯罪和失业的数据。如果用1987年为横截面数据做回归,得到o可以得出增加失业率会降低犯罪率的结论吗可以得出增加失业率会降低犯罪率的结论吗?我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物19两时期面板数据分析两时期面板数据分析( (续续1) 1)o上述
19、回归很可能存在遗漏变量问题遗漏变量问题。o一个解决办法是,控制住更多的因素,如年龄、性别、教育、执法水平等。o另一种方法是,把影响因变量的观测不到的因素分为两类:一类是恒常不变的;另一类则随时间而变。od2t表示当t=1时等于0而当t=2时等于1的一个虚拟变量,它不随i而变。ai概括了影响yit的全部观测不到的、在时间上恒定的因素,通常称作非观测效应,也称为固定效应,即ai在时间上是固定的。特质误差uit表示随时间变化的那些非观测因素。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物20两时期面板数据分析两
20、时期面板数据分析( (续续2)2)o前述1982和1987年城市犯罪率的一个非观测效应模非观测效应模型型是:oai代表了影响城市犯罪率的、不随时间而变的全部因素,诸如城市的地理位置、居民的某些人口特征(种族、教育)、城市居民对待犯罪的态度等。o给定两年的面板数据,如何估计1?我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物21两时期面板数据分析两时期面板数据分析( (续续3)3)o一种方法一种方法,将两年的数据混合起来,然后用OLS。为使混合OLS得到1的一致估计,就必须假定非观测效应ai与xit 不相关。
21、o其中, 称为复合误差(composite error)。o这一结果与1987年数据的横截面OLS回归结果不一样。注意,使用混合OLS并不解决遗漏变量问题。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物22两时期面板数据分析两时期面板数据分析( (续续4)4)o另一种方法另一种方法,考虑了非观测效应与解释变量相关性。(面板数据模型主要就是为了考虑非观测效应与解面板数据模型主要就是为了考虑非观测效应与解释变量相关性的情形释变量相关性的情形)例如在犯罪方程中,让ai中的未测出的却影响着犯罪率的因素也与失业率相
22、关。处理方法就是一阶差分(一阶差分(first-differenced)。o非观测效应被差分掉了,方程已满足OLS假定。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物23两时期面板数据分析两时期面板数据分析( (续续5)5)o上述犯罪率模型用一阶差分方程估计结果:o差分后的估计结果与前面不同差分后的估计结果与前面不同。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物24三、固定效应估计法三、固定效应估计法o取一阶差分仅
23、是消除固定效应ai的许多方法之一。更好的方法是固定效应变换固定效应变换。考虑仅有一个解释变量的模型:o对每个i求方程在时间上的平均,得到o两式相减,得到 o( 是y的除去时间均值后的数据 )我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物25固定效应估计量o固定效应变换,又称“组内变换组内变换(within transformation)”,非观测效应ai已随之消失,可以用混合OLS进行估计。基于除去时间均值变量的混合OLS估计量就是固定效应估计量(fixed effected estimator)或组内估
24、计量(within estimator)。o固定效应估计量固定效应估计量=组内估计量组内估计量我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物26组间估计量o对横截面方程o使用OLS估计时,就得到了组间估计量(between estimator)。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物273个决定系数R2o面板数据模型回归结果可得到3个决定系数:oR2(overall),表示混合OLS (pooled OLS)
25、回归的R2oR2(within),表示组内估计(或固定效应变换)的R2oR2(between),表示组间估计的R2我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物28虚拟变量回归o固定效应模型也可以理解为,每一个横截面个体i都有自己不随时间变化的非观测效应ai。o在估计时,可以为每一个i安排一个虚拟变量,得到各自的截距项,这就是虚拟变量回归虚拟变量回归(dummy variable regression)。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我
26、的猜测没有错:表里边有一个活的生物29固定效应模型的虚拟变量回归o其中,其中, i=1,2,3.N,为截面标示;,为截面标示;t=1,2,. T,为时间标,为时间标示示 ;xit为为k1解释变量,解释变量,为为k1系数列向量。系数列向量。o对于特定的个体对于特定的个体i 而言,而言, ai表示那些不随时间改变的影表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,称为或难以量化的,称为“个体效应个体效应”(individual effects)。o在固定效应模型中,解释变量的参数在固定效应模型中,解释变量的参数 对各
27、经济主体对各经济主体都相同,属于共同部分,所以不同经济主体的差异完都相同,属于共同部分,所以不同经济主体的差异完全体现在常数项参数全体现在常数项参数ai的取值上。的取值上。itiitityxu我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物30图示北京江苏GDPX(Invest、edu)北京江苏省山西省山西基础设施更加完善,受教育程度较好、经济结构以服务业为主、法制更健全我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3
28、1固定效应模型的虚拟变量回归111222iiiiiiiiiinininyxuyxuyXUyxu11112222100010100 mmmmyXUyXUyXU我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物32o1代表元素都为1的n维列向量。进一步,可以将与常数项参数ai相关的mnm维矩阵写成D,而将不包含常数项参数相关的相关的mnk维矩阵写成X,则面板数据的固定效应模型又可以更简洁地表示为:o由于上式的矩阵由于上式的矩阵D的列向量可以理解为代表第的列向量可以理解为代表第i个经个经济主体的虚拟变量,通常也可将
29、固定效应模型称为济主体的虚拟变量,通常也可将固定效应模型称为最小二乘虚拟变量模型最小二乘虚拟变量模型(Least squares dummy variable model, LSDV)。 YDXU固定效应模型的虚拟变量回归我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物33固定效应模型的固定效应模型的Stata操作操作o(1)设定截面变量和时间变量)设定截面变量和时间变量otsset panelvar timevaro(2)固定效应模型估计)固定效应模型估计oxtreg y x1 x2 x3, feo(3)
30、导出固定效应回归的个体截距项)导出固定效应回归的个体截距项opredict v, uogen c=v+_b_cons o或者,直接进行或者,直接进行LSDV估计估计oxtreg y x1 x2 x3 i.panelvar我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物34固定效应VS一阶差分固定效应固定效应我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物35固定效应VS一阶差分一阶差分一阶差分我吓了一跳,蝎子是多么丑恶和
31、恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物36四、随机效应模型四、随机效应模型o假定一个非观测效应模型为:假定一个非观测效应模型为:o固定效应法和一阶差分法的目的都是要把ai消去,因为ai被认为是与xitj中的一个或多个相关。但是,假如ai与任何一个解释变量在任何时期都不相关,那么通过变化把ai消去就会导致低效的估计量。o如果假定非观测效应如果假定非观测效应ai与每一个解释变量与每一个解释变量都不相关都不相关o则上述模型就是一个随机效应(random effects)模型。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这
32、样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物37如何估计o如果我们相信ai与解释变量不相关,则可用单一横截面回归(pooled OLS)得到的一致估计,根本不需要面板数据!但是使用单一横截面显然忽视了其他时期许多有用的信息。实际上,混合OLS回归通常是有偏误的。o定义复合误差项 ,则有o由于由于ai在每个时期都是复合误差项的一部分,在每个时期都是复合误差项的一部分,vit在在不同时间上就应是时序相关的不同时间上就应是时序相关的。itiitvau我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:
33、表里边有一个活的生物38如何估计(续1)o因为,o所以,o必须用GLS变换以消去误差项中的时序相关。22cov(,)()()()()itisitisiitiisiavvE v vE auauE a22222()()2 ()()itiiitiauE vE aE auE u222 ()isauE v222(,),aitisauv vtscorr我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物39如何估计(续2)o方程o定义o变换方程为:o固定效应估计量是从相应的变量减去时间平均,而随机效应变换只减去其时间平均的
34、一个分数随机效应变换只减去其时间平均的一个分数,这个分数依赖于 和时期的个数T。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物40随机效应估计量的矩阵表达o复合误差项的方差协方差矩阵为o随机效应估计量为:22222222222()auaaaauaaauEiiv v我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物41四种估计方法之比较四种估计方法之比较o这里的,即为前面的。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把
35、它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物42四种估计方法之比较(续)o当=0,得到混合OLS估计量;o当=1,得到固定效应估计量;o如果接近于0,随机效应估计量就会接近混合OLS估计量;如果接近于1,随机效应估计量就会接近固定效应估计量。当T很大时,趋于1,随机效应估计量与固定效应估计量非常相似。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物43求theta我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我
36、的猜测没有错:表里边有一个活的生物44随机效应模型的随机效应模型的Stata操作操作o(1)设定截面变量和时间变量)设定截面变量和时间变量otsset panelvar timevaro(2)随机效应模型估计)随机效应模型估计oxtreg y x1 x2 x3, reo(3)得到得到(或或,theta)的值的值oxtreg y x1 x2 x3, re theta我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物45随机效应模型是否优于混合随机效应模型是否优于混合OLSo在在STATA中实施随机效应回归之后,
37、使用中实施随机效应回归之后,使用xttest0,可以检验随机效应模型是否优于混合可以检验随机效应模型是否优于混合OLS 模型。模型。o本例中,本例中,P 值为值为0.0000,表明,表明RE优于混合优于混合OLS。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物46五、模型设定检验五、模型设定检验o在实证分析中,选择固定效应模型还是随机效应模在实证分析中,选择固定效应模型还是随机效应模型,一般通过型,一般通过Hausman检验来判断。检验来判断。o随机效应随机效应模型把个体效应模型把个体效应ai设定为随机扰
38、动项的一设定为随机扰动项的一部分,所以就部分,所以就要求解释变量与个体效应要求解释变量与个体效应ai不相关不相关,而固定效应模型并不需要这个假设条件。而固定效应模型并不需要这个假设条件。o因此,可以通过检验该假设条件是否满足,来选择因此,可以通过检验该假设条件是否满足,来选择模型。如果满足,那么就应该采用随机效应模型,模型。如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型。反之,就需要采用固定效应模型。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物47HausmanHausman检验的原
39、理检验的原理oHausman(1978)提出了一种基于随机效应估计量和提出了一种基于随机效应估计量和固定效应估计量之间差异的检验。固定效应估计量之间差异的检验。oHausman检验的基本思想是:检验的基本思想是:o在个体效应在个体效应ai和其他解释变量不相关的原假设下,和其他解释变量不相关的原假设下,二者的参数估计应该不会有系统的差异二者的参数估计应该不会有系统的差异。o如果拒绝了原假设,则认为如果拒绝了原假设,则认为ai与解释变量出现了相与解释变量出现了相关,此时固定效应模型是一致的,而随机效应模型关,此时固定效应模型是一致的,而随机效应模型是非一致的,我们就应该选择固定效应模型。是非一致的
40、,我们就应该选择固定效应模型。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物48关于Hausman检验的说明oHausman统计量为:统计量为:oH=(b-B) Var(b)-Var(B)-1(b-B)x2(k)ob为固定效应估计结果,为固定效应估计结果,B为随机效应估计结果。为随机效应估计结果。oHausman统计量服从自由度为统计量服从自由度为k的卡方分布。当的卡方分布。当H大于一定大于一定显著水平的临界值时,我们就认为模型中存在固定效应,显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定
41、效应模型,否则选用随机效应模型。从而选用固定效应模型,否则选用随机效应模型。o如果如果Hausman检验值为负,说明的模型设定有问题检验值为负,说明的模型设定有问题,导致,导致Hausman 检验的基本假设得不到满足,比如存在遗漏变量检验的基本假设得不到满足,比如存在遗漏变量的问题,或者某些变量是非平稳等等。的问题,或者某些变量是非平稳等等。o此时应改用此时应改用hausman检验的其他形式:检验的其他形式:ohausman fe, sigmaless我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物49Ha
42、usmanHausman检验在检验在StataStata中的操作中的操作o第一步:估计固定效应模型,存储结果第一步:估计固定效应模型,存储结果oxtreg y x1 x2 x3., fe oestimates store fixedo第二步:估计随机效应模型,存储结果第二步:估计随机效应模型,存储结果oxtreg y x1 x2 x3., reoestimates store randomo第三步:进行第三步:进行hausman检验检验ohausman fixed random我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表
43、里边有一个活的生物50面板数据的面板数据的StataStata操作实例操作实例o 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物51(1)(1)随机效应模型随机效应模型o首先采用随机效应方法来估计模型。数据集中有135个公司的3年数据,所以有405个样本观测值。但由于有缺失数据,最后得到的观测值为390个。o在STATA中输入:ouse JTRAINotsset fcode yearoxtreg hrsemp d88 d89 grant grant_1 lemploy, re我吓了一跳,蝎子是多么丑恶和恐
44、怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物52随机效应估计结果随机效应估计结果我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物53随机效应估计结果分析o职业培训补助金(grant),其估计系数为33.52,且标准差比较小,估计量在统计上非常显著。因此,如果公司在当年得到补助金,与没有得到补助金相比,在其他条件不变下,公司会给其职员更多的(平均)培训时间33.52小时,这是很大的效果。o而上一年的职业培训补助金是不显著的,说明职业培训补助金没有滞
45、后作用。o大公司是否比小公司提供更多的职业培训,从上述回归结果看:如果职员数量增加10%,每个职员的培训时间大约减少0.422小时,此结果统计上显著。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物54随机效应还是混合OLSo在随机效应回归后,输入xttest0,可得o表明,随机效应模型随机效应模型优于混合优于混合OLS 模型模型。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物55随机效应回归的序列相关检验o在随机效应
46、回归后,输入xttest1,可得检验结果表检验结果表明,存在随明,存在随机效应和序机效应和序列相关,而列相关,而且,对随机且,对随机效应和序列效应和序列相关的联合相关的联合检验也非常检验也非常显著。显著。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物56STATA命令下载安装o在STATA中,有些命令需要下载安装后才能使用,比如本例中的xttest1。o在STATA命令栏中输入osearch xttest1, neto按照提示下载并安装,然后才能使用。o该方法也适用于其他命令,如xttest2, xtte
47、st3, xtserial, 等等。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物57(2)(2)固定效应模型固定效应模型o然后采用固定效应方法来估计模型。观测值与前述相同。o在STATA中输入:ouse JTRAINotsset fcode yearoxtreg hrsemp d88 d89 grant grant_1 lemploy, fe我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物58固定效应估计结果固定效应
48、估计结果我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物59固定效应估计结果分析o与随机效应估计相比,结果相差不大,仅ln(employ)的回归系数有所变化,由统计意义上的显著变为不显著。我们想了解的是大公司是否比小公司提供更多的职业培训,从上面回归结果中无法得到下面这个结论:如果职员数量增加10%,每个职员的培训时间大约减少0.176小时,因为估计结果在统计上非常不显著。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物
49、60固定效应回归的异方差检验o在固定效应回归之后,输入xttest3,检验截面的异方差。o本例中,检验结果意味着截面间存在异方差。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物61固定效应回归的序列相关检验oxtserial y x1 x2 x3o本例的检验结果是o意味着,误差项不存在一阶自相关。考虑到数据仅3年,这一结果是合理的。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物62(3)(3)固定效应固定效应oror
50、随机效应随机效应o最后,我们在固定效应模型和随机效应模型中进行选择Hausman检验。如果检验统计量的P值不显著,用随机效应模型比较安全;而如果P值显著,则固定效应模型会更为合理。其STATA命令为:oxtreg hrsemp d88 d89 grant grant_1 lemploy, feoestimates store fixedoxtreg hrsemp d88 d89 grant grant_1 lemploy, feoestimates store randomohausman fixed random我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但