《Eviews面板数据模型估计.pptx》由会员分享,可在线阅读,更多相关《Eviews面板数据模型估计.pptx(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、面板数据及如何建立混合数据库1.面板数据定义 时间序列数据或截面数据都是一维数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。第1页/共39页地区人均消费1996199719981999200020012002CP-AH(安徽)3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京)5133.978 6203.048 6807.451 7453.
2、757 8206.271 8654.433 10473.12CP-FJ(福建)4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北)3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龙江)2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535CP-JL(吉林)2833.321 3286.432 3477.560 3736.408 4077.961 4
3、281.560 4998.874CP-JS(江苏)3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西)2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775CP-LN(辽宁)3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063CP-NMG(内蒙古)2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.1
4、80CP-SD(山东)3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海)6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94CP-SX(山西)2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561CP-TJ(天津)4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江)5342.
5、234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210第2页/共39页地区人均收入1996199719981999200020012002IP-AH(安徽)4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333IP-BJ(北京)6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38IP-FJ(福建)4884.731 6040.944 6505.145 6922.109 7279.393 8422.
6、573 9235.538IP-HB(河北)4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152IP-HLJ(黑龙江)3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565IP-JL(吉林)3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618IP-JS(江苏)4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589IP
7、-JX(江西)3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311IP-LN(辽宁)3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088IP-NMG(内蒙古)3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922IP-SD(山东)4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036IP-SH(上海)7489.45
8、1 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88IP-SX(山西)3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732IP-TJ(天津)5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060IP-ZJ(浙江)6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00第3页/共39页Pool对象侧重分析截面成员较少,而时期较长的数
9、据;对于截面成员较多,时期较少的数据,一般通过具有面板结构的工作文件(Panel workfile)进行分析。2.混合数据库Pool的建立第4页/共39页 创建Pool对象,选择Objects/New Object/Pool并在编辑窗口中输入截面成员的识别名称:(1)(1)创建创建PoolPool对象对象 第5页/共39页 对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建立合法的EViews序列名称。在Pool中使用序列的关键是序列命名:使用基本名和截面识别名称组合命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可(2)Pool(2)Pool序列命名序列命名第6页/共3
10、9页(3)Pool(3)Pool序列概念序列概念 一个Pool序列实际就是一组序列,序列名是由基本名和所有截面识别名构成的。Pool序列名使用基本名和“?”占位符,其中“?”代表截面识别名。3.3.输入输入PoolPool数据数据第7页/共39页 建立好Pool对象以后,选择View/Spreadsheet(stacked data),EViews会要求输入序列名列表。第8页/共39页大多数情况下,不同截面成员的数据从上到下依次堆积,每一列代表一个变量,每一列内数据都是按年排列的。如果数据按年排列,要确保各年内截面成员的排列顺序要一致。第9页/共39页生成新的序列打开原始pool数据,点击工具
11、栏中的poolgenr键,在弹出的对话框中输入要生成的公式,如:cp?=consume?/p?,ip?=income?/p?第10页/共39页4.4.如何估计如何估计PoolPool方程方程 单击Pool工具栏的Estimate选项打开如下对话框:第11页/共39页(1 1)因变量)因变量在因变量对话框中输入在因变量对话框中输入PoolPool变量或变量或PoolPool变量表达式。变量表达式。(2 2)估计方法)估计方法Fixed and Random下:Cross-secti(个体效应)有三个选项,分别表示无、固定和随机个(个体效应)有三个选项,分别表示无、固定和随机个体效应。体效应。Pe
12、riod(时点效应)有三个选项,分别表示无、有固定和有随机时时点效应)有三个选项,分别表示无、有固定和有随机时点效应。点效应。Weights有五个选项,分别表示无加权、个体的有五个选项,分别表示无加权、个体的GLS法、个体法、个体SUR法、法、时点时点GLS法和时点法和时点SUR法。法。(3 3)估计设置)估计设置Method有两个选项:有两个选项:LS和和TSLSSample为样本区间。为样本区间。第12页/共39页(4)解释变量解释变量 (1)Common:此此栏栏中中输输入入的的变变量量对对所所有有截截面面成成员员有有相相同同的的系数,并用一般名称或系数,并用一般名称或Pool名称输出结
13、果。名称输出结果。(2)Cross-section specific:此此栏栏中中输输入入的的变变量量对对Pool中中每每个个截截面面成成员员的的系系数数不不同同。EViews会会对对每每个个截截面面成成员员估估计计不不同同的的系系数数,并并使使用用截截面面成成员员识识别别名名后后跟跟一一般般序序列列名名,中中间间用用“”连连接接进进行行标标签。签。(3)Period specific:此此栏栏中中输输入入的的变变量量对对Pool中中每每个个时时期期的的系系数数不不同同。EViews会会对对每每个个时时期期估估计计不不同同的的系系数数,并并使使用用变变量量名名后后跟时期,中间用跟时期,中间用“
14、”连接进行标签。连接进行标签。第13页/共39页第14页/共39页二、面板数据模型形式设定检验第15页/共39页如如果果从从时时间间上上看看,不不同同个个体体之之间间不不存存在在显显著著性性差差异异;从从截截面面上上看看,不不同同截截面面之之间间也也不不存存在在显显著著性性差差异异,那那么么就就可可以以直直接接把把面面板板数数据混合在一起用普通最小二乘法(据混合在一起用普通最小二乘法(OLS)估计参数。)估计参数。EViwes估估计计方方法法:在在主主窗窗口口中中双双击击已已建建立立的的Pool数数据据库库,在在Pool窗窗口口的的工工具具栏栏中中点点击击Estimate键键,打打开开Pool
15、ed Estimation(混混合估计)窗口,其选项如下图。合估计)窗口,其选项如下图。第16页/共39页固定效应模型第17页/共39页得出如下输出结果第18页/共39页相应的表达式是:(2.0)(79.7)上式表示15个省级地区的城镇人均支出平均占收入的76%。第19页/共39页 若要查看方程,在结果输出窗口点若要查看方程,在结果输出窗口点ViewRepresentations。要用。要用模型进行模拟,点模型进行模拟,点procMake Model,在出来的窗口中点,在出来的窗口中点Solve。在结果输出窗口中点击在结果输出窗口中点击View选选Residuals/Table,Graphs,
16、Covariance Matrix,Correlation Matrix功能可以分别得到按个体计功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差序列的相关系数矩阵。序列的相关系数矩阵。第20页/共39页个体固定影响变截距模型就是对于不同的个体有不同截距的模个体固定影响变截距模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固同的横截面,模型的截距没
17、有显著性变化,那么就应该建立个体固定影响模型。定影响模型。EViwes估计方法:估计方法:在在EViwes的的Pooled Estimation对话框中的对话框中的Cross-secti下拉菜单中选中下拉菜单中选中Fixed。把。把c从从Common coefficients窗口窗口中删除,其余选项同上。中删除,其余选项同上。个体固定影响变截距模型第21页/共39页得出如下输出结果第22页/共39页相应的表达式为:(6.3)(55)其中虚拟变量 的定义是:15个省级地区的城镇人均指出平均占收入70%。从上面的结果可以看出北京市居民的自发性消费明显高于其他地区。第23页/共39页 固定效应模型分
18、为三种:个体固定效应模型、时点固定效应模型和个体时点固定效应模型。如果观察得数据是对个体固定,则应选择个体固定效用模型。但是,我们还需作个体固定效应模型和混合估计模型的选择。所以,就要作F值检验。相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过F检验来完成。假设 H0:对于不同横截面模型截距项相同(建立混合估计模型)。SSEr 备择假设 H1:对于不同横截面模型的截距项不同(建立个体固定效应模型)。SSEu 第24页/共39页F统计量定义为:F=(SSEr-SSEu)/(N+k2)/SSEu/(NT-N-k)其中,SSEr,SSEu分别表示约束模型(混合估计模型的)和非约束模型(
19、个体固定效应模型的)的残差平方和(Sum squared resid)。非约束模型比约束模型多了N1个被估参数。需要指出的是:当模型中含有k个解释变量时,F统计量的分母自由度是NT-N-k。通过对F统计量我们将可选择准确、最佳的估计模型。第25页/共39页在作回归时也是四步:第一步,先作混合效应模型:在cross-section 一栏选择None,Period也是None;Weights是cross-section Weights,然后把回归结果的Sum squared resid值复制出来,就是SSEr 第二步:作个体固定效用模型:在cross-section 一栏选择Fixed,Perio
20、d也是None;Weights是cross-section Weights,然后把回归结果的Sum squared resid值复制出来,就是SSEu 第26页/共39页第三步:根据公式F=(SSEr-SSEu)/(N+k2)/SSEu/(NT-N-k)。计算出结果。其中,T为年数,不管我们的数据是unbalance还是balance看observations就行了,也即Total pool(balanced)observations:的值,但是如果是balance我们也可以计算,也即是每一年的企业数的总和。比如说我们研究7年,每一年又15个地区,则NT715105。K为解释变量的个数,不含被
21、解释变量。第四步,根据计算出来的结果查F值分布表。看是否通过检验。检验准则:当F F(T-1,NT-T-k),=0.01,0.05或0.1时,拒绝原假设,则结论是应该建立个体固定效应模型,反之,接受原假设,则不能建立个体固定效应模型。第27页/共39页接下来对本例用F统计量检验是应该建立混合回归模型,还是个体固定效应回归模型。:。模型中不同个体的截距相同(真实模型为混合回归模型)。:模型中不同个体的截距项不同(真实模型为个体固定效应回归模型)。F统计量定义为:第28页/共39页其中SSER表示约束模型,即混合估计模型的残差平方和,SSEU表示非约束模型,即个体固定效应回归模型的残差平方和。非约
22、束模型比约束模型多了N-1个被估参数。所以本例中:所以推翻原假设,建立个体固定效应回归模型更合理。第29页/共39页当利用面板数据研究拥有充分多个体的总体经济特征时,若利当利用面板数据研究拥有充分多个体的总体经济特征时,若利用总体数据的固定效应模型就会损失巨大的自由度,使得个体截距用总体数据的固定效应模型就会损失巨大的自由度,使得个体截距项的估计不具有有效性。这时可建立个体随机影响变截距模型。其项的估计不具有有效性。这时可建立个体随机影响变截距模型。其Eviews实现见下图。实现见下图。个体随机影响变截距模型第30页/共39页运行结果得第31页/共39页相应的表达式是:其中虚拟变量 的定义是:
23、第32页/共39页固定效应模型和随机效应模型的设定检验-hausman检验众所周知,在回归模型满足基本假设时,回归系数的ols估计量是BLUE估计,但是,当模型不满足“正交性假设”时,的OLS估计量不再是无偏的。同时,当模型不满足“同方差性假设”时,的OLS估计量不是有效的。第33页/共39页对于面板数据模型令 如果不能满足回归假设则个体随机效应模型系数的GLS估计量 是有偏的和非一致的。但是正交性并不影响个体固定效应模型系数的估计量 的性质,于是可以通过检验模型误差项与解释变量的正交性来解决面板数据回归模型设定问题。第34页/共39页检验假设显然,在拒绝零假设时,模型设定为固定应模型是可行的
24、;否则,如果不能拒绝零假设时,模型应设定为随机效应模型。第35页/共39页 接下来利用Hausman统计量检验应该建立个体随机效应回归模型还是个体固定效应回归模型。:个体效应与回归变量()无关(个体随机效应回归模型):个体效应与回归变量()相关(个体固定效应回归模型)第36页/共39页分析过程如下第37页/共39页 由检验输出结果的上半部分可以看出,Hausman统计量的值是14.75,相对应的概率是0.0001,即拒接原假设,应该建立个体固定效应模型。检验结果的下半部分是Hausman检验中间结果比较。个体固定效应模型对参数的估计值为0.697648,随机效应模型对参数的估计值为0.724528。两个参数的估计量的分布方差的差为0.000049。综上分析,19962002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人金收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的70%。随地区不同,自发消费(截距项)存在显著性差异。第38页/共39页谢谢您的观看!第39页/共39页