《Eviews面板数据模型估计ppt课件.ppt》由会员分享,可在线阅读,更多相关《Eviews面板数据模型估计ppt课件.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、面板数据及如何建立混合数据库一、面板数据及如何建立混合数据库1.面板数据定义面板数据定义 时间序列数据或截面数据都是一维时间序列数据或截面数据都是一维数据。面板数据(数据。面板数据(panel data)也称时)也称时间序列截面数据(间序列截面数据(time series and cross section data)或混合数据)或混合数据(pool data)。面板数据是同时在时间)。面板数据是同时在时间和截面空间上取得的二维数据。和截面空间上取得的二维数据。地区人均消费1996199719981999200020012002CP-AH(安徽) 3282.466 3646.150 377
2、7.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596
3、.839 3890.580 4159.087 4493.535CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江苏) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775CP-LN(辽宁) 3237.275 3608.060 3918.167 4046.582 4360.42
4、0 4654.420 5402.063CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山东) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273
5、 4787.561CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210地区人均收入1996199719981999200020012002IP-AH(安徽) 4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333IP-BJ(北京) 6569.901 7419.905 8273.418 9127
6、.992 9999.700 11229.66 12692.38IP-FJ(福建) 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538IP-HB(河北) 4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152IP-HLJ(黑龙江) 3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565IP-JL(吉林) 3549.935 4041.061 4240.565 4571.439 4878.
7、296 5271.925 6291.618IP-JS(江苏) 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589IP-JX(江西) 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311IP-LN(辽宁) 3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088IP-NMG(内蒙古) 3189.414 3774.804 4383.706 4780.090 5063.228 5502.8
8、73 6038.922IP-SD(山东) 4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036IP-SH(上海) 7489.451 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88IP-SX(山西) 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732IP-TJ(天津) 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060I
9、P-ZJ(浙江) 6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00Pool对象侧重分析截面成员较少,而时期较对象侧重分析截面成员较少,而时期较长的数据;对于截面成员较多,时期较少的数据,长的数据;对于截面成员较多,时期较少的数据,一般通过具有面板结构的工作文件(一般通过具有面板结构的工作文件(Panel workfile)进行分析。)进行分析。2.混合数据库混合数据库Pool的建立的建立 创建创建Pool对象,选择对象,选择Objects/New Object/Pool并在并在编辑窗口中输入截面成员的识别名称:编辑窗口
10、中输入截面成员的识别名称: 对截面成员的识别名称没有特别要求,但必须能使用对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建立合法的这些识别名称建立合法的EViews序列名称。序列名称。 在在Pool中使用序列的关键是序列命名:使用基本名和中使用序列的关键是序列命名:使用基本名和截面识别名称组合命名。截面识别名称可以放在序列名中截面识别名称组合命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可的任意位置,只要保持一致即可 一个一个Pool序列实际就是一组序列序列实际就是一组序列, 序列名是由基本名序列名是由基本名和所有截面识别名构成的。和所有截面识别名构成的。Pool序列
11、名使用基本名和序列名使用基本名和“?”占位符,其中占位符,其中“?”代表截面识别名。代表截面识别名。 建立好建立好Pool对象以后,选择对象以后,选择View/Spreadsheet(stacked data),),EViews会要求输入序列名列表。会要求输入序列名列表。大多数情况下,不同截面成员的数据从上到下依次堆积,每一大多数情况下,不同截面成员的数据从上到下依次堆积,每一列代表一个变量列代表一个变量,每一列内数据都是按年排列的。如果数据按年排列,每一列内数据都是按年排列的。如果数据按年排列,要确保各年内截面成员的排列顺序要一致。要确保各年内截面成员的排列顺序要一致。生成新的序列生成新的序
12、列 打开原始打开原始pool数据,点击工具栏中的数据,点击工具栏中的poolgenr键,在键,在弹出的对话框中输入要生成的公式,如:弹出的对话框中输入要生成的公式,如:cp?=consume?/p?,ip?=income?/p? 单击单击Pool工具栏的工具栏的Estimate选项打开如下对话框:选项打开如下对话框: (1 1)因变量)因变量在因变量对话框中输入在因变量对话框中输入PoolPool变量或变量或PoolPool变量表达式。变量表达式。(2 2)估计方法)估计方法Fixed and Random下:下:Cross-secti(个体效应)有三个选项,分别表示无、固定和随机个(个体效应
13、)有三个选项,分别表示无、固定和随机个体效应。体效应。Period(时点效应)有三个选项,分别表示无、有固定和有随机时时点效应)有三个选项,分别表示无、有固定和有随机时点效应。点效应。Weights有五个选项,分别表示无加权、个体的有五个选项,分别表示无加权、个体的GLS法、个体法、个体SUR法、法、时点时点GLS法和时点法和时点SUR法。法。(3 3)估计设置)估计设置Method有两个选项:有两个选项:LS和和TSLSSample为样本区间。为样本区间。 (4)解释变量解释变量 (1) Common:此栏中输入的变量对所有截面成员有相同的此栏中输入的变量对所有截面成员有相同的系数,并用一般
14、名称或系数,并用一般名称或Pool名称输出结果。名称输出结果。 (2) Cross-section specific:此栏中输入的变量对此栏中输入的变量对Pool中每个中每个截面成员的系数不同。截面成员的系数不同。EViews会对每个截面成员估计不同的系数,会对每个截面成员估计不同的系数,并使用截面成员识别名后跟一般序列名,中间用并使用截面成员识别名后跟一般序列名,中间用“”连接进行标连接进行标签。签。 (3) Period specific :此栏中输入的变量对此栏中输入的变量对Pool中每个时期的中每个时期的系数不同。系数不同。EViews会对每个时期估计不同的系数,并使用变量名后会对每个
15、时期估计不同的系数,并使用变量名后跟时期,中间用跟时期,中间用“”连接进行标签。连接进行标签。1Kititkkititkyu x二、面板数据模型形式设定检验二、面板数据模型形式设定检验如果从时间上看,不同个体之间不存在显著性差异;从截面上如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(据混合在一起用普通最小二乘法(OLS)估计参数。)估计参数。EViwes估计方法:估计方法:在主窗口中双击已建立的在主窗口中双击已建立的Pool数据库,在数据库,
16、在Pool窗口的工具栏中点击窗口的工具栏中点击Estimate键,打开键,打开Pooled Estimation(混(混合估计)窗口,其选项如下图。合估计)窗口,其选项如下图。 固定效应模型固定效应模型得出如下输出结果得出如下输出结果 相应的表达式是:相应的表达式是:129.630.76ititCPIP(2.0) (79.7) 20.98,4824588rRSSE上式表示上式表示15个省级地区的城镇人均支个省级地区的城镇人均支出平均占收入的出平均占收入的76%。 若要查看方程,在结果输出窗口点若要查看方程,在结果输出窗口点ViewRepresentations。要用。要用模型进行模拟,点模型进
17、行模拟,点procMake Model,在出来的窗口中点,在出来的窗口中点Solve。在结果输出窗口中点击在结果输出窗口中点击View选选Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix功能可以分别得到按个体计功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差序列的相关系数矩阵。序列的相关系数矩阵。个体固定影响变截距模型就是对于不同的个体有不同截距的模个体固定影响变截距模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列
18、(个体)截距是不同的,但是对于不型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定影响模型。定影响模型。EViwes估计方法:估计方法:在在EViwes的的Pooled Estimation对话框中的对话框中的Cross-secti下拉菜单中选中下拉菜单中选中Fixed。把。把c从从Common coefficients窗口窗口中删除,其余选项同上。中删除,其余选项同上。个体固定影响变截距模型个体固定影响变截距模型得出如下输出结果得出如下输出结果 相应的表达式为:相应的
19、表达式为: (6.3) (55) 其中虚拟变量其中虚拟变量 的定义是:的定义是: 15个省级地区的城镇人均指出平均占收入个省级地区的城镇人均指出平均占收入70%。从上面的结果可以看出北京市居民的自。从上面的结果可以看出北京市居民的自发性消费明显高于其他地区。发性消费明显高于其他地区。1215515.60.7036.3537.6. 198.6ititCPIPDDD1215,.,D DD20.99,2270386rRSSE1,1,2,.,150,iiiD如果属于第个个体,其他 固定效应模型分为三种:个体固定效应模型、时点固定效应模型分为三种:个体固定效应模型、时点固定效应模型和个体时点固定效应模型
20、。如果观察得固定效应模型和个体时点固定效应模型。如果观察得数据是对个体固定,则应选择个体固定效用模型。但数据是对个体固定,则应选择个体固定效用模型。但是,我们还需作个体固定效应模型和混合估计模型的是,我们还需作个体固定效应模型和混合估计模型的选择。所以,就要作选择。所以,就要作F值检验。值检验。 相对于混合估计模型来说,是否有必要建立个体固相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过定效应模型可以通过F检验来完成。检验来完成。 假设假设 H0:对于不同横截面模型截距项相同(建立:对于不同横截面模型截距项相同(建立混合估计模型)。混合估计模型)。SSEr 备择假设备择假设 H1
21、:对于不同横截面模型的截距项不同:对于不同横截面模型的截距项不同(建立个体固定效应模型)。(建立个体固定效应模型)。SSEu F统计量定义为:统计量定义为: F=( SSEr - SSEu)/(N+k2)/ SSEu/(NT-N-k) 其中,其中,SSEr,SSEu分别表示约束模型(混分别表示约束模型(混合估计模型的)和非约束模型(个体固定效应模合估计模型的)和非约束模型(个体固定效应模型的)的残差平方和(型的)的残差平方和(Sum squared resid)。)。非约束模型比约束模型多了非约束模型比约束模型多了N1个被估参数。需个被估参数。需要指出的是:当模型中含有要指出的是:当模型中含有
22、k个解释变量时,个解释变量时,F统统计量的分母自由度是计量的分母自由度是NT-N- k。通过对。通过对F统计量统计量我们将可选择准确、最佳的估计模型。我们将可选择准确、最佳的估计模型。 在作回归时也是四步:在作回归时也是四步: 第一步,先作混合效应模型:第一步,先作混合效应模型: 在在cross-section 一栏选择一栏选择None ,Period也是也是None;Weights是是cross-section Weights,然后把回,然后把回归结果的归结果的Sum squared resid值复制出来,就是值复制出来,就是SSEr 第二步:作个体固定效用模型:在第二步:作个体固定效用模型
23、:在cross-section 一栏选择一栏选择Fixed ,Period也是也是None;Weights是是cross-section Weights,然后把回,然后把回归结果的归结果的Sum squared resid值复制出来,就是值复制出来,就是SSEu 第三步:根据公式第三步:根据公式F=( SSEr - SSEu)/(N+k2)/ SSEu/(NT-N-k)。计算出结果。其中,。计算出结果。其中,T为年数,不管我们的数据是为年数,不管我们的数据是unbalance还是还是balance看看observations就行了,也即就行了,也即Total pool (balanced) o
24、bservations:的值,但是如果是的值,但是如果是balance我们也可以计算,也即是每一年的企业数我们也可以计算,也即是每一年的企业数的总和。比如说我们研究的总和。比如说我们研究7年,每一年又年,每一年又15个地区,个地区,则则NT715105。K为解释变量的个数,不含为解释变量的个数,不含被解释变量。被解释变量。 第四步,根据计算出来的结果查第四步,根据计算出来的结果查F值分布表。值分布表。看是否通过检验。检验准则:当看是否通过检验。检验准则:当F F(T-1, NT-T-k) , =0.01,0.05或或0.1时,拒绝原假设,则时,拒绝原假设,则结论是应该建立个体固定效应模型,反之
25、,接受原结论是应该建立个体固定效应模型,反之,接受原假设,则不能建立个体固定效应模型。假设,则不能建立个体固定效应模型。 接下来对本例用接下来对本例用F统计量检验是应该建立混合统计量检验是应该建立混合回归模型,还是个体固定效应回归模型。回归模型,还是个体固定效应回归模型。 : 。模型中不同个体的截距相同。模型中不同个体的截距相同(真实模型为混合回归模型)。(真实模型为混合回归模型)。 :模型中不同个体的截距项不同(真实模:模型中不同个体的截距项不同(真实模型为个体固定效应回归模型)。型为个体固定效应回归模型)。 F统计量定义为:统计量定义为:0Hi1H)/() 1/()()/()() 1/()
26、(kNNTSSENSSESSEkNNTSSEkNNTkNTSSESSEFuuruur 其中其中SSER表示约束模型,即混合估计模型的残表示约束模型,即混合估计模型的残差平方和,差平方和,SSEU表示非约束模型,即个体固定表示非约束模型,即个体固定效应回归模型的残差平方和。非约束模型比约效应回归模型的残差平方和。非约束模型比约束模型多了束模型多了N-1个被估参数。个被估参数。 所以本例中:所以本例中: 所以推翻原假设,建立个体固定效应回归模型所以推翻原假设,建立个体固定效应回归模型更合理。更合理。8 . 1)89,14(16. 7) 115105/(2256339) 115/()22563394
27、797532(05. 0FF当利用面板数据研究拥有充分多个体的总体经济特征时,若利当利用面板数据研究拥有充分多个体的总体经济特征时,若利用总体数据的固定效应模型就会损失巨大的自由度,使得个体截距用总体数据的固定效应模型就会损失巨大的自由度,使得个体截距项的估计不具有有效性。这时可建立个体随机影响变截距模型。其项的估计不具有有效性。这时可建立个体随机影响变截距模型。其Eviews实现见下图。实现见下图。个体随机影响变截距模型个体随机影响变截距模型运行结果得运行结果得 相应的表达式是: 其中虚拟变量 的定义是:15218 .10536798. 272. 09 .345DDDIPPCitit2959
28、952,98. 02SSER1215,.,D DD1,0,iD如果属于第i个个体,i=1,2,.,15其他 固定效应模型和随机效应模型的设定检验固定效应模型和随机效应模型的设定检验-hausman检验检验 众所周知,在回归模型众所周知,在回归模型 满足基本假设时,回归系数的满足基本假设时,回归系数的ols估计量是估计量是BLUE估估计,但是,当模型不满足计,但是,当模型不满足“正交性假设正交性假设” 时,时, 的的OLS估计量不再是无偏的。同时,当模型估计量不再是无偏的。同时,当模型不满足不满足“同方差性假设同方差性假设” 时,时, 的的OLS估计量不是有效的。估计量不是有效的。tttuXY0
29、)|(ttXuEIXuVartt2)|( 对于面板数据模型 令 如果不能满足回归假设 则个体随机效应模型系数的GLS估计量 是有偏的和非一致的。但是正交性并不影响个体固定效应模型系数的估计量 的性质,于是可以通过检验模型误差项与解释变量的正交性来解决面板数据回归模型设定问题。Kkittikitkitwvuxy21ittiitwvu0)|(ititXEGLS 检验假设 显然,在拒绝零假设时,模型设定为固定应模型是可行的;否则,如果不能拒绝零假设时,模型应设定为随机效应模型。0)|(:0)|(:10ititititXEHXEH 接下来利用接下来利用Hausman统计量检验应该建统计量检验应该建立个
30、体随机效应回归模型还是个体固定立个体随机效应回归模型还是个体固定效应回归模型。效应回归模型。 :个体效应与回归变量(:个体效应与回归变量( )无关)无关(个体随机效应回归模型)(个体随机效应回归模型) :个体效应与回归变量(:个体效应与回归变量( )相关)相关(个体固定效应回归模型)(个体固定效应回归模型)0H1HitIPitIP分析过程如下分析过程如下 由检验输出结果的上半部分可以看出,由检验输出结果的上半部分可以看出,Hausman统计量的值是统计量的值是14.75,相对应的概率是,相对应的概率是0.0001,即拒,即拒接原假设,应该建立个体固定效应模型。接原假设,应该建立个体固定效应模型
31、。 检验结果的下半部分是检验结果的下半部分是Hausman检验中间结果比检验中间结果比较。个体固定效应模型对参数的估计值为较。个体固定效应模型对参数的估计值为0.697648,随机效应模型对参数的估计值为随机效应模型对参数的估计值为0.724528。两个参。两个参数的估计量的分布方差的差为数的估计量的分布方差的差为0.000049。 综上分析,综上分析,19962002年中国东北、华北、华年中国东北、华北、华东东15个省级地区的居民家庭人均消费和人金收入问题个省级地区的居民家庭人均消费和人金收入问题应该建立个体固定效应回归模型。人均消费平均占人应该建立个体固定效应回归模型。人均消费平均占人均收入的均收入的70%。随地区不同,自发消费(截距项)存。随地区不同,自发消费(截距项)存在显著性差异。在显著性差异。