《课件-用stata做面板数据回归.ppt》由会员分享,可在线阅读,更多相关《课件-用stata做面板数据回归.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、用Stata做面板数据回归Stata与其他计量软件比较面板数据的设定短面板长面板面板回归与空间计量目 录Stata与其他计量软件比较SPSSSASEviewsStataStata与其他计量软件比较SPSS界面人性化,基本如Excel,很容易上手数据文件最多4096个变量强于统计分析,如方差分析,没有稳健方法,弱于计量分析,缺乏调查数据分析程序较大,属于统计软件而非真正的计量软件大块头,小智慧!Stata与其他计量软件比较SAS功能强大,可编程,很受高级用户欢迎可同时处理多个数据文件,处理变量多达32768个,可画出你想要的任何数据分析图强于方差分析、混合模型分析和多变量分析,弱于有序和Logi
2、stic分析、稳健方法和调查数据分析(泊松等分布)最难掌握!原因:(1)SAS需要自己编制程序来处理和分析数据(2)改正出错程序比较困难程序占用磁盘非常大,一般2-3G大块头,大智慧!Stata与其他计量软件比较Eviews界面不够人性化,使用前最好熟悉每个命令操作的程序语言数据处理能力较弱强于时间序列分析,但其它回归分析(如面板数据等)、数据处理、统计分析较弱软件小,对内存要求也不高小块头,小智慧!Stata与其他计量软件比较Stata简单易懂、界面像Excel,操作多样化(即可编程,也可鼠标操作)数据管理能力弱于SAS,一次主要用于一个数据文件,可处理的单个数据文件受内存大小影响,可处理变
3、量达32768个强于回归分析、Logistic分析和调查数据分析,弱于方差分析和多变量分析作图功能强大程序所需磁盘空间小,一两百兆。还有免安装版本,使用极为方便小块头,大智慧!Stata与其他计量软件比较软件软件SPSSSASEviewsStata操作难易程度界面人性化最难掌握界面不够人性化简单易懂数据处理能力数据处理能力较弱,最多处理4096个变量可同时处理多个数据文件,处理变量多达32768个,可画出你想要的任何数据分析图数据处理能力较弱主要用于一个数据文件,可处理变量达32768个,作图功能强大强项统计分析,如方差分析方差分析、混合模型分析和多变量分析强于时间序列分析回归分析、Logis
4、tic分析和调查数据分析弱项计量分析,调查数据分析有序和Logistic分析、稳健方法和调查数据分析回归分析(如面板数据等)、数据处理、统计分析方差分析和多变量分析程序大小程序较大程序占用磁盘非常大软件小程序所需磁盘空间小面板数据的设定xtset pvar tvar#设定面板数据encode x1,gen(x2)#将字符型变量编码为数字型变量xtdes#显示面板数据结构xtsum#显示组内、组间与整体的统计指标xttab var#显示组内、组间与整体的分布频率xtline var(overlay)#显示每个个体的时序图短面板混合回归固定效应随机效应Hausman检验短面板回归基本步骤短面板短面
5、板回归基本步骤(1)导入并设定为面板数据。(2)做固定效应模型,并报告聚类稳健标准误与普通标准误。(3)做随机效应模型,并报告聚类稳健标准误与普通标准误。(4)比较两个模型的聚类稳健标准误与普通标准误是否相差较大,并决定采取是否使用辅助回归的Hausman检验。若相差较大则采用辅助回归的Hausman检验,若相差不大则采用传统Hausman检验。(5)通过Hausman检验,决定采用固定效应模型还是随机效应模型。(6)报告并分析结果。短面板混合回归reg y x1 x2 x3,vce(cluster id)#以“id”为聚类变量的聚类稳健标准误短面板固定效应(1)组内估计法(FE)xtreg
6、y x1 x2 x3,fe r#r表示聚类稳健标准误(2)LSDV法reg y x1 x2 x3 i.id,r#r表示聚类稳健标准误短面板固定效应(3)一阶差分法(FD)xtserial fatal beertax spircons unrate perinck,output(4)双向固定效应(时间个体固定效应)tab year,gen(year)#定义年度虚拟变量xtreg fatal beertax spircons unrate perinck year2 year3 year4 year5 year6 year7,fe rtest year2 year3 year4 year5 yea
7、r6 year7#检验年度虚拟变量联合显著性xtreg fatal beertax spircons unrate perinck i.year,fe r#直接估计双向固定效应模型,不必生成时间序列。短面板随机效应xtreg y x1 x2 x3,re r theta#随机效应FGLS,theta表示估计随机效应值xtreg y x1 x2 x3,mle#随机效应MLExttest0#LM检验,检验是否存在反应个体特性的随机扰动项ui短面板Hausman检验传统Hausman检验xtreg y x1 x2 x3,fe#(固定效应估计)estimates store FE#(储存结果)xtreg
8、 y x1 x2 x3,re#(随机效应估计)estimates store RE#(储存结果)hausman FE RE,constant sigmamore#(Hausman检验)如果聚类稳健标准误与普通标准误相差较大,则传统如果聚类稳健标准误与普通标准误相差较大,则传统Hausman检验不适用。检验不适用。短面板Hausman检验辅助回归法quietly xtreg y x1 x2 x3,rescalar theta=e(theta)global yandxforhausman y x1 x2 x3sort idby id:egen meany=mean(y)gen mdy=y-mean
9、ygen redy=y-theta*meanyby id:egen meanx1=mean(x1)gen mdx1=x1-meanx1gen redx1=x1-theta*meanx1by id:egen meanx2=mean(x2)gen mdx2=x2-meanx2gen redx2=x2-theta*meanx2by id:egen meanx3=mean(x3)gen mdx3=x3-meanx3gen redx3=x3-theta*meanx3quietly reg redy redx1 redx2 redx3 mdx1 mdx2 mdx3,vce(cluster id)test
10、mdx1 mdx2 mdx3短面板Hausman检验辅助回归法(非官方命令)ssc install xtoverid#下载安装xtoveridquietly xtreg y x1 x2 x3,re rxtoverid长面板长面板的估计策略面板校正标准误(PCSE)仅解决组内自相关的FGLS全面FGLS组间异方差的检验组内自相关的检验组间同期相关的检验变系数模型长面板长面板的估计策略(1)组间异方差:个体i的扰动项方差为i2,若i2j2(ij),则it存在“组间异方差”。(2)组内自相关:若Cov(it,is)0(ts,i),则it存在“组内自相关”。(3)组间同期相关:若Cov(it,jt)0
11、(ij,t),则it存在“组间同期相关”或“截面相关”。比如,对于省级数据,相邻省份之间的同期经济活动可能通过贸易或投资等相互影响。解决方法:(1)使用LSDV估计系数,对标准误差进行校正。(2)对异方差或自相关具体形式进行假设,然后使用可行广义最小二乘法(FGLS)进行估计。长面板长面板的基本步骤(1)检验面板数据是否存在组间异方差、组内自相关和组间同期相关问题(2)结合检验结果考虑选用面板校正标准误(PCSE)模型、仅解决组内自相关的FGLS模型和全面FGLS模型三种模型的哪一种(3)检验并判断是否采用变系数模型(4)综合上述判断结果选择最终模型(5)报告并分析结果。长面板面板校正标准误(
12、PCSE)xtpcse y x1 x2 x3,hetonly#hetonly表示存在组间异方差,但不存在组间同期相关;默认为既存在组间异方差,又存在组间同期相关。长面板仅解决组内自相关的FGLSxtpcse y x1 x2 x3,corr(ar1)corr(psar1)#corr(ar1)对应i=,适用于T并不比n大很多的情形;#corr(psar1)允许每个面板有自己的i,适用于T比n大很多的情形。长面板全面FGLS全面FGLS同时考虑组间异方差、组内自相关和组间同期相关三个因素。估计过程为:(1)进行OLS回归(2)用OLS回归残差eit来估计it的协方差矩阵。(3)进行FGLS估计。或者
13、进行迭代FDLS估计,及使用FGLS的残差在竞选FGLS估计,不断迭代直至收敛。长面板全面FGLSxtgls y x1 x2 x3,panels(option)corr(option)igls#panels(iid)假定不同个体的扰动项独立同分布#panels(het)假定不同个体的扰动项相互独立但方差可以不同#panels(cor)假定不同个体的扰动项同期相关且有不同的方差#corr(ar1)对应i=的组内自相关情形#corr(psar1)允许每个面板有自己的自回归系数i#igls 表示使用迭代式FGLS#“OLS+面板校正标准误差”最稳健,全面FGLS最有效率,进解决组内自相关的FGLS介
14、于两者之间。使用何种FGLS估计,取决于对组间异方差、组内自相关与组间同期相关的检验。长面板组间异方差的检验沃尔德检验ssc install xttest3quietly xtreg y x1 x2 x3,r fe#xtest3只能在“xtreg,fe”或“xtgls”之后才能使用xttest3quietly xtgls y x1 x2 x3xttest3长面板组内自相关的检验net install st0039 或者 findit xtserial#下载安装xtserialxtserial y x1 x2 x3,output#output表示显示一阶差分回归结果长面板组间同期相关的检验LM检
15、验(仅适用于长面板)ssc install xttest2quietly xtreg y x1 x2 x3,fe#xtest3只能在“xtreg,fe”,“xtgls”或“ivreg2”之后才能使用xttest2xtcsd检验(长面板、短面板)ssc install xtcsd#只能在xtreg之后才能使用xtcsd,pesaran abs show#(Pesaran(2004)的检验,统计量服从标准正态分布)xtcsd,friedman abs show#(Friedman(1937)的检验,统计量服从2分布)xtcsd,frees abs show#(Frees(1995,2004)的检验
16、)#show表示显示残差的相关系数矩阵#abs表示显示该矩阵非主对角线元素的绝对值之平均长面板变系数模型变系数模型可分为将“可变系数”视为常数和随机变量两种。(1)将可变系数视为常数部分变系数模型:引入个体虚拟变量以及虚拟变量与变系数解释变量xit的交互项reg y x1 x2 x3 i.id i.id#c.x1 t,vce(cluster id)#(c表明x1为连续性变量)(2)随机系数模型xtrc y x1 x2 x3,betas#betas表示显示对每组系数的估计。同时提供了参数稳定性检验面板回归与空间计量面板回归相对于截面数据,面板数据考虑了截面数据的共性,又能分析截面数据个体异质性面板数据通常建立混合模型、固定效应模型和随机效应模型,这三类模型均假设个体(地区或机构)之间相互独立,且不存在时间序列相关如果模型变量之间存在空间效应,则模型就不服从普通面板计量分析的基本假定。此时需要进一步考虑空间效应空间计量在面板模型中引入空间滞后因子,即可建立空间面板模型的一般设定形式。常见的空间面板模型:空间混合模型、空间个体效应模型、空间固定效应模型、空间随机效应模型、空间动态面板模型和空间似不相关模型