《2022年stata命令大全.docx》由会员分享,可在线阅读,更多相关《2022年stata命令大全.docx(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -*面板数据计量分析与软件实现* 说明:以下 do文件相当一部分内容来自于中山高校连玉君 *-面板数据模型 * 1. 静态面板模型:FE 和RE STATA教程,感谢他的奉献;本人做了肯定的修改与挑选; * 2. 模型挑选: FE vs POLS, RE vs POLS, FE vs RE ( pols 混合最小二乘估量) * 3. 异方差、序列相关和截面相关检验 * 4. 动态面板模型(DID-GMM,SYS-GMM * 5. 面板随机前沿模型 * 6. 面板协整分析(FMOLS,DOLS)* 说明: 1-5
2、 均用 STATA软件实现, 6 用GAUSS软件实现; * 生产效率分析(特别指 TFP): 数据包络分析(DEA)与随机前沿分析(SFA)* 说明: DEA由DEAP2.1软件实现, SFA由Frontier4.1 实现,特别后者,侧重于比较 C-D与Translog 生产函数,一步法与两步法的区分;常应用于地区经济差异、FDI溢出效应( Spillovers Effect)、工业行业效率状况等; * 空间计量分析:SLM模型与 SEM模型* 说明: STATA与Matlab 结合使用 ;常应用于空间溢出效应(* - * -一、常用的数据处理与作图- * - * 指定面板格式xtset i
3、d year (id 为截面名称, year 为时间名称) xtdes /* 数据特点 */ xtsum logy h /* 数据统计特点 */ sum logy h /* 数据统计特点 */ * 添加标签或更换变量名label var h 人力资本 rename h hum * 排序sort id year /*是以 STATA面板数据格式显现*/ sort year id /*是以 DEA格式显现 */ * 删除个别年份或省份drop if year宽数据 reshape wide logy,iid jyear 细心整理归纳 精选学习资料 - - - - - - - - - - - - -
4、 - - 第 1 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -* 宽长数据 reshape logy,iid jyear * 追加数据(用于面板数据和时间序列)xtset id year * 或者 xtdes tsappend,add5 /表示在每个省份再追加5年,用于面板数据/ tsset * 或者 tsdes .tsappend,add8 /表示追加 8年,用于时间序列/ Y=X+Z,求方差 varY,协方差 CovX,Y 和Cov(Z,Y )* 方差分解,比如三个变量Y,X,Z 都是面板格式的
5、数据,且满意bysort year:corr Y X Z,cov * 生产虚拟变量 * 生成年份虚拟变量 tab year,genyr * 生成省份虚拟变量 tab id,gendum * 生成滞后项和差分项 xtset id year gen ylag=l.y /*产生一阶滞后项 ,同样可产生二阶滞后项*/ gen ylag2=L2.y gen dy=D.y /* 产生差分项 */ * 求出各省 2000年以前的 open inv 的平均增长率 collapse mean open inv if year2000,byid 变量排序,当变量太多,按规律排列;可用命令aorder 或者 ord
6、er fdi open insti *- * 二、静态面板模型*- * 面板数据的结构 兼具截面资料和时间序列资料的特点 use product.dta, clear browse xtset id year xtdes * - * - 固定效应模型 - - * - * 实质上就是在传统的线性回来模型中加入 N-1 个虚拟变量,* 使得每个截面都有自己的截距项,* 截距项的不同反映了个体的某些不随时间转变的特点 * * 例如: lny = a_i + b1*lnK + b2*lnL + e_it * 考虑中国 29个省份的 C-D生产函数 *-画图 -* * 散点图 +线性拟合直线 twowa
7、y scatter logy h lfit logy h 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 2 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -* 散点图 +二次拟合曲线 twoway scatter logy h qfit logy h * 散点图 +线性拟合直线 +置信区间 twoway scatter logy h lfit logy h lfitci logy h * 按不同个体画出散点图和拟合线,可以以做出fe vs re的初判定 *
8、logy h if id=1 lfit logy h if id=2 lfit twoway scatter logy h if id4 lfit logy h if id4 lfit logy h if id=3 * 按不同个体画散点图 ,so beautiful.* graph twoway scatter logy h if id=1 | scatter logy h if id=2,msymbolSh | scatter logy h if id=3,msymbolT | scatter logy h if id=4,msymbold | , legendposition11 ring
9、0 label1 北京 label2 天津 label3 河北 label4 山西 * 每个省份 logy 与h的散点图,并将各个图形合并 twoway scatter logy h,byid ylabel,format%3.0f xlabel,format%3.0f * 每个个体的时间趋势图 * xtline h if id R-sq: within 模型 2 对应的 R2,是一个真正意义上的R2 * - R-sq: between corrxm_i*b_w,ym_i2 * - R-sq: overall corrx_it*b_w,y_it2 * *- F4,373 = 855.93 检验除
10、常数项外其他说明变量的联合显著性 * *- corru_i, Xb = -0.2347 * *- sigma_u, sigma_e, rho * rho = sigma_u2 / sigma_u2 + sigma_e2 dis esigma_u2 / esigma_u2 + esigma_e2 * * 个体效应是否显著? * F28, 373 = 338.86 H0: a1 = a2 = a3 = a4 = a29 * Prob F = 0.0000 说明,固定效应高度显著 *-如何得到调整后的 R2, 即 adj-R2 ?ereturn list reg logy h inv gov ope
11、n dum* *-拟合值和残差 * y_it = u_i + x_it*b + e_it * predict newvar, option /* xb xb, fitted values; the default stdp calculate standard error of the fitted values ue u_i + e_it, the combined residual xbu xb + u_i, prediction including effect 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 4 页,共 18 页 - - -
12、- - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - - u u_i, the fixed- or random-error component e e_it, the overall error component */ xtreg logy logk logl, fe predict y_hat predict a , u predict res,e predict cres, ue gen ares = a + res list ares cres in 1/10 * - * - 随机效应模型 - * - * y_it = x_it*
13、b + a_i + u_it * = x_it*b + v_it * 基本思想:将随机干扰项分成两种* 一种是不随时间转变的,即个体效应 a_i u_it * 另一种是随时间转变的,即通常意义上的干扰项* 估量方法: FGLS * Varv_it = sigma_a2 + sigma_u2 * Covv_it,v_is = sigma_a2 * Covv_it,v_js = 0 * 利用 Pooled OLS ,Within Estimator, Between Estimator * 可以估量出 sigma_a2 和sigma_u2, 进而采纳 GLS或FGLS * Re 估量量是 Fe估量
14、量和 Be估量量的加权平均 * yr_it = y_it - theta*ym_i * xr_it = x_it - theta*xm_i * theta = 1 - sigma_u / sqrtT*sigma_a2 + sigma_u2 * 解读 xtreg,re 的估量结果 use product.dta, clear xtreg logy logk logl, re *- R2 * - R-sq: within corrx_it-xm_i*b_r, y_it-ym_i2 * - R-sq: between corrxm_i*b_r,ym_i2 * - R-sq: overall corr
15、x_it*b_r,y_it2 * 上述 R2都不是真正意义上的R2,由于 Re模型采纳的是GLS估量; * * rho = sigma_u2 / sigma_u2 + sigma_e2 dis esigma_u2 / esigma_u2 + esigma_e2 * * corru_i, X = 0 assumed * 这是随机效应模型的一个最重要,也限制该模型应用的一个重要假设 * 然而,采纳固定效应模型,我们可以粗略估量出 corru_i, X xtreg market invest stock, fe * * Wald chi22 = 10962.50 Prob chi2 = 0.0000
16、 *- 时间效应、模型的挑选和常见问题* 7.2.1 时间效应(双向固定 随机 效应模型)* 7.2.2 模型的挑选 * 7.2.3 面板数据常见问题 * 7.2.4 面板数据的转换 * - 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 5 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -* -时间效应 - * - * 单向固定效应模型 * y_it = u_i + x_it*b + e_it * 双向固定效应模型 * y_it = u_i + f_t +
17、x_it*b + e_it qui tab year, genyr drop yr1 xtreg logy logk logl yr*, fe * 随机效应模型中的时间效应 xtreg logy logk logl yr*, fe * - * - 模型的挑选 - * - * 固定效应模型仍是 Pooled OLS ? xtreg logy logk logl yr*, fe /*Wald 检验 */ qui tab id, gendum /*LR 检验 */ reg logy logk logl /*POLS*/ est store m_ols reg logy logk logl dum*,
18、nocons est store m_fe lrtest m_ols m_fe est table m_*, b%6.3f star0.1 0.05 0.01 * RE vs Pooled OLS? * H0: Varu = 0 * 方法一: B-P 检验 xtreg logy logk logl, re xttest0 * FE vs RE. * y_it = u_i + x_it*b + e_it *- Hausman 检验 - * 基本思想:假如 Corru_i,x_it = 0, Fe 和 Re 都是一样的,但 Re更有效 * 假如 Corru_i,x_it.= 0, Fe 仍旧有效,
19、但 Re是有偏的 * 基本步骤 * 情形 1:huasman为正数 xtreg logy logk logl, fe est store m_fe xtreg logy logk logl, re est store m_re hausman m_fe m_re * 情形 2: qui xtreg logy h inv gov open,fe est store fe qui xtreg logy h inv gov open,re 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 6 页,共 18 页 - - - - - - - - - 名师归纳总结
20、 精品学习资料 - - - - - - - - - - - - - - - est store re hausman fe re * Hausman 检验值为负怎么办? Corrx,u_i=0 无法得到满意 * 通常是由于 RE模型的基本假设Fe模型的 * 检验过程中两个模型的方差- 协方差矩阵都采纳 hausman fe re, sigmaless * 两个模型的方差- 协方差矩阵都采纳Re模型的 hausman fe re, sigmamore *= 为何有些变量会被 drop 掉? use nlswork.dta, clear tsset idcode year xtreg ln_wag
21、e hours tenure ttl_exp, fe /* 正常执行 */ * 产生种族虚拟变量 tab race, gendum_race xtreg ln_wage hours tenure ttl_exp dum_race2 dum_race3, fe * 为何 dum_race2 和 dum_race3 会被 dropped . * 固定效应模型的设定:y_it = u_i + x_it*b + e_it 1 * 由于个体效应 u_i 不随时间转变, * 因此如 x_it 包含了任何不随时间转变的变量, * 都会与 u_i 构成多重共线性,Stata 会自动删除之;* 异方差、序列相关
22、和截面相关问题- 简 介 - * y_it = x_it*b + u_i + e_it * * 由于面板数据同时兼顾了截面数据和时间序列的特点,* 所以异方差和序列相关必定会存在于面板数据中;* 同时,由于面板数据中每个截面(公司、个人、国家、地区)之间仍可能存在内在的联系,* 所以,截面相关性也是一个需要考虑的问题;* * 此前的分析依靠三个假设条件:* (1) Vare_it = sigma2 同方差假设* 2 Corre_it, e_it-s = 0 序列无关假设* 3 Corre_it, e_jt = 0 截面不相关假设* * 当这三个假设无法得到满意时,便分别显现 异方差、序列相关和
23、截面相关问题;* 我们一方面要采纳各种方法来检验这些假设是否得到了满意;* 另一方面,也要在这些假设无法满意时寻求合理的估量方法;* - 假设检验 - *= 组间异方差检验(截面数据的特点) * Vare_i = sigma_i2 * Fe 模型 xtreg logy logk logl, fe xttest3 * Re 模型sigma_u2 上本身已经较大程度的考虑了异方差问题,主要表达在 * Re*= 序 列相关检验 * Fe 模型,如无序列相关,就一阶差分后残差相关系数应为-0.5 * xtserial Wooldridge2002 xtserial logy logk logl 细心整
24、理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 7 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - - xtserial logy logk logl, output * Re 模型 xtreg logy logk logl, re xttest1 /*供应多个统计检验量*/ *= 截面相关检验 * xttest2命令 H0: 全部截面残差的相关系数都相等 xtreg logy logk logl, fe xttest2 * 由于检验过程中执行了SUE估量,所以要求T
25、N xtreg logy logk logl if id6, fe xttest2 * xtcsd 命令(供应了三种检验方法) xtreg logy logk logl, fe xtcsd , pesaran /*Pesaran2004*/ xtcsd , friedman /*Friedman1937*/ xtreg logy logk logl, re xtcsd , pesaran *= 异方差稳健型估量* - - 估量方法 - xtreg logy h inv gov open, fe robust est store fe_rb xtreg logy h inv gov open,
26、fe robust est store fe * 结果对比 esttab fe_rb fe, b%6.3f se%6.3f mtitlefe_rb fe *= 序列相关估量 * 一阶自相关 xtregar, fe/re * 模型: y_it = u_i + x_it*b + v_it 1 * v_it = rho*v_it-1 + z_it 2 xtregar logy h inv gov open, fe est store fe_ar1 xtregar logy h inv gov open,fe lbi /*Baltagi-Wu LBI test*/ * 说明: * 1 这里的 Durb
27、in-Watson =1.280677 具有较为复杂的分布, * 不同于时间序列中的 D-W统计量; * 2 其临界值见 Bhargava et al. 1982, The Review of Economic Studies 49:553-549 * 3 Baltagi-Wu LBI = 1.4739834 基本上没有太大的参考价值, * 由于他们并未供应临界值表,而该统计量的分布又相当复杂 xtregar logy h inv gov open, re est store re_ar1 * 两阶段估量 xtregar logy h inv gov open, fe twostep est
28、store fe_ar1_two * 结果对比 xtreg logy h inv gov open, fe est store fe local models fe fe_ar1 re_ar1 fe_ar1_two esttab models, b%6.3f se%6.3f mtitlemodels r2 scar2_w corr 细心整理归纳 精选学习资料 - - - - - - - - - - - - - - - 第 8 页,共 18 页 - - - - - - - - - 名师归纳总结 精品学习资料 - - - - - - - - - - - - - - -* 高阶自相关 * newey
29、2 命令 newey2 logy h inv gov open, lag2 *= 组间相关(截面相关) * cluster 选项 use xtcs.dta, clear xtreg logy h inv gov open, fe clusterid est store fe_cluster xtreg logy h inv gov open, re clusterid est store re_cluster *看过去很晕,采纳一种综合处理:简介( Greene, 2000, chp15)* xtgls 命令* xtpcse 命令*- * * 模型 * y = X*b + U * 重点在于考虑
30、干扰项 U 的结构,包括 * 1 异方差 2 序列相关 3 截面相关性 * 应用范畴:多用于“ 大T,小 N”型面板数据, * 由于,此时截面的异质性并不是重点关注的,而时序特点就较为明显 * 因此,模型设定中未考虑个体成效*- 估量和检验 - *= xtgls 命令 use invest2.dta, clear xtgls market invest stock, panelsiid /*iid, 等同于 Pooled OLS*/ est store g_0 reg market invest stock est store g_ols xtgls market invest stock,
31、panelhet /* 截面异方差 */ est store g_phet xtgls market invest stock, corrar1 /*全部截面具有相同的自相关系数*/ est store g_par1 xtgls market invest stock, corrpsar1 /*每个截面有自己的自相关系数*/ est store g_psar1 xtgls market invest stock, panelcorr /*截面间相关且异方差*/ est store g_pcorr xtgls market invest stock, pc corrar1 est store g
32、_all * 检验异方差 xtgls market invest stock, panelhet /* 截面异方差 */ xttest3 * 检验序列相关 xtserial market invest stock * 检验截面相关 xtgls market invest stock, panelhet xttest2 * 结果对比 xtreg market invest stock, fe est store fe local models fe g_0 g_ols esttab models, b%6.3f se%6.3f mtitlemodels r2 scar2_w local models fe g_phet g_par1 g_psar1 g_pcorr g_all esttab models, b%6.3f se%6.3f mtitlemodels r2 scar2_w compress