《教学课件第6章 面板数据分析.pptx》由会员分享,可在线阅读,更多相关《教学课件第6章 面板数据分析.pptx(72页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、教材配套资源页完整PPT课件教学课件第6章 面板数据分析1配套教材:毛新述编著,2022,实证研究方法论Stata应用,中国人民大学出版社2面板数据分析概述线性面板数据模型与Stata实现动态面板数据的广义矩方法非线性面板数据模型与Stata实现利用面板数据做项目评价与政策分析与Stata实现31.什么是面版数据?什么是面板模型分析? 面板数据,也译为纵列数据,是指由横截面数据集中每个数据的一个时间序列组成。对100家上市公司连续收集10年的数据。 面板数据又分为两种类型:平衡(balanced)和非平衡(unbalanced)面板数据。 现代计量经济学软件都可以轻松对这两种数据进行处理。但是
2、,关注非平衡面板数据出现的原因仍然很重要(上市公司的兼并破产,导致原有公司不存在),这会导致复杂的计量经济学问题(sample selection, attrition)。4 面板模型分析是指采用专门的方法对面板数据进行处理的分析方法。 面板模型主要包括固定效应模型(fixed-effect model)和随机效应模型(random-effect model)。 注意:用面板数据进行分析不一定是面板模型分析。我们可以使用OLS对面板数据进行分析,即通常所说的混合数据分析。5使用面板数据的最主要原因是解决遗漏变量问题。yt=0+xt+c+ut 比如,在我们研究上市公司的公司治理、会计和财务问题时
3、,有很多不随时间变化(time-constant)的因素我们无法观测,如管理的质量或结构(managerial quality or structure)。 这些因素可能和解释变量相关,也可能与解释变量不相关。但由于在不同的年度中,这些因素的影响都存在,因此将这些因素包括在扰动项中总体来说会导致序列相关。6使用面板数据的第二个原因是可以增大样本量。降低估计量的标准误,自由度n-k,ssqrt(ee/(n-k)使用面板数据还有助于正确理解变量之间的关系(产出、规模和技术进步),可以度量难以度量的因素(地理差异) Hsiao(1985,1986)等列出了使用面板数据的好处7对于横截面观测值i,t期
4、的面板数据模型通常为:8对于情形1,在横截面上无个体影响、无结构变化对于情形2,称为变截距模型,在横截面上个体影响不同,个体影响表现为模型中被忽略的反映个体差异的变量的影响,又分为固定效应模型和随机效应模型两种情况。9 (a)如果这些未观察到的效应ai同解释变量xit相关,通常的OLS估计会导致非一致性。 解决方法:通常采用去处均值(de-meaning)或固定效应(fixed effect)和一阶差分(first difference)来消除不随时间变化的未观察效应,从而获得一致估计。 (b)如果与解释变量无关,但序列相关,不会影响一致性,但会影响有效性。 解决方法:通常采用FGLS来获得更
5、有效率的估计(即随机效应分析,random-effect)10对于情形3,称为变系数模型,除了存在个体影响外,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位上是不同的。11如果在横截面上无个体影响、无结构变化,扰动项uit服从独立同分布假定,而且和解释变量不相关,那么普通最小二乘估计给出了和的一致有效估计。 如果仅在横截面单位存在异方差,最简单的方法是仍然通过使用异方差稳健标准误(heteroscedasticity-robust standard error)来控制异方差的影响。 如果样本观测值可以分为不同的“群或聚类”(clusters),在同一“群”里的观测值互相相关,而不
6、同“群”之间的观测值不相关,这种样本称为“群/聚类样本”(cluster sample)。为了控制组间异方差以及群问题的影响,在统计推断中应采用群稳健标准误(cluster-robust standard error),或者采用GLS估计。12在Stata中,可以在reg命令后加robust、cluster选项来控制异方差和群问题的影响。可以通过下载非官方命令xttest3、xtserial、xtcsd/ xttest2来检验面板数据是否存在组间异方差、组内自相关、组间同期相关问题。可以使用xtgls来进行广义最小二乘估计。13在模型(6-1)中,如果个体固定效应ai和解释变量xit相关,那么
7、OLS和GLS都将失效。一种方法是采用一阶差分(适用两期或多期数据),去除模型(6-1)中的固定效应,由此得到的估计量为一阶差分估计量(first- differenced estimator,FD估计量)。14另一种方法是使用固定效应变换(fixed effects transformation),又称组内估计量(within estimator),来消除个体效应的影响。这种基于去除时间均值变量的混合OLS估计量被称为固定效应估计量(fixed effects estimator)或组内估计量(within estimator)。15 当T=2时,FD和FE的估计值及其全部检验统计量都完全一
8、样,故可随便选用一种。 当T3时,FE和FD估计量便不相同。 当uit无序列相关时,固定效应法比一阶差分更有效。反之一阶差分更有效。 当T很大时,尤其是当N还不是很大时(比如,N=20而T=30),使用固定效应估计量必须保持警惕。 存在差异,同时报告两种方法的结果也讲的通在固定效应模型中,同样需要群-稳健标准误来控制异方差和群问题的影响。16在模型(6-1)中,如果个体效应i和解释变量xit不相关,那么使用FE和FD消去i的变换则导致了非有效估计量。 第一,OLS虽得到参数的一致估计,但标准误差被低估。 第二,OLS估计不如可行的广义最小二乘估计有效。在随机效应模型中,同样需要群-稳健标准误来
9、控制异方差和群问题的影响。17在Stata中,可以采用xtreg命令进行固定效应和随机效应模型估计。选项fe表示固定效应估计,选项re表示随机效应估计。固定效应模型(Fixed-effects (FE) model)xtreg depvar indepvars if in weight , fe FE_options随机效应模型(GLS random-effects (RE) model)xtreg depvar indepvars if in , re RE_options在Stata中,可以使用reg命令和areg命令进行最小二乘虚拟变量回归(LSDV),以获得固定效应模型相同的结果。使用
10、非官方的Stata命令reghdfe,能方便地估计双向固定效应(选项absorb(FE1=idcode FE2=year))和双向cluster效应(选项cluster(idcode year))。ssc install reghdfe18对于长面板数据(大T),如果样本容量大,除了可以让每个个体拥有自己的截距项或时间趋势项外,还可以允许每个个体的回归方程斜率也不同,这被称为“变系数模型”。“变系数模型”可分为两大类 将“可变系数视为常数 将“可变系数”视为随机变量(随机系数模型)。 在Stata中,可以采用xtrc命令进行随机系数模型估计。命令为: xtrc y xl x2 x3,betas
11、 其中,选择项“betas”表示,显示对每组系数的估计。191混合横截面模型还是固定效应模型:F检验 如果不同个体的截距项都相同,表明应当采用混合横截面模型。拒绝零假设,表示固定效应模型更好。2混合横截面模型还是随机效应模型:Breusch-Pagan检验 如果没有个体效应,那么OLS是最佳线性无偏估计(BLUE)。拒绝零假设,表示随机效应模型更好。3随机效应还是固定效应:Hausman检验 拒绝零假设,表示固定效应模型更好。201.混合横截面模型还是固定效应模型 在Stata中,执行固定效应模型(xtreg y x,fe)估计后,自动会报告固定效应的F检验值,如果拒绝原假设,表明应当采用固定
12、效应模型。2.混合横截面模型还是随机效应模型 在Stata中,xttest0执行拉格朗日乘数检验(又称为Breusch-Pagan检验,BP test), 检验应采用混合横截面模型还是随机效应模型。如果拒绝原假设,则表明随机效应模型更好。3.固定效应模型还是随机效应模型 hausman命令用来检验应选择固定效应模型还是随机效应模型。拒绝零假设,FE更好21虽然面板数据能在一定程度上解决遗漏变量(个体异质性)问题,但如果回归模型本身包含内生解释变量(endogenous regressors),则仍需使用工具变量法。实际操作通常分为两步: 首先对模型进行变换以解决遗漏变量问题(比如,使用固定效应
13、模型FE或一阶差分法FD), 然后对变换后的模型使用二阶段最小二乘法(2SLS)。当然,如果认为不存在遗漏变量问题,则可省略第一步。221.对固定效应模型先进行离差变换,再使用工具变量法2.对固定效应模型先进行一阶差分,再使用工具变量法3.对随机效应模型使用工具变量法 此时,可以先对随机效应模型进行FGLS变换,然后对变换后的模型进行2SLS回归。4.对面板数据模型采用GMM估计 当工具变量个数多于内生解释变量个数时,对面板数据进行GMM估计会更有效率。23在Stata中,可以使用xtivreg或非官方的xtivreg2进行面板数据模型的工具变量估计。xtivreg y varlistl(va
14、rlist2 = varlist_iv),option其中,“varlistl”为外生解释变量,“varlist2”为内生解释变量,而“ varlist_iv”为工具变量。选择项(opition)“fe”表示组内估计法,即对固定效应模型先进行离差变换,再使用工具变量法。选择项(opition)“fd”表示一阶差分法,即对固定效应模型先进行一阶差分,再使用工具变量法。选择项(opition)“re”表示“随机效应”模型,即对随机效应模型使用工具变量法。“vce(robust)”表示使用聚类稳健标准误。Stata中xtivreg命令无法提供GMM估计,需要下载非官方的xtivreg2来执行。该命令
15、只能处理固定效应模型,即先对模型进行FE或FD变换后,再对变换后的模型使用GMM:ssc install xtivreg2(下载安装命令xtivreg2)24面板数据的一个优点是可以对个体的动态行为进行建模。有些经济理论认为,由于惯性或部分调整,个体的当前行为取决于过去行为,比如资本存量的调整。如果在面板模型中解释变量包含了被解释变量的滞后值,则称之为“动态面板数据”(Dynamic Panel Data,简记为DPD)。动态面板模型是指包含滞后被解释变量作为解释变量的面板模型,见模型(6-6)。25 采用OLS估计时,由于滞后因变量与误差项中固定效应相关,因而估计量是非一致的。为了消除滞后因
16、变量和固定效应之间的相关,可以采用最小二乘哑变量回归(LSDV)、固定效应回归或者去除均值回归,以消除固定效应的影响。 采用单因子固定效应模型估计时,由于滞后因变量与误差项中固定效应相关,因此,在采用组间估计时,滞后因变量的系数估计将出现大样本偏误(动态面板偏误)(Nickell,1981;Bond,2002),即使增大N也不能消除这一偏误。并且,如果其他解释变量xit同滞后因变量存在相关性,估计系数将产生更严重的偏误。如果误差项uit存在自相关,则要获得一致的估计量则更加困难。26一种方法是对原模型进行一阶差分,从而消除常数项和固定效应。272829 传统形式的工具变量则称为“标准式”(st
17、andard)、“IV式”(IV-style)或collapsed(折叠式)工具变量。 在差分GMM以及下文的系统GMM估计中,为了尽量不损失样本容量,一般默认使用GMM式工具变量。但如果工具变量并非滞后变量(比如,额外的工具变量,或外生变量作为自己的工具变量),则仍可使用标准式工具变量。 由(6-8)可知,如果使用GMM式工具变量,则工具变量的总数是时间维度T的二次函数,可能导致很多工具变量。如果T很大,则会有很多工具变量,容易出现弱工具变量(weak instruments)问题(通常滞后越多期则相关性越弱),产生偏差。 有关“GMM式”工具变量产生及具体形式见“Stata程序6.4.1.
18、1:动态面板数据模型中GMM式工具变量和IV式工具变量”。3031在Stata中,一共有xtabond、xtdpdsys、xtdpd和非官方的xtabond2四个命令可以执行动态面板的GMM估计。各个估计命令的文献来源与使用条件见表6-1。 xtabond(差分GMM) xtdpdsys(系统GMM) xtdpd(差分和系统GMM) xtabond2(差分和系统GMM)32*通过cd命令设定当前工作目录use abdata.dta,clearxtset id year*使用xtabond、xtdpd、xtabond2进行差分GMM估计*Treat w and k as predetermine
19、d and include w, L.w, k, L.k, and L2.k as additional regressorsxtabond n l(0/2).ys yr1980-yr1984, lags(2) pre(w, lag(1,.) pre(k, lag(2,.) /工具变量84est store xtabondxtdpd l(0/2).n l(0/1).w l(0/2).(k ys) yr1980-yr1984, dgmmiv(n w L.k) div(l(0/2).ys) div(yr1980-yr1984) /工具变量84est store xtdpdxtabond2 l(0/
20、2).n l(0/1).w l(0/2).(k ys) yr1980-yr1984, gmm(L.n L.w L2.k) iv(l(0/2).ys) iv(yr1980-yr1984) nolevel /工具变量83est store xtabond2 /默认没有常数项esttab xtabond xtdpd xtabond2,mtitles b se /结果一致,xtabond2估计的标准误略有差异33对于面板数据,如果被解释变量为虚拟变量、计数变量等受限变量,则为非线性面板数据。一般来说,非线性面板数据不再适用线性面板数据的方法。对于短面板数据,在一些标准的非线性模型中,固定效应模型的一致
21、估计量无法得到,比如二值probit模型。与线性的情形不同,混合横截面数据模型与随机效应模型中的斜率参数将导致不一致的估计量。更一般地,线性模型的结果并非总能推广到非线性模型,并且用于某一种形式的非线性模型的方法可能无法适用于另一种形式。34非线性面板数据模型同样包括:混合横截面模型、随机效应(RE)模型和固定效应(FE)模型(如果可获得)。 如果FE模型是恰当的,那么如果可行,就必须使用FE估计量。 RE模型的条件均值与混合横截面数据模型的条件均值不同,除非随机个体效应是加法形式或者乘法形式的。所以,与线性的情形不同,如果假设RE模型是恰当的,非线性模型的混合数据模型估计会导致不一致的参数估
22、计值,反之亦然。 在非线性面板模型中,原则上都需报告群/聚类-稳健标准误,即使控制了随机、固定效应,也需要计算群/聚类-稳健标准误。35对于面板数据,如果被解释变量为二值虚拟变量,则称估计模型为“面板二元选择模型(binary choice model for panel data)”或“面板二值模型”。面板二值数据的主要估计方法包括混合横截面回归、随机效应估计与固定效应估计。对非线性面板随机效应二元选择模型,不便使用线性面板随机效应模型中的广义最小二乘法(GLS) 进行估计,转而进行最大似然估计(MLE)。36对非线性面板固定效应二元选择模型,不便使用线性面板固定效应模型中的一阶差分或组内变
23、换来消除固定效应如何在固定效应二元选择模型与混合横截面二元选择模型之间进行选择?可以使用以下的hausman(豪斯曼)检验。37在Stata中,probit和logit命令提供混合横截面二值选择模型估计。xtprobit和xtlogit命令可对随机效应面板二元选择模型进行估计。xtlogit命令可对固定效应面板二元选择模型进行估计。混合横截面二值选择模型,Stata命令为:probit y xl x2 x3,vce(cluster id) /混合 probit 回归logit y xl x2 x3,vce(cluster id) /混合 logit 回归其中,id为用来确定面板单位的变量。对于
24、面板二值选择模型,其随机效应估计的Stata命令为:xtprobit y xl x2 x3 /默认为随机效应 probitxtlogit y xl x2 x3 /默认为随机效应logit在Stata的输出结果中,包含了对原假设“H0:=0”的LR检验结果(Stata将记为“rho”)。如果拒绝“H0:=0”,则认为应采用随机效应模型;反之,则支持混合横截面回归。固定效应面板logit的Stata命令为:xtlogit y xl x2 x3,fe不存在固定效应的面板probit模型,因为目前尚无法解决此伴生参数问题。通过est store收集logit;xtlogit,fe;xtlogit,re
25、的估计结果,使用hausman命令进行模型选择。3839对于固定效应的Tobit模型,由于找不到个体异质性i的充分统计量,故无法像固定效应的Logit或计数模型那样进行条件最大似然估计。如果直接在混合横截面Tobit回归中加入面板单位的虚拟变量(类似于LSDV法),所得的固定效应估计量也是不一致的。面板Tobit模型仅考虑随机效应的Tobit模型40在Stata中,tobit命令提供混合横截面Tobit模型估计。xttobit命令可对随机效应面板Tobit模型估计。 混合Tobit回归的Stata命令为:tobit y xl x2 x3,11(#) ul(#) vce(cluster id)其
26、中,选择项“11 (#) ”表示下限(lower limit),选择项“ul”表示上限(upper limit),而id为指示面板单位的变量。随机效应的面板Tobit回归的Stata命令为:xttobit y xl x2 x3,11(#) ul(#) tobit其中,选择项“ 11(#)”表示下限(lower limit),选择项“ul (#)”表示上限(upper limit),而选择项“tobit”表示对原假设“H0:2=0”进行LR检验。不存在固定效应的面板tobit模型,因为目前尚无法解决此伴生参数问题。41对y只取包括0在内的有限几个值的面板数据。比如,企业在一段时间内每年获得专利的
27、个数,全国各省在几年内每年发生矿难的数目,世界各国近几十年每年发生示威游行的次数,一些病人在一段时间内的每期发病次数,等等。 不存在个体效应,可以使用混合横截面泊松回归(pooled regression)。 更一般地,我们允许个体效应的存在,即不同个体拥有不同的i。 如果i与所有解释变量xit均不相关,则应使用“随机效应泊松模型”。 如果i与某个解释变量相关,则应使用“固定效应泊松模型”。42在Stata中,poisson命令提供混合横截面计数数据模型估计。xtpoisson和xtnbreg命令可对随机效应和固定效应面板计数数据模型进行估计。混合泊松回归的Stata命令为:poisson y
28、 xl x2 x3 ,vce(cluster id) irr其中,id是用来确定面板单位的变量。选择项“irr”表示汇报发生率比(incidence rate ratio) 。面板泊松回归的Stata命令为:xtpoisson y xl x2 x3,fe normal irr其中,选择项“fe”表示固定效应,默认为“re”(随机效应)。选择项“normal”表示在估计随机效应模型时,指定个体异质性服从正态分布,默认为服从Gamma分布。选择项“irr”表示汇报发生率比(incidence rate ratio)。负二项面板回归的Stata命令为:nbreg y xl x2 x3,vce(clu
29、ster id)面板负二项回归的Stata命令为:xtnbreg y xl x2 x3,fe irr其中,选择项“fe”表示固定效应,默认为“re”(随机效应)。选择项irr”表示汇报发生率比(incidence rate ratio)。43混合横截面或面板数据对于评价某一事件的影响(项目评价,program evaluation)或政策的影响(政策分析,policy analysis)可能非常有用。即评价或分析某些经济或社会项目对个人、企业、邻居或城市的影响。这种项目效应也常被称为“处理效应”(treatment effect)。在最简单的项目评价中,把对象分为两组。对照组或控制组(cont
30、rol group)不参加这个项目,而实验组(experimental group)或处理组(treatment group)则参加44在理想的随机实验(ideal randomized experiment)中,实验组与控制组成员的决定完全是随机的解释变量“处理水平”与被遗漏的扰动项是不相关的。这样,就避免了遗漏变量偏差(omitted variable bias)或内生变量偏差(endogeneity bias)。这是随机实验的最大优点。45在随机实验中,因果效应(causal effect)有着清晰的定义。在理想的随机实验中,X对y的因果效应表现为条件期望的差别,即E(y | X=x)-
31、 E(y | X = 0),也称为“处理效应”(treatment effect)。在随机实验的执行过程中,可能并不完全符合“理想的随机实验的要求。可能出现的问题包括“内部有效性问题”(internal validity)与“外部有效性问题”(external validity)。46内部有效性问题 未能完全随机分组(failure to randomize)。 未能完全遵从实验设计(partial compliance)。 中途退出实验(attrition)。 实验效应或霍桑效应(experimental effect或Hawthorne effect)。外部有效性问题 样本的代表性不足(n
32、on-representative sample)。 一般均衡效应(general equilibrium effect) 。 自我选择效应。47由于某些并非为了实验目的而发生的外部突发事件,使得当事人仿佛被随机地分在了实验组或控制组。这种情形被称为“自然实验”或“准实验”。随机实验虽然说服力强,但通常成本较高。自然实验可分为两类。在第一类自然实验中,个体的分组或处理水平完全由自然实验所决定,可直接用OLS估计因果效应。在第二类自然实验中,个体的分组或处理水平只是部分地由自然实验所决定,此时应以自然实验带来的随机变动作为工具变量进行估计。48当某些外生事件(常常是政府的政策改变)改变了个人、家
33、庭、企业或城市运行的环境时,便产生了自然实验。一个自然实验总有一个不受政策变化影响的对照(control)组和一个被认为受政策变化影响的处理(treatment)组。为了控制好对照组和处理组之间的系统差异,我们至少需要两个年份的数据,一个在政策改变以前,另一个在政策改变之后。于是我们的样本就按使用目的划分为4组:变化前的对照组,变化后的对照组,变化前的处理组和变化后的处理组。4950在Stata中,可以自行通过设定处理组、实验期及其交互项来进行双重差分估计。也可以下载非官方命令diff进行双重差分估计。ssc install diff /下载安装命令 diff该命令的基本格式为:diff y,
34、treat(varname) period(varname) cov(zl z2) robust report test 其中,“y”为结果变量(outcome variable,即被解释变量y),必选项“treat(varname) ”用来指定处理变量(即(6-11)中的dT),必选项“period(varname)”用来指定实验期虚拟变量(即(6-11)中的d2),选择项“robust”表示汇报稳健标准误。选择项“cov(zl z2)”用来指定其他解释变量(即(6-11)中的其他解释变量),其中“cov”表示协变量(covariate);选择项“ report ”表示汇报对协变量系数的估计
35、结果。选择项“test”表示检验在基期时,各变量在实验组与控制组的均值是否相等。511.处理效应与选择难题 在许多情况下,并没有随机实验或自然实验的数据,而只有观测数据(observational data)。且由于实际处理水平存在自我选择(self selection),并非随机分组,故可能导致不一致的估计。因此,对于观测数据,需使用特别的计量方法来估计处理效应。52考虑就业培训的处理效应评估。常会发现参加就业培训者的未来收入比未参加者更低是否参加培训是参加者自我选择(self selection)的结果,岗位好收入高的人群并不需要参加就业培训,而就业培训的参加者多为失业、低收入者,甚至刑满
36、释放犯。由于实验组与对照组成员的初始条件不完全相同,故存在“选择偏差(selection bias)”。53事实上,我们真正感兴趣的问题是,实验组的未来收入是否会比这些人如果未参加培训项目的(假想)未来收入更高?然后实验组未参加培训项目时的未来收入是无法获得的为此,Rubin(1974)提出了以下“反事实框架”(a counterfactual framework),称为“鲁宾因果模型”(Rubin Causal Model,简记RCM)。5455由于处理效应(y1i-y0i)为随机变量,故我们关心其期望值,即“平均处理效应”(Average Treatment Effect,简记ATE),也
37、称为“平均因果效应”(Average Causal Effect,简记ACE)。另一常用概念为仅考虑项目实际参加者的平均处理效应,称为“参与者平均处理效应”(Average Treatment Effect on the Treated,简记ATT或ATET)或“参与者处理效应”(Treatment Effect on the Treated,简记TOT)。56由于个体通常会根据其参加项目的预期收益E(y1i-y0i)而自我选择是否参加项目,导致对平均处理效应的估计带来困难,这被称为“选择难题”(the selection problem)。解决“选择难题”的方法之一是通过随机分组(rando
38、m assignment),使得个体是否参加项目是随机的。这对随机实验是可行的,对大多数自然实验而言则不可行。因此,在大多数情况下,需要使用以下两类方法。第一类方法假设个体依可测变量选择是否参加项目,而第二类方法假设个体依不可测变量选择。57匹配方法:是否放回:放回匹配和不放回匹配匹配数量:一对一匹配,一对多匹配匹配变量:单个变量x和多个变量x1、x2、x358更一般地,xi可能包括多个变量,比如xi为K维向量。此时,如果直接使用xi进行匹配,则意味着要在高维度空间进行匹配,可能遇到数据稀疏的问题,即很难找到与xi相近的xj与之匹配。为此,一般使用某函数f(xi)将K维向量xi的信息压缩到一维
39、,进而根据f(xi)进行匹配。方法之一为使用向量范数(vector norm),即在向量空间(vector space)定义的距离函数。考虑xi与xj之间的相似度或距离,通常基于“马氏距离”(Mahalanobis distance)进行匹配,被称为“马氏匹配”(Mahalanobis matching)。59马氏匹配的缺点是,如果x包括的变量较多或样本容量不够大,则不容易找到好的匹配,比如,尽管个体j与个体i的(相对)马氏距离最近,但绝对距离可能依然很远。为此,统计学家Rosenbaum and Rubin(1983)提出使用“倾向得分”(propensity score,简记p-score
40、)来度量距离。个体i的“倾向得分”是指,在给定的情况下,个体i进入处理组的条件概率,即P(xi)=P(Di=1| x=xi),或简记为p(x)。使用倾向得分作为距离函数进行匹配,称为“倾向得分匹配”(Propensity Score Matching,简记PSM)。PSM的理论依据在于,如果可忽略性假定成立,则只需在给定p(x)的情况下,(y0i,y1i)就独立于Di,从而解决了“选择难题”。60通过倾向得分匹配计算平均处理效应的一般步骤如下。 (1)选择协变量xi,尽量将可能影响(y0i,y1i)的相关变量包括进来,以保证可忽略性假设得到满足。 (2)估计倾向得分,一般使用logit回归。
41、(3)进行倾向得分匹配。如果倾向得分估计得较准确,则应使得xi在匹配后的处理组与控制组分布较均匀。 (4)根据匹配后样本(matched sample)计算平均处理效应。61在Stata中,倾向得分匹配可通过下载非官方命令psmatch2来实现:ssc install psmatch2,replace该命令的一般格式为Psmatch2 D xl x2 x3,outcome(y) logit ties ate common odds pscore(varname) quietly其中,“D”为处理变量(treatment variable) , “xl x2 x3”为协变量,“outcome(y
42、)”用来指定变量“y”为结果变量(outcome variable)。选择项“logit”表示使用logit来估计倾向得分,默认方法为probit。选择项“ties”表示包括所有倾向得分相同的并列个体,默认按照数据排序选择其中一位个体。选择项“ate”表示同时汇报ATE,ATU与ATT,默认仅汇报ATT。选择项“common”表示仅对共同取值范围(common support)内个体进行匹配,默认对所有个体进行匹配。选择项“odds”表示使用几率比(odds ratio,即p/(l-p)进行匹配;默认使用倾向得分p进行匹配。选择项“gscore(varname)”用来指定某变量作为倾向得分,默
43、认通过“xl x2 x3 ”来估计倾向得分。选择项“quietly”表示不汇报对倾向得分的估计过程。62对于观测数据,如果怀疑存在依不可测变量选择,则大致有以下几种处理方法。 (1)尽量使用更多的相关可测变量,以满足可忽略性假定,然后使用匹配估计量。 (2)如果影响处理变量Di的不可观测变量不随时间而变,而且有面板数据,则可使用“双重差分倾向得分匹配估计量”(differences-in-differences PSM estimator)。 (3)使用断点回归法,特别是模糊断点回归。 (4)使用工具变量法,比如Imbens and Angrist(1994)提出的局部平均处理效应IV估计量。
44、 (5)根据依可测变量选择的影响来估计依不可测变量选择的影响。6364差分PSM估计的基本句式为:diff outcome_var,treat (varname) period (varname) id (varname) kernel ktype(kernel) cov (varlist) report logit support test其中,“outcome_var”为结果变量,必选项“treat (varname)”用来指定处理变量,必选项“period(varname)”用来指定实验期虚拟变量(实验期=1,非实验期=0)。必选项“id(varname)”用来指定个体ID(这是进行匹配
45、的前提)。必选项“kernel”表示进行基于倾向得分的核匹配(命令diff不提供其他匹配方法),选择项“ktype(kernel)”用于指定核函数,默认为二次核。必选项“cov(varlist)”用来指定用于估计倾向得分的协变量,选择项“report”表示汇报对倾向得分的估计结果。选择项表示使用logit估计倾向得分,默认为Probit选择项,“support”表示仅使用共同取值范围(common support)内的观测值进行匹配。选择项“test”表示检验在倾向得分匹配后,各变量在实验组与控制组的分布是否平衡(balancing test)。65依可测变量选择的一种特殊情形是,有时处理变量
46、Di完全由某连续变量xi是否超过某断点(cutoff point)所决定。据以进行分组的变量xi称为“分组变量”(assignment variable, forcing variable或running variable)。比如,考察上大学对工资收入的影响,并假设上大学与否(Di)完全取决于由高考成绩xi是否超过500分66在给定xi(如分数)的情况下,Di(是否上大学)是常数,独立于其他变量。满足可忽略性假定。处理组(考上)和控制组(未考上)完全没有交集,不满足重叠假设处理变量Di为xi的函数,记为D(xi),由于函数D(xi)在500处存在一个断点(discontinuity),这提供了
47、估计Di对yi因果效应的机会对于高考成绩为498,499,500或501的考生,可以认为他们在各方面(包括可观测变量与不可观测变量)都没有系统差异。67他们高考成绩的细微差异只是由于“上帝之手”随机抽样的结果(考试成绩本身含随机因素,导致成绩为500或501的考生上大学(进入处理组),而成绩为498或499的考生落榜(进入控制组)。因此,由于制度原因,仿佛对高考成绩在小邻域500-s,500+s之间的考生进行了随机分组,故可视为准实验(quasi experiment)。由于存在随机分组,故可一致地估计在x=500附近的局部平均处理效应(Local Average Treatment Effe
48、ct,简记LATE)。6869断点回归可通过非官方Stata命令rd来实现:ssc install rd,replace /下载安装命令rd该命令使用局部线性回归来估计断点回归模型,其基本句式为rd y D x, z0(real) strineq mbw (numlist ) graph bdep oxline kernel(rectangle) cov(varlist) x (varlist)其中,“y”为结果变量,“D”为处理变量,而“x”为分组变量。选择项“z0(real)”用来指定断点位置,默认值为“z0(0)”,即断点为原点。如果省略处理变量D,则默认为精确断点回归,并根据分组变量x来计算处理变量,即如果x大于或等于断点z0,则D取值为1;反之,D取值为0。选择项“stringeq”表示根据严格不等式(strong inequality)来计算处理变量,即如果x大于断点z0,则D取值为1;反之,D取值为0。70谢谢大家!71本课件制作整理者:郭迎春 仅可用于教学、学习、交流使用 如内容、图片、字体等有侵权,请联系删除。 72