《计量经济学可行性研究.docx》由会员分享,可在线阅读,更多相关《计量经济学可行性研究.docx(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 计量经济学可行性研究 一、引言:“阅历讨论可信性”的三次大争论 在我国,经过30年的进展,计量经济学模型已经成为经济理论讨论和实际经济分析一种主流的实证方法。与此同时,人们对于计量经济学模型方法产生了不同的甚至是相反的评价,究其缘由局部来自于计量经济学模型方法本身,更多地来自于计量经济学模型的应用讨论(李子奈和齐良书,2023a)。一局部讨论者由于不了解计量模型方法详细的应用背景和适用条件,陷入一种滥用和错用的误区,一项实证讨论从计量经济模型的设定开头,始终到模型的估量、检验、评价和解释,随便性和错误随处可见。针对这一现象,洪永淼(2023)、李子奈(2023,2023)以及李子奈和齐良书(
2、2023a,2023b)联系我国实际,从计量经济学在现代经济学中的地位、作用和局限性以及其哲学根底、经济学根底、模型设定问题等角度对计量经济学的方法论进展了奠基性的讨论。 计量经济学作为一门独立的经济学分支学科,其区分于其他相关学科的本质特征是什么?计量经济学应用讨论的科学性和牢靠性如何保证?这些问题引发了国际计量经济学界三次集中的大争论,一场阅历讨论的“可信性革命”(AngristandPischke,2023)蔚然成风。第一次大争论始于闻名的“凯恩斯丁伯根之争”(Keynes,1939,1940;Tinbergen,1940),凯恩斯认为丁伯根所用的多元回归分析是一种“巫术”,计量经济学作
3、为“统计炼金术”的分支还远未成熟到足以成为科学的分支。凯恩斯反对使用概率论,而丁伯根使用的“回归”却未能利用概率论的原理很好地解释估量结果,当时的经济学阅历讨论陷入困难丛生的境地。最终这场争辩以Haavelmo(1944)计量经济学中的概率论方法一文的发表而告完毕,该文为经济学中的概率论思想正名,在概率论的根底上建立起统一的计量经济学根本框架。自此,计量经济学不仅转变了人们关于客观经济世界学问的形成方式,而且渐渐成为经济学主流的阅历讨论方法。 1980年月初,众多学者的反思掀起了有关阅历讨论可信性问题的其次次大争论。Sims(1980)对当时的大型宏观计量经济模型所施加的外部约束条件的牢靠性提
4、出质疑,认为这些不现实的约束条件将导致不行靠的政策分析结论,进而建议使用更少约束条件的VAR建模策略。该模型已被讨论者和政策制定者所广泛采纳,主要用于分析经济如何受到经济政策临时性变化和其他因素的影响,Sims也因此获得2023年诺贝尔经济学奖。Hendry(1980)就计量经济学的应用沦为炼金术问题绽开锋利的批判,提出让阅历讨论走向科学的一条金科玉律就是“检验、检验、再检验”。Leamer(1983)一文则指出回归分析中模型假定以及掌握变量选择的随便性导致的结果脆弱性,由此提倡应当进展回归模型的敏感性分析。Black(1982)以及PrattSchlaifer(1984)对应用讨论者将回归模
5、型中的相关关系错误推广至因果关系提出批判,同时对两者的区分进展了具体的论述。 面对其次次争论中消失的难题,计量经济学家提出了各种建模思想、估量量以及检验统计量,理论计量进入百花齐放的阶段;然而,理论计量讨论与阅历讨论之间的裂缝反而扩大了,理论计量越来越简单,应用计量则在某些领域变得越来越简洁(Heckman,2023)。为此,进入新世纪以来,以JournalofEconometrics百期纪念专刊对计量经济学方法论、模型方法进展的总结为开端,以重要学术期刊的专刊为阵地,计量经济学界掀起了对阅历讨论可信性的第三次大争论,并形成了模型设定的统计适切性和因果关系的有效识别两大核心议题。 纵观三次大争
6、论,可信性革命的核心问题在于实现经济理论、统计学、数学在计量经济学应用讨论中的科学结合。第一次大争论主要关注经济理论与数学的结合问题,解决了计量经济学的概率论根底问题,同时确立了凯恩斯宏观经济理论在模型设定中的导向作用。其次次大争论突出了数据与模型的结合问题,在宏观实证领域摈弃了模型设定的经济理论导向,确立了数据关系的导向作用。第三次大争论强调了模型设定的统计适切性问题和因果关系的有效识别问题,本质上是试图实现经济理论导向和数据关系导向的综合,向实现经济理论、统计学、数学的科学结合迈出了坚实的一步。 当前,中国计量经济学正处于迈向国际化和标准化的新阶段,面临着与国外先进水平的实质性接轨,这其中
7、的一个关键问题就是提高应用讨论的可信性。如何借鉴国际经济学界对于阅历讨论可信性问题的讨论成果应成为我们的着力点之一,这也是我国计量经济学根本理论讨论连续和深入的需要。为此,本文首先厘清计量经济学探究客观经济世界过程的本质特征,进而从模型的随机性设定、经济变量之间的因果关系识别以及模型的统计适切性评价等三个方面论述计量经济学应用讨论的可信性来源,以期抛砖引玉,到达对计量经济学应用讨论的正本清源。 二、计量经济学对客观经济现实的探究过程 现代经济学讨论建立的根本假设前提是(Hendry,1995):现实经济世界中存在着某种具有规律性的机制,这种机制是由经济主体的生产、交易、消费等行为构成的,并进一
8、步认为经济机制的某些规律性是可以测度的,这种可测的机制局部称为数据生成过程(简称DGP)。经济学家对于客观经济世界真实DGP的熟悉和探究经受了一场从打算论法则到“无序中的有序”的概率论法则的变革,而在这场变革中,计量经济学起着关键作用。计量经济学家将随机性视为客观经济现象的特别冲突性,并致力于查找适宜的方法论根底以保证计量经济学应用的牢靠性。 Haavelmo(1944)澄清了计量经济学讨论对象的特别冲突性,认为经济规律的特有性质打算着概率论方法运用的必定性;文中把随机性作为一条规律引入模型,用概率分布及其特征值来描述客观经济现象的变动规律,尤其是引入联合分布来刻画相互依存、同时确定的变量的变
9、动关系,使得随机性设定成为计量模型不行或缺的重要局部;进而在概率论的根底上,利用20世纪初统计学的最新成果建立起计量经济学的根本框架。因此,该文被誉为计量经济学的“南十字星座”,开启了计量经济学的现代之门(Hoover,2023),Haavelmo也因此获得1989年的诺贝尔经济学奖。此后,计量经济学家对计量模型描述客观经济现象的本质特征有了清楚的熟悉,本文阐述如下。 (一)计量经济学探究客观经济世界的本质特征 经济现象(表达为观测数据)是定义于一个完备概率空间(,P0)的随机过程ZZt,t=1,2,的一个实现,概率测度P0供应了对序列Z的随机行为的完全描述,因此被认为是真实的数据生成机制,即
10、最一般意义上的DGP。正是由于P0未知,才产生建模、估量和推断问题,假如我们可以得到Z的一个实现,就可能从Z中推断P0。因此,计量经济模型建模的首要含义是从现实经济世界到概率空间的映射。由于概率空间(,P0)过于抽象,并不能为我们供应一个足够敏捷的框架用于对随机经济现象的建模,需要将概率空间映射到更敏捷的概念概率模型。从实际角度看,我们只能得到有限序列Zn=(Z1”,Zn”)”的一个实现zn,即样本容量为n的抽样。生成容量为n的样本的随机过程可由其分布完全刻画。进一步定义分布函数和密度函数的参数化形式为F=F(z;),zn和f=f(z;),zn,称之为参数化概率模型,其中为未知参数向量。 随机
11、过程最重要的特性是统计特性,它刻画了随机过程的本质,因而可以从偶然性中提醒出必定性。多维联合分布(密度)函数是随机过程统计特性最完善的描述。随机过程Zt的分布(密度)函数是既包括变量关系又包括样本点关系的高维联合分布函数,要从中得出详细可用的模型,往往需要对向量Zt(假定v1维)进展分块Zt=(Xt”,Yt”)”以及一系列的约化。例如,把对联合分布的建模约化为对条件分布建模,进而约化为对条件期望建模,这就是总体回归模型;其中Yt是l1维的被解释变量,Xt是(vl)1维的解释变量。计量经济模型就是使用经济和统计假定从联合分布(密度)中识别出经济定量关系(White,1994;ReisandWol
12、ak,2023)。综合上述,计量经济学对客观经济世界的探究,蕴含着从“现实经济世界到概率空间的映射概率空间到概率模型的映射概率模型到计量经济模型的映射”这一过程。把随机因素规律化,这是计量模型区分于其他经济模型的本质特征:一方面可以表达人类行为与经济活动内在的随机性,另一方面也是我们掌握未知因素影响的重要途径。因而计量模型的设定包含随机扰动项及其概率分布的设定,它使得模型能最大限度地靠近客观经济现实。 提醒变量之间的经济关系是建立计量经济模型的主要目的,需要基于观测到的信息资料推断结果。问题在于,我们所观测到的数据,是从某个可能的假设或缘由的集合中所导致的结果,也就是说,数据和假设之间缺乏一一
13、对应的关系,由此产生的新学问(推断结论)是一种带有不确定性的学问。这种准确性的缺乏成为归纳推理系统化的最大障碍。20世纪初,统计学家提出的一种有关新学问产生的方式有效地解决了这个问题,Rao(2023)将其总结为以下的规律方程:不确定的学问+所含不确定性度量的学问=有用的学问在形成新的具有不确定性的学问时,对其存在错误的可能性进展度量是一种理性选择,由这种规律过程产生的学问才能够用于解释现实并指导实践。计量经济分析中,无论是参数估量还是假设检验,都是基于一个样本得到的结论,但处理方式遵循了上述规律方程所强调的有关不确定学问的产生方式,这种处理最终通过分布来实现。因此,计量经济模型只有包含随机性
14、设定,才能在经济关系的检验中包含对自身置信度的有效度量,从而实现对客观经济现象随机性的有效驾驭。 (二)探究过程的多样性与牢靠性 经济规律具有相当局限的持续不变性,或者说经济规律的不变性是有条件的,只有在肯定时空条件下,经济运行规律即真实DGP才是唯一的。然而,现代经济生活极大的简单性,使得我们发觉并建立真实模型之求往往成为奢望。从未知的真实DGP到计量经济模型,是一个探究过程,固然也就允许讨论者多方尝试,从而最终的模型设定呈现多样性。 但是,这种探究性和多样性并不意味着模型设定的随便性。只有在肯定建模准则下建立的计量经济模型,才能成为对真实DGP的一个有用的、牢靠的近似。我们认为,阅历讨论的
15、可信性必需依靠以下三个重要来源:其一,扰动项的概率构造不仅表达于模型设定,而且主宰了参数估量、假设检验等经济计量分析的主要环节,其丰富的经济和统计含义应当得到重视。其二,每项实证讨论都有特定的讨论目的,需要通过模型设定实现对关注效应的有效识别和牢靠推断;因果关系推断作为计量经济分析的重要目标,其有效识别是阅历讨论的核心问题。其三,模型设定是统计推断的根底,错误的设定可以导致错误的推断;模型统计适切性是评价模型对真实DGP概率构造近似程度的重要标准。 三、扰动项的含义与随机性设定 对计量经济模型的不行观测成分尤其是随机扰动概率构造的讨论,包括相应的估量和检验是理论计量的主要讨论对象。对应用讨论而
16、言,它们是计量模型描述客观经济现象不行或缺的一局部,也是计量经济模型“计量含义”的集中表达。未能有效地驾驭随机设定对客观经济现象的描述功能,某种程度上也限制了对计量经济模型的创新性运用,计量经济学进展过程中的屡次创新和重大突破就发端于如何更好地运用随机扰动项分布来描述客观经济现象。Woodridge(2023)认为,对于扰动项的处理可能是任何计量分析中最重要的内容。无视其存在,或仅作为一种摆设,计量经济模型设定就失去一个重要的牢靠性来源。应用讨论中却存在诸多误区,本文对此进展了梳理。 第一,将扰动项视为一种符号,忽视其重要含义。 计量经济模型的设定包含着确定性设定与随机性设定两局部。以最常见的
17、回归模型为例,确定性设定刻画了模型中的观测变量、参数以及函数形式,随机性设定描述了扰动项的概率分布以及与解释变量的关系。一般而言,确定性设定更多表达经济意义,随机设定更多表达统计意义,两者是相依共生的。一方面,无论确定性设定如何表达经济意义上的合理性,模型推断的牢靠性仍旧依靠于随机性设定的合理性;另一方面,确定性设定局部假如不合理,也会影响随机性设定的合理性,比方遗漏重要解释变量或者函数形式错误设定,可能导致随机扰动项与解释变量相关而破坏外生性假定,或者导致扰动项呈现异方差等简单变化,从而对随机性设定局部的牢靠性造成严峻影响。 而且,大多数计量经济学模型方法在讨论条件分布的某一属性(例如条件均
18、值)时,往往会对其他属性(如条件方差)做一些帮助性的限制假设,忽视扰动项,这些假设的合理性就得不到争论与讨论。例如,在讨论市场有效性时,常用的混合Q检验统计量只有在条件同方差下才听从渐近卡方分布,这一结论在条件异方差下并不成立,很多国内讨论由于无视这一点(如波动集聚性的存在),导致错误推翻市场有效性(洪永淼,2023)。 还应指出的是,面板数据模型目前虽大量应用,但截面相关问题尚未引起重视。面板数据中截面相关是普遍存在的,其设定既有丰富的经济含义,又是统计推断结果牢靠性的重要保证。以非平稳面板数据的单位根检验为例,广泛应用的LLC检验、IPS检验都假定ADF回归中不同个体的扰动项相互独立,当存
19、在截面相关时,这些统计量就不再收敛于原来的分布,产生严峻的水平扭曲问题;即使是一般的面板回归模型,截面相关也将影响估量量的有效性甚至是全都性(Pesaran,2023)。 其次,检验过程忽视有关扰动项及DGP的设定,主观选择符合所需要的结果。 许多统计量是基于有关扰动项及DGP的某种设定推导出来的,如单位根检验、Granger因果关系检验以及协整检验对于扰动项及DGP设定有很强的依靠性。这些检验几乎是我国目前宏观经济与金融实证讨论应用最广的方法,同时也是错误集中的领域。 单位根检验的DF、ADF方法的临界值选择依靠于模型是否存在截距项与趋势项。许多讨论者完全按自己讨论的“需要”,随便地选择模型
20、设定,导致模型设定过程成为一个黑箱。依据Enders(2023)给出的严格检验步骤,应当对截距项、趋势项的系数进展反复的检验,以确保得到数据支持的模型设定。原始的Granger因果检验没有规定变量必需平稳但事实上隐含这一假定,许多讨论都将此检验应用于非平稳时序,后续的讨论已经说明,使用非平稳时间序列时,该统计量的渐近分布不再是标准分布。周建和李子奈(2023)的蒙特卡罗模拟显示,序列的不平稳性是造成虚假Granger因果关系最主要的因素之一。 在非平稳时序的协整检验中这一问题更是突出。Johansen(1988)、JohansenJuselius(1990)提出了协整关系的MLE估量和检验方法
21、,其检验结果对DGP的设定具有很强的依靠性。Eviews软件就给出了5种DGP下协整关系的可能结果。目前国内几乎没有应用讨论进展严格的DGP识别检验,而是依据某些主观因素在各种DGP下选择检验结果。这种做法抹煞讨论对象真实的总体属性,扭曲了真实的协整关系,其检验结果可能是错误的。 第三,忽视不同数据类型的分布特性,想固然地推广统计量。 无视检验统计量分布成立的前提,随便扩展检验的适用范围,想固然地将已有的检验统计量直接推广到不同类型的数据构造,也是造成讨论结论不行靠的缘由。例如,在面板协整检验中,有些讨论原封不动地移植时间序列下的EG两步法。时间序列仅有时间维度,非平稳时序统计量的概率根底是随
22、机泛函的极限定理,在此根底上产生了单位根与协整理论,其中由基于残差的EG两步法构建的协整检验统计量收敛于非标准分布。面板数据同时包括时间维度T和截面维度n,Pedroni(1999)和Kao(1999)基于残差的协整检验统计量并非时间序列EG两步法的直接推广,而是序贯收敛于标准正态分布,且要经过与真实DGP有关的参数调整。蒙特卡罗模拟显示,这种错误推广存在过度拒绝原假设的问题,此时面板协整就很简单成为一种普遍关系了,结论是不行信的。 第四,缺乏对检验的名义水平和实际拒绝概率的甄别。 在扰动项是正态分布的严格假定下,可以推导某些检验统计量原假设下的有限样本分布,对应的检验称为准确检验。更多的情形
23、是我们只能得到统计量在原假设下的渐近分布,相应的检验称为大样本检验或者渐近检验;一些简单检验统计量甚至是听从非标准分布,必需通过模拟获得其临界值。渐近检验用样本容量趋于无穷时的分布函数来近似表示统计量有限样本的统计特性,计算出的P值都是渐近值,可能存在过度拒绝或拒绝缺乏的水平扭曲问题。例如,GMM框架下的Hansen-J检验与MLE框架下的IM检验,在有限样本下就存在明显的过度拒绝问题;又如面板协整检验,其极限分布是时间维度T和截面维度n趋向无穷的结果,大局部检验统计量的极限分布建立在序贯收敛或联合收敛的极限定理(PhillipsandMoon,1999)之上,联合收敛的推导过程还往往有n、T
24、比率的假定。这将给有限样本下统计量的检验水平和成效造成影响,使得统计量的应用受到n、T长度的限制,有些甚至不行使用(胡毅等,2023)。在国外的优秀学术期刊中,对检验的名义水平和实际拒绝概率进展区分和处理,已经成为一项阅历讨论牢靠性的重要表达。我国大局部的宏观经济时序数据时间长度都较短,统计量分布的绝大多数已知结论又只是渐近性质,但检验统计量的有限样本适用性问题却还未受到足够重视。 四、因果关系的识别和推断 一项经济学阅历讨论,应当与一个清楚的、表述准确的目标相联系,只有了解构建一个模型的初衷,我们才能对其做出评价(Granger,1999)。而在诸多目标之中,因果关系的推断是核心。因果关系首
25、先是一个哲学概念,但哲学上迄今没有给出普遍、严格、可量化的定义,社会科学对因果关系的测度更多地是基于某一角度的考虑。例如,计量经济学中广为采纳的Granger因果关系检验就是从变量之间的猜测关系来检验因果关系。如何定义因果效应并进展有效识别则成为可信性革命其次次和第三次大争论的核心话题。 (一)有效识别因果关系的困难之处 StockWatson(2023)指出,因果效应(casualeffect)可以定义为,在一个抱负的随机化掌握试验中,一个给定的行为或处理对某一结果的影响。Wold(1969)明确指出,计量经济学想成为一种根底创新的科学方法,关键在于必需克制由于缺少试验所带来的局限性。在试验
26、室条件下,先验掌握某因素的效应与后验分别出该因素的效应,其结果是等价的。而现实中得到的数据大多是观测数据,我们若想在计量经济学也取得这种等价性,就必需首先将与“试验”有关的全部非掌握因素的效应全部测定并分别出来。 讨论者往往通过在回归方程中引入足够多的掌握变量来构造一种类似于试验的环境,即获得关注变量的净效应(Woodridge,2023;Stock,2023)。我们认为,这只是获得因果效应的必要条件而不是充分条件。一方面,计量经济学分析的重要环节之一就是如何推断毕竟哪些因素与“试验”有关,只要无法确定全部显著有关的变量,我们就面临着误设试验模型的问题,因而也不具备试验科学所要求的根底条件(H
27、endry,1995)。另一方面,即使是一种因果关系,基于回归模型也很难对其背后的作用机制进展清楚的刻画,或者明确毕竟是哪一项机制在起作用。因此,无论是因果效应的存在性,还是其背后的详细作用机制的识别,都需要在讨论设计和模型设定中充分考虑。阅历讨论中的另一种处理方式是基于描述性计量建模进展明确的因果关系推断。例如通货膨胀长久性讨论,有些讨论者基于自回归、不行观测成分、状态转移等模型进展了明确的因果论断。但是,这些模型都属于描述性的统计模型,意在刻画通胀的统计特征,唯有以不同形式施加经济假设,建立诸如粘性信息模型、学习模型、Calvo-Rotemberg模型或者DSGE模型,才能解释通货膨胀长久
28、性的经济动力源(Fuhrer,2023)。又如地方政府策略互动行为的讨论,往往以空间计量模型中的空间滞后系数度量策略互动行为的方向与强度。局部讨论者仅据此进展特定策略互动机制的因果效应阐述是不恰当的,缘由是无视了两个重要的识别问题:第一,空间滞后关系既可能是地方政府策略互动过程的结果,也可能是某些遗漏的地区特征的外生相关或者对地方政策的共同冲击所致;其次,支出溢出、财政竞争以及标尺竞争等理论假说都可以推导出同样的简化型地方政府政策反响函数,空间滞后模型本身不能识别哪种机制在起作用。我们认为,对于描述性建模工作,模型结果的相关背景或者可能缘由的阐述是有必要的,但不能过度推广甚至是错误推广其经济含
29、义。 (二)因果关系识别方法的新近进展 对因果关系的推断是经济学讨论的重中之重,而在非试验条件下进展因果关系的有效识别又是难之又难。然而,这一事实并不排斥我们科学地进展计量经济学讨论的可能性,追求更为明确、透亮化的识别策略则是努力的目标。由于对哪些因素有利于透亮化、识别所需的假定以及经济理论扮演的角色有着不同的见解,对因果关系的识别进展出两个方向:一是基于实际试验与准试验方法;二是构造计量建模。 1试验与准试验(自然试验)方法 试验学派已成为经济学阅历讨论的一个新潮流(AngristandPischke,2023),这些方法往往用于对一个工程、政策或一些其他的干预或处理的影响进展讨论。抱负的随
30、机化掌握试验为使用实际数据进展因果效应的计量经济分析供应了一个理论基准。其中心思想是通过从一个总体中随机地选取个体,然后随机地对局部个体进展处理,进而测度因果效应。处理的随机安排可以保证处理的水平独立分布于结果的任何其他影响因素,由此消退了遗漏变量偏差的可能性。此时,处理水平X对Y的因果效应就是条件期望E(YX=x)与E(YX=0)之差,其中E(YX=x)是处理组中处理水平为X时Y的期望值,E(YX=0)是掌握组中Y的期望值。假如某一处理对全部成员都一样,那么X就是二元变量,因果效应可用处理组与掌握组之间的样本平均结果之差来估量。而且,随机安排下这种因果效应等同于单变量的回归模型Y=0+1X+
31、u的斜率系数,OLS估量量1就是因果效应的全都估量。由于抱负的随机化掌握试验所具有的对因果关系推断的优势,越来越多的讨论者进展了实际试验;有些实际试验存在着道德与本钱问题,讨论者转而将其思想应用于基于观测数据的准试验。前文认为一般的回归分析本质上是一种相关推断,那为什么试验框架下的回归分析却可以进展因果推断呢?关键的差异就在于上述的随机安排思想。问题是,现实中的试验和准试验,都与抱负的随机化掌握试验存在或多或少的差距。目前国内应用该建模思路的讨论存在大量错误,根源就在于对这些方法的适用范围和隐含假定缺少熟悉。假如随机化失败,处理局部地以主体的特征或偏好为根底,那么试验结果反映的既是处理效应,也
32、是非随机安排效应;即使处理的安排是随机的,但个体并不总是完全遵守随机化试验协议,实际得到的处理也可能不是随机的。而且,实际试验和准试验还可能存在损失问题、试验效应、工具变量牢靠性、掌握组个体的匹配等问题,它们的叠加将使得状况变得更加简单。虽然实际试验和准试验方法得到了广泛的应用,但我们必需看到这些方法本身的局限性,并不是全部的经济学领域都具备实际试验或准试验的条件;而且,这些方法更多地是验证因果效应的存在性及程度,对于背后的作用机理则多少显得无能为力,根本缘由在于这其中没有多少经济理论(构造)。 2.构造建模方法 ReissWolak(2023)区分了非构造计量经济模型(或称描述性模型)以及构
33、造计量经济模型。非构造模型基于正式的统计模型,提醒数据(经济变量)之间的统计特征与统计关系,经济理论的作用仅限于选择被解释变量和解释变量,或者为变量间的关系供应可能的经济学解释,最终模型是以变量的联合分布的某些特征呈现出来。所谓构造计量经济模型,则明确地将经济理论模型与统计模型相结合,从而有效识别出定量的经济因果关系;构造建模是计量经济学区分于统计学以及统计学与其他学科穿插讨论的集中表达。 我们认为,过去十年是构造计量建模的复兴时期。之所以说是复兴,是由于既有继承,又有进展。事实上,早期基于凯恩斯主义理论的大型宏观联立方程模型就是一种构造模型。但是,这些模型一方面未能表达理性预期以及经济主体的
34、行为特征等微观根底,因而受到了“卢卡斯批判”;另一方面在统计假定上又未能考虑数据特征,使经济理论处于一种超检验的地位,从而阻断了建模者依据数据信息规律全都地修改构造模型的可能。20世纪80年月随着宏观经济学中RBC模型框架的兴起以及随机效用等微观计量模型的进展,构造建模有了新的进展,而过去十年计量方法的快速进步则使得模型高度构造化。现在所谓的“构造”是指在经济行为主体的动态最优化过程中,刻画偏好、技术、禀赋以及制度等因素的深层参数(Heckman,2023;ReisandWolak,2023),从而使得模型具有坚实的微观根底;而且包含了更多的统计构造,变量的动态构造以及不行观测效应都得到高度重
35、视。 以微观经济学的动态均衡建模为例,根据行为主体的互动类型,可以分为单经济主体的动态局部均衡模型、多经济主体的动态一般均衡模型以及动态博弈模型(AguirregabiriaandMira,2023)。在宏观经济学中,DSGE模型成为新的讨论范式,该类模型严格依据一般均衡理论,刻画了包括对行为主体所处环境、决策行为的一系列决策规章以及决策时所面临的不确定性,并在动态优化背景下构建经济主体行为方程,最终获得以非线性期望差分方程组为形式的模型均衡关系式,同时利用有关方法进展均衡的计算以及模型参数的估量。构造模型方法最大的优点在于,构造参数有着明确的经济含义,这使得实证结果也有相应的经济解释。而且,
36、通过反事实分析可对新政策进展评估,相比试验方法,构造建模的效用最大化框架使得福利分析成为可能,政策比拟和最优政策选择有了牢靠标准。 (三)经济理论在因果效应识别中扮演什么角色? 洪永淼(2023)曾指出:统计方法与工具,不管是数理统计还是经济统计,均不能确认经济变量之间的数量关系是否为因果关系。因果关系确实认,必需借助于经济理论的指导。问题在于如何指导呢? 目前流行的回归分析对经济理论的应用主要表达在以下两个方面: 其一,为变量的选择供应依据,或者通过施加回归模型参数的约束而将理论本身作为讨论对象。这里需要再一次强调的是,即使回归模型的变量有相关经济背景,仍旧只是供应了一种潜在的、可能的因果解
37、释,而不是构造模型中深层参数直接的因果效应。例如,为讨论拍卖的中标额和投标者数量的均衡关系,非构造建模将中标额对投标人数进展回归,在标准的统计假定下,该回归模型给出了给定投标人数时对中标额的线性猜测。构造计量建模则在风险厌恶程度、追求预期利润最大化以及和人信息分布等假定下,得到给定投标人数目、中标额的条件密度和条件期望。 其二,是在实证讨论前面附加一个理论模型,然后说明后面的实证模型是对该理论模型的验证,或者认为这样的实证模型设定就有了依据。然而,这并不是真正的构造建模,理论模型中的构造参数在各种“演化”之后在实证模型中已不见踪影:假如没有进展实证模型参数与构造参数之间的识别则未能根本解决因果
38、效应的有效识别。 在经济理论与计量分析相结合的过程中,还存在一种现象,将理论模型的某些概念等同于统计概念,均衡方程与协整方程就是一个典型。经济模型中的均衡往往是一系列假定之下得到的经济变量关系的构造方程,而协整表达的是变量间某种长期稳定的统计关系,这种等同至少在以下三个方面存在问题:第一,即使变量之间不具备经济意义上的均衡关系,仍旧可能具有协整关系;其次,均衡关系往往存在于多个时间序列之间,仅对其中局部时间序列进展协整检验进而得到的协整方程是不完全的,并不是变量之间均衡关系的真实反映;第三,经济理论的均衡有着丰富的含义,包括一般均衡与局部均衡、跨期与期内均衡、长期均衡、博弈均衡等,并不是全部均
39、衡都能通过协整检验来验证,或者说协整未能表达其含义。无视这种区分,一方面是导致DSGE模型均衡的计算以及动态博弈模型马尔可夫精炼均衡的计算等前沿领域没有得到重视,另一方面却消失了“为均衡而协整”的泛滥现象,协整好像成为一种普遍关系了。 对于因果效应的推断,我们认为,不同的建模方法是一种互补,而不是相互替代。越来越多的经济学家(例如Granger,2023;ReissandWolak,2023;Acemoglu,2023;Keane,2023)认为必需在宏观经济学、进展经济学、产业组织、劳动经济学等各个领域的阅历讨论中引入更多的经济理论(构造),才能从本质意义上解释因果效应背后的规律链条与作用机
40、制。结合因果推断这一重要讨论目标,我们更加推崇上述的构造计量建模,实现理论建模与阅历分析的统一;但在卫生经济学、社会经济学等领域,理论数理化相对滞后,一些命题的提出并没有经过严格的数理模型推导,甚至是依靠于直觉,此时试验与准试验方法则应是其因果推断的选择。那么,在成认各种建模思路合理性的前提下,如何在各自的建模框架下保证其统计推断的牢靠性呢?这涉及到一项讨论牢靠性的另一根本问题模型的统计适切性评价。 五、模型的统计适切性评价 计量分析中,参数估量与参数约束关系检验是我们获得有关经济规律一般性结论的归纳论证过程,其牢靠性依靠于统计量的良好性质,而这些良好性质的获得又依靠于计量经济模型这个载体中的
41、各种设定。问题在于,这些设定在实际应用中并不必定得到样本数据的支持。假如统计推断建立在各种未得到数据支持的设定之上,其结论将是危如累卵。因此,在PesaranSmith(1985)提出的评价计量经济模型的三个标准中,模型在统计上的适切性(StatisticalAdequacy)渐渐成为最主要的标准。当一个模型的各种假定得到数据的支持时,我们称该模型在统计上是适切的,或者说是正确设定的(White,1994;Gewekeetal,2023;Spanos,1999;CameronandTrivedi,2023)。对模型统计适切性的重视,是计量经济学提高其应用牢靠性的需要,由此形成第三次大争论的另一
42、核心议题。计量经济学家从两种思路解决这一难题。一种简洁的想法就是,找到稳健的计量模型方法,使得统计适切性不依靠于特定的模型设定。另一种思路则是,找到适宜的方法证明自己所依靠的假定是合理的,由此形成了模型选择和模型设定检验两种模型评价思路(Gewekeetal,2023)。实证讨论中,对于稳健推断、模型设定检验和模型选择的应用也存在重视不够或熟悉模糊的问题,以下是本文的一些看法。 首先,我们要强调经济分析不能代替统计适切性评价。例如,对于可能存在内生解释变量的回归模型,讨论者往往依据理论分析、直观推断或者已有文献结论等先验阅历信息,找到工具变量进展IV估量,进而依据Hausman检验推断是否的确
43、存在内生性问题。假如工具变量的牢靠性只停留在经济意义层面,而没有通过模型设定检验进展甄别,由此得到的推断结论很可能是误导性的。以教育收益率的经典实证讨论(Hayashi,2023)为例,使用不同的工具变量集,得到的检验结果截然不同。缘由在于上述做法无视了Hausman检验要求IV估量量具有全都性的隐含条件,而这是在工具变量符合与扰动项正交且与内生解释变量(强)相关等严格假定之下才能得到的理论结果,在实证讨论中并不必定成立,必需通过模型设定检验进展验证。 其次,稳健推断方法与模型评价表达的是对统计适切性的不同要求,各有所长。以回归模型的非球形扰动问题为例,White(1980)与NeweyWes
44、t(1987)的稳健标准误方法受到越来越多阅历讨论者的青睐,AngristPischke(2023)甚至认为稳健标准误方法的诞生使得异方差以及序列相关这些设定检验变得不再重要,相应的GLS方法将退出舞台。Leamer(2023)指出这种熟悉是有失偏颇的,稳健标准误方法与设定检验及相应的GLS方法表达的是对统计适切性的两种不同要求,前者只是要求得到牢靠的置信区间范围,后者则更进一步要求有效的点估量。当讨论者只关注参数约束检验时,稳健标准误方法足以保证其牢靠性;假如关注的是某些政策效应的比拟,就涉及参数估量值的详细大小,此时GLS的有效性明显更为重要。此外,以施加较少约束的稳健推断方法代替模型设定
45、检验这一做法还可能限制我们对客观经济世界的进一步探究。Sims(2023)就认为对面板数据的条件异方差进展建模并使用FGLS可以比稳健标准误方法获得更多的经济信息,一个明显的例子就是随机系数模型可以同时表达异方差的来源以及个体的异质性特征。 再次,对于完整的模型评价而言,模型设定检验和模型选择都具有重要意义,但前者更为关键。在很多时间序列分析中,包括单位根检验、Granger因果关系检验和VAR建模,我们常常只看到讨论者依据AIC或BIC等信息准则来确定最优滞后阶数,并未见有关模型设定检验,这种以模型选择替代模型设定检验的做法是危急的。在模型选择过程中,需要先确定一个模型族f(z;i),i,z
46、n,i=1,m,全部的备选模型都享有同等的地位,然后在特定的标准下挑出最正确模型f(z;k)。Lehmann(1990)、Spanos(2023)认为这其中隐含着两种可能错误:一是正确的模型f(z;0)可能不包括在模型族中,更重要的是没有考虑选择可能犯错的概率,这恰恰没有表达在形成新的具有不确定性的学问时,对这些新学问存在错误的可能性进展度量的要求。而模型的设定检验有原假设和备择假设的区分,其结论是基于分布和犯错概率的推断结果。即使通过模型选择得到的最优模型也不能保证全部的设定都得到数据的支持,对那些关系到估量和推断性质的模型设定问题还必需进展严格的设定检验。相比模型选择,模型设定检验是关系到
47、计量经济分析过程牢靠性的更为根本的步骤,如时序分析中的模型选择就只是在平衡拟合和简洁性之间的选择,并不能保证残差必定满意独立同分布假定。 最终,我们强调模型设定检验并不是对数据的重复使用或者数据挖掘。对于给定的数据Zn,通常需要用于两种检验:(1)参数约束关系检验;(2)对于设定模型M(z)牢靠性的检验。因此,有人质疑这是否对数据进展了重复使用。Spanos(2023)对此赐予反对:一是上述两种检验是对数据Zn所提出的两个不同问题,二是这两种检验具有不同的边界。详细而言,参数约束检验假定M(z)在统计上是适切的,问题的探究仍旧在其边界内;而模型设定检验考察的问题是数据Zn是否由M(z)所刻画的
48、随机机制所产生,问题的探究已经超越M(z)的边界。也有学者指责模型设定检验本质上也是一种数据挖掘。实际应用中,数据挖掘的含义很宽:一种是指建模者为了证明某种先验理论而有意掩盖或摒弃与理论相悖的数据信息,这是不行取的;一种是指为了使计量模型通过一系列设定检验而反复修正模型形式的做法,此时只要建模者将模型设定检验的过程明朗化、严谨化和系统化,便是可取的建模方法(韩德瑞和秦朵,1998)。 在计量模型统计适切性评价中,稳健推断、模型设定检验与模型选择都发挥了重要作用,这些不同方法的使用肯定程度上也依靠于讨论目的。其中,模型设定检验是最为关键的步骤,每一种模型方法下都有相应的模型设定检验问题。假如设定检验的结果暴露出问题,就应当重新考虑模型的设定,重新进展检验,直至通过检验。这一过程可以概括为“模型设定模型估量模型