《计量经济学异方差性优秀课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学异方差性优秀课件.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学异方差性第1页,本讲稿共52页第六章第六章 异方差性异方差性 学习目的学习目的 通过本章的学习,你可以知道什么是异方差性,异方差性是通过本章的学习,你可以知道什么是异方差性,异方差性是如何形成的,异方差性导致什么样的后果,怎样检验和处理具有如何形成的,异方差性导致什么样的后果,怎样检验和处理具有异方差性的模型。异方差性的模型。基本要求基本要求1)掌握异方差性的概念、异方差性的后果和几种常见的检验方法。掌握异方差性的概念、异方差性的后果和几种常见的检验方法。2)了解加权最小二乘法原理,并能运用加权最小二乘法估计线性回归模型。了解加权最小二乘法原理,并能运用加权最小二乘法估计线性回归模型
2、。3)了解异方差稳健推断原理。了解异方差稳健推断原理。第2页,本讲稿共52页异方差性及其产生原因异方差性及其产生原因 异方差性的影响异方差性的影响 异方差性的检验异方差性的检验 异方差性的的修正异方差性的的修正第六章第六章 异方差性异方差性第3页,本讲稿共52页第一节第一节 异方差性及其产生原因异方差性及其产生原因、异方差性的含义、异方差性的含义对于多元线性回归模型对于多元线性回归模型(6-1)同方差性假设为同方差性假设为如果出现如果出现 即对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同即对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了,则认为出现了异方差性
3、异方差性(HeteroskedasticityHeteroskedasticity)。)。第4页,本讲稿共52页二、异方差的类型二、异方差的类型 同方差性假定是指回同方差性假定是指回归归模型中不可模型中不可观观察的随机察的随机误误差差项项 条件的方差是一个常数,因此每个条件的方差是一个常数,因此每个 的条件方差不随的条件方差不随X的的变变化而化而变变化,即有化,即有以解释变量以解释变量X为为不再是常数,不再是常数,在异方差的情况下,在异方差的情况下,总总体中的随机体中的随机误误差差项项的方差的方差通常它随解通常它随解释变释变量量值值的的变变化而化而变变化,即化,即第5页,本讲稿共52页 根据根
4、据 与解与解释变释变量量X的关系,异方差一般可的关系,异方差一般可归结为归结为三种三种类类型(如型(如图图):):(1 1)单调递单调递增型:增型:随随X的增大而增大;的增大而增大;(2 2)单调递单调递减型:减型:(3)复)复杂杂型:型:随随X的增大而减小;的增大而减小;随随X的的变变化呈复化呈复杂杂形式。形式。第6页,本讲稿共52页第7页,本讲稿共52页三、异方差产生的原因三、异方差产生的原因例例6-1 6-1 居民储蓄模型居民储蓄模型在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为 其中,其中,为为第第i个家庭的个家庭的储储蓄蓄
5、额额,为为第第i个家庭的可支配收入。个家庭的可支配收入。析:析:在在该该模型中,假定模型中,假定的方差的方差为为常数往往不符合常数往往不符合实际实际情况。情况。对对于高收入于高收入的方差往往随的的方差往往随的这这属于属于递递增型异方差。增型异方差。家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定的目的而储蓄),差异较小。因此特定的目的而储蓄),差异较小。因此增加而增加,增加而增加,第8页,本讲稿共52页三、异方差产生的原因三、异方差产生的原因例例6-2 6-2 干中学模型干中学模型 人人们们在学在学习习的的过过
6、程中,其行程中,其行为误为误差随差随时间时间而减少。在而减少。在这这种情况下,种情况下,会减小。会减小。的方差的方差可以预料可以预料 例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错字个数下降,而且打错字个数的方差也下降,这属于字个数下降,而且打错字个数的方差也下降,这属于递减型的异方差递减型的异方差。资资料收集技料收集技术术的改的改进进可能会使可能会使减小。减小。例如,相较于没有先进设备的银行,那些
7、拥有先进数据处理设备的例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。第9页,本讲稿共52页三、异方差产生的原因三、异方差产生的原因例例6-36-3股票价格和消费者价格股票价格和消费者价格 考虑如下考虑如下20个国家在第二个国家在第二次世界大战后直至次世界大战后直至1969年间的年间的股票价格(股票价格(Y)和消费者价格)和消费者价格(X)的百分比变化的散点图。的百分比变化的散点图。图中,对智利的观测值图中,对智利的观测值Y和和X远大于对其他国家的观测远大于对其他国
8、家的观测值,故可视为一个异常值,在值,故可视为一个异常值,在这种情况下,同方差性的假定这种情况下,同方差性的假定就难以维持了。就难以维持了。第10页,本讲稿共52页三、异方差产生的原因三、异方差产生的原因例例6-4 6-4 假性异方差假性异方差两个变量有真实关系:两个变量有真实关系:其中其中满满足足线线性回性回归归模型的假定,即模型的假定,即满满足零均足零均值值和不和不变变方差的假定。方差的假定。如果我们误以为如果我们误以为Y和和X之间的关系为:之间的关系为:并并认为认为,那么,那么记记,则则因此因此是是的函数,即我的函数,即我们们建立的模型具有异方差。建立的模型具有异方差。第11页,本讲稿共
9、52页第二节第二节 异方差性的影响异方差性的影响1参数估计量非有效参数估计量非有效 计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型参数,会产生一系列不良后果。参数,会产生一系列不良后果。2OLS估计的随机干扰项的方差不再是无偏的估计的随机干扰项的方差不再是无偏的3基于基于OLS估计的各种统计检验非有效估计的各种统计检验非有效4模型的预测失效模型的预测失效第12页,本讲稿共52页1 1参数估计量非有效参数估计量非有效 根据前面有关根据前面有关OLS参数估计量的无偏性和有效性的证明过程,可以参数估计量的无偏性和有效性的证
10、明过程,可以看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并没有起作用。但在异方差情况下没有起作用。但在异方差情况下OLS估计量不再具有有效性,因为在有估计量不再具有有效性,因为在有效性证明中利用了效性证明中利用了而且在大样本情况下,而且在大样本情况下,OLS估计量也不具有渐进有效性。估计量也不具有渐进有效性。第13页,本讲稿共52页为详细说明异方差使为详细说明异方差使OLS参数估计量的无效性,我
11、们考虑一元回归模型:参数估计量的无效性,我们考虑一元回归模型:(6-2)该模型参数的该模型参数的OLS估计量可以写为估计量可以写为 对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。如果模型随机误差项包含异方差,那么有如果模型随机误差项包含异方差,那么有这这一异方差取决于一异方差取决于的的值值。第14页,本讲稿共52页(6-3)(6-4)显显然(然(6-3)式与()式与(6-4)式不同,只有在)式不同,只有在时时两者才是相同的。两者才是相同的。在上述在上述给给定的异方差情况下,定的异方差情况下,的方差的方差为为容
12、易证明容易证明而同方差假而同方差假设设下,下,的的OLS估计方差为估计方差为第15页,本讲稿共52页2 2OLSOLS估计的随机干扰项的方差不再是无偏的估计的随机干扰项的方差不再是无偏的 异方差时异方差时OLS估计的随机误差项的方差不再是真实随机干扰项估计的随机误差项的方差不再是真实随机干扰项方差的无偏估计,正是因为这一点才使得方差的无偏估计,正是因为这一点才使得OLS估计的参数不再是有估计的参数不再是有效的,这可从(效的,这可从(6-3)式中直接看出来。)式中直接看出来。(6-3)第16页,本讲稿共52页3 3基于基于OLSOLS估计的各种统计检验非有效估计的各种统计检验非有效1)t统计量统
13、计量 不再服从不再服从t分布;分布;3)F 统计量也不再服从统计量也不再服从F分布;分布;4)LM统计统计量也不再有量也不再有渐渐近近分布。分布。总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,的用来检验各种假设的统计量都不再是有效的,OLS估计量不再是估计量不再是最佳线性无偏估计量(即不具有最佳线性无偏估计量(即不具有BLUE性质)。性质)。第17页,本讲稿共52页4 4模型的预测失效模型的预测失效 所以,如果仍然使用所以,如果仍然使用OLS估计量,将导致预测区间偏大或偏估计量,将导
14、致预测区间偏大或偏小,预测功能失效。小,预测功能失效。当模型出现异方差时,当模型出现异方差时,一方面,由于上述后果,使得一方面,由于上述后果,使得OLS估计不再具有良好的统计性质;估计不再具有良好的统计性质;另一方面,由于在被解释变量预测值的置信区间中也包含有参数估计另一方面,由于在被解释变量预测值的置信区间中也包含有参数估计 量的标准差,量的标准差,第18页,本讲稿共52页第三节第三节 异方差性检验异方差性检验用什么来表示随机干扰项的方差?用什么来表示随机干扰项的方差?问题问题 :一般的一般的处处理方法是首先采用普通最小二乘法估理方法是首先采用普通最小二乘法估计计模型,以求得随机干模型,以求
15、得随机干扰扰项项的估的估计计量,用量,用表示。表示。这样这样我我们们有有即用即用来表示随机干来表示随机干扰项扰项的方差。的方差。第19页,本讲稿共52页 对于对于解释变量引起的异方差解释变量引起的异方差,我们可以用,我们可以用如下几种方法来检验异方差。如下几种方法来检验异方差。一、图示检验法一、图示检验法二、帕克二、帕克(Park)检验与戈里瑟检验与戈里瑟(Gleiser)检验检验三、三、G-Q(Goldfeld-Quandt)检验)检验四、四、F检验检验五、拉格朗日乘子检验五、拉格朗日乘子检验六、怀特检验六、怀特检验第20页,本讲稿共52页一、图示检验法一、图示检验法图图6-2 不同异方差类
16、型不同异方差类型(图示检验法只能进行大概的判断)(图示检验法只能进行大概的判断)第21页,本讲稿共52页二、帕克二、帕克(Park)(Park)检验与戈里瑟检验与戈里瑟(Gleiser)(Gleiser)检验检验 基本思想:基本思想:以以 或或 为为被解被解释变释变量,以原模型的某一个解量,以原模型的某一个解释变释变量量为为解解释变释变量,建立如下回量,建立如下回归归方程:方程:或或 选择关于变量选择关于变量Xj的不同函数形式,对方程进行估计并进行显著性的不同函数形式,对方程进行估计并进行显著性检验。如果存在某一种函数形式,使得方程显著成立,则说明原模型检验。如果存在某一种函数形式,使得方程显
17、著成立,则说明原模型存在异方差性。存在异方差性。第22页,本讲稿共52页三、三、G-QG-Q(Goldfeld-QuandtGoldfeld-Quandt)检验)检验基础基础范围范围基本思想基本思想 F检验检验 样本容量较大、异方差递增或递减的情况样本容量较大、异方差递增或递减的情况 按某一个解释变量对样本排序,再将排序后的样本一分为二,按某一个解释变量对样本排序,再将排序后的样本一分为二,对子样本对子样本和子样本和子样本分别作分别作OLS回归,然后利用两个子样本回归,然后利用两个子样本 的残差平方和之比构造的残差平方和之比构造 F 统计量进行异方差检验。统计量进行异方差检验。第23页,本讲稿
18、共52页步骤步骤 (1)将)将n组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。(3)对对每个子每个子样样分分别进别进行行OLS回回归归,并,并计计算各自的残差平方和。分算各自的残差平方和。分别别用用 表示表示较较小的与小的与较较大的残差平方和(自由度均大的残差平方和(自由度均为为 )。)。(2)将序列中)将序列中间间的的c个个观观察察值值除去,并将剩下的除去,并将剩下的观观察察值值划分划分为较为较小与小与较较大的相同的大的相同的 两个子两个子样样本,每个子本,每个子样样样样本容量均本容量均为为 ,这样这样做主
19、要是做主要是为为了突出小方差了突出小方差 样本和大方差样本之间的差异。样本和大方差样本之间的差异。第24页,本讲稿共52页步骤步骤 (4)在同方差性假定下,构造如下)在同方差性假定下,构造如下满满足足F分布的分布的统计统计量:量:(5)给给定定显显著性水平著性水平 ,确定,确定临临界界值值 。若。若则则拒拒绝绝同方差性假同方差性假设设,表明原模型随机干,表明原模型随机干扰项扰项存在异方差性。存在异方差性。当然,当然,还还可根据两个残差平方和可根据两个残差平方和对应对应的子的子样样的的顺顺序判断是序判断是递递增增型异方差型异方差还还是是递递减异型方差。减异型方差。,第25页,本讲稿共52页注意:
20、注意:1)G-Q检验结果有时要依赖于省略的样本个数检验结果有时要依赖于省略的样本个数c的大小。的大小。根据蒙特卡洛试验结果和实际经验,根据蒙特卡洛试验结果和实际经验,Judge等人建议等人建议若若n 为为30 左右,左右,c 取取4;若;若n 为为60 左右,左右,c 取取10。2)G-Q检验需要按照某一被认为有可能引起异方差的解释变量检验需要按照某一被认为有可能引起异方差的解释变量 观察值的大小排序,因此,可能需要对各个解释变量进行轮观察值的大小排序,因此,可能需要对各个解释变量进行轮 流试验,而且它只适合检验单调递增或递减型异方差。流试验,而且它只适合检验单调递增或递减型异方差。第26页,
21、本讲稿共52页四、四、F F 检验检验考考虑虑我我们们常用的多元常用的多元线线性回性回归归模型模型假定假定该该模型模型满满足高斯足高斯马马尔尔科夫假科夫假设设,特,特别别地我地我们们假假设设OLS估估计计依然是无偏、一致估依然是无偏、一致估计计第27页,本讲稿共52页同方查差假设意味着同方查差假设意味着等价于等价于只需检验只需检验 是否与一个或多个解释变量相关,可是否与一个或多个解释变量相关,可估计如下方程估计如下方程然后检验该方程的总体显著性,统计量为然后检验该方程的总体显著性,统计量为第28页,本讲稿共52页五、拉格朗日乘子检验五、拉格朗日乘子检验 (6-11)用于检验异方差的用于检验异方
22、差的LM统计量可以通过下式得到统计量可以通过下式得到步骤步骤 (1)用)用OLS估估计计模型,得到模型,得到OLS回回归归残差平方残差平方 序列。序列。(2)对对(6-9)进进行回行回归归,记记下回下回归归得到的得到的拟拟合合优优度度 。(4)如果如果BP检验的检验的P值很小,那就应该采取一些纠正的措施,一个可能的值很小,那就应该采取一些纠正的措施,一个可能的 措施就是用异方差稳健标准差和前面讨论过的检验统计量。措施就是用异方差稳健标准差和前面讨论过的检验统计量。(3)计计算算LM统计统计量相量相应应的的P值值(查查 分布表得到的概率),如果分布表得到的概率),如果P值足够值足够小,即小于给定
23、的显著性水平的话,那么我们就拒绝同方差的零假设。小,即小于给定的显著性水平的话,那么我们就拒绝同方差的零假设。第29页,本讲稿共52页六、怀特检验六、怀特检验 与多个解与多个解释变释变量可能存在非量可能存在非线线性关系性关系范围:范围:下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。例:例:对对于二元回于二元回归归模型模型(6-12)先做先做OLS回回归归,再做如下,再做如下辅辅助回助回归归相相应应的的LM统计统计量量为为可在大可在大样样本情况下本情况下进进行行 检验检验,也可用,也可用F统计统计量量进进行行检验检
24、验当当辅辅助回助回归归中的解中的解释变释变量量较较多多时时,可去掉交叉,可去掉交叉项项或用被解或用被解释变释变量的量的预测预测估估计值计值做解做解释变释变量量第30页,本讲稿共52页例例6-5一个异方差检验的说明性例子一个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:给定如下农村居民人均消费函数回归模型:(6-14)相关数据如表相关数据如表6-1。Y表示表示农农村家庭人均消村家庭人均消费费支出,支出,表示从事表示从事农业经营农业经营的收入,的收入,表示其他收入。表示其他收入。第31页,本讲稿共52页地区地区人均人均消消费费支出支出Y农业经营农业经营收入收入X1其他其他收入收入X2
25、地区地区人均人均消消费费支出支出Y农业经营农业经营收入收入X1其他其他收入收入X2北京北京天津天津河北河北山西山西内蒙古内蒙古辽辽宁宁吉林吉林黑黑龙龙江江上海上海江江苏苏浙江浙江安徽安徽福建福建江西江西山山东东河南河南3552.12050.91429.81221.61554.61786.31661.71604.54753.22374.73479.21412.42503.1172019051375.6579.11314.6928.8609.81492.81254.31634.61684.1652.51177.6985.81013.110531027.812931083.84446.42633.1
26、1674.81346.2480.51303.6547.6596.25218.42607.23596.61006.92327.71203.81511.61014.1湖北湖北湖南湖南广广东东广西广西海南海南重重庆庆四川四川贵贵州州云南云南西藏西藏陕陕西西甘甘肃肃青海青海宁夏宁夏新疆新疆2703.361550.621357.431475.161497.521098.391336.251123.711331.031127.371330.451388.791350.232703.361550.621242.91068.81386.7883.2919.3764889.4589.6614.8621.6803
27、.8859.61300.11242.91068.82526.9875.6839.810881067.7647.8644.3814.4876887753.5963.4410.32526.9875.6表表6-1 中国中国2001年各地区农村居民家庭人均纯收入与消费支出年各地区农村居民家庭人均纯收入与消费支出 单位:元单位:元 第32页,本讲稿共52页例例6-5 一个异方差检验的说明性例子一个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:给定如下农村居民人均消费函数回归模型:(6-14)相关数据如表相关数据如表6-1。Y表示表示农农村家庭人均消村家庭人均消费费支出,支出,表示从事表示从
28、事农业经营农业经营的收入,的收入,表示其他收入。表示其他收入。下面利用表下面利用表6-1中中国中中国2001年各地区农村居民家庭人均纯收入及消费年各地区农村居民家庭人均纯收入及消费支出的相关数据对(支出的相关数据对(6-14)式进行)式进行OLS估计,然后再进行异方差性检验。估计,然后再进行异方差性检验。第33页,本讲稿共52页OLSOLS估计结果如下:估计结果如下:估计结果表明,其他收入的增长对人均消费支出增长的影响大于农业收入增长对人均消费支出的增长。接下来我们进行异方差性检验。第34页,本讲稿共52页可以认为不同地区农村人均消费支出的差别主要来源于非农经营收入及其他收入的差别,因此如果存
29、在异方差,则可能是X2引起的。观察残差平方项e2与 lnX2的散点图:第35页,本讲稿共52页G-QG-Q检验检验:1、将原始数据按X2排成升序,去掉中间的5个数据,得到两个容量各为13的子样本。、对两个子样本分别做OLS回归,得到各自的残差平方和RSS1和RSS2。子样本:子样本:第36页,本讲稿共52页、计算 F 统计量。在5%的显著性水平下,自由度为(10,10)的F分布的临界值为F0.05(10,10)=2.97,因此G-Q检验在5%的显著性水平下拒绝两组样本存在同方差的假定,原模型中lnX2可能带来递增型的异方差。检验结果:F检验、LM检验、怀特检验第37页,本讲稿共52页第四节第四
30、节 异方差性的修正异方差性的修正一、异方差稳健推断一、异方差稳健推断二、加权最小二乘法二、加权最小二乘法第38页,本讲稿共52页一、异方差稳健推断一、异方差稳健推断 调整标准差、调整标准差、t 统计量、统计量、F 统计量、统计量、LM 统计量以使得他们在存在统计量以使得他们在存在未知形式的异方差时仍然有用。这就意味着可以报告新的有用统计量,未知形式的异方差时仍然有用。这就意味着可以报告新的有用统计量,这种方法就是这种方法就是异方差稳健推断(异方差稳健推断(Heteroskedasticity-Robust Inference)。定义:定义:我我们们先看看在异方差情况下,怎先看看在异方差情况下,
31、怎样样推断参数估推断参数估计计量的方差量的方差。第39页,本讲稿共52页考虑第二节中的一元线性回归模型,如下考虑第二节中的一元线性回归模型,如下(6-16)对于该模型,我们假定除同方差假设外,其他的基本假设都成立。对于该模型,我们假定除同方差假设外,其他的基本假设都成立。如果模型随机误差项包含异方差,那么有如果模型随机误差项包含异方差,那么有(6-17)这这一异方差取决于一异方差取决于的的值值。第40页,本讲稿共52页 该该模型参数模型参数 的的OLS估估计计量可以写量可以写为为(6-18)(6-19)在异方差下,容易在异方差下,容易证证明明的方差的方差为为当当时时,上式就是,上式就是满满足同
32、方差假足同方差假设设下下OLS估估计计的的的方差。的方差。(6-20)用用 表示初始的表示初始的Y对对X进进行行OLS回回归归后得到的残差,那么后得到的残差,那么对对于任何形式的于任何形式的 的恰当估的恰当估计计量量为为异方差(包括同方差)而言,异方差(包括同方差)而言,第41页,本讲稿共52页对于一般的多元回归模型对于一般的多元回归模型(6-21)假定随机假定随机误误差差项项除了是异方差外,其他基本假除了是异方差外,其他基本假设满设满足,可以足,可以证证明明的恰当估的恰当估计计量量为为(6-22)这这里里为为来自用来自用对对所有其他的解所有其他的解释变释变量量进进行回行回归归得到的第得到的第
33、i个残差,个残差,是是该该回回归归的残差平方和。的残差平方和。据式(据式(6-20)、()、(6-22)可求得异方差稳健标准差)可求得异方差稳健标准差第42页,本讲稿共52页 有了异方差稳健标准差,可以很方便的求得异方差稳健有了异方差稳健标准差,可以很方便的求得异方差稳健t统计量,还可以计统计量,还可以计算相应的算相应的F、LM统计量。统计量。异方差稳健异方差稳健LM统计量的计算步骤概括如下:统计量的计算步骤概括如下:(1)对对受限模型受限模型进进行行OLS回回归归得到回得到回归归残差残差;(2)分分别别把在零假把在零假设设下每一个被排除的自下每一个被排除的自变变量量对对其余未被排除的自其余未
34、被排除的自变变量量进进行行 回回归归,如果有,如果有q个被排除的个被排除的变变量,那么将得到量,那么将得到q个残差序列(个残差序列(););(3)求出每个残差序列求出每个残差序列 和和 的乘的乘积积;(4)用虚用虚变变量量1对对 进进行回行回归归(不包括截距)得到残差平方和(不包括截距)得到残差平方和,进进而可以而可以计计算得到算得到LM统计统计量量为为 。在零假。在零假设设 下,下,LM 分布。分布。统计量近似服从统计量近似服从第43页,本讲稿共52页二、加权最小二乘法二、加权最小二乘法 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的加权最小二乘法是对原模型加权,使之变成一个
35、新的不存在异方差性的模型,然后采用模型,然后采用OLS法估计其参数。法估计其参数。定义:定义:基本思想:基本思想:在采用在采用OLS方法方法时时,对较对较小的残差平方小的残差平方赋赋予予较较大的大的权权重,重,对较对较大的大的赋赋予予较较小的小的权权重,以重,以对对残差提供的信息的重要程度作一番修正,提高参残差提供的信息的重要程度作一番修正,提高参数估计的精确程度。数估计的精确程度。第44页,本讲稿共52页不同形式的异方差要求用不同的加权方法来处理。不同形式的异方差要求用不同的加权方法来处理。(一)(一)异方差为异方差为已知的解释变量的某一函数形式已知的解释变量的某一函数形式时时 的加权最小二
36、乘估计的加权最小二乘估计(二)(二)异方差形式未知时的估计异方差形式未知时的估计可行的加权最小可行的加权最小 二乘法二乘法第45页,本讲稿共52页(一)(一)异方差为已知的解释变量的某一函数形式时的加权最小二乘估计异方差为已知的解释变量的某一函数形式时的加权最小二乘估计对于多元回归模型对于多元回归模型(6-23)用用代表所有的解代表所有的解释变释变量,我量,我们们假定第假定第i个随机个随机误误差差的方差的方差为为如下形式如下形式其中其中是某些是某些导导致异方差的解致异方差的解释变释变量量观观察察值值的函数。的函数。该式表明该式表明去除原模型,使之去除原模型,使之变变成如下形式的新模型:成如下形
37、式的新模型:随机干扰项的方差与某些解释变量之间存在相关性,那么我们可以用随机干扰项的方差与某些解释变量之间存在相关性,那么我们可以用第46页,本讲稿共52页进一步改写为:进一步改写为:(6-24)其中,其中,其余其余类类似。似。在在(6-24)式中,随机式中,随机误误差差项项 的方差的方差为为第47页,本讲稿共52页上面的加权最小二乘例子实际上就是对加了权的残差平方和实施上面的加权最小二乘例子实际上就是对加了权的残差平方和实施OLS估计,即求解估计,即求解如果直接用如果直接用干干扰项扰项的方差等于的方差等于1,它也,它也满满足同方差性,此足同方差性,此时时加加权权最小二乘法就是最小二乘法就是对
38、对如下加了如下加了权权的的模型模型进进行行OLS回回归归:作为权数,则容易验证变换后的模型的随机作为权数,则容易验证变换后的模型的随机第48页,本讲稿共52页加权最小二乘法如何用矩阵的形式来表示?加权最小二乘法如何用矩阵的形式来表示?讨论:讨论:第49页,本讲稿共52页 如果我们确实知道回归模型随机干扰项是异方差的,而且我们知如果我们确实知道回归模型随机干扰项是异方差的,而且我们知道异方差形式,那么我们应该用加权最小二乘法。但是有时候即使道异方差形式,那么我们应该用加权最小二乘法。但是有时候即使模型随机干扰项满足同方差假设,我们可能仍然需要用加权最小二模型随机干扰项满足同方差假设,我们可能仍然
39、需要用加权最小二乘来估计模型。例如当我们估计个体水平模型中的参数时,尽管个乘来估计模型。例如当我们估计个体水平模型中的参数时,尽管个体水平模型中的干扰项满足基本假设,但如果个体水平的资料不能体水平模型中的干扰项满足基本假设,但如果个体水平的资料不能得到,而只能得到某些组或某些地理区域中的个体的平均水平资料,得到,而只能得到某些组或某些地理区域中的个体的平均水平资料,这时估计模型就必须用加权最小二乘法(权重为个体规模数),因这时估计模型就必须用加权最小二乘法(权重为个体规模数),因为用平均水平的资料来估计个体为用平均水平的资料来估计个体 水平的模型,必然会出现异方差水平的模型,必然会出现异方差性
40、的问题。性的问题。第50页,本讲稿共52页 用个体规模作为权重进行加权最小二乘估计的前提是个体水平用个体规模作为权重进行加权最小二乘估计的前提是个体水平的回归模型的随机误差项满足同方差假设。如果个体水平模型随机的回归模型的随机误差项满足同方差假设。如果个体水平模型随机误差项是异方差的,那么正确的权重应取决于异方差的形式。这就误差项是异方差的,那么正确的权重应取决于异方差的形式。这就是为什么越来越多的研究者在用人均资料估计模型时只简单计算稳是为什么越来越多的研究者在用人均资料估计模型时只简单计算稳健标准差和相应的统计量。健标准差和相应的统计量。另一个变通的方法是根据个体规模来加权,但只报告另一个
41、变通的方法是根据个体规模来加权,但只报告WLSWLS估计中估计中异方差稳健统计量。这样可以确保在个体水平资料满足基本假设时,异方差稳健统计量。这样可以确保在个体水平资料满足基本假设时,估计结果有效;在个体水平资料存在异方差时,通过稳健推断来描估计结果有效;在个体水平资料存在异方差时,通过稳健推断来描述,估计是有用的。述,估计是有用的。第51页,本讲稿共52页(二)异方差形式未知时的估计(二)异方差形式未知时的估计可行的加权最小二乘法可行的加权最小二乘法定义:定义:我我们们把估把估计计的的 记为记为 而不是用而不是用的的权权重函数得到的估重函数得到的估计计量称量称为为可行的可行的加加权权最小二乘估最小二乘估计计量量(FWLS)。)。有很多方法模型化异方差形式,有很多方法模型化异方差形式,这这里介里介绍绍一种特殊的、比一种特殊的、比较较灵活的方法灵活的方法 ,用,用作为作为WLSWLS估计中估计中 假定随机假定随机误误差差 的方差的方差为为(6-27)这这里里是原回是原回归归模型中的解模型中的解释变释变量,量,是未知的参数,是未知的参数,如果用前面如果用前面的异方差表达式,那么的异方差表达式,那么这这里里第52页,本讲稿共52页