《第六章--异方差性ppt课件.ppt》由会员分享,可在线阅读,更多相关《第六章--异方差性ppt课件.ppt(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 异方差性异方差性 学习目的学习目的通过本章的学习,了解什么是异方差性,异方差性是如何形成的,异通过本章的学习,了解什么是异方差性,异方差性是如何形成的,异方差性导致什么样的后果,怎样检验和处理具有异方差性的模型。方差性导致什么样的后果,怎样检验和处理具有异方差性的模型。 基本要求基本要求1)掌握异方差性的概念、异方差性的后果和几种常见的检验方法。掌握异方差性的概念、异方差性的后果和几种常见的检验方法。2)了解了解加权最小二乘法加权最小二乘法原理,并能运用加权最小二乘法估计线性回原理,并能运用加权最小二乘法估计线性回归模型。归模型。3)了解异方差稳健推断原理。了解异方差稳健推断原理
2、。引子:引子:更为接近真实的结论是什么?更为接近真实的结论是什么? 根据四川省根据四川省20002000年年2121个地市州医疗机构数与人口数个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结医疗机构数与人口数的回归模型。对模型估计的结果如下:果如下: 式中式中 表示卫生医疗机构数(个),表示卫生医疗机构数(个), 表示人口表示人口数量(万人)。数量(万人)。 (291.5778) (0.644284)-563.0548 5.3735iiYX20.785456R 20.774146R 6
3、9.56003F (-1.931062) (8.340265)t YX参数标准误差参数标准误差模型显示的结果和问题模型显示的结果和问题 人口数量对应参数的标准误差较小;人口数量对应参数的标准误差较小; t 统计量远大于临界值,可决系数和修正的可决系数结果统计量远大于临界值,可决系数和修正的可决系数结果 较好,较好,F检验结果明显显著;检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量表明该模型的估计效果不错,可以认为人口数量 每增加每增加1 1万人,平均说来医疗机构将增加万人,平均说来医疗机构将增加5.37355.3735个个。 然而,这里得出的结论可能是不可靠的,平均说来每增加然
4、而,这里得出的结论可能是不可靠的,平均说来每增加1 1万人口万人口可能并不需要增加可能并不需要增加这样多的医疗机构,所得结论并这样多的医疗机构,所得结论并不符合真实情况。不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更为接近有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?真实的结论又是什么呢?异方差性及其产生原因异方差性及其产生原因 异方差性的影响异方差性的影响 异方差性的检验异方差性的检验 异方差性的的修正异方差性的的修正第六章第六章 异方差性异方差性第一节第一节 异方差性及其产生原因异方差性及其产生原因 同方差的含义同方差的含义 同方差性:对所有的同方
5、差性:对所有的 有:有: (6.16.1) 因为方差是度量被解释变量因为方差是度量被解释变量 的观测值围绕回归线的观测值围绕回归线 (6.26.2) 的的分散程度分散程度,因此同方差性指的是所有观测值的,因此同方差性指的是所有观测值的 分散程度分散程度相同相同。 01122E( ).iiikkiYXXX (1,2,., )i in2Var( ) =iuY 图形表示图形表示XY概率密度X 设模型为设模型为 如果对于模型中随机误差项如果对于模型中随机误差项 有:有: 第一节第一节 异方差性及其产生原因异方差性及其产生原因iu01122.1,2,.,iiikkiiYXXXuin2Var(),1,2,
6、3,.,iiuin(6.4)(6.3)、异方差性的含义、异方差性的含义即对于不同的样本点,随机干扰项的方差不再是常数,即对于不同的样本点,随机干扰项的方差不再是常数,而是而是互不相同互不相同,则认为出现了,则认为出现了异方差异方差(Heteroskedasticity)。进一步,把异方差看成是。进一步,把异方差看成是由于由于某个解释变量的变化而引起的某个解释变量的变化而引起的,则,则22Var( )()iiiuf X(6.4) 图形表示图形表示XY概率密度 异方差性是指模型违反古典假定中的同方差性,异方差性是指模型违反古典假定中的同方差性,即即各残差项的方差并非相等各残差项的方差并非相等。一般
7、地,一般地,由于数据观测质量、数据异常值、某些由于数据观测质量、数据异常值、某些经济变化的特性、模型设定形式的偏误经济变化的特性、模型设定形式的偏误等原因,等原因,导致了异方差的出现。导致了异方差的出现。主要原因往往是主要原因往往是重要变量的遗漏重要变量的遗漏,所以很多情况,所以很多情况下,异方差表现为下,异方差表现为残差方差随着某个残差方差随着某个(未纳入模(未纳入模型的)型的)解释变量的变化而变化解释变量的变化而变化。二、异方差的类型二、异方差的类型2()iif X常数i 同方差性假定是指回归模型中不可观察的随机误差项同方差性假定是指回归模型中不可观察的随机误差项 条件的方差是一个常数,因
8、此每个条件的方差是一个常数,因此每个 的条件方差不随的条件方差不随X的变化而变化,即有的变化而变化,即有以解释变量以解释变量X为为i2()iif X不再是常数,不再是常数,2i在异方差的情况下,总体中的随机误差项在异方差的情况下,总体中的随机误差项的方差的方差通常它随解释变量值的变化而变化,即通常它随解释变量值的变化而变化,即i2()iif X 根据根据2i 与解释变量与解释变量X的关系,异方差一般可归结为三种类型(如图):的关系,异方差一般可归结为三种类型(如图):(1 1)单调递增型:)单调递增型:2i 随随X的增大而增大;的增大而增大;(2 2)单调递减型:)单调递减型:(3)复杂型:)
9、复杂型: 随随X的增大而减小;的增大而减小;2i随随X的变化呈复杂形式。的变化呈复杂形式。 2i三、异方差产生的原因三、异方差产生的原因例例6-1 6-1 居民储蓄模型居民储蓄模型在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为 01iiiSYiSiY其中,其中,为第为第i个家庭的储蓄额,个家庭的储蓄额, 为第为第i个家庭的可支配收入。个家庭的可支配收入。 析:析: iiiY在该模型中,假定在该模型中,假定的方差为常数往往不符合实际情况。对于高收入的方差为常数往往不符合实际情况。对于高收入的方差往往随的的方差往往随的这属于这属于递增型
10、异方差。递增型异方差。家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定的目的而储蓄),差异较小。因此特定的目的而储蓄),差异较小。因此增加而增加,增加而增加,(一)截面数据中总体各单位的差异(一)截面数据中总体各单位的差异 通常认为,截面数据较时间序列数据更容易产生通常认为,截面数据较时间序列数据更容易产生异方差。这是因为异方差。这是因为同一时点不同对象的差异,一同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异般说来会大于同一对象不同时间的差异。不过,。不过,在时间序列数据发生较大变化的情况下,也可
11、能在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。出现比截面数据更严重的异方差。三、异方差产生的原因三、异方差产生的原因例例6-2 6-2 干中学模型干中学模型 人们在学习的过程中,其行为误差随时间而减少。在这种情况下,人们在学习的过程中,其行为误差随时间而减少。在这种情况下, 会减小。会减小。i2i 的方差的方差可以预料可以预料 例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打
12、错字个数下降,而且打错字个数的方差也下降,这属于字个数下降,而且打错字个数的方差也下降,这属于递减型的异方差。递减型的异方差。资料收集技术的改进可能会使资料收集技术的改进可能会使2i减小。减小。 例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。(二)数据的测量误差(二)数据的测量误差 样本数据的观测误差有可能随样本数据的观测误差有可能随研究范围研究范围的扩大的扩大 而增加,或而增加,或随时间的推移随时间的推移
13、逐步积累,也可能随逐步积累,也可能随 着着观测技术的提高观测技术的提高而逐步减小。而逐步减小。 以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境外部环境对产出量的影响被包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。三、异方差产生的原因三、异方差产生的原因 (三)模型中省略了某些重要的解释变量(三)模型中省略了某些重要的解释变量假设正确的计量模型是:
14、假设正确的计量模型是: 假如略去假如略去 ,而采用,而采用 当被略去的当被略去的 与与 有呈同方向或反方向变有呈同方向或反方向变 化的趋势时化的趋势时, ,随随 的有规律变化会体现在(的有规律变化会体现在(6.56.5) 式的式的 中。中。3iX01122iiiiYXXu3iX*011iiiYXu2iX1iX*iu(6.5)*iu1iX例例6-36-3股票价格和消费者价格股票价格和消费者价格 考虑如下考虑如下20个国家在第二次世界大战后直至个国家在第二次世界大战后直至1969年间的股票价格年间的股票价格(Y)和消费者价格)和消费者价格(X)的百分比变化的散点图。的百分比变化的散点图。 图中,对
15、智利的观测值图中,对智利的观测值Y和和X远大于对其他国家远大于对其他国家的观测值,故可视为一个异常值,在这种情况下,的观测值,故可视为一个异常值,在这种情况下,同方差性的假定就难以维持了。同方差性的假定就难以维持了。三、异方差产生的原因三、异方差产生的原因例例6-4 6-4 假性异方差假性异方差两个变量有真实关系:两个变量有真实关系: 201iiiYX其中其中i满足线性回归模型的假定,即满足零均值和不变方差的假定。满足线性回归模型的假定,即满足零均值和不变方差的假定。01iiiYX如果我们误以为如果我们误以为Y和和X之间的关系为:之间的关系为:并认为并认为( )0iE,那么,那么2220011
16、( )()()()iiiiiVarEEXX记记20011( ) () ()iiif XXX ,则,则2222( )()()()iiiiiVarEEf XfX( )iVariX因此因此是是的函数,即我们建立的模型具有异方差。的函数,即我们建立的模型具有异方差。 (四)模型的设定误差(四)模型的设定误差 模型的设定主要包括变量的选择和模型数学形式模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的的函
17、数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。关系设定为线性,也可能导致异方差。第二节第二节 异方差性的影响异方差性的影响1参数估计量非有效参数估计量非有效 计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型参数,会产生一系列不良后果。参数,会产生一系列不良后果。2OLS估计的随机干扰项的方差不再是无偏的估计的随机干扰项的方差不再是无偏的3基于基于OLS估计的各种统计检验非有效估计的各种统计检验非有效4模型的预测失效模型的预测失效1 1参数估计量非有效参数估计量非有效 根据前面有关根据前面有关O
18、LS参数估计量的无偏性和有效性的证明过程,可以参数估计量的无偏性和有效性的证明过程,可以看到,当计量经济学模型出现异方差时,其普通最小二乘法看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量参数估计量仍然具有无偏性和一致性仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并,因为同方差假设在证明无偏性和一致性时并没有起作用。但在异方差情况下没有起作用。但在异方差情况下OLS估计量估计量不再具有有效性不再具有有效性,因为在有,因为在有效性证明中利用了效性证明中利用了2()E I而且在大样本情况下,而且在大样本情况下,OLS估计量也不具有渐进有效性。估计量也不具有渐进有效性。
19、为详细说明异方差使为详细说明异方差使OLS参数估计量的无效性,我们考虑一元回归模型:参数估计量的无效性,我们考虑一元回归模型: (6-2)01iiiYX该模型参数的该模型参数的OLS估计量可以写为估计量可以写为 对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。如果模型随机误差项包含异方差,那么有如果模型随机误差项包含异方差,那么有2(|)iiiVarX这一异方差取决于这一异方差取决于iX的值。的值。12iiix yx2211221()()niiiniixVarx(6-3)212()iVarx(6-4) 显然(显
20、然(6-3)式与()式与(6-4)式不同,只有在)式不同,只有在22i时两者才是相同的。时两者才是相同的。在上述给定的异方差情况下,在上述给定的异方差情况下,1的方差为的方差为容易证明容易证明而同方差假设下,而同方差假设下,1的的OLS估计方差为估计方差为2 2OLSOLS估计的随机干扰项的方差不再是无偏的估计的随机干扰项的方差不再是无偏的 异方差时异方差时OLS估计的随机误差项的方差不再是真实随机干扰项估计的随机误差项的方差不再是真实随机干扰项方差的无偏估计,正是因为这一点才使得方差的无偏估计,正是因为这一点才使得OLS估计的参数不再是有估计的参数不再是有效的,这可从(效的,这可从(6-3)
21、式中直接看出来。)式中直接看出来。2211221()()niiiniixVarx(6-3)3 3基于基于OLSOLS估计的各种统计检验非有效估计的各种统计检验非有效1)t统计量统计量 不再服从不再服从t分布;分布; 3)F 统计量也不再服从统计量也不再服从F分布;分布; 4)LM(拉格朗日乘数检验)(拉格朗日乘数检验)统计量也不再有渐近统计量也不再有渐近2分布。分布。 总而言之,在异方差情况下,我们建立在高斯马尔科夫定理总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,基础上的用来检验各种假设的统计量都不再是有效的, OLS估计量不再是最佳线性
22、无偏估计量。估计量不再是最佳线性无偏估计量。 变量的显著性检验中,构造了t统计量由于方差不是常数而是变数,这时一般意义上由于方差不是常数而是变数,这时一般意义上t t 比值的分布比值的分布是未知的是未知的,不再遵从,不再遵从t-t-分布,使得分布,使得t t检验失效;同理,在异方检验失效;同理,在异方差条件下,差条件下,F F比值也不再是遵从比值也不再是遵从F-F-分布,分布,F F检验也失效。检验也失效。4 4模型的预测失效模型的预测失效 当模型出现异方差时,当模型出现异方差时,一方面,由于上述后果,使得一方面,由于上述后果,使得OLS估计不再具有良好的统计估计不再具有良好的统计性质;另一方
23、面,由于在被解释变量预测值的置信区间中也性质;另一方面,由于在被解释变量预测值的置信区间中也包含有参数估计量的标准差包含有参数估计量的标准差,所以,如果仍然使用,所以,如果仍然使用OLS估计估计量,将导致预测区间偏大或偏小,预测功能失效。量,将导致预测区间偏大或偏小,预测功能失效。 判断下列说法是否正确,并简要说明为什么。判断下列说法是否正确,并简要说明为什么。 (1 1)当异方差出现时,最小二乘估计是有偏的)当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性和不具有最小方差特性有效性;有效性; (2 2)当异方差出现时,常用的)当异方差出现时,常用的t t和和F F检验失效;检验失效;
24、 (3 3)如果回归模型中遗漏一个重要变量,则)如果回归模型中遗漏一个重要变量,则OLSOLS残差必定表现出明显的趋势。残差必定表现出明显的趋势。 第三节第三节 异方差性检验异方差性检验用什么来表示随机干扰项的方差?用什么来表示随机干扰项的方差? 问题问题 : 一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰项的估计量,用项的估计量,用ie表示。这样我们有表示。这样我们有22()() ( )iiiiiOLSVarEeeYY即用即用2ie来表示随机干扰项的方差。来表示随机干扰项的方差。检验思路:检验思路:由于由于异方差性
25、异方差性就是相对于不同的解释变量观测值,随机就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验误差项具有不同的方差。那么:检验异方差性,也就是检验随机误随机误差项的方差与解释变量观测值之间的相关性及其相关的差项的方差与解释变量观测值之间的相关性及其相关的“形式形式”。 对于对于解释变量引起的异方差解释变量引起的异方差,我们可以用,我们可以用如下几种方法来检验异方差。如下几种方法来检验异方差。一、图示检验法一、图示检验法二、帕克二、帕克(Park)检验与戈里瑟检验与戈里瑟(Gleiser)检验检验三、三、G-Q(Goldfeld-Quandt)检验)检验四、
26、四、F检验检验五、拉格朗日乘子检验五、拉格朗日乘子检验六、怀特检验六、怀特检验一、图示检验法一、图示检验法 (一)相关图形分析(一)相关图形分析 方差描述的是方差描述的是随机变量取值的(与其均值的)离散程度随机变量取值的(与其均值的)离散程度。 因为被解释变量因为被解释变量 与随机误差项与随机误差项 有相同的方差,所以利用分有相同的方差,所以利用分析析 与与 的相关图形,可以初略地看到的相关图形,可以初略地看到 的离散程度与的离散程度与 之之间是否有相关关系。间是否有相关关系。 如果随着如果随着 的增加,的增加, 的离散程度为逐渐增大(或减小)的变的离散程度为逐渐增大(或减小)的变化趋势,则认
27、为存在递增型(或递减型)的异方差。化趋势,则认为存在递增型(或递减型)的异方差。uYXXYYXY用用19981998年四川省各地市州农村居民家庭消费支出与家庭纯年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图收入的数据,绘制出消费支出对纯收入的散点图, ,其中用其中用 表示农村家庭消费支出,表示农村家庭消费支出, 表示家庭纯收入。表示家庭纯收入。1Y1X图形举例图形举例设一元线性回归模型为:设一元线性回归模型为: 运用运用OLS法估计法估计, ,得样本回归模型为:得样本回归模型为:由上两式得残差:由上两式得残差:绘制出绘制出 对对 的散点图的散点图如果如果
28、 不随不随 而变化,则表明而变化,则表明不存在异方差不存在异方差;如果如果 随随 而变化,则表明而变化,则表明存在异方差存在异方差。 (二)残差图形分析(二)残差图形分析12iiiY Xu12iiY=+ X-iiieYY2ieiXiuiuiXiX一、图示检验法一、图示检验法 e i 2 e i 2 X X 同方差 递增异方差 e i 2 e i 2 X X 递减异方差 复杂型异方差 图图6-2 不同异方差类型不同异方差类型(图示检验法只能进行大概的判断)(图示检验法只能进行大概的判断)二、帕克二、帕克(Park)(Park)检验与戈里瑟检验与戈里瑟( (GleiserGleiser) )检验检
29、验 基本思想:基本思想:2ie|iejX 以以 或或 为被解释变量,以原模型的某一个解释变量为被解释变量,以原模型的某一个解释变量为解释变量,建立如下回归方程:为解释变量,建立如下回归方程:2()ijiief X或或 ()ijiief X 选择关于变量选择关于变量Xj 的不同函数形式,对方程进行估计并进行显著性的不同函数形式,对方程进行估计并进行显著性检验。如果检验。如果存在某一种函数形式,使得方程显著成立,则说明原模型存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性存在异方差性。该检验要求变量的观测值为大样本。该检验要求变量的观测值为大样本。检验的步骤检验的步骤 1.1.建立模
30、型并求建立模型并求 根据样本数据建立回归模型,并求残差序列根据样本数据建立回归模型,并求残差序列 2.2.寻找寻找 与与 的最佳函数形式的最佳函数形式 用残差绝对值用残差绝对值 对对 进行回归,用各种函数进行回归,用各种函数 形式去试,寻找最佳的函数形式。形式去试,寻找最佳的函数形式。iXieiiie = Y -YieXie 3.3.判断判断 根据选择的函数形式作根据选择的函数形式作 对对 的回归,的回归, 作为作为 的替代变量,对所选函数形式回归。用回归所得的替代变量,对所选函数形式回归。用回归所得到的到的 、 、 等信息判断,若参数等信息判断,若参数 显著不为零显著不为零,即认为存在异方差
31、性。,即认为存在异方差性。FXie2iet三、三、G-QG-Q(Goldfeld-QuandtGoldfeld-Quandt)检验)检验基础基础基本思想基本思想 F检验检验 按某一个解释变量对样本排序,再将排序后按某一个解释变量对样本排序,再将排序后的样本一分为二,对子样本和子样本分别作的样本一分为二,对子样本和子样本分别作OLS回归,然后利用回归,然后利用两个子样本的残差平方和之比两个子样本的残差平方和之比构造构造 F 统计量进行异方差检验统计量进行异方差检验。 作用作用:检验递增性:检验递增性(或递减性或递减性)异方差。异方差。检验的前提条件:检验的前提条件: 1、要求检验使用的为大样本容
32、量。、要求检验使用的为大样本容量。 2、除了同方差假定不成立外,其它假定均满足。、除了同方差假定不成立外,其它假定均满足。步骤步骤 1.排序排序将将n组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。 2.数据分组数据分组将序列中间的将序列中间的c个观察值除去,并将剩下的观察值划分为较小与个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为较大的相同的两个子样本,每个子样样本容量均为 , 这样做主要是为了突出小方差样本和大方差样本之间的差异。这样做主要是为了突出小方差样本和大方差
33、样本之间的差异。()2nc 3.提出假设提出假设222220112H :, =1,2,., ;H :in = in. 步骤步骤 2212,iiee()12nck 对每个子样分别进行对每个子样分别进行OLS回归,并计算各自的残差平方和。分别用回归,并计算各自的残差平方和。分别用 表示较小的与较大的残差平方和(自由度均为表示较小的与较大的残差平方和(自由度均为 )。)。 4.构造构造F统计量统计量在同方差性假定下,构造如下满足在同方差性假定下,构造如下满足F分布的统计量:分布的统计量:2221/ (1)2(1,1)22 / (1)2iincekncncFFkkncek5.判断判断 12( ,)F
34、v v12( ,)FF v v 给定显著性水平给定显著性水平 ,确定临界值,确定临界值 。若。若则拒绝同方差性假设,表明原模型随机干扰项存在异方差性。则拒绝同方差性假设,表明原模型随机干扰项存在异方差性。当然,还可根据两个残差平方和对应的子样的顺序判断是递增当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。型异方差还是递减异型方差。,注意:注意: 1)G-Q检验结果有时要依赖于省略的样本个数检验结果有时要依赖于省略的样本个数c的大小。的大小。 根据蒙特卡洛试验结果和实际经验,根据蒙特卡洛试验结果和实际经验,Judge等人建议等人建议若若n 为为30 左右,左右,c
35、 取取4;若;若n 为为60 左右,左右,c 取取10。2)G-Q检验需要按照某一被认为有可能引起异方差的解释变量检验需要按照某一被认为有可能引起异方差的解释变量 观察值的大小排序,因此,观察值的大小排序,因此,可能需要对各个解释变量进行轮可能需要对各个解释变量进行轮 流试验,而且它只适合检验单调递增或递减型异方差。流试验,而且它只适合检验单调递增或递减型异方差。Goldfeld-Quanadt检验具体操作检验具体操作1. 1. EViewsEViews软件操作软件操作 (1)对变量取值排序(按递增或递减)对变量取值排序(按递增或递减)。在。在Procs菜单里选菜单里选Sort Current
36、 Page/Sort Workfile Series命令,出现排序命令,出现排序对话框,键入对话框,键入 ,如果以递增型排序,选,如果以递增型排序,选“Ascenging”,如果以递减型排序,则应选如果以递减型排序,则应选“Descending”,点,点ok。本例本例选递增型排序,这时变量选递增型排序,这时变量 与与 将以将以 按递增型排序。按递增型排序。 (2 2)构造子样本区间,建立回归模型构造子样本区间,建立回归模型。在本例中,样本容量。在本例中,样本容量 ,删除中间,删除中间1/41/4的观测值,即大约的观测值,即大约5 5个观测值,余下部分平分个观测值,余下部分平分得两个样本区间:得
37、两个样本区间:1-81-8和和14-2114-21,它们的样本个数均是,它们的样本个数均是8 8个,即个,即 X128nnXY21nX在在Sample菜单里,将区间定义为菜单里,将区间定义为1-8,然后用,然后用OLS方方法法 求得如下结果求得如下结果(表表1)在在Sample菜单里菜单里,将区间定义为将区间定义为14-21,再用,再用OLS方法求得如下结果方法求得如下结果(表表2)(3 3)求求F统计量值统计量值。基于表。基于表1 1和表和表2 2中残差平方和的中残差平方和的数据,即数据,即Sum squared resid的值。由表的值。由表1 1计算得到计算得到的残差平方和为的残差平方和
38、为 ,由表,由表2 2计算得到的计算得到的残差平方和为残差平方和为 。根据根据Goldfeld-Quanadt检验,检验,F统计量为统计量为 21=144958.9ie22= 734355.8ie2221734355.85.066144958.9iieFe (4)判断判断 在在 下,式中分子、分母的自由度均为下,式中分子、分母的自由度均为6, 查查F分布表得临界值为:分布表得临界值为: 因为因为 ,所以拒绝原假设,所以拒绝原假设,表明模型确实存在异方差。表明模型确实存在异方差。0.050.05(6,6)4.28F0.055.066(6,6)4.28FF四、四、F F 检验检验考虑我们常用的多元
39、线性回归模型考虑我们常用的多元线性回归模型01122 12iiikkiiYXXXin, , ,假定该模型满足高斯马尔科夫假设,特别地我们假设假定该模型满足高斯马尔科夫假设,特别地我们假设12(|,)0kEXXXOLS估计依然是无偏、一致估计估计依然是无偏、一致估计同方差假设意味着同方差假设意味着等价于等价于只需检验只需检验 是否与一个或多个解释变量相关,可估计如是否与一个或多个解释变量相关,可估计如下方程下方程然后检验该方程的总体显著性,统计量为然后检验该方程的总体显著性,统计量为2012:(|,)kHVARXXX220:()HE2201122iiikkiieXXXv2222/(1)/(1)e
40、eRkFRnk五、拉格朗日乘子检验五、拉格朗日乘子检验222keLMnR (6-11)用于检验异方差的用于检验异方差的LM统计量可以通过下式得到统计量可以通过下式得到步骤步骤 (1)用)用OLS估计模型,得到估计模型,得到OLS回归残差平方回归残差平方2ie 序列。序列。 (2) 对(对(6-9)进行回归,记下回归得到的拟合优度)进行回归,记下回归得到的拟合优度 。22 eR(4) 如果如果BP检验的检验的P值很小,那就应该采取一些纠正的措施,一个可能的值很小,那就应该采取一些纠正的措施,一个可能的 措施就是用措施就是用异方差稳健标准差异方差稳健标准差和前面讨论过的检验统计量。和前面讨论过的检
41、验统计量。 (3) 计算计算LM统计量相应的统计量相应的P值值(查(查2 分布表得到的概率),如果分布表得到的概率),如果P值足够值足够小,即小于给定的显著性水平的话,那么我们就拒绝同方差的零假设。小,即小于给定的显著性水平的话,那么我们就拒绝同方差的零假设。六、怀特检验六、怀特检验 2ie与多个解释变量可能存在非线性关系与多个解释变量可能存在非线性关系范围:范围: 基本思想:基本思想: 不需要关于异方差的任何先验信息,只需要在不需要关于异方差的任何先验信息,只需要在大样本的情况下,将大样本的情况下,将OLS估计后的残差平方对估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘常数、解释
42、变量、解释变量的平方及其交叉乘积等所构成一个辅助回归积等所构成一个辅助回归,利用辅助回归建立,利用辅助回归建立相应的检验统计量来判断异方差性。相应的检验统计量来判断异方差性。下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。例:例: 对于二元回归模型对于二元回归模型01122 12iiiiYXXin, , ,(6-12) 先做先做OLS回归,再做如下辅助回归回归,再做如下辅助回归222011223142512iiiiiiiieXXXXX Xv相应的相应的LM统计量为统计量为22 eLMnR可在大样本情况下进行可在大样
43、本情况下进行 检验,也可用检验,也可用F统计量进行检验统计量进行检验当辅助回归中的解释变量较多时,可去掉交叉项或用被解释变当辅助回归中的解释变量较多时,可去掉交叉项或用被解释变量的预测估计值做解释变量量的预测估计值做解释变量2White检验的基本步骤:检验的基本步骤: 以一个二元线性回归模型为例,设模型为:以一个二元线性回归模型为例,设模型为: (6.7)6.7) 并且,设异方差与并且,设异方差与 的一般关系为的一般关系为(6.8) (6.8) 其中其中 为随机误差项。为随机误差项。012t1t2ttY = + X + X +u23,ttXX222012456t1t2t1t2t1t2tt =
44、+ X + X + X + X + X X +vtv1.1.求回归估计式并计算求回归估计式并计算用用OLS估计式(估计式(6.76.7),计算残差),计算残差 ,并求残差,并求残差的平方的平方 。2.2.求辅助函数求辅助函数用残差平方用残差平方 作为异方差作为异方差 的估计,并建立的估计,并建立 的辅助回归,即的辅助回归,即(6.9) 222012356t1t2t1t2t1t2te = + X + X + X + X + X X-ttteY Y2te2t22232323ttttttX ,X ,X ,X ,X X2te2te3.3.计算计算 利用求回归估计式(利用求回归估计式(6.86.8)得到
45、辅助回归函数的可)得到辅助回归函数的可决系数决系数 , 为样本容量。为样本容量。4.4.提出假设提出假设 0261H0,H2,3,.,6j:=.=:j(=)不全为零2nRn5.5.检验检验 在零假设成立下,有在零假设成立下,有 渐进服从自由度为渐进服从自由度为5 5的的 分布。给定显著性水平分布。给定显著性水平 , ,查查 分布表得临界分布表得临界值值 ,如果,如果 , ,则拒绝原假设,表明模则拒绝原假设,表明模型中随机误差存在异方差型中随机误差存在异方差 。2nR22(5)222(5)nRWhite检验具体操作检验具体操作 由表由表6.2估计结果,按路径估计结果,按路径view/residu
46、al tests/white heteroskedasticity(no cross terms or cross terms),进入进入White检验。检验。 根据根据White检验中辅助函数的构造,最后一项为变检验中辅助函数的构造,最后一项为变 量的交叉乘积项,因为本例为一元函数,故无交叉量的交叉乘积项,因为本例为一元函数,故无交叉 乘积项,因此应选乘积项,因此应选no cross terms,则辅助函数则辅助函数 为:为: 经估计出现经估计出现White检验结果,见表检验结果,见表6.36.3。22012ttttxxv从表从表6.36.3可以看出可以看出由由White检验知,检验知,在在
47、 下,查查 分布表得临界值分布表得临界值 因为因为 所以拒绝原假设,不拒绝备所以拒绝原假设,不拒绝备择假设,表明模型存在异方择假设,表明模型存在异方差。差。218.0694nR0.052220.0518.0694(2)5.9915nR20.05(2)5.9915表表6.3例例6-5一个异方差检验的说明性例子一个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:给定如下农村居民人均消费函数回归模型:(6-14) 01122lnlnlniiiiYbbXbXm相关数据如表相关数据如表6-1。 1X2XY表示农村家庭人均消费支出,表示农村家庭人均消费支出, 表示从事农业经营的收入,表示从事农
48、业经营的收入, 表示其他收入。表示其他收入。地区地区人均人均消费支出消费支出Y农业经营农业经营收入收入X1其他其他收入收入X2地区地区人均人均消费支出消费支出Y农业经营农业经营收入收入X1其他其他收入收入X2北京北京天津天津河北河北山西山西内蒙古内蒙古辽宁辽宁吉林吉林黑龙江黑龙江上海上海江苏江苏浙江浙江安徽安徽福建福建江西江西山东山东河南河南3552.12050.91429.81221.61554.61786.31661.71604.54753.22374.73479.21412.42503.1172019051375.6579.11314.6928.8609.81492.81254.3163
49、4.61684.1652.51177.6985.81013.110531027.812931083.84446.42633.11674.81346.2480.51303.6547.6596.25218.42607.23596.61006.92327.71203.81511.61014.1湖北湖北湖南湖南广东广东广西广西海南海南重庆重庆四川四川贵州贵州云南云南西藏西藏陕西陕西甘肃甘肃青海青海宁夏宁夏新疆新疆2703.361550.621357.431475.161497.521098.391336.251123.711331.031127.371330.451388.791350.232703.
50、361550.621242.91068.81386.7883.2919.3764889.4589.6614.8621.6803.8859.61300.11242.91068.82526.9875.6839.810881067.7647.8644.3814.4876887753.5963.4410.32526.9875.6表表6-1 中国中国2001年各地区农村居民家庭人均纯收入与消费支出年各地区农村居民家庭人均纯收入与消费支出 单位:元单位:元 例例6-5一一个异方差检验的说明性例子个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:给定如下农村居民人均消费函数回归模型:(6-14)