第六章异方差性.pptx

上传人:莉*** 文档编号:80100953 上传时间:2023-03-22 格式:PPTX 页数:100 大小:1.49MB
返回 下载 相关 举报
第六章异方差性.pptx_第1页
第1页 / 共100页
第六章异方差性.pptx_第2页
第2页 / 共100页
点击查看更多>>
资源描述

《第六章异方差性.pptx》由会员分享,可在线阅读,更多相关《第六章异方差性.pptx(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、引子:更为接近真实的结论是什么?更为接近真实的结论是什么?根据四川省20002000年2121个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:式中 表示卫生医疗机构数(个),表示人口数量(万人)。参数标准误差第1页/共100页模型显示的结果和问题模型显示的结果和问题 人口数量对应参数的标准误差较小;t 统计量远大于临界值,可决系数和修正的可决系数结果 较好,F检验结果明显显著;表明该模型的估计效果不错,可以认为人口数量表明该模型的估计效果不错,可以认为人口数量 每增加每增加1 1万人,平均说来医疗机构将增加万人,平均说来

2、医疗机构将增加5.37355.3735个个。然而,这里得出的结论可能是不可靠的,平均说来每增加1 1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?第2页/共100页异方差性及其产生原因异方差性及其产生原因 异方差性的影响异方差性的影响 异方差性的检验异方差性的检验 异方差性的的修正异方差性的的修正第六章 异方差性第3页/共100页第一节 异方差性及其产生原因 同方差的含义同方差的含义 同方差性:对所有的同方差性:对所有的 有:有:(6.16.1)因为方差是度量被解释变量因为方差是度量被解释变量 的观测值

3、围绕回归线的观测值围绕回归线 (6.26.2)的的分散程度分散程度,因此同方差性指的是所有观测值的,因此同方差性指的是所有观测值的 分散程度分散程度相同相同。第4页/共100页图形表示图形表示第5页/共100页 设模型为 如果对于模型中随机误差项 有:第一节 异方差性及其产生原因(6.4)(6.3)、异方差性的含义第6页/共100页即对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差(Heteroskedasticity)。进一步,把异方差看成是由于某个解释变量的变化而引起的,则(6.4)第7页/共100页图形表示图形表示第8页/共100页 异方差性是指模型违反古典

4、假定中的同方差性,即各残差项的方差并非相等。一般地,由于数据观测质量、数据异常值、某些经济变化的特性、模型设定形式的偏误等原因,导致了异方差的出现。主要原因往往是重要变量的遗漏,所以很多情况下,异方差表现为残差方差随着某个(未纳入模型的)解释变量的变化而变化。第9页/共100页二、异方差的类型二、异方差的类型 同方差性假定是指回归模型中不可观察的随机误差项同方差性假定是指回归模型中不可观察的随机误差项 条件的方差是一个常数,因此每个条件的方差是一个常数,因此每个 的条件方差不随的条件方差不随X的变化而变化,即有的变化而变化,即有以解释变量以解释变量X为为不再是常数,不再是常数,在异方差的情况下

5、,总体中的随机误差项在异方差的情况下,总体中的随机误差项的方差的方差通常它随解释变量值的变化而变化,即通常它随解释变量值的变化而变化,即第10页/共100页 根据根据 与解释变量与解释变量X的关系,异方差一般可归结为三种类型(如图):的关系,异方差一般可归结为三种类型(如图):(1 1)单调递增型:)单调递增型:随随X的增大而增大;的增大而增大;(2 2)单调递减型:)单调递减型:(3)复杂型:)复杂型:随随X的增大而减小;的增大而减小;随随X的变化呈复杂形式。的变化呈复杂形式。第11页/共100页第12页/共100页三、异方差产生的原因三、异方差产生的原因例例6-1 6-1 居民储蓄模型居民

6、储蓄模型在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为 其中,其中,为第为第i个家庭的储蓄额,个家庭的储蓄额,为第为第i个家庭的可支配收入。个家庭的可支配收入。析:析:在该模型中,假定在该模型中,假定的方差为常数往往不符合实际情况。对于高收入的方差为常数往往不符合实际情况。对于高收入的方差往往随的的方差往往随的这属于这属于递增型异方差。递增型异方差。家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定的目的而储蓄),差异较小。因此特定的目的而储蓄),差异

7、较小。因此增加而增加,增加而增加,第13页/共100页(一)截面数据中总体各单位的差异 通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。第14页/共100页三、异方差产生的原因三、异方差产生的原因例例6-2 6-2 干中学模型干中学模型 人们在学习的过程中,其行为误差随时间而减少。在这种情况下,人们在学习的过程中,其行为误差随时间而减少。在这种情况下,会减小。会减小。的方差的方差可以预料可以预料 例如,考虑一次打字测验,在给定的一段时间里,打字出

8、错个数与用例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错字个数下降,而且打错字个数的方差也下降,这属于字个数下降,而且打错字个数的方差也下降,这属于递减型的异方差。递减型的异方差。资料收集技术的改进可能会使资料收集技术的改进可能会使减小。减小。例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。银行,在他们对帐户的每月或每季财务报告中,

9、会出现更少的差错。第15页/共100页(二)数据的测量误差 样本数据的观测误差有可能随研究范围的扩大 而增加,或随时间的推移逐步积累,也可能随 着观测技术的提高而逐步减小。第16页/共100页以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A,那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。三、异方差产生的原因三、异方差产生的原因第17页/共1

10、00页 (三)模型中省略了某些重要的解释变量假设正确的计量模型是:假如略去 ,而采用 当被略去的 与 有呈同方向或反方向变 化的趋势时,随 的有规律变化会体现在(6.56.5)式的 中。(6.5)第18页/共100页例例6-36-3股票价格和消费者价格股票价格和消费者价格 考虑如下考虑如下20个国家在第二次世界大战后直至个国家在第二次世界大战后直至1969年间的股票价格年间的股票价格(Y)和消费者价格)和消费者价格(X)的百分比变化的散点图。的百分比变化的散点图。图中,对智利的观测值图中,对智利的观测值Y和和X远大于对其他国家远大于对其他国家的观测值,故可视为一个异常值,在这种情况下,的观测值

11、,故可视为一个异常值,在这种情况下,同方差性的假定就难以维持了。同方差性的假定就难以维持了。第19页/共100页三、异方差产生的原因三、异方差产生的原因例例6-4 6-4 假性异方差假性异方差两个变量有真实关系:两个变量有真实关系:其中其中满足线性回归模型的假定,即满足零均值和不变方差的假定。满足线性回归模型的假定,即满足零均值和不变方差的假定。如果我们误以为如果我们误以为Y和和X之间的关系为:之间的关系为:并认为并认为,那么,那么记记,则,则因此因此是是的函数,即我们建立的模型具有异方差。的函数,即我们建立的模型具有异方差。第20页/共100页(四)模型的设定误差 模型的设定主要包括变量的选

12、择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。第21页/共100页第二节第二节 异方差性的影响异方差性的影响1参数估计量非有效参数估计量非有效 计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型参数,会产生一系列不良后果。参数,会产生一系列不良后果。2OLS估计的随机干扰项的方差不再是无偏的估计的随机干扰项的方差不再是无偏的3基于基于OLS估计的各种统计检验非有效估计的各种统计检验非有效4模型

13、的预测失效模型的预测失效第22页/共100页1 1参数估计量非有效参数估计量非有效 根据前面有关根据前面有关OLS参数估计量的无偏性和有效性的证明过程,可以参数估计量的无偏性和有效性的证明过程,可以看到,当计量经济学模型出现异方差时,其普通最小二乘法看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量参数估计量仍然具有无偏性和一致性仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并,因为同方差假设在证明无偏性和一致性时并没有起作用。但在异方差情况下没有起作用。但在异方差情况下OLS估计量估计量不再具有有效性不再具有有效性,因为在有,因为在有效性证明中利用了效性证明中利用了

14、而且在大样本情况下,而且在大样本情况下,OLS估计量也不具有渐进有效性。估计量也不具有渐进有效性。第23页/共100页为详细说明异方差使为详细说明异方差使OLS参数估计量的无效性,我们考虑一元回归模型:参数估计量的无效性,我们考虑一元回归模型:(6-2)该模型参数的该模型参数的OLS估计量可以写为估计量可以写为 对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。如果模型随机误差项包含异方差,那么有如果模型随机误差项包含异方差,那么有这一异方差取决于这一异方差取决于的值。的值。第24页/共100页(6-3)(6-4

15、)显然(显然(6-3)式与()式与(6-4)式不同,只有在)式不同,只有在时两者才是相同的。时两者才是相同的。在上述给定的异方差情况下,在上述给定的异方差情况下,的方差为的方差为容易证明容易证明而同方差假设下,而同方差假设下,的的OLS估计方差为估计方差为第25页/共100页2 2OLSOLS估计的随机干扰项的方差不再是无偏的估计的随机干扰项的方差不再是无偏的 异方差时异方差时OLS估计的随机误差项的方差不再是真实随机干扰项估计的随机误差项的方差不再是真实随机干扰项方差的无偏估计,正是因为这一点才使得方差的无偏估计,正是因为这一点才使得OLS估计的参数不再是有估计的参数不再是有效的,这可从(效

16、的,这可从(6-3)式中直接看出来。)式中直接看出来。(6-3)第26页/共100页3 3基于基于OLSOLS估计的各种统计检验非有效估计的各种统计检验非有效1)t统计量统计量 不再服从不再服从t分布;分布;3)F 统计量也不再服从统计量也不再服从F分布;分布;4)LM(拉格朗日乘数检验)(拉格朗日乘数检验)统计量也不再有渐近统计量也不再有渐近分布。分布。总而言之,在异方差情况下,我们建立在高斯马尔科夫定理总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,基础上的用来检验各种假设的统计量都不再是有效的,OLS估计量不再是最佳线性无偏估计量。估计

17、量不再是最佳线性无偏估计量。第27页/共100页 变量的显著性检验中,构造了t统计量由于方差不是常数而是变数,这时一般意义上由于方差不是常数而是变数,这时一般意义上t t 比值的分布比值的分布是未知的是未知的,不再遵从,不再遵从t-t-分布,使得分布,使得t t检验失效;同理,在异方检验失效;同理,在异方差条件下,差条件下,F F比值也不再是遵从比值也不再是遵从F-F-分布,分布,F F检验也失效。检验也失效。第28页/共100页4 4模型的预测失效模型的预测失效 当模型出现异方差时,当模型出现异方差时,一方面,由于上述后果,使得一方面,由于上述后果,使得OLS估计不再具有良好的统计估计不再具

18、有良好的统计性质;另一方面,由于在被解释变量预测值的置信区间中也性质;另一方面,由于在被解释变量预测值的置信区间中也包含有参数估计量的标准差包含有参数估计量的标准差,所以,如果仍然使用,所以,如果仍然使用OLS估计估计量,将导致预测区间偏大或偏小,预测功能失效。量,将导致预测区间偏大或偏小,预测功能失效。第29页/共100页第30页/共100页判断下列说法是否正确,并简要说明为什么。(1 1)当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性有效性;(2 2)当异方差出现时,常用的t t和F F检验失效;(3 3)如果回归模型中遗漏一个重要变量,则OLSOLS残差必定表现出明显的趋势。第

19、31页/共100页第三节第三节 异方差性检验异方差性检验用什么来表示随机干扰项的方差?用什么来表示随机干扰项的方差?问题问题 :一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰项的估计量,用项的估计量,用表示。这样我们有表示。这样我们有即用即用来表示随机干扰项的方差。来表示随机干扰项的方差。检验思路:检验思路:由于由于异方差性异方差性就是相对于不同的解释变量观测值,随机就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验误差项具有不同的方差。那么:检验异方差性,也就是检验随机误随机误

20、差项的方差与解释变量观测值之间的相关性及其相关的差项的方差与解释变量观测值之间的相关性及其相关的“形式形式”。第32页/共100页 对于对于解释变量引起的异方差解释变量引起的异方差,我们可以用,我们可以用如下几种方法来检验异方差。如下几种方法来检验异方差。一、图示检验法一、图示检验法二、帕克二、帕克(Park)检验与戈里瑟检验与戈里瑟(Gleiser)检验检验三、三、G-Q(Goldfeld-Quandt)检验)检验四、四、F检验检验五、拉格朗日乘子检验五、拉格朗日乘子检验六、怀特检验六、怀特检验第33页/共100页一、图示检验法一、图示检验法 (一)相关图形分析 方差描述的是随机变量取值的(

21、与其均值的)离散程度。因为被解释变量 与随机误差项 有相同的方差,所以利用分析 与 的相关图形,可以初略地看到 的离散程度与 之间是否有相关关系。如果随着 的增加,的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。第34页/共100页用用19981998年四川省各地市州农村居民家庭消费支出与家庭纯年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图收入的数据,绘制出消费支出对纯收入的散点图,其中用其中用 表示农村家庭消费支出,表示农村家庭消费支出,表示家庭纯收入。表示家庭纯收入。图形举例图形举例第35页/共100页设一元线性回归模

22、型为:运用OLS法估计,得样本回归模型为:由上两式得残差:绘制出 对 的散点图如果 不随 而变化,则表明不存在异方差;如果 随 而变化,则表明存在异方差。(二)残差图形分析第36页/共100页一、图示检验法一、图示检验法图图6-2 不同异方差类型不同异方差类型(图示检验法只能进行大概的判断)(图示检验法只能进行大概的判断)第37页/共100页二、帕克二、帕克(Park)(Park)检验与戈里瑟检验与戈里瑟(Gleiser)(Gleiser)检验检验 基本思想:基本思想:以以 或或 为被解释变量,以原模型的某一个解释变量为被解释变量,以原模型的某一个解释变量为解释变量,建立如下回归方程:为解释变

23、量,建立如下回归方程:或或 选择关于变量选择关于变量Xj 的不同函数形式,对方程进行估计并进行显著性的不同函数形式,对方程进行估计并进行显著性检验。如果检验。如果存在某一种函数形式,使得方程显著成立,则说明原模型存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性存在异方差性。该检验要求变量的观测值为大样本。第38页/共100页检验的步骤 1.1.建立模型并求 根据样本数据建立回归模型,并求残差序列 2.2.寻找 与 的最佳函数形式 用残差绝对值 对 进行回归,用各种函数 形式去试,寻找最佳的函数形式。第39页/共100页 3.3.判断 根据选择的函数形式作 对 的回归,作为 的替代

24、变量,对所选函数形式回归。用回归所得到的 、等信息判断,若参数 显著不为零,即认为存在异方差性。第40页/共100页第41页/共100页三、三、G-QG-Q(Goldfeld-QuandtGoldfeld-Quandt)检验)检验基础基本思想基本思想 F检验 按某一个解释变量对样本排序,再将排序后的样本一分为二,对子样本和子样本分别作OLS回归,然后利用两个子样本的残差平方和之比两个子样本的残差平方和之比构造 F 统计量进行异方差检验。作用:检验递增性(或递减性)异方差。检验的前提条件:1、要求检验使用的为大样本容量。2、除了同方差假定不成立外,其它假定均满足。第42页/共100页步骤步骤 1

25、.排序将将n组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。组样本观察值按某一被认为可能引起异方差的解释变量的观察值大小排序。2.数据分组数据分组将序列中间的将序列中间的c个观察值除去,并将剩下的观察值划分为较小与个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为较大的相同的两个子样本,每个子样样本容量均为,这样做主要是为了突出小方差样本和大方差样本之间的差异。这样做主要是为了突出小方差样本和大方差样本之间的差异。3.提出假设第43页/共100页步骤步骤 对每个子样分别进行对每个子样分别进行OLS回归,并计算各自的残差平方和。分别用回归,并

26、计算各自的残差平方和。分别用 表示较小的与较大的残差平方和(自由度均为表示较小的与较大的残差平方和(自由度均为 )。)。4.构造F统计量在同方差性假定下,构造如下满足F分布的统计量:第44页/共100页5.判断 给定显著性水平给定显著性水平 ,确定临界值,确定临界值 。若。若则拒绝同方差性假设,表明原模型随机干扰项存在异方差性。则拒绝同方差性假设,表明原模型随机干扰项存在异方差性。当然,还可根据两个残差平方和对应的子样的顺序判断是递增当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。型异方差还是递减异型方差。,第45页/共100页注意:注意:1)G-Q检验结果有时

27、要依赖于省略的样本个数检验结果有时要依赖于省略的样本个数c的大小。的大小。根据蒙特卡洛试验结果和实际经验,根据蒙特卡洛试验结果和实际经验,Judge等人建议等人建议若若n 为为30 左右,左右,c 取取4;若;若n 为为60 左右,左右,c 取取10。2)G-Q检验需要按照某一被认为有可能引起异方差的解释变量检验需要按照某一被认为有可能引起异方差的解释变量 观察值的大小排序,因此,观察值的大小排序,因此,可能需要对各个解释变量进行轮可能需要对各个解释变量进行轮 流试验,而且它只适合检验单调递增或递减型异方差。流试验,而且它只适合检验单调递增或递减型异方差。第46页/共100页Goldfeld-

28、Quanadt检验具体操作检验具体操作1.EViews1.EViews软件操作软件操作 (1)对对变变量量取取值值排排序序(按按递递增增或或递递减减)。在在Procs菜菜单单里里选选Sort Current Page/Sort Workfile Series命命令令,出出现现排排序序对对话话框框,键键入入 ,如如果果以以递递增增型型排排序序,选选“Ascenging”,如如 果果 以以 递递 减减 型型 排排 序序,则则 应应 选选“Descending”,点点ok。本本例例选选递递增增型型排排序序,这这时时变变量量 与与 将以将以 按递增型排序。按递增型排序。(2 2)构构造造子子样样本本区

29、区间间,建建立立回回归归模模型型。在在本本例例中中,样样本本容容量量 ,删删除除中中间间1/41/4的的观观测测值值,即即大大约约5 5个个观观测测值值,余余下下部部分分平平分分得得两两个个样样本本区区间间:1-81-8和和14-2114-21,它它们们的的样样本本个个数均是数均是8 8个,即个,即 第47页/共100页在在Sample菜单里,将区间定义为菜单里,将区间定义为1-8,然后用,然后用OLS方法方法 求得如下结果求得如下结果(表表1)第48页/共100页在在Sample菜单里菜单里,将区间定义为将区间定义为14-21,再用,再用OLS方法求得如下结果方法求得如下结果(表表2)第49

30、页/共100页(3 3)求求F统计量值统计量值。基于表。基于表1 1和表和表2 2中残差平方和的中残差平方和的数据,即数据,即Sum squared resid的值。由表的值。由表1 1计算得到计算得到的残差平方和为的残差平方和为 ,由表,由表2 2计算得到的计算得到的残差平方和为残差平方和为 。根据根据Goldfeld-Quanadt检验,检验,F统计量为统计量为 第50页/共100页 (4)判断 在 下,式中分子、分母的自由度均为6,查F分布表得临界值为:因为 ,所以拒绝原假设,表明模型确实存在异方差。第51页/共100页四、四、F F 检验检验考虑我们常用的多元线性回归模型考虑我们常用的

31、多元线性回归模型假定该模型满足高斯马尔科夫假设,特别地我们假设假定该模型满足高斯马尔科夫假设,特别地我们假设OLS估计依然是无偏、一致估计估计依然是无偏、一致估计第52页/共100页同方差假设意味着等价于只需检验 是否与一个或多个解释变量相关,可估计如下方程然后检验该方程的总体显著性,统计量为第53页/共100页五、拉格朗日乘子检验五、拉格朗日乘子检验 (6-11)用于检验异方差的用于检验异方差的LM统计量可以通过下式得到统计量可以通过下式得到步骤步骤 (1)用)用OLS估计模型,得到估计模型,得到OLS回归残差平方回归残差平方 序列。序列。(2)对(对(6-9)进行回归,记下回归得到的拟合优

32、度)进行回归,记下回归得到的拟合优度 。(4)如果如果BP检验的检验的P值很小,那就应该采取一些纠正的措施,一个可能的值很小,那就应该采取一些纠正的措施,一个可能的 措施就是用措施就是用异方差稳健标准差异方差稳健标准差和前面讨论过的检验统计量。和前面讨论过的检验统计量。(3)计算计算LM统计量相应的统计量相应的P值值(查(查 分布表得到的概率),如果分布表得到的概率),如果P值足够值足够小,即小于给定的显著性水平的话,那么我们就拒绝同方差的零假设。小,即小于给定的显著性水平的话,那么我们就拒绝同方差的零假设。第54页/共100页六、怀特检验六、怀特检验 与多个解释变量可能存在非线性关系与多个解

33、释变量可能存在非线性关系范围:范围:基本思想:不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。第55页/共100页下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。下面以两个解释变量的回归模型为例来说明怀特检验的基本思想与步骤。例:例:对于二元回归模型对于二元回归模型(6-12)先做先做OLS回归,再做如下辅助回归回归,再做如下辅助回归相应的相应的LM统计量为统计量为可在大样本情况下进行可在大样本情况下进行 检验,也可用检验,也可用F统

34、计量进行检验统计量进行检验当辅助回归中的解释变量较多时,可去掉交叉项或用被解释变量当辅助回归中的解释变量较多时,可去掉交叉项或用被解释变量的预测估计值做解释变量的预测估计值做解释变量第56页/共100页White检验的基本步骤:以一个二元线性回归模型为例,设模型为:(6.7)6.7)并且,设异方差与 的一般关系为(6.8)(6.8)其中 为随机误差项。第57页/共100页1.1.求回归估计式并计算求回归估计式并计算用用OLS估计式(估计式(6.76.7),计算残差),计算残差 ,并求残差的平方,并求残差的平方 。2.2.求辅助函数求辅助函数用残差平方用残差平方 作为异方差作为异方差 的估计,并

35、建立的估计,并建立 的辅助回归,即的辅助回归,即(6.9)第58页/共100页3.3.计算计算 利用求回归估计式(利用求回归估计式(6.86.8)得到辅助回归函数的可决系数)得到辅助回归函数的可决系数 ,为样本容量。为样本容量。4.4.提出假设提出假设 第59页/共100页5.5.检验检验 在零假设成立下,有在零假设成立下,有 渐进服从自由度为渐进服从自由度为5 5的的 分布。给定显著性水平分布。给定显著性水平 ,查查 分布表得临界值分布表得临界值 ,如果,如果 ,则拒绝原假设,表明模型中随则拒绝原假设,表明模型中随机误差存在异方差机误差存在异方差 。第60页/共100页White检验具体操作

36、检验具体操作 由表6.2估计结果,按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms),进入White检验。根据White检验中辅助函数的构造,最后一项为变 量的交叉乘积项,因为本例为一元函数,故无交叉 乘积项,因此应选no cross terms,则辅助函数 为:经估计出现经估计出现White检验结果,见表检验结果,见表6.36.3。第61页/共100页从表从表6.36.3可以看出可以看出由由White检验知,检验知,在在 下,查查 分布表得临界值分布表得临界值 因为因为 所以拒绝原假设,

37、不拒绝备所以拒绝原假设,不拒绝备择假设,表明模型存在异方择假设,表明模型存在异方差。差。表表6.3第62页/共100页例例6-5一个异方差检验的说明性例子一个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:给定如下农村居民人均消费函数回归模型:(6-14)相关数据如表相关数据如表6-1。Y表示农村家庭人均消费支出,表示农村家庭人均消费支出,表示从事农业经营的收入,表示从事农业经营的收入,表示其他收入。表示其他收入。第63页/共100页地区地区人均人均消费支出消费支出Y农业经营农业经营收入收入X1其他其他收入收入X2地区地区人均人均消费支出消费支出Y农业经营农业经营收入收入X1其他其

38、他收入收入X2北京北京天津天津河北河北山西山西内蒙古内蒙古辽宁辽宁吉林吉林黑龙江黑龙江上海上海江苏江苏浙江浙江安徽安徽福建福建江西江西山东山东河南河南3552.12050.91429.81221.61554.61786.31661.71604.54753.22374.73479.21412.42503.1172019051375.6579.11314.6928.8609.81492.81254.31634.61684.1652.51177.6985.81013.110531027.812931083.84446.42633.11674.81346.2480.51303.6547.6596.25

39、218.42607.23596.61006.92327.71203.81511.61014.1湖北湖北湖南湖南广东广东广西广西海南海南重庆重庆四川四川贵州贵州云南云南西藏西藏陕西陕西甘肃甘肃青海青海宁夏宁夏新疆新疆2703.361550.621357.431475.161497.521098.391336.251123.711331.031127.371330.451388.791350.232703.361550.621242.91068.81386.7883.2919.3764889.4589.6614.8621.6803.8859.61300.11242.91068.82526.9875

40、.6839.810881067.7647.8644.3814.4876887753.5963.4410.32526.9875.6表表6-1 中国中国2001年各地区农村居民家庭人均纯收入与消费支出年各地区农村居民家庭人均纯收入与消费支出 单位:元单位:元 第64页/共100页例例6-5一一个异方差检验的说明性例子个异方差检验的说明性例子给定如下农村居民人均消费函数回归模型:给定如下农村居民人均消费函数回归模型:(6-14)相关数据如表相关数据如表6-1。Y表示农村家庭人均消费支出,表示农村家庭人均消费支出,表示从事农业经营的收入,表示从事农业经营的收入,表示其他收入。表示其他收入。下面利用表下

41、面利用表6-1中中国中中国2001年各地区农村居民家庭人均纯收入及消费年各地区农村居民家庭人均纯收入及消费支出的相关数据对(支出的相关数据对(6-14)式进行)式进行OLS估计,然后再进行异方差性检验。估计,然后再进行异方差性检验。第65页/共100页OLSOLS估计结果如下:估计结果如下:估计结果表明,其他收入的增长对人均消费支出增长的估计结果表明,其他收入的增长对人均消费支出增长的影响大于农业收入增长对人均消费支出的增长。接下来影响大于农业收入增长对人均消费支出的增长。接下来我们进行异方差性检验。我们进行异方差性检验。第66页/共100页可以认为不同地区农村人均消费支出的差别主要来源于非农

42、可以认为不同地区农村人均消费支出的差别主要来源于非农经营收入及其他收入的差别,因此如果存在异方差,则可能经营收入及其他收入的差别,因此如果存在异方差,则可能是是X X2 2引起的。观察残差平方项引起的。观察残差平方项e e2 2与与 lnlnX X2 2的散点图的散点图 :第67页/共100页G-QG-Q检验检验:1 1、将原始数据按、将原始数据按X X2 2排成升序,去掉中间的排成升序,去掉中间的5 5个数据,得到个数据,得到两个容量各为两个容量各为1313的子样本。的子样本。、对两个子样本分别做、对两个子样本分别做OLSOLS回归,得到各自的残差平方和回归,得到各自的残差平方和RSSRSS

43、1 1和和RSSRSS2 2 。子样本:子样本:第68页/共100页、计算 F 统计量。在在5%5%的显著性水平下,自由度为(的显著性水平下,自由度为(10,1010,10)的)的F分布分布的临界值为的临界值为F0.05(10,10)=2.97,因此,因此G-Q检验在检验在5%5%的显著的显著性水平下拒绝两组样本存在同方差的假定,原模型中性水平下拒绝两组样本存在同方差的假定,原模型中lnX2可能带来递增型的异方差。可能带来递增型的异方差。检验结果:检验结果:F检验、检验、LM检验、怀特检验检验、怀特检验第69页/共100页第四节第四节 异方差性的修正异方差性的修正一、异方差稳健推断一、异方差稳

44、健推断二、加权最小二乘法二、加权最小二乘法第70页/共100页一、异方差稳健推断一、异方差稳健推断 调整标准差、调整标准差、t 统计量、统计量、F 统计量、统计量、LM 统计量以使得他统计量以使得他们在存在未知形式的异方差时仍然有用。这就意味着可以报们在存在未知形式的异方差时仍然有用。这就意味着可以报告新的有用统计量,这种方法就是告新的有用统计量,这种方法就是异方差稳健推断异方差稳健推断(Heteroskedasticity-Robust Inference)。)。定义:定义:我们先看看在异方差情况下,怎样推断参数估计量的方差我们先看看在异方差情况下,怎样推断参数估计量的方差。第71页/共10

45、0页考虑第二节中的一元线性回归模型,如下考虑第二节中的一元线性回归模型,如下(6-16)对于该模型,我们假定除同方差假设外,其他的基本假设对于该模型,我们假定除同方差假设外,其他的基本假设都成立。如果模型随机误差项包含异方差,那么有都成立。如果模型随机误差项包含异方差,那么有(6-17)这一异方差取决于这一异方差取决于的值。的值。第72页/共100页 该模型参数该模型参数 的的OLS估计量可以写为估计量可以写为(6-18)(6-19)在异方差下,容易证明在异方差下,容易证明的方差为的方差为当当时,上式就是满足同方差假设下时,上式就是满足同方差假设下OLS估计的估计的的方差。的方差。(6-20)

46、用用 表示初始的表示初始的Y对对X进行进行OLS回归后得到的残差,那么对于任何形式的回归后得到的残差,那么对于任何形式的 的恰当估计量为的恰当估计量为异方差(包括同方差)而言,异方差(包括同方差)而言,第73页/共100页对于一般的多元回归模型对于一般的多元回归模型(6-21)假定随机误差项除了是异方差外,其他基本假设满足,可以证明假定随机误差项除了是异方差外,其他基本假设满足,可以证明的恰当估计量为的恰当估计量为(6-22)这里这里为来自用为来自用对所有其他的解释变量进行回归得到的第对所有其他的解释变量进行回归得到的第i个残差,个残差,是该回归的残差平方和。是该回归的残差平方和。据式(据式(

47、6-20)、()、(6-22)可求得异方差稳健标准差)可求得异方差稳健标准差第74页/共100页 有了异方差稳健标准差,可以很方便的求得异方差稳健有了异方差稳健标准差,可以很方便的求得异方差稳健t统计量,统计量,还可以计算相应的还可以计算相应的F、LM统计量。统计量。异方差稳健异方差稳健LM统计量的计算步骤概括如下:统计量的计算步骤概括如下:(1)对受限模型进行对受限模型进行OLS回归得到回归残差回归得到回归残差;(2)分别把在零假设下每一个被排除的自变量对其余未被排除的自变量进行分别把在零假设下每一个被排除的自变量对其余未被排除的自变量进行 回归,如果有回归,如果有q个被排除的变量,那么将得

48、到个被排除的变量,那么将得到q个残差序列(个残差序列(););(3)求出每个残差序列求出每个残差序列 和和 的乘积;的乘积;(4)用虚变量用虚变量1对对 进行回归(不包括截距)得到残差平方和进行回归(不包括截距)得到残差平方和,进而可以计算得到进而可以计算得到LM统计量为统计量为 。在零假设。在零假设 下,下,LM 分布。分布。统计量近似服从统计量近似服从第75页/共100页二、加权最小二乘法二、加权最小二乘法 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用模型,然后采用OLS法估计其参数。法估计其参数

49、。定义:定义:基本思想:基本思想:在采用在采用OLS方法时,对较小的残差平方方法时,对较小的残差平方赋予较大的权重,对较大的赋予较大的权重,对较大的赋予较小的权重,以对残差提供的信息的重要程度作一番修正,提高参赋予较小的权重,以对残差提供的信息的重要程度作一番修正,提高参数估计的精确程度。数估计的精确程度。第76页/共100页不同形式的异方差要求用不同的加权方法来处理。不同形式的异方差要求用不同的加权方法来处理。(一)(一)异方差为异方差为已知的解释变量的某一函数形式已知的解释变量的某一函数形式时时 的加权最小二乘估计的加权最小二乘估计(二)(二)异方差形式未知时的估计异方差形式未知时的估计可

50、行的加权最小可行的加权最小 二乘法二乘法第77页/共100页(一)(一)异方差为已知的解释变量的某一函数形式时的加权最小二乘估计异方差为已知的解释变量的某一函数形式时的加权最小二乘估计对于多元回归模型对于多元回归模型(6-23)用用代表所有的解释变量,我们假定第代表所有的解释变量,我们假定第i个随机误差个随机误差的方差为如下形式的方差为如下形式其中其中是某些导致异方差的解释变量观察值的函数。是某些导致异方差的解释变量观察值的函数。该式表明该式表明去除原模型,使之变成如下形式的新模型:去除原模型,使之变成如下形式的新模型:随机干扰项的方差与某些解释变量之间存在相关性,那么我们可以用随机干扰项的方

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁