《计量经济学第五章-异方差讲解教学教材.ppt》由会员分享,可在线阅读,更多相关《计量经济学第五章-异方差讲解教学教材.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学第五章-异方差讲解 模型显示的结果和问题:模型显示的结果和问题:人口数量对应参数的标准误差较小人口数量对应参数的标准误差较小 t t 统计量远大于临界值统计量远大于临界值 可决系数和修正的可决系数结果较好可决系数和修正的可决系数结果较好 F F检验结果明显显著检验结果明显显著 表明该模型的估计效果不错,可以认为人口数量每表明该模型的估计效果不错,可以认为人口数量每增加增加1 1万人,平均说来医疗机构将增加万人,平均说来医疗机构将增加5.37355.3735个。个。然而,这里得出的结论可能是不可靠的,平均说来每然而,这里得出的结论可能是不可靠的,平均说来每增加增加1 1万人口可能并不需
2、要增加这样多的医疗机构,所得万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?更为接近真实的结论又是什么呢?第一节第一节 异方差性的概念异方差性的概念 一、异方差性的实质一、异方差性的实质(一)同方差性的含义(一)同方差性的含义 同方差性:对所有的同方差性:对所有的i i(i=1i=1,2 2,n n)有)有 既随机扰动项的方差为一个常数。既随机扰动项的方差为一个常数。因为方差是度量被解释变量因为方差是度量被解释变量Y Y的观测值围绕回归线的观
3、测值围绕回归线 的分散程度,因此同方差性指的是所有观测值具有的分散程度,因此同方差性指的是所有观测值具有相同相同的分散程度。的分散程度。(二)异方差性的含义(二)异方差性的含义 设模型为设模型为 如果对于模型中随机误差项如果对于模型中随机误差项 有:有:则称具有则称具有异方差性异方差性。进一步,把异方差看成是由于某个解释变量的变化而进一步,把异方差看成是由于某个解释变量的变化而引起的,则引起的,则 图形表示:(一)模型中省略了某些重要的解释变量(一)模型中省略了某些重要的解释变量 二、产生异方差的原因二、产生异方差的原因 (二)模型的设定误差(二)模型的设定误差 模型的设定主要包括变量的选择和
4、模型数学形式的确模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。此外,模型的函数形式不正确,如把变是模型设定问题。此外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差量间本来为非线性的关系设定为线性,也可能导致异方差.(三)测量误差的变化(三)测量误差的变化 样本数据的观测误差有可能随研究范围的扩大而增样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐
5、步减小。高而逐步减小。(四)截面数据中总体各单位的差异(四)截面数据中总体各单位的差异 通通常常认认为为,截截面面数数据据较较时时间间序序列列数数据据更更容容易易产产生生异异方方差差。这这是是因因为为同同一一时时点点不不同同对对象象的的差差异异,一一般般说说来来会会大大于于同同一一对对象象不不同同时时间间的的差差异异。不不过过,在在时时间间序序列列数数据据发发生生较较大大变变化化的的情情况况下下,也也可可能能出出现现比比截截面面数数据据更更严严重重的的异方差。异方差。第二节第二节 异方差性的后果异方差性的后果 一、对参数估计统计特性的影响一、对参数估计统计特性的影响 (一)参数估计的无偏性仍然
6、成立(一)参数估计的无偏性仍然成立 参数估计的无偏性仅依赖于基本假定中的零均值假定参数估计的无偏性仅依赖于基本假定中的零均值假定,所以异所以异方差存在对方差存在对参数估计的参数估计的无偏性的成立没有影响。即仍然有无偏性的成立没有影响。即仍然有 (二)参数估计的方差不再是最小的(二)参数估计的方差不再是最小的 同方差假定是同方差假定是OLSOLS估计方差最小的前提条件,所以随机误差估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。项是异方差时,将不能再保证最小二乘估计的方差最小。二、对参数显著性检验的影响二、对参数显著性检验的影响由于异方差的影响,使得无法正确
7、估计参数的标准误由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的差,导致参数估计的t t统计量值不能正确确定,如果仍用统计量值不能正确确定,如果仍用t t统计量值进行参数的显著性检验将失去意义。统计量值进行参数的显著性检验将失去意义。三、对预测的影响三、对预测的影响 尽管参数的尽管参数的OLSOLS估计量仍然无偏,并且基于此的预测也估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对是无偏的,但是由于参数估计量不是有效的,从而对Y Y的的预测也将不是有效的。预测也将不是有效的。第三节第三节 异方差性的检验异方差性的检验 一、图形法一、图形法 (一)相
8、关图形分析(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量程度。因为被解释变量Y Y与随机误差项与随机误差项u u有相同的方差,有相同的方差,所以利用分析所以利用分析Y Y与与X X的相关图形,可以初略地看到的相关图形,可以初略地看到Y Y的离的离散程度与散程度与X X之间是否有相关关系。之间是否有相关关系。如果随着如果随着x x的增加,的增加,Y Y的离散程度为逐渐增大(或减的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异小)的变化趋势,则认为存在递增型(或递减型)的异方差。方差。用用1
9、9981998年年四四川川省省各各地地市市州州农农村村居居民民家家庭庭消消费费支支出出与与家家庭庭纯纯收收入的数据,绘制出消费支出对纯收入的散点图,其中用入的数据,绘制出消费支出对纯收入的散点图,其中用 表示农村家庭消费支出,表示农村家庭消费支出,表示家庭纯收入。表示家庭纯收入。图形举例图形举例:(二)残差图形分析(二)残差图形分析 设一元线性回归模型为设一元线性回归模型为:(5.105.10)运用运用OLSOLS法估计法估计,得样本回归模型为:得样本回归模型为:(5.11)(5.11)由式由式(5.10)(5.10)和式和式(5.11)(5.11)得残差:得残差:(5.12)(5.12)绘制
10、出绘制出 对对 的散点图的散点图 :如果如果 不随不随 而变化,则而变化,则表明表明 不存在异方差不存在异方差;如果如果 随随 而变化,则表而变化,则表明明 存在异方差存在异方差。二、二、Goldfeld-QuanadtGoldfeld-Quanadt检验检验 作用作用:检验递增型:检验递增型(或递减型或递减型)异方差。异方差。(一)(一)检验的前提条件检验的前提条件 1 1、要求检验使用的为大样本容量。、要求检验使用的为大样本容量。2 2、除了同方差假定不成立外,其它假定均满足。、除了同方差假定不成立外,其它假定均满足。1、将样本(观察值)按某个解释变量的大小排序;将样本(观察值)按某个解释
11、变量的大小排序;2、将序列中间(段)约将序列中间(段)约 c=1/4 个观察值除去,并使余下的头、个观察值除去,并使余下的头、尾两段样本容量相同,均为尾两段样本容量相同,均为(n-c)/2 个;个;3、提出假设:提出假设:4、分别对头、尾两部分样本进行回归,且计算各残差平方和分分别对头、尾两部分样本进行回归,且计算各残差平方和分别为别为k是估计参数的个数。是估计参数的个数。并建立统计量并建立统计量(二)检验的具体做法(二)检验的具体做法(步骤步骤)5、进行进行F检验检验 分析:递增异方差,方差之比就会远远大于分析:递增异方差,方差之比就会远远大于1;同方差,方差之比趋近于同方差,方差之比趋近于
12、1。否则不存在异方差性。否则不存在异方差性。,则拒绝原假设,认为存在异方差性;则拒绝原假设,认为存在异方差性;三、三、WhiteWhite检验检验 (一一 )基本思想)基本思想 不需要关于异方差的任何先验信息,只需要在大样本不需要关于异方差的任何先验信息,只需要在大样本的情况下,将的情况下,将OLSOLS估计后的残差平方对常数、解释变量、估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。用辅助回归建立相应的检验统计量来判断异方差性。(二二)检验的特点检验的特点 要求
13、变量的取值为大样本要求变量的取值为大样本 不仅能够检验异方差的存在性,同时在多变量的不仅能够检验异方差的存在性,同时在多变量的 情情况下,还能判断出是哪一个变量引起的异方差。况下,还能判断出是哪一个变量引起的异方差。(三)检验的基本步骤:(三)检验的基本步骤:以一个二元线性回归模型为例,设模型为:以一个二元线性回归模型为例,设模型为:并且,设异方差与并且,设异方差与 的一般关系为的一般关系为 (5.145.14)其中其中:为随机误差项。为随机误差项。White 检验检验:(检验各回归系数是否为零。等于零,不存在异方差)(一)(一)ARCHARCH过程过程 设设ARCHARCH过程为过程为 (5
14、.165.16)p p为为ARCHARCH过程的阶数过程的阶数,并且并且 为随机误差。为随机误差。(二)检验的基本思想(二)检验的基本思想 在时间序列数据中,可认为存在的异方差性为在时间序列数据中,可认为存在的异方差性为 ARCHARCH过过程程,并并通通过过检检验验这这一一过过程程是是否否成成立立去去判判断断时时间间序序列是否存在异方差。列是否存在异方差。四、四、ARCHARCH检验检验 1、提出原假设:中至少有一个不为零 2、参数估计并计算 对原模型作OLS估计,求出残差 ,并计算残差平方序列 ,以分别作为对 的估计。3、求辅助回归 (5.17)(三)(三)ARCHARCH检验的基本步骤检
15、验的基本步骤 4 4、检验、检验 计算辅助回归的可决系数 ,并且在 成立时,基于大样本,渐进服从 ;给定显著性水平 查 分布表得临界值 ,如果 ,则拒绝原假设,表明模型中得随机误差存在异方差。(四四)检验的特点检验的特点 变量的取值为大样本,并且是时间序列 只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。第四节第四节 异方差性的补救措施异方差性的补救措施 一、模型变换法一、模型变换法 以一元线性回归模型为例:以一元线性回归模型为例:经检验经检验 存在异方差,且存在异方差,且 模型变换法是用模型变换法是用 去除(去除(5.175.17)式的两端,得)式的两端,得 :令:令:(5
16、.205.20)式的随机误差项)式的随机误差项 的方差为的方差为 (5.215.21)经变换的(经变换的(5.195.19)式的随机误差项)式的随机误差项 已是同方差。已是同方差。二、加权最小二乘法二、加权最小二乘法 以一元线性回归模型为例:以一元线性回归模型为例:经检验经检验 存在异方差,存在异方差,(一)基本思路(一)基本思路 区别对待不同的区别对待不同的 。对较小的。对较小的 给予较大的权给予较大的权数,对较大的数,对较大的 给予较小的权数,从而使给予较小的权数,从而使 更好地更好地 反映反映 对残差平方和的影响程度。对残差平方和的影响程度。(二)具体做法(二)具体做法 1 1、选取权数
17、并求出加权的、选取权数并求出加权的残差平方和残差平方和 通常取权数通常取权数 ,当,当 越小时,越小时,越大。当越大。当 越越大时,大时,越小。越小。将权数与残差平方相乘以后再求和,得到将权数与残差平方相乘以后再求和,得到加权的残差平方和:加权的残差平方和:2 2、求使满足、求使满足 的的 根据最小二乘原理,若使得加权残差平方和最小,则:根据最小二乘原理,若使得加权残差平方和最小,则:其中:其中:三、模型的对数变换三、模型的对数变换 在经济意义成立的情况下,如果对模型:在经济意义成立的情况下,如果对模型:作对数变换,作对数变换,其变量其变量 和和 分别用分别用 和和 代替,即:代替,即:对数变
18、换后的模型通常可以降低异方差性的影响:对数变换后的模型通常可以降低异方差性的影响:运用对数变换能使测定变量值的尺度缩小。运用对数变换能使测定变量值的尺度缩小。经过对数变换后的线性模型,其残差表示相对误差往往比绝对经过对数变换后的线性模型,其残差表示相对误差往往比绝对误差有较小的差异。误差有较小的差异。注意:注意:对变量取对数虽然能够减少异方差对模型的影响,但应注对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。意取对数后变量的经济意义。第五节第五节 案例分析案例分析 一、问题的提出和模型设定一、问题的提出和模型设定 为了对医疗机构制定规划提供依据,分析比较医疗机构与为
19、了对医疗机构制定规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型假定医疗机构数与人口数之间满足线性约束,则理论模型设定为:设定为:其中其中:表示卫生医疗机构数,表示表示卫生医疗机构数,表示 人口数。人口数。四川省四川省20002000年各地区医疗机构数与人口数年各地区医疗机构数与人口数 地区地区人口数人口数(万人)(万人)X医疗机构数医疗机构数(个)(个)Y地区地区人口数人口数(万人)(万人)X339.9医疗机构数医疗机构数(个)(个)Y成都成都1013
20、36304眉山眉山827自贡自贡315911宜宾宜宾508.51530攀枝攀枝花花103934广安广安438.61589泸州泸州463.71297达州达州620.12403德阳德阳379.31085雅安雅安149.8866绵阳绵阳518.41616巴中巴中346.71223广元广元302.61021资阳资阳488.41361遂宁遂宁3711375阿坝阿坝82.9536内江内江419.91212甘孜甘孜88.9594乐山乐山345.91132凉山凉山402.41471南充南充 709.2 4064二、参数估计二、参数估计 估计样本回归函数如下估计样本回归函数如下:估计结果为估计结果为 (一)图形
21、法(一)图形法 绘制 对 的散点图。三、检验模型的异方差三、检验模型的异方差2、判断。由图可以看出,残差平方 对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方 随 的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。(二)(二)Goldfeld-QuanadtGoldfeld-Quanadt检验检验(1 1)对变量取值排序(按递增或递减)对变量取值排序(按递增或递减)。(2 2)构造子样本区间,建立回归模型构造子样本区间,建立回归模型。在本例中,。在本例中,样本容量样本容量n=21n=21,删除中间,删除中间1/41/4的观测值,即大约
22、的观测值,即大约5 5个观个观测值,余下部分平分得两个样本区间:测值,余下部分平分得两个样本区间:18 18和和14211421它们的样本个数均是它们的样本个数均是8 8个个.即即 分别用分别用18、1421两个样本采用最小二乘法,两个样本采用最小二乘法,得得残差平方和的数据分别为残差平方和的数据分别为 (3 3)求求F F统计量值统计量值。(4 4)判断判断 在在 下下,统统计计量量分分子子、分分母母的的自自由由度度均均为为6 6查查F F分分布布表得临界值为表得临界值为 因为因为 所以拒绝原假设,表明模型确实存在异方差。所以拒绝原假设,表明模型确实存在异方差。四、异方差的修正四、异方差的修
23、正 (一)加权最小二乘法(一)加权最小二乘法(WLSWLS)用用 作作 权数权数,估计结果如下:估计结果如下:估计结果:估计结果:结论结论:运用加权小二乘法消除了异方差性后,参数的运用加权小二乘法消除了异方差性后,参数的t t检验均显著,可决系数大幅提高,检验均显著,可决系数大幅提高,F F检验也显著,并说明检验也显著,并说明人口数量每增加人口数量每增加1 1万人,平均说来将增加万人,平均说来将增加2.9532.953个卫生医疗个卫生医疗机构,而不是引子中得出的增加机构,而不是引子中得出的增加5.37355.3735个医疗机构。个医疗机构。第第 五五 章章 结结 束束 了!了!此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢