多重共线性 (2).ppt

上传人:石*** 文档编号:84125091 上传时间:2023-04-02 格式:PPT 页数:21 大小:4.01MB
返回 下载 相关 举报
多重共线性 (2).ppt_第1页
第1页 / 共21页
多重共线性 (2).ppt_第2页
第2页 / 共21页
点击查看更多>>
资源描述

《多重共线性 (2).ppt》由会员分享,可在线阅读,更多相关《多重共线性 (2).ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、多重共线性现在学习的是第1页,共21页10.1 10.1 多重共线性的性质多重共线性的性质含义:原意是指回归模型的解释变量之间存在“完 全”或准确的线性关系。如:现在多重共线性还用来泛指诸X变量之间有交互 相关,但又非完全相关:见P320 Ballentine Map现在学习的是第2页,共21页引起多重共线性的原因 (montgormery&peak)1.数据采集所用的方法:限于一个范围2.模型或从中取样的总体受到约束:如做电力消费(Y)对收入(X2)和住房面积(X3)回归时,可能X2高的X3也大3.模型设定:如在模型中加入多项式,数据范围小等4.一个过度决定的模型:回归元个数大于观测次数现在

2、学习的是第3页,共21页10.2 出现完全多重共线性时的估计问题在完全多重共线性的情况下,回归系数是不确定的,其标准误是无穷大。对于三变量回归:由第7章可知:现在学习的是第4页,共21页回归系数衡量的是X2或X3对Y的净影响,X2和X3是完全共线性的,就不能把每个X对Y的偏影响分离出来现在学习的是第5页,共21页10.3 不完全多重共线性的估计问题假定不完全多重共线性的形式为:这种情形下,回归系数是可以估计的:如果vi足够小,以至于接近于零,则(10.3.1)表示几乎完全共线性。这时我们又回到(10.2.2)的不定式情形。比较现在学习的是第6页,共21页10.4 多重共线性的理论后果在近似多重

3、共线性的情形下,OLS估计量仍然是无偏的。但是,无偏性只是一种多维样本(multisample)或重复抽样的性质(与微数缺测性的对应)共线性并不破坏最小方差性质。但是,这并不意味着,在任意给定的样本中,一个OLS估计量的方差一定是小的。仍然是BLUE多重共线性本质上是一种样本现象。即使总体不存在共线性,由于抽样方法或小样本问题也可能带来多重共线性问题。例如:一般地,收入高的人也更富裕,很难分开二者的各自影响现在学习的是第7页,共21页10.5 多重共线性的实际后果1.OLS估计量的大方差与协方差 随着r23增大,方差增大,协方差的绝对值也增大。增大的速度用方差膨胀因子(VIF,variance

4、-inflating factor)衡量:现在学习的是第8页,共21页由此可见:一般:方差膨胀系数的倒数称为容许度(TOL)2.更宽的置信区间 标准误增大,则有关总体参数的置信区间随之变大。在高度多重共线性的情形下,增加了接受错误假设的概率(第二类错误)见P328 TABLE 10-2见P327 表 10-1现在学习的是第9页,共21页3.“不显著”的t比率将这一t值和临界t值相比较,即t检验 高度共线性使估计的标准误增加很快,t值迅速变小。因而,容易接受总体参数为零的虚拟假设4.值高而显著的t值少但是,个别偏回归系数的t检验可能并不显著这就是多重共线性的一个信号现在学习的是第10页,共21页

5、5.OLS估计量及其标准误对数据的微小变化很敏感 P329 例子Goldberger认为微数缺测性(micronumerosity)是一个重要的问题微数缺测性:狭义是指样本大小n等于零的情形 广义是指观测次数刚刚超过待估参数个数现在学习的是第11页,共21页10.7 侦察多重共线性的经验规则只要愿意,就可以测度多元回归中任一样本中共线性的显现程度 克曼塔 值高而显著的t比率少 值比较高,比如大于0.8,F 检验一般会拒绝所有偏回归系数同时为零,但是,t 检验却可能表明,没有或极少偏回归系数是统计上显著的回归元之间有高度的两两相关 高的零阶相关(比如,大于0.8)是多重共线性存在的充分条件,但非

6、必要条件。即使零阶(简单)相关系数较低(比如,小于0.5),多重共线性仍然可能存在现在学习的是第12页,共21页检查偏相关辅助回归 做每一个Xi 对其余X的回归,计算判定系数服从自由度为k-2和n-k+1的F分布现在学习的是第13页,共21页 Fi 大于给定显著性水平的 F 临界值,则 Xi和其余X之间存在共线性 Fi 小于给定显著性水平的 F 临界值,则Xi和其余 X 之间不存在共线性,可以把 Xi 保留在模型中。特征值、病态系数=k在(100,1000)之间,中等共线性,或CI大于30,严重共线 容许度与方差膨胀因子其中 是回归元 Xi 的偏回归系数,是 Xj 对其余(k-2)个回归元的辅

7、助回归的现在学习的是第14页,共21页 其中,VIFj 是方差膨胀因子VIFj 越大,变量Xj与其余变量的共线性越严重经验规则:VIF大于10(大于0.90),认为是高度共线性容许度(tolerance):无共线性,则 TOLj=1 完全共线性,则TOLj=0现在学习的是第15页,共21页10.8 补救措施:无为而治或经验程序先验信息 做消费Y对收入X2和X3的回归中,如果事先得知 ,则可以变为如下回归横截面与时间序列数据并用 其中,Y汽车需求,P价格,I收入,t时间一般地,价格和收入之间存在共线性现在学习的是第16页,共21页Tobin提出:利用横截面数据估计收入弹性,得再做回归:这样,就能

8、得到较准确的价格弹性剔除变量或设定误差 面对严重的共线性,最简单的方法就是去掉某些变量。但是剔除变量会导致设定误差。实际中,需要权衡利弊。现在学习的是第17页,共21页变量代换 如果关系式:在t时刻成立,则在t-1时刻有:(10.8.1)减去(10.8.2)得:即使 X2 和 X3 的水平值是高度相关的,其一阶差分回归可能不存在多重共线性现在学习的是第18页,共21页补充新数据 在三变量回归中,有:样本增大,一般地说会增大,上述方差会降低,从而降低标准误,对参数的估计会更加准确。现在学习的是第19页,共21页现在学习的是第20页,共21页无多重共线性时的参数估计:无多重共线性时的参数估计:返回现在学习的是第21页,共21页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁