《应用回归分析第6章课后习题参考复习资料.docx》由会员分享,可在线阅读,更多相关《应用回归分析第6章课后习题参考复习资料.docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第6章 多重共线性的情形及其处理思索及练习参考答案6.1 试举一个产生多重共线性的经济实例。答: 例如有人建立某地区粮食产量回来模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。由于农业投入资金X3及化肥用量X1,水浇地面积X2有很强的相关性,所以回来方程效果会很差。再例如依据某行业企业数据资料拟合此行业的生产函数时,资本投入, 劳动力投入, 资金投入及能源供应都及企业的生产规模有关,往往出现高度相关状况,大企业二者都大,小企业都小。6.2多重共线性对回来参数的估计有何影响?答:1, 完全共线性下参数估计量不存在;2, 近似共线性下估计量非有效;3, 参数估计量
2、经济含义不合理;4, 变量的显著性检验失去意义;5, 模型的预料功能失效。6.3 具有严峻多重共线性的回来方程能不能用来做经济预料?答:虽然参数估计值方差的变大简洁使区间预料的“区间变大,使预料失去意义。但假如利用模型去做经济预料,只要保证自变量的相关类型在将来期中始终保持不变,即使回来模型中包含严峻多重共线性的变量,也可以得到较好预料结果;否那么会对经济预料产生严峻的影响。6.4多重共线性的产生于样本容量的个数n, 自变量的个数p有无关系?答:有关系,增加样本容量不能消退模型中的多重共线性,但能适当消退多重共线性造成的后果。当自变量的个数p较大时,一般多重共线性简洁发生,所以自变量应选择少而
3、精。6.5 自己找一个经济问题来建立多元线性回来模型,怎样选择变量和构造设计矩阵X才可能防止多重共线性的出现?答:请参考第三次上机试验题机场吞吐量的多元线性回来模型,留意利用二手数据很难防止多重共线性的出现,所以一般利用逐步回来和主成分回来消退多重共线性。假如进展自己进展试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X的列向量即X1,X2, 不相关。6.6对第5章习题9财政收入的数据分析多重共线性,并依据多重共线性剔除变量。将所得结果及逐步回来法所得的选元结果相比拟。附5.9 在探讨国家财政收入时,我们把财政收入按收入形式分为:各项税收收入, 企业收入, 债务收入, 国家能源交通重点建
4、立收入, 根本建立贷款归还收入, 国家预算调整基金收入, 其他收入等。为了建立国家财政收入回来模型,我们以财政收入y亿元为因变量,自变量如下:x1为农业增加值亿元,x2为工业增加值亿元,x3为建筑业增加值亿元,x4为人口数万人,x5为社会消费总额亿元,x6为受灾面积万公顷。据中国统计年鉴获得19781998年共21个年份的统计数据,见表5.4P167。由定性分析知,全部自变量都及y有较强的相关性,分别用后退法和逐步回来法作自变量选元。解:逐步回来法回来方程为:但是回来系数的说明不合理。解:1分析数据的多重共线性。干脆进展Y及四个变量的线性回来方程,并做多重共线性的诊断,由分析得相应输出结果如下
5、:a方差扩大因子法,由表1中值, 可知x1235的方差扩大因子远大于10,这几个自变量之间存在很高的线性相关性,即回来方程存在严峻的多重共线性。b.特征根和条件数判定法。输出结果如表2:表1表2其中最大的条件数=290.443,说明自变量间存在严峻的多重共线性,这及方差扩大因子法的结果一样。其中x0245在第五行同时较大,说明其间存在多重共线性。2消退多重共线性。下面依据多重共线性剔除变量。先剔除值最大的自变量,得:从上表可以看出,的值中,除了以外,其余的均大于10,故回来方程照旧存在严峻的多重共线性。接着剔除值最大的自变量,得:从上表可以看出,的值中,除了以外,其余的均大于10,故回来方程还
6、存在严峻的多重共线性。接着剔除值最大的自变量,得:由上表可以看出,全部自变量的值都小于10,故回来方程的多重共线性已经被消退。但自变量没有通过T检验,说明不显著,剔除后再做回来分析得:从上表可以看出,得到的回来方程为回来方程的多重共线性虽然被消退,但是模型的自变量的t,说明在95的置信度下对y的线性影响不显著。模型只剩下x3,3所得结果及逐步回来结果比拟。对逐步回来选出的三个自变量做多重共线性的分析,得到:从上表可以看出,尽管用逐步回来的方法选出的自变量为,但是回来方程还是存在多重共线性。但是依据多重共线性剔除变量后,模型只剩下x3,损失了很多信息,得到的模型 国家财政收入只及x3建筑业增加值有关,明显不符合建模的初衷。4主成分回来法标准化全部自变量,做主成分分析得输出结果如下:由上表,第一个主成分包含有原始6个变量近85.546%的信息量,故只选此一个主成分。 (a) 主成分1(x1).991(x2).985(x3).983(x4).929(x5).990(x6).610由上表得第一个主成分表达式为:Z*)/,即:作Y*及Z1的最小二乘估计,输出结果如下:得主成分回来的回来方程为: N. x121x221x321x421x521x621y21依据标准化的均值和标准差复原变量后最终方程为: -6175.44+