《多元统计分析第4章(回归分析)ppt课件.ppt》由会员分享,可在线阅读,更多相关《多元统计分析第4章(回归分析)ppt课件.ppt(267页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能第四章第四章 回归分析回归分析4.1 4.1 模型介绍模型介绍4.2 4.2 一个因变量的线性回归模型一个因变量的线性回归模型 的参数估计与假设检验的参数估计与假设检验4.3 4.3 基本回归诊断基本回归诊断4.4 4.4 处理多元线性回归中自变量共线处理多元线性回归中自变量共线 性的几种方法性的几种方法4.5 4.5 多因变量的多元线性回归多因变量的多元线性回归4.6 4.6 广义线性模型介绍广义线性模型介绍1为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大
2、会精神,充分发挥中小学图书室育人功能u 回归分析,谢宇著,社会科学文献回归分析,谢宇著,社会科学文献出版社,出版社,2010年年.回归分析内容的参考书回归分析内容的参考书2为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、一个自变量一个因变量的回归模型一、一个自变量一个因变量的回归模型4.1 4.1 模型介绍模型介绍案例案例1 1 表表4.14.1中的数据是检验某种工业中的数据是检验某种工业用发动机用发动机性能性能的试验数据的试验数据.在各种不在各种不同的速度同的速度SPEED(SPEED(在每分钟转几百转度在每分钟转几百转度量量
3、)下,测量发动机产生的马力下,测量发动机产生的马力POWERPOWER,试建立试建立马力马力POWERPOWER与与速度速度SPEEDSPEED的关的关系式系式.3为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能序号序号SPEEDPOWER序号序号SPEEDPOWER序号序号SPEEDPOWER122.064.03919.058.001710.532.05220.062.471021.063.211813.039.68318.054.941122.064.031915.045.79416.048.841220.059.632017.
4、051.17514.043.731318.052.92119.056.65612.037.481416.048.842221.062.61715.046.851514.042.742323.065.31817.051.171612.036.632424.063.89表表4.14为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能5为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一般模型:一般模型:注:注:x可能是随机变量,也可能是非随机可能是随机变量,也可能是非随机变量变量.
5、或或6为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一元线性回归模型:一元线性回归模型:或或7为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能多项式模型:多项式模型:可化为线性模型的非线性模型:可化为线性模型的非线性模型:非线性模型:非线性模型:8为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能产生产生 的原因的原因u 许多其他因素的影响许多其他因素的影响u 度量误差度量误差u 模型不精确引起的误差模型不精确
6、引起的误差9为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能最简单的模型为最简单的模型为当当x也也有测量误差时,称为有测量误差时,称为度量误差模型度量误差模型.例如例如 体重和身高的关系体重和身高的关系 树高和树的直径的关系树高和树的直径的关系 物理成绩与数学成绩的关系物理成绩与数学成绩的关系 高考成绩与平时成绩的关系高考成绩与平时成绩的关系 粮食产量与施肥量的关系粮食产量与施肥量的关系或或10为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能用观测表示的模型用观测表示的模
7、型令令11为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能或或模型为模型为假设检验假设检验区间估计区间估计参数的最参数的最小二乘估小二乘估计计12为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能二、一个因变量多个自变量的回归模型二、一个因变量多个自变量的回归模型案例案例2 2(用电量的例子用电量的例子)房主对空调在自家房主对空调在自家电量消耗方面的影响是很关注的,因此他电量消耗方面的影响是很关注的,因此他记录了记录了2121天中每天空调使用的小时数天中每天空调使用的小时数
8、.他还监测了这些天的电表并计算出使用的他还监测了这些天的电表并计算出使用的千瓦千瓦(度度)数数.同时还记录了烘干器每天使同时还记录了烘干器每天使用的次数用的次数.试建立试建立用电量用电量KWHKWH与与空调使用的空调使用的小时数小时数ACAC和和烘干器每天使用的次数烘干器每天使用的次数DRYERDRYER的经验公式的经验公式.数据如下表:数据如下表:13为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能KWHACDRYERKWHACDRYERKWHACDRYER351.51668.01627.51634.529412.518512.0
9、1665.02827.52436.00172.00786.53572.53948.53658.01335.00796.03777.52657.519313.51758.02336.00表表4.214为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能15为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能16为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能17为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,
10、贯彻全国教育大会精神,充分发挥中小学图书室育人功能案例案例3(水泥数据水泥数据)某种水泥在凝固时单位质量某种水泥在凝固时单位质量所释放的热量为所释放的热量为Y卡卡/克与水泥中下列四种化克与水泥中下列四种化学成分有关:学成分有关:18为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能x1x2x3x4Y72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483
11、.81166912113.31068812109.4表表4.319为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一般模型:一般模型:注:注:x可能一部分分量是随机变量,另一可能一部分分量是随机变量,另一部分是非随机变量部分是非随机变量.或或20为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能多元线性模型:多元线性模型:或或21为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能多项式模型:多项式模型:可化为线性模
12、型的非线性模型:可化为线性模型的非线性模型:非线性模型:非线性模型:22为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能若若x也是随机的,一般假设也是随机的,一般假设x和和y联合分布联合分布为正态分布为正态分布.最简单的是线性模型最简单的是线性模型或或23为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能用观测表示的线性回归模型用观测表示的线性回归模型令令24为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能模型为
13、模型为或或25为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能案例案例4 设发电量设发电量Y1,工业总产值,工业总产值Y2与钢材与钢材产量产量x1,水泥产量,水泥产量x2,机械工业总产值,机械工业总产值x3,棉纱产量棉纱产量x4,机制纸产量,机制纸产量x5之间有线性相关之间有线性相关关系,表中收集了关系,表中收集了1949年到年到1978年共年共30年年的数据的数据.试用试用reg过程求出过程求出Y1,Y2与与x1,x2,x3,x4,x5的关系式的关系式.26为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大
14、会精神,充分发挥中小学图书室育人功能三、多个因变量多个自变量的回归模型三、多个因变量多个自变量的回归模型27为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能度量误差模型度量误差模型 28为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能线性回归模型线性回归模型29为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能用观测表示的线性回归模型用观测表示的线性回归模型令令30为深入学习习近平新时代中国特色社会主义思想和党的
15、十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能模型为模型为31为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能1、建立因变量、建立因变量Y与与 经验公式经验公式(回归方程回归方程);2、对经验公式的可信度进行检验;、对经验公式的可信度进行检验;判断每个自变量判断每个自变量 对对Y的影的影响是否显著?响是否显著?3、诊断经验公式是否适合这组数据;、诊断经验公式是否适合这组数据;4、利用经验公式进行预报、控制及指导、利用经验公式进行预报、控制及指导生产生产.回归分析是研究一个回归分析是研究一个(或几个或几个)因变量因变量
16、Y与另与另一些变量的相互依赖关系一些变量的相互依赖关系.具体研究以下几具体研究以下几个问题:个问题:32为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能思考:思考:回归分析模型与方差分析模回归分析模型与方差分析模型的区别与联系?型的区别与联系?数据类型不同数据类型不同侧重点不同侧重点不同均为线性模型均为线性模型33为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能案例案例5(癌症病情缓解是否发生癌症病情缓解是否发生)见见SAS帮帮助系统中助系统中logistic的的Exam
17、ple1.因变量因变量:remiss:表示癌症是否缓解,缓解取值为:表示癌症是否缓解,缓解取值为1,没有缓解取值为,没有缓解取值为0.自变量(影响癌症治疗效果的因素)自变量(影响癌症治疗效果的因素):cell、smear、infil、li、blast、temp 34为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能remisscellsmearinfilliblasttemp1.8.83.661.91.1.996 10.90.360.321.40.740.99200.80.880.70.80.1760.982010.870.870.7
18、1.0530.98610.90.750.681.30.5290.98010.650.650.60.5190.982010.730.730.70.3980.986表表4.4共有共有27个观测个观测.35为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能广义线性模型广义线性模型(GLM)l 随机部分随机部分:响应变量响应变量Y,并假定其概率并假定其概率 分布分布(E(Y)=).l 系统部分系统部分:模型中模型中的的解释变量解释变量.l 联系函数联系函数(link function):):g()36为深入学习习近平新时代中国特色社会主义思想
19、和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能LogisticLogistic回归模型回归模型 l 随机部分随机部分:响应变量响应变量 Y 为二分变量,为二分变量,仅取二个值仅取二个值(1(1或或0)0),并假定等于,并假定等于1 1的概的概率为率为 p(x).37为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能4.2 4.2 一个因变量的线性回归模型一个因变量的线性回归模型参数估计与假设检验参数估计与假设检验1 1、如何估计未知参数?、如何估计未知参数?2 2、检验模型是否显著,某些参数是否、检验模型是否显著
20、,某些参数是否 满足一定的限制?满足一定的限制?38为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一、一个自变量一个因变量的线性回归模型一、一个自变量一个因变量的线性回归模型1 1、最小二乘估计、最小二乘估计2 2、假设检验、假设检验3 3、预测、预测39为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能1 1、最小二乘估计、最小二乘估计4041为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能42为深入学习习近
21、平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能解得:解得:其中:其中:43为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能用矩阵表示模型用矩阵表示模型44为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能(1)(1)式表示为式表示为45为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能利用四块求逆公式利用四块求逆公式46为深入学习习近平新时代中国特色社会主义思想和党
22、的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能47为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能48为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能49为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能50为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能帽子矩阵51为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国
23、教育大会精神,充分发挥中小学图书室育人功能证明:证明:52为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能53为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能54为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能55为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能证明:证明:我们通过案例我们通过案例2 2来看来看SASSAS的输出结果的输出结果.56为
24、深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 proc gplot data=ex411;plot kwh*ac=*;title 用电量用电量KWH与空调使用小时与空调使用小时AC的散点图的散点图;proc reg data=ex411 graphics;model kwh=ac ;title KWH与与AC的一元线性回归模型的一元线性回归模型;run;print cli;/*输出单个观测值的上下限输出单个观测值的上下限*/print clm;/*输出观测值均值的上下限输出观测值均值的上下限*/title;run;57kwh102
25、030405060708090100ac123456789101112131458为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能AnalysisofVarianceSourceDFSumofSquaresMeanSquareFValuePrFModel15609.6626 5609.662626.85|t|Intercept127.851077.806543.570.0021ac15.341081.030675.180 为尺度因子为尺度因子.它它们的选取对上式的影响并不是很大,应们的选取对上式的影响并不是很大,应该尽量选择具有明确
26、统计意义的该尽量选择具有明确统计意义的.143为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能(2)Cook距离距离注:注:这里这里M和和c的选取是由构造参数向量的选取是由构造参数向量 的的联合置信区域而用到的联合置信区域而用到的.该值小说明在置信区该值小说明在置信区域内,不是强影响点,该值大说明不在置信域内,不是强影响点,该值大说明不在置信区域内是强影响点区域内是强影响点.通常,当通常,当 时,认为是强影响点,但时,认为是强影响点,但不是绝对,要考虑实际问题的背景不是绝对,要考虑实际问题的背景.144为深入学习习近平新时代中国特色
27、社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能可以证明,可以证明,Cook距离的等价形式距离的等价形式其中:其中:为残差为残差 为第为第i个观测点离均值的距离个观测点离均值的距离.145为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能结论:结论:残差大残差大或者或者观测点离均值的距离远观测点离均值的距离远的点可能是强影响点的点可能是强影响点.高杠杆点:高杠杆点:大,接近大,接近1.(1)大表示大表示xi离均值远;离均值远;(2)误差的方差小误差的方差小.说明说明:远离均值的点对回归模型起关键作远离均
28、值的点对回归模型起关键作用,它会把回归线拉向自己用,它会把回归线拉向自己.146为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能在在SAS中输出中输出Cook距离的方法:距离的方法:model dependent=independent/r;观察案例观察案例1的输出结果,因为的输出结果,因为4/24=0.1667,仅有第仅有第17和和24两个观测的两个观测的Cook距离大于距离大于0.1667,所以它们可能是强影响点,所以它们可能是强影响点.观测观测24是强影响点的主要原因是残差大,是强影响点的主要原因是残差大,而观测而观测17是强
29、影响点的主要原因是离均值是强影响点的主要原因是离均值的距离远的距离远.147为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能148为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能149为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能1724150为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能因为因为 ,所以规则如下,所以规则如下:拟合值拟合值(fi
30、tted value)记记如果如果 ,则第,则第i个观测是强影个观测是强影响点响点.151为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能152为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能标准:一般标准:一般则把该观测看作强影响点则把该观测看作强影响点.153为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能data ex401;input x y;cards;155 50 160 57 165 63 170
31、 70 190 150;run;proc reg outsscp=sscp;model y=x/influence;run;154为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能RStudent2,DFFITS2,DFBETAS2,155为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能学生化残差学生化残差(Rstudent:studentized residual)标准标准:该值大于该值大于2,可能是强影响点,可能是强影响点.比较比较156为深入学习习近平新时代中国特色社
32、会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能表中表中Cov ratio的计算公式:的计算公式:分子为去掉第分子为去掉第i个观测后回归系数估计的协个观测后回归系数估计的协方差矩阵估计的行列式,分母为利用全部方差矩阵估计的行列式,分母为利用全部n个观测回归系数估计的协方差矩阵估计个观测回归系数估计的协方差矩阵估计的行列式的行列式.说明由于这个观测的加入使得系数的估计方说明由于这个观测的加入使得系数的估计方差变化很大,说明该观测可能是差变化很大,说明该观测可能是强影响点强影响点.157为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,
33、充分发挥中小学图书室育人功能在案例在案例1中在中在reg过程中使用语句:过程中使用语句:model power=speed/influence;得到影响分析的结果得到影响分析的结果.158为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 Hat Diag Cov -DFBETAS-Hat Diag Cov -DFBETAS-Obs Residual Obs Residual RStudentRStudent H Ratio H Ratio DFFITSDFFITS Intercept speed Intercept speed 1
34、-0.1489 -0.0906 0.1054 1.2258 -0.0311 0.0196 -0.0242 1 -0.1489 -0.0906 0.1054 1.2258 -0.0311 0.0196 -0.0242 2 3.5451 2 3.5451 2.37152.3715 0.0618 0.7278 0.6085 -0.2362 0.3471 0.0618 0.7278 0.6085 -0.2362 0.3471 3 1.2690 0.7565 0.0426 1.0864 0.1596 0.0091 0.0241 3 1.2690 0.7565 0.0426 1.0864 0.1596 0
35、.0091 0.0241 4 0.4229 0.2498 0.0480 1.1460 0.0561 0.0307 -0.0204 4 0.4229 0.2498 0.0480 1.1460 0.0561 0.0307 -0.0204 5 0.5669 0.3406 0.0778 1.1771 0.0990 0.0810 -0.0675 5 0.5669 0.3406 0.0778 1.1771 0.0990 0.0810 -0.0675 6 -0.4292 -0.2656 0.1322 1.2562 -0.1036 -0.0960 0.0858 6 -0.4292 -0.2656 0.1322
36、 1.2562 -0.1036 -0.0960 0.0858 7 1.0599 0.6351 0.0599 1.1238 0.1602 0.1141 -0.0883 7 1.0599 0.6351 0.0599 1.1238 0.1602 0.1141 -0.0883 8 0.1260 0.0741 0.0423 1.1453 0.0156 0.0050 -0.0018 8 0.1260 0.0741 0.0423 1.1453 0.0156 0.0050 -0.0018 9 1.7020 1.0295 0.0491 1.0460 0.2340 -0.0447 0.0913 9 1.7020
37、1.0295 0.0491 1.0460 0.2340 -0.0447 0.091310 1.6581 1.0194 0.0805 1.0837 0.3017 -0.1601 0.209610 1.6581 1.0194 0.0805 1.0837 0.3017 -0.1601 0.209611 -0.1489 -0.0906 0.1054 1.2258 -0.0311 0.0196 -0.0242 11 -0.1489 -0.0906 0.1054 1.2258 -0.0311 0.0196 -0.0242 159为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精
38、神,充分发挥中小学图书室育人功能 Hat Diag Cov -DFBETAS-Hat Diag Cov -DFBETAS-Obs Residual Obs Residual RStudentRStudent H Ratio H Ratio DFFITSDFFITS Intercept speed Intercept speed12 0.7051 0.4206 0.0618 1.1503 0.1079 -0.0419 0.061612 0.7051 0.4206 0.0618 1.1503 0.1079 -0.0419 0.061613 -0.7710 -0.4557 0.0426 1.1240
39、 -0.0962 -0.0055 -0.014513 -0.7710 -0.4557 0.0426 1.1240 -0.0962 -0.0055 -0.014514 0.4229 0.2498 0.0480 1.1460 0.0561 0.0307 -0.020414 0.4229 0.2498 0.0480 1.1460 0.0561 0.0307 -0.020415 -0.4231 -0.2540 0.0778 1.1829 -0.0738 -0.0604 0.050315 -0.4231 -0.2540 0.0778 1.1829 -0.0738 -0.0604 0.050316 -1.
40、2792 -0.8022 0.1322 1.1906 -0.3131 -0.2899 0.259116 -1.2792 -0.8022 0.1322 1.1906 -0.3131 -0.2899 0.259117 -1.9188 -1.2725 17 -1.9188 -1.2725 0.1890 0.1890 1.1665 -0.6143 -0.5903 0.5424 1.1665 -0.6143 -0.5903 0.542418 -0.8562 -0.5233 0.1019 1.1908 -0.1763 -0.1560 0.135618 -0.8562 -0.5233 0.1019 1.19
41、08 -0.1763 -0.1560 0.135619 -0.000103 -0.000061 0.0599 1.1674 -0.0000 -0.0000 0.000019 -0.000103 -0.000061 0.0599 1.1674 -0.0000 -0.0000 0.000020 0.1260 0.0741 0.0423 1.1453 0.0156 0.0050 -0.001820 0.1260 0.0741 0.0423 1.1453 0.0156 0.0050 -0.001821 0.3520 0.2080 0.0491 1.1495 0.0473 -0.0090 0.01842
42、1 0.3520 0.2080 0.0491 1.1495 0.0473 -0.0090 0.018422 1.0581 0.6412 0.0805 1.1482 0.1897 -0.1007 0.131822 1.0581 0.6412 0.0805 1.1482 0.1897 -0.1007 0.131823 -1.4958 -0.9458 0.1364 1.1691 -0.3759 0.2635 -0.313223 -1.4958 -0.9458 0.1364 1.1691 -0.3759 0.2635 -0.313224 -5.5428 24 -5.5428 -5.45435.4543
43、 0.17350.1735 0.2274 0.2274 -2.49912.4991 1.8778 -2.1784 1.8778 -2.1784160为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能161为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能解决方法解决方法(1)检验数据是否有误检验数据是否有误(2)是否与其它数据属于同一模型是否与其它数据属于同一模型(3)特别关注是否蕴含其它信息特别关注是否蕴含其它信息(4)考虑选用其它模型考虑选用其它模型162为深入学习习近平
44、新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能三、共线性诊断三、共线性诊断问题:问题:为什么要做共线性诊断?为什么要做共线性诊断?163为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能164为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能165为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能方差膨胀因子推导与解释:方差膨胀因子推导与解释:矩阵表示:矩阵表示:(1)
45、用用y对前对前k-1个解释变量回归,得到残差个解释变量回归,得到残差 y*;(2)用用xk对前对前k-1个解释变量回归,得到残差个解释变量回归,得到残差 ;(3)用用y*对对 回归,得到回归,得到 k的最小二乘估计的最小二乘估计.可以采用下列三步算法得到可以采用下列三步算法得到 k的最小二乘估计的最小二乘估计166为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能167为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能另一种推导方法另一种推导方法168为深入学习习近平新时代中
46、国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能2.2.条件指数条件指数169为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能一般认为:一般认为:(1)条件指数值在)条件指数值在10到到30间为弱相关;间为弱相关;(2)条件指数值在)条件指数值在30到到100间为中等相关;间为中等相关;(3)条件指数值在)条件指数值在100到到1000间表明有强相间表明有强相关。关。(4)条件指数值大于)条件指数值大于1000表明有严重的相表明有严重的相关关在案例在案例3中,条件指数为中,条件指数为249.57
47、825,所以所以存在强相关存在强相关.170为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能3.方差比例方差比例 对于大的条件指数,还需要找出哪些变量对于大的条件指数,还需要找出哪些变量间存在强的线性关系间存在强的线性关系.因为每个条件指数对应因为每个条件指数对应一个特征向量,而大的条件指数相应的特征值一个特征向量,而大的条件指数相应的特征值较小,故构成这一特征向量的变量间有近似的较小,故构成这一特征向量的变量间有近似的线性关系线性关系.在统计中用方差比例来说明各个自在统计中用方差比例来说明各个自变量在构成这个特征向量中的贡献变量在
48、构成这个特征向量中的贡献.一般建议:在大的条件指数中由方差比例一般建议:在大的条件指数中由方差比例超过超过0.50.5的自变量构成的变量子集就认为是相关的自变量构成的变量子集就认为是相关变量集变量集.在案例在案例3 3中,中,5 5个变量(包括截距项)个变量(包括截距项)的方差比例均大于的方差比例均大于0.50.5,这说明这,这说明这5 5个变量有强个变量有强线性关系线性关系.171为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能VIF:Variance Inflation FactorsTOL:tolerance在在SAS中输出共
49、线性诊断结果的方法:中输出共线性诊断结果的方法:172为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能案例案例3中,研究共线性问题时,可以使用中,研究共线性问题时,可以使用输出结果分别在后面的表中输出结果分别在后面的表中.model y=x1 x2 x3 x4/vif collinoint;model y=x1 x2 x3 x4/vif collin;或或173为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能案例案例3的方差分析表的方差分析表174 Parameter E
50、stimates Parameter Standard VarianceVariable DF Estimate Error t Value Pr|t|InflationIntercept 1 62.40537 70.07096 0.89 0.3991 0 x1 1 1.55110 0.74477 2.08 0.0708 38.49621x2 1 0.51017 0.72379 0.70 0.5009 254.42317x3 1 0.10191 0.75471 0.14 0.8959 46.86839x4 1 -0.14406 0.70905 -0.20 0.8441 282.51286 Co