多元线性回归分析精选PPT.ppt

上传人:石*** 文档编号:84134433 上传时间:2023-04-02 格式:PPT 页数:28 大小:1.16MB
返回 下载 相关 举报
多元线性回归分析精选PPT.ppt_第1页
第1页 / 共28页
多元线性回归分析精选PPT.ppt_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《多元线性回归分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《多元线性回归分析精选PPT.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于多元线性回归分析第1页,讲稿共28张,创作于星期日主要内容第一节:多元线性回归概念及统计描述第二节:多元线性回归假设检验第三节、多元线性回归自变量的筛选第四节:多元线性回归应用第五节:多元线性回归应注意问题第六节:实例分析(SAS)第2页,讲稿共28张,创作于星期日第一节:多元线性回归概念及统计描述第一节:多元线性回归概念及统计描述 概概念念:用用于于分分析析一一个个连连续续型型因因变变量量与与多多个个自自变变量之间的线性关系的统计学分析方法。量之间的线性关系的统计学分析方法。例:血压值与年龄、性别、劳动强度、饮食习例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史惯、吸烟状况、

2、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂清总胆固醇、甘油三脂第3页,讲稿共28张,创作于星期日多元线性回归数据结构多元线性回归数据结构假定对假定对n n例观察对象逐一测定了因变量例观察对象逐一测定了因变量Y Y与与m m个自变量个自变量X1X1,X2,X2,XmXm的数值。的数值。例号例号 X1 X2 Xm Y 1 X11 X12 X1m Y1 2 X21 X22 X2m Y2 3 n Xn1 Xn2 Xnm Yn 第4页,讲稿共28张,创作于星期日第5页,讲稿共28张,创作于星期日多元线性回归模型多元线性回归模型 多元线性回

3、归数学模型:多元线性回归数学模型:相应的由样本估计而得到的回归模型:相应的由样本估计而得到的回归模型:其中表示Y的总体平均值的估计值,b0为常数项,也称为截距,bi为Xi的偏回归系数,表示当方程中其他自变量不变时,自变量Xi变化一个计量单位,反应变量Y的总体平均值的估计值变化的单位数.第6页,讲稿共28张,创作于星期日标准化偏回归系数标准化偏回归系数因为各自变量都有各自的计量单位以及不同的变异度,因为各自变量都有各自的计量单位以及不同的变异度,所以不能直接用普通偏回归系数的大小来比较方程中所以不能直接用普通偏回归系数的大小来比较方程中各个自变量对反应变量各个自变量对反应变量Y Y的影响大小。需

4、要求出标准的影响大小。需要求出标准化偏回归系数。化偏回归系数。设:与一般回归系数设:与一般回归系数bibi对应的标准化偏回归系数为对应的标准化偏回归系数为BiBi,则,则 S SXiXi、S SY Y分别为分别为XiXi和和Y Y的标准差。的标准差。第7页,讲稿共28张,创作于星期日偏回归系数的估计偏回归系数的估计-最小二乘法最小二乘法 基本思想:利用收集到的因变量和自变量建立线性函数,使得每一个实际测量的Yi与估计的Yi之间的离差的平方和尽可能的小。只有一个自变量时,回归结果为二维平面的一条直线,而有两个自变量时,结果为三维空间的一个平面,有更多的自变量时,回归的结果则是在三维以上空间的“超

5、平面”,无法直观图形表达,只能想象。第8页,讲稿共28张,创作于星期日多元线性回归分析前体条件多元线性回归分析前体条件LINELINE(1)linear:Y与与X1,X2,,Xm之间具有线性关系。之间具有线性关系。(2)independent:各个体观测值间相互独立。各个体观测值间相互独立。(3)normal distribution:在一定范围内,对任意一组自变在一定范围内,对任意一组自变量量X1,X2,,Xm值,值,Y都服从正态分布。都服从正态分布。(4)equal variance:在一定范围内,不同组自变量对应在一定范围内,不同组自变量对应的的Y具有相同方差。具有相同方差。第9页,讲稿

6、共28张,创作于星期日残差分析通过残差分析可以深入了解实际资料是否符合回归模型假设(如正态、方差齐)第10页,讲稿共28张,创作于星期日多元线性回归决定系数多元线性回归决定系数决定系数:回归平方和(SS回)在总平方和(SS总)中比例。R2=SS回/SS总0R21,R2接近1,表示样本数据很好的拟合了所用的线性回归模型。R2反映了线性回归模型能多大程度上解释Y的变异。第11页,讲稿共28张,创作于星期日第二节:多元线性回归假设检验第二节:多元线性回归假设检验 在多元线性回归模型中,由于变量众多,需要对模型的合理性以及参数的显著性进行检验。一、回归方程的假设检验(F检验)H0:1=2=p=0 H1

7、:1,2p不全为0如果H0成立,认为回归方程不显著,如果拒绝H0,认为回归方程显著。第12页,讲稿共28张,创作于星期日二、回归系数的假设检验(t检验)在F检验中,如果拒绝H0假设,只能说1,2p不全为0,还需要进一步检查每个自变量的总体偏回归系数。H0:i=0,H1:i0(i=1,2p)如果H0成立,认为偏回归系数i不显著,如果拒绝H0,认为偏回归系数i显著。第13页,讲稿共28张,创作于星期日第三节、自变量的筛选多元回归分析时收集的某些自变量对因变量无影影响或影响甚微;也不敢保证自变量之间是相互独立的,因而在建立多元线性回归方程时,需要使回归方程尽可能包含对解释因变量有较大贡献的自变量,而

8、把贡献不大的或无贡献以及与其他自变量有密切关系的自变量排除。第14页,讲稿共28张,创作于星期日自变量筛选的标准和原则1、残差平方和(SS残)缩小或决定系数(R2)增大R2=1-SS残/SS总2、残差均方(MS残)缩小或调整决定系数(R2ad)增大 MS残=SS残/(n-p-1)3、Cp统计量减小第15页,讲稿共28张,创作于星期日自变量筛选的方法向前选择法建模时没有自变量,逐个加入自变量。并通过F检验加入自变量对模型的影响是否显著。显著则保留此变量。向后删除法建模时加入所有自变量,通过F检验,逐个剔除在当前模型中最不显著的自变量,直到模型的变量都显著为止。逐步筛选法为上述两种方法的综合,即每

9、次首先加入一个变量,如果其对模型影响显著,则保留,然后对当前模型中的所有变量进行检查,剔除不显著的变量。直到没有显著变量加入且没有不显著变量剔除为止。最大R2改进法最小R2改进法R2选择法修正R2选择法Cp选择法第16页,讲稿共28张,创作于星期日定量的建立一个反应变量和多个自变量之间的线性关系筛选危险因素通过较易测算的变量估计不易测量的变量通过反应变量控制自变量第四节:多元线性回归应用第17页,讲稿共28张,创作于星期日第五节:多元线性回归应注意问题多重共线性 除了LINE前提条件外,多元线性回归还需要注意自变量之间的关系。当自变量之间高度相关,则称自变量存在多重共线性。共线性可使回归系数极

10、不稳定,表现为回归系数标准误很大,以至于本来非常重要的自变量无统计意义而不能进入方程,甚至使样本回归系数可大可小,可正可负,专业知识无法进行解释。最简单的处理办法就是删除变量:在相关性较强的变量中删除测量误差较大的、缺失数据多的,专业角度看不是很重要的,也可采用主成分回归法。第18页,讲稿共28张,创作于星期日交互效应 当回归模型中有多于2个的自变量,变量之间可能存在交互作用(一自变量对应变量的作用大小与另一个自变量的取值有关),此时可建立包含各自变量及其某些有交互作用的自变量的乘积(X1X2)的回归模型。例如:A、B两种药物对帕金森综合症都有作用,而且相信联合用药效果更好,为探讨联合用药可行

11、性,进行了随机对照临床试验。最终的得到的回归方程为:=49-2.5X1+1.9X2+0.2X1X2第19页,讲稿共28张,创作于星期日非同质性资料合并第20页,讲稿共28张,创作于星期日哑变量设置 多元线性回归分析中自变量可以是连续的(年龄、血压),也可以是二分类的(性别),不能把有序变量(高、中、低)和无序多分类变量直接纳入分析。必须先将有序变量或多分类无序变量转换成多个二分类变量,再进行回归分析。第21页,讲稿共28张,创作于星期日通径分析 当多元回归自变量较多时,相互间的关系十分复杂,有的自变量并不是直接对反应变量产生影响,而是通过对其他自变量的作用间接地影响反应变量。通径分析是一种在回

12、归基础上的拓展,用以处理这种具有复杂变量关系的方法。例如:回归模型后,自变量X1、X2对Y贡献甚微,但从专业知识考虑X1、X2是通过X3、X4影响Y的,这时就需要通径分析。步骤:1、根据专业知识绘制变量间的通径图。2、按照通径图建立线性方程。3、将各系数添加到通径图上。4、根据通径图计算各变量对Y的直接、间接效应。第22页,讲稿共28张,创作于星期日第六节:实例分析(SAS)为分析各大学附近房屋价格及其相关因素,统计了近期成交房屋售价和基本情况。试用回归分析方法确定哪些因素对价格有明显影响,并建立模型。占地面积占地面积税率税率教师学生比教师学生比卧室间数卧室间数总间数总间数居住面积居住面积价格

13、价格0.857230.76471850152900第23页,讲稿共28张,创作于星期日SAS分析过程采用REG过程对数据进行多元线性回归分析,编程如下:data house;/*建立数据集house*/input land tax ratio bedrooms rooms area price;/*要输入的变量*/cards;。;proc reg data=house;/*采用reg过程进行多元回归分析*/model price=land tax ratio bedrooms rooms area;run;第24页,讲稿共28张,创作于星期日proc reg data=house;/*采用采用

14、reg过程进行多元回归分析过程进行多元回归分析*/model price=land tax ratio bedrooms rooms area/selection=stepwise;/*采用逐步筛选法*/run;第25页,讲稿共28张,创作于星期日Price=36942+6967.58365*land+71.36620*area-63.06941*ratio第26页,讲稿共28张,创作于星期日利用PLOT语句绘制模型的残差图proc reg data=house;model price=land ratio area;plot residual.*predicted.;run;第27页,讲稿共28张,创作于星期日感谢大家观看第28页,讲稿共28张,创作于星期日

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁