多元回归分析与协方差分析.ppt

上传人:石*** 文档编号:38891868 上传时间:2022-09-06 格式:PPT 页数:11 大小:880KB
返回 下载 相关 举报
多元回归分析与协方差分析.ppt_第1页
第1页 / 共11页
多元回归分析与协方差分析.ppt_第2页
第2页 / 共11页
点击查看更多>>
资源描述

《多元回归分析与协方差分析.ppt》由会员分享,可在线阅读,更多相关《多元回归分析与协方差分析.ppt(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、多元回归分析与协方差分析现在学习的是第1页,共11页多元线性回归模型Y=0+1X1+2X2+.+pXm+其中其中X1、X2、Xm为个自变量为个自变量(即影响因素即影响因素);0、1、2、m为为+1个总体回归参数个总体回归参数(也称为回归系数也称为回归系数);为随机误差。为随机误差。当研究者通过试验获得了当研究者通过试验获得了(X1,X2,Xm,Y)的组的组样本值后,样本值后,运用最小平方法便可求出上式中各总体回归运用最小平方法便可求出上式中各总体回归参数的估计值参数的估计值b0、b1、b2、bm,于是,于是,多元线性回归多元线性回归模型变成了多元线性回归方程式。模型变成了多元线性回归方程式。Y

2、=b0+b1X1+b2X2+.+bpXm现在学习的是第2页,共11页回归分析的任务多元回归分析的任务就是用数理统计法估多元回归分析的任务就是用数理统计法估计出各回归参数的值及其标准误差;对各回计出各回归参数的值及其标准误差;对各回归参数和整个回归方程作假设检验;对各回归参数和整个回归方程作假设检验;对各回归变量归变量(即自变量即自变量)的作用大小作出评价;并的作用大小作出评价;并利用已求得的回归方程对因变量进行预测、利用已求得的回归方程对因变量进行预测、对自变量进行控制等等。对自变量进行控制等等。现在学习的是第3页,共11页标准回归系数及其意义 因为各因为各bi的值受各变量单位的影响。为便于比

3、较,需要的值受各变量单位的影响。为便于比较,需要求出标准化回归系数,消除仅由单位不同所带来的差别。求出标准化回归系数,消除仅由单位不同所带来的差别。设设 与一般回归系数与一般回归系数bi对应的标准化回归系数为对应的标准化回归系数为Bi,则,则Bi=biSXi/SY 式中式中的的SXi、SY分别为自变量分别为自变量Xi和和Y的标准差。的标准差。一般认为标准化回归系数的绝对值越大,所对应的自变量对一般认为标准化回归系数的绝对值越大,所对应的自变量对因变量的影响也就越大。但是,当自变量彼此相关时,回归系因变量的影响也就越大。但是,当自变量彼此相关时,回归系数受模型中其他自变量的影响,解释标准化回归系

4、数时必须采数受模型中其他自变量的影响,解释标准化回归系数时必须采取谨慎的态度。当然,更为妥善的办法是通过回归诊断,了解取谨慎的态度。当然,更为妥善的办法是通过回归诊断,了解哪些自变量之间有严重的多重共线性,从而,舍去其中作用较哪些自变量之间有严重的多重共线性,从而,舍去其中作用较小的变量,小的变量,使保留下来的所有自变量之间尽可能互相独立。使保留下来的所有自变量之间尽可能互相独立。现在学习的是第4页,共11页自变量为定性变量的数量化法设某定性变量有个水平设某定性变量有个水平(如如ABO血型系统有个水平血型系统有个水平),若分别用、若分别用、代表个水平的取值,是不够合理的、代表个水平的取值,是不

5、够合理的。因为这隐含着承认各等级之间的间隔是相等的,其实质是假。因为这隐含着承认各等级之间的间隔是相等的,其实质是假定该因素的各水平对因变量的影响作用几乎是相同的。定该因素的各水平对因变量的影响作用几乎是相同的。比较妥当的做法是引入个哑变量比较妥当的做法是引入个哑变量(Dummy Variables),每个哑变量取值为或。现以每个哑变量取值为或。现以ABO血型系血型系统为例,说明产生哑变量的具体法。统为例,说明产生哑变量的具体法。当某人为当某人为A型血时,令型血时,令X1=1、X2=X3=0;当某人为;当某人为B型血时,令型血时,令X2=1、X1=X3=0;当某人为;当某人为AB型血时,令型血

6、时,令X3=1、X1=X2=0;当某人为;当某人为O型血时,令型血时,令X1=X2=X3=0。现在学习的是第5页,共11页变量筛选 研究者根据专业知识和经验所选定的全部自变量并非研究者根据专业知识和经验所选定的全部自变量并非对因变量都是有显著性影响的对因变量都是有显著性影响的,故筛选变量是回归分析中不故筛选变量是回归分析中不可回避的问题。然而,筛选变量的方法很多,详见本章第可回避的问题。然而,筛选变量的方法很多,详见本章第节,这里先介绍最常用的一种变量筛选法节,这里先介绍最常用的一种变量筛选法逐步筛选逐步筛选法。法。模型中的变量从无到有,根据模型中的变量从无到有,根据F统计量按统计量按SLEN

7、TRY的的值值(选变量进入方程的显著性水平选变量进入方程的显著性水平)决定该变量是否入选决定该变量是否入选;当模型选入变量后,再根据;当模型选入变量后,再根据F统计量按统计量按SLSTAY的值的值(将方将方程中的变量剔除出去的显著性水平程中的变量剔除出去的显著性水平)剔除各不显著的变量,剔除各不显著的变量,依次类推。这样直到没有变量可入选依次类推。这样直到没有变量可入选,也没有变量可剔除或也没有变量可剔除或入选变量就是刚剔除的变量,则停止逐步筛选过程。入选变量就是刚剔除的变量,则停止逐步筛选过程。现在学习的是第6页,共11页回归诊断 自变量之间如果有较强的相关关系,就很自变量之间如果有较强的相

8、关关系,就很难求得较为理想的回归方程;若个别观测点难求得较为理想的回归方程;若个别观测点与多数观测点偏离很远或因过失误差与多数观测点偏离很远或因过失误差(如抄写如抄写或输入错误所致或输入错误所致),它们也会对回归方程的质,它们也会对回归方程的质量产生极坏的影响。对这两面的问题进行监量产生极坏的影响。对这两面的问题进行监测和分析的法,称为回归诊断。前者属于共测和分析的法,称为回归诊断。前者属于共线性诊断问题;后者属于异常点诊断问题。线性诊断问题;后者属于异常点诊断问题。现在学习的是第7页,共11页第章协方差分析第章协方差分析什么是协方差分析什么是协方差分析协方差分析是将回归分析与方差分析结合起来

9、使用的一协方差分析是将回归分析与方差分析结合起来使用的一种分析法。在这种分析中,先将定量的影响因素种分析法。在这种分析中,先将定量的影响因素(即难以即难以控制的因素控制的因素)看作自变量,或称为协变量,建立因变量随自看作自变量,或称为协变量,建立因变量随自变量变化的回归方程变量变化的回归方程,这样就可以利用回归方程把因变量的变这样就可以利用回归方程把因变量的变化中受不易控制的定量因素的影响扣除掉,从而化中受不易控制的定量因素的影响扣除掉,从而,能够较合理地能够较合理地比较定性的影响因素处在不同水平下,经过回归分析手段修正比较定性的影响因素处在不同水平下,经过回归分析手段修正以后的因变量的总体均

10、数之间是否有显著性的差别,这就是协以后的因变量的总体均数之间是否有显著性的差别,这就是协方差分析解决问题的基本思想。方差分析解决问题的基本思想。现在学习的是第8页,共11页协方差分析的模型设定性的影响因素为设定性的影响因素为A、B、C等等,它们之间的交互作用为它们之间的交互作用为A*B、A*C等;定量的影响因素为等;定量的影响因素为X或或X1、X2、;定量;定量的观测结果的观测结果(即因变量即因变量)为为Y,则有,则有(1)单因素水平设计的协方差分析模型为单因素水平设计的协方差分析模型为 MODEL Y=XA/SS3;(2)配伍组设计的协方差分析模型为配伍组设计的协方差分析模型为 MODEL

11、Y=XAB/SS3;(3)两因素析因设计的协方差分析模型为两因素析因设计的协方差分析模型为 MODEL Y=XABA*B/SS3;现在学习的是第9页,共11页协方差分析的应用条件理论上要求各组资料都来自方差相同的理论上要求各组资料都来自方差相同的正态总体;各组的总体直线回归系数相等,正态总体;各组的总体直线回归系数相等,且都不为。因此,严格地说,在对资料作且都不为。因此,严格地说,在对资料作协方差分析之前,应先对这两个前提条件作协方差分析之前,应先对这两个前提条件作假设检验,若资料符合上述两个条件,或经假设检验,若资料符合上述两个条件,或经变量变换后符合上述条件,方可进行协方差变量变换后符合上述条件,方可进行协方差分析。分析。现在学习的是第10页,共11页例例 看书上有关协方看书上有关协方差分析的实例!差分析的实例!现在学习的是第11页,共11页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁