回归分析课件.ppt

上传人:石*** 文档编号:84135583 上传时间:2023-04-02 格式:PPT 页数:26 大小:477.50KB
返回 下载 相关 举报
回归分析课件.ppt_第1页
第1页 / 共26页
回归分析课件.ppt_第2页
第2页 / 共26页
点击查看更多>>
资源描述

《回归分析课件.ppt》由会员分享,可在线阅读,更多相关《回归分析课件.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于回归分析现在学习的是第1页,共26页例例1.考虑学生体重考虑学生体重(因变量因变量)与身高与身高(自变量、定量变量自变量、定量变量)的关系时,一般需要把男女学生分开来考虑,因为这的关系时,一般需要把男女学生分开来考虑,因为这一关系一关系很可能很可能因为性别的不同而不同。因为性别的不同而不同。这些数据储存在这些数据储存在SPSS数据文件数据文件 height.sav 中。中。现在学习的是第2页,共26页o如果如果分别考虑分别考虑男、女生的体重与身高的关系,并假设这一关系为男、女生的体重与身高的关系,并假设这一关系为线性线性的,我的,我们得到们得到(拟合拟合)如下如下两个简单线性回归方程两个简

2、单线性回归方程,括号内为相应系数估计的,括号内为相应系数估计的 p-值。值。o女生:女生:w0=-12.446+0.422 h0,R2=0.214,(.547)(.002)F=11.165(.002)o男生:男生:w1=-37.400+0.645 h1,R2=0.434,(.032)(.000)F=42.128(.000)o拟合结果表明,男、女生的身高和体重的关系是不同的。拟合结果表明,男、女生的身高和体重的关系是不同的。o问题是:问题是:上述身高和体重的关系在不同性别之间的上述身高和体重的关系在不同性别之间的差异显著吗差异显著吗?o在上述结果中在上述结果中似乎没有一个合适的量来回答这一问题。

3、似乎没有一个合适的量来回答这一问题。现在学习的是第3页,共26页o在回归模型中引进在回归模型中引进哑变量哑变量(dummy variable),我们就可以来回答上述,我们就可以来回答上述问题。问题。o哑变量的哑变量的取值为取值为 1 和和 0,用来,用来区分定性变量取区分定性变量取某个特定值某个特定值还是还是其它值其它值。例。例1中的变量中的变量 D 就是一个哑变量就是一个哑变量,o哑变量的应用哑变量的应用 例例1的带有哑变量的回归模型为如下的多元线性回归模型的带有哑变量的回归模型为如下的多元线性回归模型:(变量变量 Dh=Dh)w=b b 0+b b 1 D+b b 2 h+b b 3(Dh

4、)+e e(1)o对于女生,对于女生,D=0,模型,模型(1)变为变为 w=b b 0+b b 2 h+e e;而男生的模型则为而男生的模型则为 w=(b b 0+b b 1)+(b b 2+b b 3)h+e e。现在学习的是第4页,共26页o拟合得到如下的回归方程:拟合得到如下的回归方程:w=-12.446 24.954 D+0.422 h+0.223 Dh (.534)(.347)(.001)(.166)o由拟合结果可以看出,变量由拟合结果可以看出,变量 D 和和 Dh 的系数均不显著。因此可以说,性别对身高和的系数均不显著。因此可以说,性别对身高和体重关系的体重关系的影响不显著影响不显

5、著。o但是但是,由于,由于 b b 0 不显著,因此我们需对模型作修改:不显著,因此我们需对模型作修改:w=37.4 D+0.346 h+0.299 Dh (.033)(.000)(.004)o此时,变量此时,变量 D 和和 Dh 的系数均为显著的。的系数均为显著的。o因此我们说,性别对身高和体重关系的因此我们说,性别对身高和体重关系的影响是显著的影响是显著的。现在学习的是第5页,共26页w=37.4 D+0.346 h+0.299 Dh D=0 w=0.346 hD=1 w=37.4+(0.299+0.346)h男生身高对体重的效应大于女生男生身高对体重的效应大于女生身高对体重的效应身高对体

6、重的效应现在学习的是第6页,共26页4 二项二项 Logistic回归回归现在学习的是第7页,共26页例子例子在一次住房展销会上在一次住房展销会上,与房地产商签定与房地产商签定购房意向书的顾客中购房意向书的顾客中,在随后在随后3个月中个月中,只有一部分购买了房屋只有一部分购买了房屋.购买房屋的顾客记为购买房屋的顾客记为1,没有购买记为没有购买记为0现在学习的是第8页,共26页一、定性因变量的回归方程的意义 设因变量 y只是取0,1两个值的定性变量,考虑简单线性回归模型:由于,是01型贝努利随机变量,则得如下分布根据随机变量的期望值定义,可得现在学习的是第9页,共26页二、定性因变量回归的特殊问

7、题 1.离散非正态误差项 2.零均值异方差性 3.回归方程的限制 现在学习的是第10页,共26页三 Logistic回归模型 针对01型因变量产生的问题,对回归 模型应该作两个方面的改进。1.回归函数应该改用限制在 区间内的 连续曲线,而不能再沿用直线回归方程。2.因变量本身只取0,1两个离散值,不适于 直接作为回归模型中的因变量,可以用 等于1的比例代替 本身作为因变量。现在学习的是第11页,共26页LogitLogit变换变换 发生比发生比现在学习的是第12页,共26页Logistic Logistic 回归模型回归模型现在学习的是第13页,共26页回归系数的含义回归系数的含义发生比发生比

8、(相对风险相对风险)为当为当x1增加增加1个单位时个单位时,相对风险的比值相对风险的比值现在学习的是第14页,共26页基本操作基本操作Analyze=Regression=Binary Logistic pDependent 输入因变量输入因变量pCovariates 输入自变量输入自变量pMethod:输入自变量筛选策略输入自变量筛选策略 Enter:强行进入强行进入 Forward:逐步筛选逐步筛选 Backward:向后筛选向后筛选pSelect:选择一个变量作为条件变量选择一个变量作为条件变量现在学习的是第15页,共26页基本操作基本操作pCategorical :如果自变量是分类变量

9、如果自变量是分类变量 生成虚拟变量生成虚拟变量.Categorical Covariates:指定分类变量指定分类变量Change Contrast:选择参照类选择参照类,最常用为最常用为indicator现在学习的是第16页,共26页其他操作其他操作pOption:选择选择Statistics and plots:输出统计量和图输出统计量和图 Classificaton Plots:绘制因变量实际值与预测绘制因变量实际值与预测 分类值的关系图分类值的关系图 Hosmerlemeshow goodness-of-fit:输出拟合优度指标输出拟合优度指标 Casewise listing of

10、residuals:输出各样本输出各样本 数据的非标准化残差数据的非标准化残差,标准化残差标准化残差 Correlations of estimates:参数估计的相关阵参数估计的相关阵 Iteration history:最大似然估计的迭代过程最大似然估计的迭代过程 CI for exp(B):风险比默认为风险比默认为95%置信区间置信区间现在学习的是第17页,共26页其他操作其他操作Display:显示方法显示方法Probability for Stepwise:选择逐步回归中选择逐步回归中 自变量进入方程或剔除出方程的显著性水平自变量进入方程或剔除出方程的显著性水平 Classficat

11、ion cutoff:设置因变量分类分界值设置因变量分类分界值Maximum Iterations:极大似然估计的最大极大似然估计的最大 迭代次数迭代次数现在学习的是第18页,共26页其他操作其他操作pSave:保存保存Predicted Values:预测值预测值 Probabilities:因变量取因变量取1的预测概率值的预测概率值 Group membership:分类预测值分类预测值Residuals:残差残差Influence:COOK距离距离,杠杆值等杠杆值等现在学习的是第19页,共26页实例分析实例分析例例1:消费行为数据消费行为数据,研究是否购买与研究是否购买与性别性别,年龄年

12、龄,收入水平的关系收入水平的关系.性别以男为参照类性别以男为参照类,收入以低收入为参照类收入以低收入为参照类变量选择分别采用变量选择分别采用(1)强制进入法强制进入法(2)逐步回归法逐步回归法 要求写出要求写出Logistic回归方程回归方程,解释回归系数的意义解释回归系数的意义现在学习的是第20页,共26页逐步回归法主要结果分析逐步回归法主要结果分析1 model summary表显示了模型拟合优度表显示了模型拟合优度 方面的指标方面的指标,模型拟合优度不理想模型拟合优度不理想2分类表显示了各模型的错判矩阵分类表显示了各模型的错判矩阵,第第1个模型的总体正确率为个模型的总体正确率为62.4%

13、,但对购买但对购买 人群预测的正确率为人群预测的正确率为0,第第2个模型的总体正确率为个模型的总体正确率为60.6%,但对购买人群预测的正确率为提高了但对购买人群预测的正确率为提高了,第二个模型略好第二个模型略好.3 回归方程回归方程 LogitP=-1.11+0.504gender(1)+0.096income(1)+0.761 income(2)LogitP|(gender(1)=1)-LogitP|(gender(0)=0.504odds(gender(1)=1)/odds(gender(1)=0)=1.656现在学习的是第21页,共26页主要结果分析主要结果分析LogitP=-1.11

14、+0.504gender(1)+0.096income(1)+0.761 income(2)LogitP|(income(1)=1,income(1)=0)-LogitP|(income(1)=0,income(1)=0)=0.096odds(中等收入中等收入)/odds(低收入低收入)=1.101现在学习的是第22页,共26页主要结果分析主要结果分析说明说明(1)女性的购买发生比是男性的女性的购买发生比是男性的1.656倍倍(2)中等收入的购买发生比是低等收入的中等收入的购买发生比是低等收入的1.101倍倍,(3)高等收入的购买发生比高等收入的购买发生比 是低等收入的是低等收入的2.139倍

15、倍结论结论:年龄对是否购买该商品无影响年龄对是否购买该商品无影响,女性及女性及高收入阶层购买可能性大高收入阶层购买可能性大现在学习的是第23页,共26页实例分析实例分析例例2:logist2.sav:某项病因调查工作中某项病因调查工作中,通过病例对照研究通过病例对照研究,用逐步回归法进行用逐步回归法进行Logistic回归分析回归分析,要求要求对上述主要结果作统计分析对上述主要结果作统计分析,写写 出出Logistic回归方程回归方程,解释回归解释回归 系数意义系数意义现在学习的是第24页,共26页作业作业5 civil.sav:研究我国民航客运量的变化趋势与成因研究我国民航客运量的变化趋势与成因 用逐步回归法选择解释变量用逐步回归法选择解释变量,写出写出 最后回归方程最后回归方程,解释回归系数的意义解释回归系数的意义,并作残差并作残差 分析和多重共线性检测分析和多重共线性检测.现在学习的是第25页,共26页感感谢谢大大家家观观看看现在学习的是第26页,共26页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁