《应用回归分析改.ppt》由会员分享,可在线阅读,更多相关《应用回归分析改.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章第八章应用回归分析应用回归分析回归分析的研究对象1)家庭收入与家庭支出的关系2)父母身高与子/女身高的关系3)平时作业成绩与最后的考试成绩的关系4)银行利率与股票指数的关系现实世界中变量之间的关系并不总是可以用函数关系(自变量确定,因变量唯一)来表示的比如:经验和统计数据表明某些变量的取值相互之间是有关系的,不是完全无关的,这种关系称为统计相关关统计相关关系系 统计相关关系统计相关关系:回归分析及回归方程回归分析及回归方程:回归分析回归分析就是研究变量间的统计相关关系一种统计方法.根据变元的统计数据,用一个函数来近似变元间的统计相关关系,这个函数叫回归方程回归方程或回归函数回归函数本例中
2、,父亲身高与儿子身高的关系就是统计相关关系统计相关关系上述高尔顿得到的近似直线方程就是回归方程回归方程8.1 一元线性回归一元线性回归一元线性回归的模型:其中,X为确定性变量,它是可以测量和控制的,也称解释变量或自变量;Y为被解释变量或响应变量 根据变元(X,Y)的一组观测值代入上述一元线性回归模型,得:我们导出了参数的极大似然估计,但是,历史上高尔顿是用我们高等数学中所学过的最小二乘法导出的,因此,一般称之为最小二乘估计关于上述例1,请大家思考如下问题:我们得到的回归方程有什么用?根据哪些指标可以判断回归的效果?上述回归的效果如何?上例中:年龄为自变量(控制变量),体重为因变量(响应变量),
3、回 归方程为:y=7.83+2.01x,那么据此方程得:x=(y-7.83)/2.01 ,它 可否视为把体重作为自变量,年龄作为因变量的回归方程?对于任意给定的一组数值(xi,yi)i=1,2,n,比如 xi 表示第i天的最高 气温,yi表示第i天股市的收盘指数,是否都可以像例1一样代入参数的公 式并求出回归方程?如果观测值较多,直接手算比较复杂,如何借助计算机求解回归方程?关于问题1:回归方程有什么用途?回归方程的主要用途是预测和控制,比如根据上例的回归方程 y=7.83+2.01x,我们可以预测 x=2.2(岁)时儿童的体重为:y=7.83+2.01*2.2=12.252(kg)-这是y的
4、点估计,我们还可以得到y的区间估计。对于一元线性回归模型 ,其中误差项满足正态性,独立性,及方差齐性的条件,给定 ,则对应 的点估计为 ;当 n 充分大时,置信水平为此外,我们还可以求出参数关于问题2:哪些指标可以判断回归的效果?如下指标都可以直接或间接用来表示回归的效果:残差平方和 SSE 估计标准差 相关系数 R 判定系数 修正判定系数 其中p为自变元个数 从例1第二问的结果看,该例回归的效果还是很好的 关于问题3:能否由体重关于年龄的回归方程:y=7.83+2.01x,得出年龄关于体重的回归方程:x=(y-7.83)/2.01=0.4975y 3.8955?不可以。事实上,如果把体重作为
5、自变量年龄作为因变量,代入一元回归的公式,得:x=0.4939y 3.853;二者为何不同呢?因为我们这里介绍的一元回归模型中,自变量与响应变量的地位是不等同的 还有一种回归,叫距离回归,即通过各散点到回归函数的距离平方和最小来求出回归参数,此时自变量与响应变量的地位是等同的,这种情况下是可以直接从 y关于 x 的回归方程解出 x 关于 y 的回归方程的 关于问题4:对于任意给定的一组数值(xi,yi)i=1,2,n,是否都可以求变量的回归方程?可以代入参数最小二乘估计的公式求出变元的回归方程,但是,如果变元 X 和 Y 没有统计相关关系,这样求出的回归方程是没有意义的(如气温与股票点数);而
6、如果回归模型的三个条件,即正态性,独立性,方差齐性 不满足,我们就无法对参数的概率特性(分布,区间估计 等)作出判断。直观地说,如果根据变元 X 和 Y 的观测值算出的相关系数的绝对值越大(越接近1),即表示变元 X 和 Y 线性关系越强,这时拟合观测值(xi,yi)的回归方程越有意义那么,相关系数的绝对值要达到多大才可以求回归方程呢?在统计上,我们是用假设检验的方法来判定变元的线性关系是否显著,因为检验的统计量服从F分布(证明略),因此这个检验叫F检验关于问题4:如何借助计算机算法进行回归分析?各种统计软件都有回归分析的功能,比如SAS,SPSS,R,包括MATLAB的统计包 等,这里我们介
7、绍EXCEL的回归分析功能操作步骤(多元回归同样操作,但利用EXCEL多元回归分析时自变元个数不能超过16个):1)把数据输入EXCEL表2)点工具菜单 加载宏 数据分析 回归对例1中数据的EXCEL回归分析结果:相关系数判定系数修正判定系数估计标准差F统计量观测值F检验的P值,当P值小于给定显著性水平时,说明变元线性关系显著P值小于显著性水平时说明常数项显著性非零P值小于显著性水平时说明x系数显著性非零回归参数置信区间的上下限SSRSSESSTF=(SSR/1)/(SSE/n-2)F(1,n-2)例2:恩格尔系数(食品支出与收入之比)的估算已知人均月收入X与人均食品月支出Y的15组抽样数据如
8、下,求恩格尔系数:X1020960970102091015805408301230106012901380810920640Y270260250280270360190260310310340380270280200分析:根据给定数据,先找出X,Y的回归函数,再根据回归函数来估计恩 格尔系数解:利用EXCEL进行回归分析,得:8.2 多元线性回归多元线性回归令:解方程组得参数的解方程组得参数的此外:此外:例3:试根据表中居民月收入X1(单位百元)及 某商品的单价X2(单位十元)来拟合该商 品的需求量Y(单位百件)的函数需求 Y月收入 X1商品单价 X2105210731582139514942010318104241231913523154解:利用EXCEL进行回归分析,得:需要说明的是:逐步回归,多元回归参数的检验,预测,参差分析,及应用案例等 略 THE END THANKS