应用统计学 回归分析.pptx

上传人:莉*** 文档编号:73773858 上传时间:2023-02-22 格式:PPTX 页数:106 大小:2.40MB
返回 下载 相关 举报
应用统计学 回归分析.pptx_第1页
第1页 / 共106页
应用统计学 回归分析.pptx_第2页
第2页 / 共106页
点击查看更多>>
资源描述

《应用统计学 回归分析.pptx》由会员分享,可在线阅读,更多相关《应用统计学 回归分析.pptx(106页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、回归是研究自变量与因变量之间的关系形式的分析方法。一、回归分析的提出 回归分析起源于生物学研究,是由英国生物学家兼统计学家高尔登(Francis Galton 1822-1911)在19世纪末叶研究遗传学特性时首先提出来的。高尔登在1889年发表的著作自然的遗传中,提出了回归分析方法以后,很快就应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用。回归的现代涵义与过去大不相同。一般说来,回归是研究因变量随自变量变化的关系形式的分析方法。其目的在于根据已知自变量来估计和预测因变量的总平均值。第一节 引言 第1页/共106页根据因变量与自变量之间的关系不同,可以分为两种类型:函数关系 相关

2、关系 第一节 引言 因变量(Y)与自变量(X)之间的关系第2页/共106页二、回归分析和相关分析函数关系函数关系反映客观事物之间存在着严格的依存关系。在这种关系中,当一个或几个变量取值一定时,另一个变量有确定的值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。一般把作为影响因素的变量称为自变量,把发生对应变化的变量称为因变量。第一节 引言 第3页/共106页相关关系相关关系相关关系反映的相关关系反映的是客观事物之间的非严格、不确定的是客观事物之间的非严格、不确定的线性依存关系。线性依存关系。这种线性依存关系有两个显著的特点:这种线性依存关系有两个显著的特点:二、回归分析和相关分析客

3、观事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。客观事物之间的数量依存关系不是确定的,具有一定的随机性。表现在当一个或几个相互联系的变量取一定数值时,与之对应的另一个变量可以取若干个不同的数值。这种关系虽然不确定,但因变量总是遵循一定规律围绕这些数值的平均数上下波动。第4页/共106页图 国内生产总值y与固定资产投资完成额x间关系的散点图第5页/共106页二、回归分析和相关分析回归分析 回归分析是研究某一随机变量(因变量)与另外一个或几个普通变量(自变量)之间的数量变动的关系。由回归分析求出的关系式,称为回归模型。相关分析 相

4、关分析是研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。回归分析与相关分析的关系第6页/共106页区别 相关分析研究的变量都是随机变量,并且不分自变量与因变量;回归分析研究的变量要首先明确那些是自变量,那些是因变量?并且自变量是确定的普通变量,因变量是随机变量。二、回归分析和相关分析联系 由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、预测,同时相关系数还是检验回归分析效果的标准。第7页/共106页根据自变量的多少 回归模型可以分为一元回归模型和多元回归模型。根据回归模型的形式线性与否 回归模型可以分

5、为一元回归模型和多元回归模型。根据回归模型是否带有虚拟变量 回归模型可以分为普通回归模型和带虚拟变量的回归模型。此外,根据回归模型是否用滞后的因变量作自变量,回归模型又可分为无自回归现象的回归模型和自回归模型。三、回归模型的种类第8页/共106页第二节 一元线性回归模型 设x为自变量,y为因变量,y与x之间存在某种线性关系,即一元线性回归模型为 (6.2.1)给定x,y的n对观测值xi,yi,代入式(6.2.1)得 (6.2.1)当b0时,x与y为正相关,当b0时,x与y为负相关。1、一元线性回归模型第9页/共106页二、OLS(Ordinary Least Square)估计 OLS的中心思

6、想 最小二乘法的中心思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列两点要求:第二节 一元线性回归模型第10页/共106页二、OLS(Ordinary Least Square)估计第11页/共106页二、OLS(Ordinary Least Square)估计第12页/共106页OLS的特性 最小二乘估计量 具有线性、无偏性和最小方差性等良好的性质。线性、无偏性和最小方差性统称BLUE性质。满足BLUE性质的估计量 称为BLUE估计量。二、OLS(Ordinary Least Square)估计第13页/共106页 回归方程的检验 在一元线性回归模型中最常用的显著性检验

7、方法有:相关系数检验法F检验法t检验法 3.2 一元线性回归预测法 第14页/共106页三、离差平方和的分解与可决系数 在一元线性回归模型中,观测值的数值会发生波动,这种波动称为变差。变差产生的原因如下:3.2 一元线性回归预测法 受自变量变动的影响,即x取值不同时的影响;受其他因素(包括观测和实验中产生的误差)的影响。为了分析这两方面的影响,需要对总变差进行分解。第15页/共106页三、相关系数 离差平方和的分解 回归离差平方和剩余离差平方和第16页/共106页 总平方和分解总平和分解图 第17页/共106页三、相关系数可决系数 第18页/共106页三、相关系数 相关系数的取值范围为 当R=

8、0时,说明回归变差为0,自变量x的变动对总变差毫无影响,这种情况称y与x不相关。当|R|=1时,说明回归变差等于总变差,总变差的变化完全由自变量x的变化所引起,这种情况成为完全相关。这时因变量y是自变量x的线性函数,二者之间呈函数关系。当0|R|1时,说明自变量x的变动对总变差有部分影响,这种情况成为普通相关。Y的变差完全由随机因素引起样本的全部观察值都落在所拟和的回归直线上第19页/共106页四、显著性检验相关系数检验法 第一步,计算相关系数R;第二步,根据回归模型的自由度(n-2)和给定的显著性水平值,从相关系数临界值表中查出临界值;第三步,判别。若|R|R(n-2),表明两变量之间线性相

9、关关系显著,检验通过,这时回归模型可以用来预测;若|R|30,式(6.2.31)可简化为第29页/共106页六、应用举例 例6.2.1 某省19781989年国内生产总值和固定资产投资完成额资料如表6.2.1所示。第30页/共106页六、应用举例 试配合适当的回归模型并进行显著性检验;若19991999年该省固定资产投资完成额为249249亿元,当显著性水平0.050.05时,试估计19901990年国内生产总值的预测区间。解:.绘制散点图 第31页/共106页六、应用举例2设一元线性回归模型为3计算回归系数第32页/共106页六、应用举例4检验线性关系的显著性 第33页/共106页六、应用举

10、例第34页/共106页六、应用举例5预测(2)当显著性水平,自由度nm12210时,查t分布表得(1)计算估计值的标准误差第35页/共106页六、应用举例第36页/共106页七、几个应当注意的问题 1重视数据的收集和甄别在收集数据的过程中可能会遇到以下困难:(1)一些变量无法直接观测。(2)数据缺失或出现异常数据。(3)数据量不够。(4)数据不准确、不一致、有矛盾。2.合理确定数据的单位 在建立回归方程时,如果不同变量的单位选取不适当,导致模型中各变量的数量级差异悬殊,往往会给建模和模型解释带来诸多不便。比如模型中有的变量用小数位表示,有的变量用百位或千位数表示,可能会因舍入误差使模型计算的准

11、确性受到影响。因此,适当选取变量的单位,使模型中各变量的数量级大体一致是一种明智的做法。第37页/共106页 一元线性回归模型研究的是某一因变量与一个自变量之间的关系问题。但是,客观现象之间的联系是复杂的,许多现象的变动都涉及到多个变量之间的数量关系。研究某一因变量与多个自变量之间的相互关系的理论和方法就是多元线性回归模型。第三节 多元线性回归预测法第38页/共106页第三节 多元线性回归预测法第39页/共106页一、多元线性回归模型及其假设条件多元线性回归模型第40页/共106页一、多元线性回归模型及其假设条件第41页/共106页一、多元线性回归模型及其假设条件第42页/共106页一、多元线

12、性回归模型及其假设条件第43页/共106页一、多元线性回归模型及其假设条件第44页/共106页二、模型参数OSL的估计与性质 模型参数的OSL 估计第45页/共106页二、模型参数OSL的估计与性质 回归系数向量估计值 的统计性质第46页/共106页回归系数向量估计值 的统计性质 第47页/共106页三、多元线性回归模型的检验 常用的检验方法有检验法检验法 t检验法DWDW检验法 在建立多元线性回归模型的过程中,为进一步分析回归模型所反映的变量之间的关系是否符合客观实际,引入的影响因素是否有效,同样需要对回归模型进行检验。第48页/共106页1.检验法第49页/共106页 与相关系数检验法一样

13、,复相关系数检验法的步骤为:()计算复相关系数;()查相关系数临界值表;根据回归模型的自由度nm和给定的显著性水平值,查相关系数临界值表()判别。1.检验法第50页/共106页样本容量增大(n)R2也随之增大(R2)R2的大小很难说明问题存在的问题1.检验法第51页/共106页1.检验法第52页/共106页1.检验法当n为小样本,解释变量数很大时,上式可能为负数,这时取其值为0。第53页/共106页2.F 检验法检验Y与解释变量x1,x2,xk之间的线性关系是否显著第54页/共106页2.F 检验法第55页/共106页2.F 检验法第56页/共106页 回归方程显著,并不意味着每个解释变量对因

14、变量Y的影响都重要回归方程显著每个回归系数都显著2.F 检验法第57页/共106页3.T检验法第58页/共106页3.T检验法可应用excel直接获得检验结果第59页/共106页4.DW 检验法第60页/共106页4.DW检验法在序列相关中,最常见的是一阶自相关,最常用的检验方法是DW检验法(Durbin-Watson准则)。定义统计量为:第61页/共106页4.DW检验法第62页/共106页4.DW检验法第63页/共106页表 检验判别表 4.DW检验法第64页/共106页4.DW检验法 将上面DW检验判别表绘成图形如下图:第65页/共106页4.DW检验法第66页/共106页5.预测区间第

15、67页/共106页5.预测区间第68页/共106页四、应用举例 某省19781989年消费基金、国民收入使用额和平均人口资料如表6.3.3所示。试配合适当的回归模型并进行各种检验;若1990年该省国民收入使用额为67十亿元,平均人口为58百万人,当显著性水平0.05时,试估计1990年消费基金的预测区间。第69页/共106页四、应用举例 可应用excel直接获得检验结果第70页/共106页四、应用举例 第71页/共106页四、应用举例 第72页/共106页四、应用举例 第73页/共106页四、应用举例 第74页/共106页四、应用举例 第75页/共106页四、应用举例7.检验第76页/共106

16、页四、应用举例第77页/共106页四、应用举例第78页/共106页第四节 虚拟变量回归预测 虚拟变量品质变量不像数量变量那样表现为具体的数值。它只能以品质、属性、种类等形式来表现。要在回归模型中引入此类品质变量,必须首先将具有属性性质的品质变量数量化。通常的做法是令某种属性出现对应于1,不出现对应于0。这种以出现为,未出现为形式表现的品质变量,就称为虚拟变量。带虚拟变量的回归模型 常见的带虚拟变量的回归模型有以下三种形式:第79页/共106页带虚拟变量的回归模型第四节 虚拟变量回归预测 第80页/共106页其中的趋势变化如右图所示第四节 虚拟变量回归预测 第81页/共106页第四节 虚拟变量回

17、归预测 第82页/共106页第四节 虚拟变量回归预测 第83页/共106页虚拟变量的回归模型应用举例 例 某省农业生产资料购买力和农民货币收入统计数据,根据上述统计数据,试建立一元线性回归模型和带虚拟变量的回归模型,并将两模型对比分析 第84页/共106页虚拟变量回归模型的应用举例第85页/共106页虚拟变量回归模型的应用举例第86页/共106页 非线性回归模型按变量个数也可以分为一元非线性回归模型和多元非线性回归模型;曲线的形式也因实际情况不同而有多种形式,如指数曲线、双曲线、S形曲线等。第五节非线性回归模型第87页/共106页非线性回归模型的形式 第五节非线性回归模型第88页/共106页第

18、五节非线性回归模型第89页/共106页 根据非线性回归模型线性化的不同性质,上述模型一般可以分成三种类型:第一类:直接换元型 这类非线性回归模型通过简单的变量换元可直接化为线性回归模型,如式(1)、式(2)、式(3)、式(4)。第二类:间接代换型 这类非线性回归模型经常通过对数变形代换间接地化为线性回归模型,如:式(5)、式(6)。第三类:非线性型 这类非线性回归模型属于不可线性化的非线性回归模型,如式(7)和式(8)。第五节非线性回归模型 非线性回归模型的分类第90页/共106页 直接换元法第91页/共106页 对于式(5)、式(6)和式(7)所示的非线性回归模型,因变量与待估计参数之间的关

19、系也是非线性的。因此不能通过直接换元化为线性模型。对此类模型,通常可通过对回归方程两边取对数将其化为可以直接换元的形式。这种先取对数再进行变量代换的方法称为间接换元法。间接换元法第92页/共106页 间接换元法第93页/共106页例 6.5.1例 6.5.直接换元法计算表第94页/共106页例 6.5.1第95页/共106页例 6.5.1第96页/共106页例 6.5.1第97页/共106页例 6.5.1 由于商品零售额增加,流通费用率呈下降趋势,二者之间为负相关关系,故相关系数取负值为:0.9898。说明两者高度相关,用双曲线回归模型配合进行预测是可靠的。第98页/共106页例 6.5.1第

20、99页/共106页举例 4第100页/共106页举例第101页/共106页本章小节回归分析和相关分析的目的不同在回归分析中,寻找的是变量之间的关系,代表这种关系的方程可能就是所期望的结果,也可能是所期望预测的均值。在相关分析中,需要度量的是两个或两个以上随机变量之间线性关系的强度。当二维数据显示在散点图上落在一条直线附近时,它们支持一个线性关系,但是这并不能证明这是必然的和有因果关系的。第102页/共106页本章小节线性回归模型的一般形式为 第103页/共106页本章小节第104页/共106页 对于非线性回归模型,一般可以分成三种类型:直接换元型 即通过简单的变量换元可直接化为线性回归模型;间接代换型 通常通过对数变换的代换间接地化为线性回归模型;非线性型 指不能线性化的非线性回归模型。对于可线性化的非线性回归模型可以转化为线性模型后进行求解,并应用可决系数R2或相关系数R度量非线性相关程度。本章小节第105页/共106页感谢您的观看!第106页/共106页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁