《相关与回归》PPT课件.ppt

上传人:wuy****n92 文档编号:70500688 上传时间:2023-01-21 格式:PPT 页数:73 大小:545.50KB
返回 下载 相关 举报
《相关与回归》PPT课件.ppt_第1页
第1页 / 共73页
《相关与回归》PPT课件.ppt_第2页
第2页 / 共73页
点击查看更多>>
资源描述

《《相关与回归》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《相关与回归》PPT课件.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、7 相关分析7 相关分析 表表7-1 我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位:元单位:元年份年份人均人均国民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148 在研究我国人均消费水平的

2、问题中,把全国人均消费额记为y,把人均国民收入记为x。我们搜集到19811993年的样本数据(xi,yi),i=1,2,,13,数据见表7-1。第七章第七章 相关关系分析相关关系分析统计学学习目标掌握掌握一元线性回归一元线性回归的基本原理和参数的最小二的基本原理和参数的最小二乘估计方法乘估计方法掌握回归方程的显著性检验掌握回归方程的显著性检验利用回归方程进行利用回归方程进行预测预测掌握掌握相关系数相关系数的含义、计算方法和应用的含义、计算方法和应用7.1 概述相关关系的含义相关关系的含义相关关系的分类相关关系的分类相关关系的内容相关关系的内容7.1.1 变量间的关系p函数关系p相关关系变量间的

3、关系(函数关系)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的关系可表示为的关系可表示为 y=p x(p 为单价)为单价)圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表表示示为为S=R2 企企业业的的原原材材料料消消耗耗额额(y)与与产产量量(x1)、单单位位产产量量消消耗耗(x2)、原原材材料料价价格格(x3)之之间的关系可表示为间的关系可表示为y=x1 x2 x3 变量间的关系(函数关系)是一一对应的是一一对应的 确定关系确定关系各各观观测测点点落落在在 一条线上一条线上 x xy y变量间的关系(相关关系)相关关系的例子相

4、关关系的例子商品的消费量(商品的消费量(y)与居民收入(与居民收入(x)之间的关系之间的关系商品销售额(商品销售额(y)与广告费支出(与广告费支出(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温度温度(x3)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程度(x)之间的关系之间的关系父亲身高(父亲身高(y)与子女身高(与子女身高(x)之间的关系之间的关系变量间的关系(相关关系)变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定当当变变量

5、量 x 取取某某个个值值时时,变变量量 y 的取值可能有几个的取值可能有几个各观测点分布在直线周围各观测点分布在直线周围 x xy y7.1.2 相关关系种类正相关与负相关正相关与负相关直线相关与曲线相关直线相关与曲线相关单相关与复相关单相关与复相关相关关系的图示 不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相

6、关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 7.1.3 相关分析与回归分析相关分析相关分析就是用一个指标来表明现象间相互就是用一个指标来表明现象间相互依存关系的密切程度(直线相关用依存关系的密切程度(直线相关用相关系数描述相关系数描述,曲线相关用相关指曲线相关用相关指数描述)数描述)回归分析回归分析是指对具有相关关系的现象,根据是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式)合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变,用来近似地表达变量间的平均变化关系的一种统计分析方法。化关系的一种统

7、计分析方法。相关分析与回归分析区别 l在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。l相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。l相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。相关分析与回归分析联系相关分析是回归分析的基础和前提回归分析是相关分析的深入和继续7.2 一元线性回归回归分析的特点回归分析的特点一元线性回归方程一元线性回归方程估计标准

8、误差估计标准误差回归方程的显著性检验回归方程的显著性检验利用回归方程进行预测与控制利用回归方程进行预测与控制对总体回归方程参数的估计对总体回归方程参数的估计7.2.1 回归分析的特点回归分析回归分析是应用统计方法寻找一数学方程,建立是应用统计方法寻找一数学方程,建立自变量与因变量之间的关系,并据以利用自变量自变量与因变量之间的关系,并据以利用自变量的给定值来推算或估计因变量的值的给定值来推算或估计因变量的值因变量是随机变量,自变量是非随机变量,是给因变量是随机变量,自变量是非随机变量,是给定的数值定的数值线性回归与非线性回归线性回归与非线性回归一元线性回归与多元线性回归一元线性回归与多元线性回

9、归7.2.2 一元线性回归方程的建立一元线性回归方程一元线性回归方程最小二乘法确定回归方程系数最小二乘法确定回归方程系数一元线性回归模型(概念要点)对对于于只只涉涉及及一一个个自自变变量量的的简简单单线线性性回回归归模模型型可表示为可表示为模型中,模型中,Y 是是X 的线性函数(部分)加上误差项的线性函数(部分)加上误差项线性部分反映了由于线性部分反映了由于X 的变化而引起的的变化而引起的Y的变化的变化误差项误差项 是随机变量是随机变量反反映映了了除除 X 和和 Y之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 Y 的影响的影响是不能由是不能由 X 和和 Y 之间的线性关系所解释

10、的变异性之间的线性关系所解释的变异性回归方程总总体体回回归归参参数数 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计总体回归方程样本回归方程总体回归方程(概念要点)简单线性回归方程的形式如下简单线性回归方程的形式如下 E(Y)=0+1X描描述述 Y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于 X 的的方方程程称称为总体回归方程。为总体回归方程。0是是回回归归直直线线在在 Y 轴轴上上的的截截距距,是是当当 X=0 时时 Y的期望值的期望值 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当X每每变变动一个单位时,动一个单位时,Y 的的平均平均变动值变动

11、值3.简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为其其中中:是是估估计计的的回回归归直直线线在在 y 轴轴上上的的截截距距,是是直直线线的斜率,它表示的斜率,它表示 x 每变动一个单位时,每变动一个单位时,的变动值。的变动值。2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就得到了,就得到了估计的回归方程。估计的回归方程。估计的回归方程。估计的回归方程。1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本数据去估计本数据去估计估计的回归方程7.2.2 回归方程的建立回归方程的建立 表表7-1 我国人均国民收入

12、与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位:元元年份年份人均人均国民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148 在在研研究究我我国国人人均均消消费费水水平平的的问问题题中中,把把全全国国人人均

13、均消消费费额额记记为为y,把把人人均均国国民民收收入入记记为为x。我我们们搜搜集集到到19811993年年的的样样本本数数据据(xi,yi),),i=1,2,13,数据见表,数据见表7-1。最小平方法(图示)最小平方法(概念要点)使因变量的观察值与估计值之间的离差平方和使因变量的观察值与估计值之间的离差平方和最小来求得方程系数的方法。即最小来求得方程系数的方法。即用用最最小小平平方方法法拟拟合合的的直直线线来来代代表表x与与y之之间间的的关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小最小平方法确定回归方程系数最小平方法确定回归方程系数最小平方法确定回归方程系数估计

14、方程的求法(实例)【例例7.1】根根据据表表7-1中中的的数数据据,配配合合人人均均消费金额对人均国民收入的回归方程。消费金额对人均国民收入的回归方程。根据方程系数的根据方程系数的求解公式得求解公式得估计(经验)方程 人均消费金额对人均国民收入的回归方程为y=54.22286+0.52638 x 7.2.3 估计标准误差估计标准误差含义估计标准误差含义估计标准误差的计算估计标准误差的计算估计标准误差的含义根据回归方程计算的因变量的值与实际观察根据回归方程计算的因变量的值与实际观察值有一定的差距即值有一定的差距即估计标准误差估计标准误差,该误差的,该误差的大小反映了回归直线的代表性,因此,拟合大

15、小反映了回归直线的代表性,因此,拟合出回归线后,需要计算估计标准误差,以出回归线后,需要计算估计标准误差,以确确定该回归线的可利用价值如何定该回归线的可利用价值如何估计标准误差的计算估计标准误差含义是各观察值与估计值误差的平均值。离差平方和的分解因因变变量量 y 的的取取值值是是不不同同的的,y 取取值值的的这这种种波波动动称为称为变差变差对对一一个个具具体体的的观观测测值值来来说说,变变差差的的大大小小可可以以通通过该实际观测值与其均值过该实际观测值与其均值 之差来表示之差来表示全全部部n次次观观察察值值的的总总变变差差可可由由这这些些离离差差的的平平方方和和 表示表示离差平方和的分解(图示

16、)x xy y 离差分解图离差分解图离差平方和的分解(三个平方和的关系)两端平方后求和有两端平方后求和有从从图上看有图上看有Lyy=Q+U总变差总变差(L Lyyyy)回归变差回归变差(U U)剩余变差剩余变差(Q Q)离差平方和的分解(三个平方和的意义)总变差(总变差(Lyy)反映因变量的反映因变量的 n 个观察值与其均值的总离差个观察值与其均值的总离差回归变差(回归变差(U)反反映映自自变变量量 x 的的变变化化对对因因变变量量 y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x 与与 y 之之间间的的线线性性关关系系引引起的起的 y 的取值变化,也称为可解释的平方和的取值变

17、化,也称为可解释的平方和剩余变差(剩余变差(Q)反反映映除除 x 以以外外的的其其他他因因素素对对 y 取取值值的的影影响响,也也称为不可解释的平方和称为不可解释的平方和总变差(Lyy)回归变差(U)剩余变差(Q)7.2.4 回归方程的显著性检验回归方程显著性检验统计量F(1,n-2)拒绝域回归方程的显著性检验回归方程的显著性检验H0:线性关系不显著H1:线性关系显著F=U/Q/(n-2)回归方程的显著性检验(检验的步骤)提出假设H0:计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若FF,拒绝H0;若F=F,接受H0利用回归方程进行 预测与控制利用

18、回归方程进行预测与控制小样本时预测值的区间估计大样本时预测值的区间估计对于自变量 x 的一个某个值 x0,根据回归方程得到因变量 y 的一个预测区间利用回归方程进行预测 y0在1-置信水平下的预测值为大样本时,可以用大样本时,可以用Z Z分布:分布:式中:式中:S Sy y为估计标准误差为估计标准误差简化公式利用回归方程进行预测(置信区间估计:算例)【例【例7.2】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间。解:根据前面的计算结果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信区间为人人 均均 消消 费费 金金 额额 95%95%的的

19、置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间利用回归方程进行控制控制是预测的反问题,即要求观测值在某区间(y1,y2)内取值时,问x需控制在什么范围。即要求以一定的置信度求出相应的x1,x2,使得x1xx2时,所对应的观测值y落在(y1,y2)内。如大样本且当置信度为95.45%时,可利用解出x1,x2作为控制的上下限。7.2.6 总体回归方程的参数估计总体回归方程的参数估计7.3 多元线性回归分析多元线性回归模型(概念要点)一个因变量与两个及两个以上自变量之间的回归描述因变量 y 如何依赖于自变量 x1,x2,xp 和误差项 的方程

20、称为多元线性回归模型多元线性回归模型涉及 p 个自变量的多元线性回归模型可表示为 是被称为误差项的随机变量 y 是x1,x2,xp 的线性函数加上误差项 说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性多元线性回归分析多元回归方程的建立估计标准误差多元线性回归方程的显著性检验多元线性回归方程系数的显著性检验7.3.3 应用回归分析时 应注意的问题定性分析与定量分析相结合定性分析与定量分析相结合随机误差项随机误差项-残差图残差图预测不能随意扩大范围预测不能随意扩大范围-不能外推不能外推影响回归系数的因素影响回归系数的因素-计量单位计量单位7.4 相关分析相关分析与相关系数相关分析与相

21、关系数相关系数的测定相关系数的测定相关系数的显著性检验及抽样误差相关系数的显著性检验及抽样误差等级相关等级相关相关分析l用一个指标来表明现象间相互依存关系的用一个指标来表明现象间相互依存关系的 密切程度密切程度直线相关用相关系数描述直线相关用相关系数描述曲线相关用相关指数描述曲线相关用相关指数描述7.4.2 相关系数的测定相关系数的测定相关系数的测定相关关系的测定(相关系数)对变量之间关系密切程度的度量对变量之间关系密切程度的度量对对两两个个变变量量之之间间线线性性相相关关程程度度的的度度量量称称为为简简单相关系数单相关系数若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,

22、称称为总体相关系数,记为为总体相关系数,记为 若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系数,记为系数,记为 r相关关系的测定(相关系数取值及其意义)r 的取值范围是的取值范围是-1,1|r|=1,为完全相关为完全相关r=1,为完全正相关,为完全正相关r=-1,为完全负相关,为完全负相关 r=0,不存在不存在线性相关线性相关关系关系-1 r0,为负相关为负相关0 t t,拒绝拒绝拒绝拒绝HH0 0 若若若若 t t t t,接受接受接受接受HH0 0相关系数的抽样误差用来对总体相关系数进行区间估计。如果r是正态分布,则总体相关系数的估计区间是相关系数陷阱异常值的影响变量的样本方差过小其他变量的作用7.4.4 等级相关等级相关等级相关等级相关的显著性检验当当n=30时,时,t检验检验本章作业6、7

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁