《(07)第7章 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《(07)第7章 相关与回归分析.ppt(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第 7 章章 相关与回归分析相关与回归分析作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学第第7章章 相关与回归分析相关与回归分析7.17.1 变量间关系的度量变量间关系的度量变量间关系的度量变量间关系的度量 7.2 7.2 一元线性回归一元线性回归一元线性回归一元线性回归7.3 7.3 利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测7.4 7.4 多元线性回归分析多元线性回归分析多元线性回归分析多元线性回归分析学习目标学习目标1.相关系数的分析方法相关系数的分析方法2.线性回归的基本原理和参数的最小二乘线性回归
2、的基本原理和参数的最小二乘估计估计3.回归直线的拟合优度回归直线的拟合优度4.回归方程的显著性检验回归方程的显著性检验5.利用回归方程进行估计和预测利用回归方程进行估计和预测6.用用 Excel 进行回归进行回归7.1 变量间关系的度量变量间关系的度量一一.变量间的关系变量间的关系二二.相关关系的描述与测度相关关系的描述与测度变量间的关系变量间的关系函数关系函数关系1.是一一是一一对应的确定关系对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值
3、时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),其其中中 x x 称称为为自自变变量量,y y 称称为为因因变变量量3.各各观测点落在一条线上观测点落在一条线上 x xy y函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关关系系可表示为可表示为 y y=pxpx (p p 为单价为单价)圆圆 的的 面面 积积(S)(S)与与 半半 径径 之之 间间 的的 关关 系系 可可 表表 示示 为为S S=R R
4、2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系系可可表表示为示为y y=x x1 1 x x2 2 x x3 3 相关关系相关关系(correlation)1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个的取值可能有几个4.各观测各观测点分布在直线周围点分布在直线周围 x xy y相
5、关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系之间的关系收入水平收入水平(y y)与受教育程度与受教育程度(x x)之间的关系之间的关系粮粮食食亩亩产产量量(y y)与与施施肥肥量量(x x1 1)、降降雨雨量量(x x2 2)、温度温度(x x3 3)之间的关系之间的关系商商品品的的消消费费量量(y y)与与居居民民收收入入(x x)之之间间的的关关系系商商品品销销售售额额(y y)与与广广告告费费支支出出(x x)之之间间的的关关系系相关关系相关关系(类型类型)相关关系的描述与测度相关关系的描述与测度(散点图
6、散点图)散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 散点图散点图(例题分析例题分析)【例例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近
7、年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增加,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 散点图散点图(例题分析例题分析)散点图散点图(例题分析例题分析)相关关系的描述与测度相关关系的描述与测度(相关系数相关系数)相关系数相关系数(correlation coefficient)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数
8、据计算的,则称为样本相关系数,记为 r相关系数相关系数(计算公式计算公式)样本相关系数的计算公式相关系数相关系数(取值及其意义取值及其意义)1.r r 的取值范围的取值范围是是 -1,1-1,12.|r r|=|=1 1,为完全相关为完全相关n nr r=1 1,为,为完全正相关完全正相关n nr r=-1-1,为完全负相关为完全负相关3.r r=0=0,不存在不存在线性线性线性线性相关相关关系相关关系相关4.-1-1 r r 0 0,为为负相关负相关5.0 0 F,拒绝H0;若FF,拒绝H0,线性关系显著线性关系检验线性关系检验(方差分析表方差分析表)Excel 输出的方差分析表输出的方差分
9、析表回归系数检验回归系数检验3.在一元线性回归中,等价于线性关系的显著性检验1.检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著2.理论基础是回归系数 的抽样分布回归系数检验回归系数检验(检验步骤检验步骤)1.提出假设提出假设n nH H0 0:1 1=0(=0(没有线性关系没有线性关系)n nH H1 1:1 1 0(0(有线性关系有线性关系)2.计算检验的统计量计算检验的统计量3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t t t,拒绝拒绝H H0 0;t t =7.533515t t=2.201=2.201,拒拒绝绝H H0
10、0,表表明明不不良良贷贷款款与贷款余额之间有线性关系与贷款余额之间有线性关系回归系数检验回归系数检验(例题分析例题分析)P 值的应用值的应用P P=0.000000=0.000000 F F ,拒绝拒绝H H0 0Excel Excel 输出输出输出输出结果的分析结果的分析结果的分析结果的分析回归系数检验和推断回归系数检验和推断回归系数的检验回归系数的检验1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第一类错误(弃真错误)4.对每一个自变量都要单独进行检验5.应用
11、 t 检验统计量回归系数的检验回归系数的检验(步骤步骤)1.提出假设n nH H0 0:i i=0 (=0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系)n nH H1 1:i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系)2.计算检验的统计量 t3.确定显著性水平,并进行决策 t t t t,拒绝拒绝H H0 0;t t t t,不能拒绝不能拒绝H H0 0Excel Excel 输出输出输出输出结果的分析结果的分析结果的分析结果的分析回归系数的推断回归系数的推断(置信区间置信区间)回归系数在(1-)%置信水平下的置信区间为 回归系数的回归系数的抽样标准差抽样标准差Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析本章小结本章小结1.变量间关系的度量变量间关系的度量2.回归模型、回归方程与估计的回归方程回归模型、回归方程与估计的回归方程3.回归方程的拟合优度回归方程的拟合优度4.回归分析中的显著性检验回归分析中的显著性检验5.估计和预测估计和预测6.用用Excel 进行回归分析进行回归分析结结 束束