《第七章-相关与回归分析ppt课件(全).ppt》由会员分享,可在线阅读,更多相关《第七章-相关与回归分析ppt课件(全).ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 相关与回归分析相关与回归分析 1例子例子:我们身边有趣的经济现象我们身边有趣的经济现象n人们每时每刻都在关心事物之间的关系,人们每时每刻都在关心事物之间的关系,n比如,比如,n几个亲生兄弟间的智商与出生顺序有关系几个亲生兄弟间的智商与出生顺序有关系n受教育程度与性别有关系受教育程度与性别有关系n出生率出生率X X和文盲率和文盲率Y Y之间的关系之间的关系2n在这一章,我们将学习:在这一章,我们将学习:n什么是相关分析?什么是相关分析?n什么是回归分析?什么是回归分析?3第一节第一节 相关分析概述相关分析概述n一、函数关系与相关关系一、函数关系与相关关系(一)函数关系(一)函数关系
2、n严格的依存关系,即具有确定性的对应关系,严格的依存关系,即具有确定性的对应关系,可用一个数学表达式反映出来。可用一个数学表达式反映出来。n如:如:s s与与r rn销售额与销售量的关系销售额与销售量的关系4函数关系函数关系 x xy y作为影响因素的变量称自变量,用作为影响因素的变量称自变量,用x x表示;表示;发生对应变化的变量称因变量,用发生对应变化的变量称因变量,用y y表示。表示。5(二二)相关关系相关关系n不严格的依存关系不严格的依存关系n不具有确定性的对应关系不具有确定性的对应关系n不能用不能用函数关系精确的表达函数关系精确的表达6相关关系相关关系 x xy y7判断函数关系判断
3、函数关系oror相关关系相关关系n商品销售额商品销售额(y)(y)与广告费支出与广告费支出(x)(x)之间的关系之间的关系收入水平收入水平(y)(y)与受教育程度与受教育程度(x)(x)之间的关系之间的关系商品销售额商品销售额(y)(y)与产量与产量(x)(x)的关系的关系身高身高(y)(y)与体重与体重(x)(x)8二、相关关系的种类二、相关关系的种类n(一)(一)按相关程度分:按相关程度分:1 1、完全相关、完全相关2 2、不相关、不相关3 3、不完全相关、不完全相关不相关不相关不完全相关不完全相关完全相关完全相关9(二)按相关的方向分:相关的方向分:n1 1、正相关:、正相关:x x增加
4、,增加,y y增加增加 x x减少,减少,y y减少减少n2 2、负相关:、负相关:x x增加,增加,y y减少减少 x x减少,减少,y y增加增加负相关负相关正相关正相关10(三)按相关的形式分n1、线性相关:、线性相关:x,y大致呈直线关系大致呈直线关系n2、非线性相关:、非线性相关:x,y大致呈曲线关系大致呈曲线关系线性相关线性相关非线性相关非线性相关11(四)按所研究的变量多少分:n1、单相关:、单相关:x与与y的相关关系的相关关系n2、复相关:、复相关:x,y与与z的相关关系的相关关系12第二节第二节 相关关系的判断和测度相关关系的判断和测度n一、定性分析一、定性分析n n根据经济
5、理论、专业知识和实践经验,根据经济理论、专业知识和实践经验,通过绘制相关表或相关图,判断通过绘制相关表或相关图,判断x x与与y y是是否存在相关关系,及相关的方向、形态否存在相关关系,及相关的方向、形态和密切程度。和密切程度。131 1、相关表、相关表判断广告费与年销售收入是否具有相关关系?判断广告费与年销售收入是否具有相关关系?随着广告费的增加,年销售收入基本上也随着广告费的增加,年销售收入基本上也是增加的,所以两者之间存在一的正相关是增加的,所以两者之间存在一的正相关关系。关系。142 2、相关图(散点图)、相关图(散点图)15二、定量分析二、定量分析n简单相关系数:简单相关系数:在直线
6、相关条件下,表在直线相关条件下,表明两个现象之间相关关系的方向和密切明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号程度的综合性指标。一般用符号r r表示。表示。161 1、相关系数计算、相关系数计算17化简得:化简得:18516565165696045625980184647744384420253600324625y y2 2合计合计10987654321序号序号26507265076084280949004225360017649001600225400 x x2 266266298759992886245601825可支配收入可支配收入y y764478528060598
7、06569307039755336933369334734732604421350302400402701550020 xyxy消费支出消费支出x xP190,P190,表表6-16-1,计算消费支出与可支配收入的相关系数,计算消费支出与可支配收入的相关系数19解:计算相关系数需算解:计算相关系数需算5 5个数个数说明说明x x与与y y高度线性相关高度线性相关202 2、相关系数的取值及意义、相关系数的取值及意义212 2、相关系数的取值及意义、相关系数的取值及意义(5)(5)n|0.30.3称为微弱相关称为微弱相关n0.3|0.3|0.50.5称为低度相关称为低度相关n0.0.|0.80.
8、8称为显著相关称为显著相关n0.8|0.8|1 1称为高度相关或强相关称为高度相关或强相关22判断:判断:n若若r=1r=1,说明什么?,说明什么?n若若r=0.3,r=0.3,说明什么?说明什么?n若若r=-0.9,r=-0.9,说明什么?说明什么?nR=0.6R=0.6与与r=-0.8r=-0.8哪个相关程度更大?哪个相关程度更大?23课堂练习课堂练习n计算公司每年的投资和利润的简单相关系数。计算公司每年的投资和利润的简单相关系数。年度年度投资(万元)投资(万元)利润(万元)利润(万元)1 13 38 82 24 45 53 36 67 74 47 72020合计合计2020404024R
9、egress“往回走往回走”n高尔顿爵士高尔顿爵士(1822-1911)被誉为现代回归)被誉为现代回归和相关技术的创始人。和相关技术的创始人。n他在研究父母的身高对儿女身高的影响时发他在研究父母的身高对儿女身高的影响时发现,如果父母的身高超出人群身高的平均值,现,如果父母的身高超出人群身高的平均值,儿女的身高通常也会超出人群平均身高,但儿女的身高通常也会超出人群平均身高,但不像父母超出的那么多。高尔顿把这种现象不像父母超出的那么多。高尔顿把这种现象称为称为“向人群平均身高的回归向人群平均身高的回归”。n于是这种说法就被用在这种统计方法上了。于是这种说法就被用在这种统计方法上了。第二节第二节 回
10、归分析回归分析25第二节第二节 回归分析回归分析一、回归分析的定义一、回归分析的定义n回归分析中,用来表达回归分析中,用来表达变量之间的关系变量之间的关系的的数学形式数学形式就叫就叫“模型模型”,也叫,也叫“回归方程回归方程”。如:。如:Y=3+2Xn“回归回归”是一种用模型来是一种用模型来估计或预测估计或预测因变因变量的方法。量的方法。26相关与回归分析的区别相关与回归分析的区别1 1n相关分析相关分析:x x与与y y之间依存关系的密切程之间依存关系的密切程度,但不能指出度,但不能指出x x与与y y相互关系的具体形相互关系的具体形式,也无法用式,也无法用x x去预测去预测y yn回归分析
11、回归分析:通过数学方程来描述:通过数学方程来描述x x与与y y的的关系,并能写出关系,并能写出x x与与y y的具体形式,也可的具体形式,也可以用以用x x去预测去预测y y27区别区别2 2n相关分析中,相关分析中,x x与与y y都是随机变量,两者都是随机变量,两者对等;对等;n回归分析中,回归分析中,x x是确定性变量,是确定性变量,y y是随是随机变量或叫因变量,机变量或叫因变量,y y处于被解释的地处于被解释的地位。位。28两者的联系两者的联系n1 1、相关分析是回归分析的基础和前提、相关分析是回归分析的基础和前提n2 2、回归分析是相关分析的深入和继续、回归分析是相关分析的深入和
12、继续29二、回归模型的类型二、回归模型的类型一个自变量一个自变量一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性回线性回归归非线性非线性回归回归30第三节 一元线性回归分析 一、模型的建立一、模型的建立 1、总体回归模型、总体回归模型 为常数项或截距项,为常数项或截距项,为斜率系数为斜率系数,是随机误差是随机误差项项,又称随机干扰项又称随机干扰项。模型假设条件模型假设条件:假定假定1 1:随机误差项的观测值互不相关:随机误差项的观测值互不相关假定假定2 2
13、:随机误差项的均值为零:随机误差项的均值为零方差为一个不变的常数(等方差假定)方差为一个不变的常数(等方差假定)假定假定3 3:随机误差项服从正态分布:随机误差项服从正态分布31 因变量的估计值;因变量的估计值;x x 自变量;自变量;a a 回归直线在回归直线在y y轴上的截距;轴上的截距;b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数,表明表明x x每增加一个单位,因变量每增加一个单位,因变量y y的的 平均平均变化值变化值 b0b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关2 2、样本回归模型、样本回归模型32例如例如:n研究收入(研究收
14、入(x x)对消费()对消费(y y)的)的影响,获得如下的回归模型:影响,获得如下的回归模型:33n(1)截矩项,表示当)截矩项,表示当x=0时,时,y的期望值。在的期望值。在这里,它表示平均每人固定的最低消费水平。这里,它表示平均每人固定的最低消费水平。n(2)斜率为)斜率为0.75,表示收入每增加一元,人们,表示收入每增加一元,人们会将其中的会将其中的75%花在消费上。花在消费上。n(3)当月收入为)当月收入为5000元时,消费水平的期望元时,消费水平的期望值为值为4200。但是,实际观察时,对于月收入为。但是,实际观察时,对于月收入为5000元的人群而言,其消费可能为元的人群而言,其消
15、费可能为3200元,元,4200元,元,4600,所以,所以 是估计值或预测值。是估计值或预测值。342 2、模型中参数的确定、模型中参数的确定最小二乘法最小二乘法(ordinary least square)OLS35x收入收入y消费消费36求偏导数方法,得到以下联立方程组:求偏导数方法,得到以下联立方程组:37建立一元线性回归模型的步骤:建立一元线性回归模型的步骤:确确定自变量定自变量x x和因变量和因变量y y;计计算算 代代入公式,先求入公式,先求b b,再求,再求a a。38516565165696045625980184647744384420253600324625x x2 2合
16、计合计10987654321序号序号66266298759992886245601825可支配收入可支配收入76447852806059806569307039755336933369334734732604421350302400402701550020 xyxy消费支出消费支出P190,P190,表表6-16-1,建立消费支出与可支配收入的回归模型,建立消费支出与可支配收入的回归模型y yx x3940分析:分析:(25,20)41课堂练习:某公司每年的投资和利课堂练习:某公司每年的投资和利润如下润如下计算:计算:建立投资与利润的回归模型建立投资与利润的回归模型 预测当投资为预测当投资为1
17、010万元时,利润是多少?万元时,利润是多少?年度年度投资(万元)投资(万元)利润(万元)利润(万元)1 13 38 82 24 45 53 36 67 74 47 72020合计合计20204040423 3、拟合优度检验、拟合优度检验n(1 1)判定系数)判定系数43第八章第八章 相关与回归分析相关与回归分析总剩余偏差总剩余偏差总回归偏总回归偏差差总偏差总偏差44判定系数测度了回归直线对观测数据的拟合程度判定系数测度了回归直线对观测数据的拟合程度,记为记为45516565165696045625980184647744384420253600324625y y2 2合计合计10987654
18、321序号序号26507265076084280949004225360017649001600225400 x x2 266266298759992886245601825可支配收入可支配收入y y76447852806059806569307039755336933369334734732604421350302400402701550020 xyxy消费支出消费支出x x表表6-16-1,计算消费支出与可支配收入的相关系数,计算消费支出与可支配收入的相关系数46解:计算相关系数解:计算相关系数r r说明回归直线的拟合优度很好。说明回归直线的拟合优度很好。47(2 2)估计标准误)估计标准
19、误估计标准差越小,则变量间相关程度越高,回归估计标准差越小,则变量间相关程度越高,回归估计标准差越小,则变量间相关程度越高,回归估计标准差越小,则变量间相关程度越高,回归线对线对线对线对Y Y的解释程度越高。的解释程度越高。的解释程度越高。的解释程度越高。48合合计10109 98 87 76 65 54 43 32 21 1序序号号100.6254100.62540 047347366266247347360.9024260.902427.8047.80470.19670.196787898980.4044960.404496-0.636-0.63653.63653.636535375750
20、.8390560.839056-0.916-0.91670.91670.916707099990.7673760.767376-0.876-0.87665.87665.876656592928.9760168.976016-2.996-2.99662.99662.996606088885.1801765.180176-2.276-2.27644.27644.276424262624.1452964.145296-2.036-2.03632.03632.036303045458.0428968.042896-2.836-2.83642.83642.836404060605.7792165.7792162.4042.40412.59612.596151518185.5884965.5884962.3642.36417.63617.63620202525消费支出消费支出y y可支配收入可支配收入x x49解:估计标准误解:估计标准误只适用于同一样本数据,不同回归模只适用于同一样本数据,不同回归模型的优劣比较。型的优劣比较。50作业作业p152p152n计算题第计算题第2 2题题n下周一交下周一交51