统计学课件 第8章 相关与回归分析-新.ppt

上传人:qwe****56 文档编号:69534738 上传时间:2023-01-06 格式:PPT 页数:72 大小:884KB
返回 下载 相关 举报
统计学课件 第8章 相关与回归分析-新.ppt_第1页
第1页 / 共72页
统计学课件 第8章 相关与回归分析-新.ppt_第2页
第2页 / 共72页
点击查看更多>>
资源描述

《统计学课件 第8章 相关与回归分析-新.ppt》由会员分享,可在线阅读,更多相关《统计学课件 第8章 相关与回归分析-新.ppt(72页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第第 8章章 相关与回归分析相关与回归分析8.1 变量间关系的度量变量间关系的度量 8.2 一元线性回归一元线性回归8.3 多元线性回归多元线性回归2010年学习目标学习目标l相关关系的分析相关关系的分析l参数的最小二乘估计参数的最小二乘估计l回归直线的拟合优度回归直线的拟合优度l用用 Excel 进行回归进行回归2010年子代与父代一样吗?子代与父代一样吗?GaltonGalton被被被被誉誉誉誉为为为为现现现现代代代代回回回回归归归归和和和和相相相相关关关关技技技技术术术术的的的的创创创创始始始始人人人人。18751875年年年年,GaltonGalton利利利利用用用用豌豌豌豌豆豆豆豆实

2、实实实验验验验来来来来确确确确定定定定尺尺尺尺寸寸寸寸的的的的遗遗遗遗传传传传规规规规律律律律。他他他他挑挑挑挑选选选选了了了了7 7组组组组不不不不同同同同尺尺尺尺寸寸寸寸的的的的豌豌豌豌豆豆豆豆,并并并并说说说说服服服服他他他他在在在在英英英英国国国国不不不不同同同同地地地地区区区区的的的的朋朋朋朋友友友友每每每每一一一一组组组组种种种种植植植植1010粒粒粒粒种种种种子子子子,最最最最后后后后把把把把原原原原始始始始的的的的豌豌豌豌豆豆豆豆种种种种子子子子(父父父父代代代代)与与与与新新新新长长长长的的的的豌豌豌豌豆种子豆种子豆种子豆种子(子代子代子代子代)进行尺寸比较进行尺寸比较进行尺

3、寸比较进行尺寸比较当当当当结结结结果果果果被被被被绘绘绘绘制制制制出出出出来来来来之之之之后后后后,他他他他发发发发现现现现并并并并非非非非每每每每一一一一个个个个子子子子代代代代都都都都与与与与父父父父代代代代一一一一样样样样,不不不不同同同同的的的的是是是是,尺尺尺尺寸寸寸寸小小小小的的的的豌豌豌豌豆豆豆豆会会会会得得得得到到到到更更更更大大大大的的的的子子子子代代代代,而而而而尺尺尺尺寸寸寸寸大大大大的的的的豌豌豌豌豆豆豆豆却却却却得得得得到到到到较较较较小小小小的的的的子子子子代代代代。GaltonGalton把把把把这这这这一一一一现现现现象象象象叫叫叫叫做做做做“返返返返祖祖祖祖”

4、(趋趋趋趋向向向向于于于于祖祖祖祖先先先先的的的的某某某某种种种种平平平平均均均均类类类类型型型型),后后后后来来来来又又又又称称称称之之之之为为为为“向向向向平平平平均均均均回回回回归归归归”。一一一一个个个个总总总总体体体体中中中中在在在在某某某某一一一一时时时时期期期期具具具具有有有有某某某某一一一一极极极极端端端端特特特特征征征征(低低低低于于于于或或或或高高高高于于于于总总总总体体体体均均均均值值值值)的的的的个个个个体体体体在在在在未未未未来来来来的的的的某某某某一一一一时时时时期期期期将将将将减减减减弱弱弱弱它它它它的的的的极极极极端端端端性性性性(或或或或者者者者是是是是单单单

5、单个个个个个个个个体体体体或或或或者者者者是是是是整整整整个个个个子子子子代代代代),这这这这一一一一趋趋趋趋势势势势现现现现在在在在被被被被称称称称作作作作“回回回回归归归归效效效效应应应应”。人人人人们们们们发发发发现现现现它它它它的的的的应应应应用用用用很很很很广广广广,而而而而不不不不仅仅仅仅限限限限于于于于从一代到下一代豌豆大小问题从一代到下一代豌豆大小问题从一代到下一代豌豆大小问题从一代到下一代豌豆大小问题2010年子代与父代一样吗?子代与父代一样吗?正正正正如如如如GaltonGalton进进进进一一一一步步步步发发发发现现现现的的的的那那那那样样样样,平平平平均均均均来来来来说

6、说说说,非非非非常常常常矮矮矮矮小小小小的的的的父父父父辈辈辈辈倾倾倾倾向向向向于于于于有有有有偏偏偏偏高高高高的的的的子子子子代代代代;而而而而非非非非常常常常高高高高大大大大的的的的父父父父辈辈辈辈则则则则倾倾倾倾向向向向于于于于有有有有偏偏偏偏矮矮矮矮的的的的子子子子代代代代。在在在在第第第第一一一一次次次次考考考考试试试试中中中中成成成成绩绩绩绩最最最最差差差差的的的的那那那那些些些些学学学学生生生生在在在在第第第第二二二二次次次次考考考考试试试试中中中中倾倾倾倾向向向向于于于于有有有有更更更更好好好好的的的的成成成成绩绩绩绩(比比比比较较较较接接接接近近近近所所所所有有有有学学学学生

7、生生生的的的的平平平平均均均均成成成成绩绩绩绩),而而而而第第第第一一一一次次次次考考考考试试试试中中中中成成成成绩绩绩绩最最最最好好好好的的的的那那那那些些些些学学学学生生生生在在在在第第第第二二二二次次次次考考考考试试试试中中中中则则则则倾倾倾倾向向向向于于于于有有有有较较较较差差差差的的的的成成成成绩绩绩绩(同同同同样样样样比比比比较较较较接接接接近近近近所所所所有有有有学学学学生生生生的的的的平平平平均均均均成成成成绩绩绩绩)。同同同同样样样样,平平平平均均均均来来来来说说说说,第第第第一一一一年年年年利利利利润润润润最最最最低低低低的的的的公公公公司司司司第第第第二二二二年年年年不不

8、不不会会会会最最最最差差差差,而第一年利润最高的公司第二年则不会是最好的而第一年利润最高的公司第二年则不会是最好的而第一年利润最高的公司第二年则不会是最好的而第一年利润最高的公司第二年则不会是最好的如如如如果果果果把把把把父父父父代代代代和和和和子子子子代代代代看看看看作作作作两两两两个个个个变变变变量量量量,找找找找出出出出这这这这两两两两个个个个变变变变量量量量的的的的关关关关系系系系,并并并并根根根根据据据据这这这这种种种种关关关关系系系系建建建建立立立立适适适适当当当当的的的的数数数数学学学学模模模模型型型型,就就就就可可可可以以以以根根根根据据据据父父父父代代代代的的的的数数数数值值

9、值值预预预预测测测测子子子子代代代代的的的的取取取取值值值值,这这这这就就就就是是是是经经经经典典典典的的的的回回回回归归归归方方方方法法法法要要要要解解解解决决决决的的的的问问问问题。学完本章的内容你会对回归问题有更深入的理解题。学完本章的内容你会对回归问题有更深入的理解题。学完本章的内容你会对回归问题有更深入的理解题。学完本章的内容你会对回归问题有更深入的理解 2010年回归分析研究什么?回归分析研究什么?l l研研研研究究究究某某某某些些些些实实实实际际际际问问问问题题题题时时时时往往往往往往往往涉涉涉涉及及及及到到到到多多多多个个个个变变变变量量量量。在在在在这这这这些些些些变变变变量

10、量量量中中中中,有有有有一一一一个个个个变变变变量量量量是是是是研研研研究究究究中中中中特特特特别别别别关关关关注注注注的的的的,称称称称为为为为因因因因变变变变量量量量,而而而而其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因素,称为自变量l l假假假假定定定定因因因因变变变变量量量量与与与与自自自自变变变变量量量量之之之之间间间间有有有有某某某某种种种种关关关关系系系系,并并并并把把把把这这这这种种种种关关关关系系系系用用用用适适适适当当当当的的的的数数数数学学学学模模

11、模模型型型型表表表表达达达达出出出出来来来来,那那那那么么么么,就就就就可可可可以以以以利利利利用用用用这这这这一一一一模模模模型型型型根根根根据据据据给给给给定定定定的的的的自自自自变变变变量量量量来来来来预预预预测测测测因因因因变变变变量量量量,这这这这就就就就是是是是回回回回归归归归要要要要解解解解决决决决的的的的问题问题问题问题l l在在在在回回回回归归归归分分分分析析析析中中中中,只只只只涉涉涉涉及及及及一一一一个个个个自自自自变变变变量量量量时时时时称称称称为为为为一一一一元元元元回回回回归归归归,涉涉涉涉及及及及多多多多个个个个自自自自变变变变量量量量时时时时则则则则称称称称为为

12、为为多多多多元元元元回回回回归归归归。如如如如果果果果因因因因变变变变量量量量与与与与自自自自变变变变量量量量之之之之间间间间是是是是线线线线性性性性关关关关系系系系,则则则则称称称称为为为为线线线线性性性性回回回回归归归归(linear(linear regression)regression);如如如如果果果果因因因因变变变变量量量量与与与与自自自自变变变变量量量量之之之之间间间间是是是是非非非非线线线线性性性性关关关关系系系系则则则则称称称称为为为为非非非非线线线线性性性性回归回归回归回归(nonlinear regression)(nonlinear regression)2010年

13、8.1.1 变量间的关系变量间的关系 8.1.2 相关关系的描述与测度相关关系的描述与测度 8.1.3 相关系数的显著性检验相关系数的显著性检验8.1 变量间关系的度量变量间关系的度量2010年 x xy y函数关系函数关系1.是一一是一一对应的确定关系对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),

14、其其中中 x x 称称为为自自变变量量,y y 称称为为因因变变量量3.各各观测点落在一条线上观测点落在一条线上 8.1.1 变量间的关系变量间的关系2010年变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关系可表示为关系可表示为 y y=p p x x(p p 为单价为单价)圆圆的的面面积积(S)(S)与与半半径径之之间间的的关关系系可可表表示示为为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料

15、料价价格格(x x3 3)之之间间的的关关系系可表示为可表示为y y=x x1 1 x x2 2 x x3 3 2010年相关关系相关关系(几个例子几个例子)l l子女的身高与其父母身高的关系子女的身高与其父母身高的关系子女的身高与其父母身高的关系子女的身高与其父母身高的关系uu从从遗遗传传学学角角度度看看,父父母母身身高高较较高高时时,其其子子女女的的身身高高一一般般也也比比较较高高。但但实实际际情情况况并并不不完完全全是是这这样样,因因为为子子女女的的身身高高并并不不完完全全是是由由父父母母身高一个因素所决定的,还有其他许多因素的影响身高一个因素所决定的,还有其他许多因素的影响l l一个人

16、的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系uu收收入入水水平平相相同同的的人人,他他们们受受教教育育的的程程度度也也不不可可能能不不同同,而而受受教教育育程程度度相相同同的的人人,他他们们的的收收入入水水平平也也往往往往不不同同。因因为为收收入入水水平平虽虽然然与与受受教教育育程程度度有有关关系系,但但它它并并不不是是决决定定收收入入的的惟惟一一因因素素,还还有有职职业、工作年限等诸多因素的影响业、工作年限等诸多因素的影响l l农作物的单位面积产量与降雨量之间的关系农作物的单位面积产量与降雨量之间的

17、关系农作物的单位面积产量与降雨量之间的关系农作物的单位面积产量与降雨量之间的关系uu在在一一定定条条件件下下,降降雨雨量量越越多多,单单位位面面积积产产量量就就越越高高。但但产产量量并并不不是是由由降降雨雨量量一一个个因因素素决决定定的的,还还有有施施肥肥量量、温温度度、管管理理水水平平等等其其他许多因素的影响他许多因素的影响l l商品的消费量商品的消费量商品的消费量商品的消费量(y)(y)与居民收入与居民收入与居民收入与居民收入(x)(x)之间的关系之间的关系之间的关系之间的关系l l商品销售额商品销售额商品销售额商品销售额(y)(y)与广告费支出与广告费支出与广告费支出与广告费支出(x)(

18、x)之间的关系之间的关系之间的关系之间的关系2010年相关关系相关关系(correlation)1.一一一一个个个个变变变变量量量量的的的的取取取取值值值值不不不不能能能能由由由由另另另另一个变量唯一确定一个变量唯一确定一个变量唯一确定一个变量唯一确定2.对对对对大大大大量量量量的的的的数数数数据据据据观观观观察察察察研研研研究究究究,就就就就会会会会发发发发现现现现许许许许多多多多变变变变量量量量之之之之间间间间存存存存在这一定的客观规律。在这一定的客观规律。在这一定的客观规律。在这一定的客观规律。3.当当当当变变变变量量量量 x x 取取取取某某某某个个个个值值值值时时时时,变变变变量量量

19、量 y y 的的的的取取取取值值值值对对对对应应应应着着着着一一一一个个个个分分分分布布布布4.各观测各观测各观测各观测点分布在直线周围点分布在直线周围点分布在直线周围点分布在直线周围 y y x x 2010年 相关分析就是对两个变量之间线性关系的描述与度量,解决的主要问题:pp变量之间是否存在关系?变量之间是否存在关系?pp如果存在关系,是什么样的关系?如果存在关系,是什么样的关系?pp变量之间的关系强度如何?变量之间的关系强度如何?pp样本所反映的变量之间的关系能否代表总体变量只见到关样本所反映的变量之间的关系能否代表总体变量只见到关系?系?2010年 完全负线性相关完全负线性相关完全负

20、线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关8.1.2 相关关系的描述与测度相关关系的描述与测度2010年相关关系的类型相关关系的类型相关关系相关关系非非线性相关线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相

21、关完全相关不不相关相关2010年用散点图描述变量间的关系用散点图描述变量间的关系(例题分析例题分析)【例例例例8.18.1】一一一一家家家家大大大大型型型型商商商商业业业业银银银银行行行行在在在在多多多多个个个个地地地地区区区区设设设设有有有有分分分分行行行行,其其其其业业业业务务务务主主主主要要要要是是是是进进进进行行行行基基基基础础础础设设设设施施施施建建建建设设设设、国国国国家家家家重重重重点点点点项项项项目目目目建建建建设设设设、固固固固定定定定资资资资产产产产投投投投资资资资等等等等项项项项目目目目的的的的贷贷贷贷款款款款。近近近近年年年年来来来来,该该该该银银银银行行行行的的的的贷

22、贷贷贷款款款款额额额额平平平平稳稳稳稳增增增增长长长长,但但但但不不不不良良良良贷贷贷贷款款款款额额额额也也也也有有有有较较较较大大大大比比比比例例例例的的的的提提提提高高高高,这这这这给给给给银银银银行行行行业业业业务务务务的的的的发发发发展展展展带带带带来来来来较较较较大大大大压压压压力力力力。为为为为弄弄弄弄清清清清楚楚楚楚不不不不良良良良贷贷贷贷款款款款形形形形成成成成的的的的原原原原因因因因,希希希希望望望望利利利利用用用用银银银银行行行行业业业业务务务务的的的的有有有有关关关关数数数数据据据据做做做做些些些些定定定定量量量量分分分分析析析析,以以以以便便便便找找找找出出出出控控控控

23、制制制制不不不不良良良良贷贷贷贷款款款款的的的的办办办办法法法法。下下下下面面面面是是是是该该该该银银银银行行行行所所所所属属属属的的的的2525家家家家分分分分行行行行20022002年的有关业务数据年的有关业务数据年的有关业务数据年的有关业务数据 绘制散点图绘制散点图绘制散点图绘制散点图2010年散点图散点图(例题分析例题分析)2010年相关系数相关系数(correlation coefficient)1.度量变量之间线性关系强度的一个统计量度量变量之间线性关系强度的一个统计量n n若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为为总总体相关系数,记为体相关系数

24、,记为 n n若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系系数数,简称为相关系数,记为简称为相关系数,记为 r rl l也也称称为为PearsonPearson相相关关系系数数 (Pearsons(Pearsons correlation correlation coefficient)coefficient)2010年样本相关系数样本相关系数样本相关系数的计算公式或或化简为化简为按上述计算公式计算的相关系数也称为按上述计算公式计算的相关系数也称为线性相关系数线性相关系数或或PearsonPearson系数系数计算相关系数计算相关系数计算相关系数计算相关系数20

25、10年相关系数相关系数(例题分析例题分析)2010年相关系数的性质相关系数的性质性质性质1:r 的取值范围是-1,1n n|r r|=|=1 1,为完全相关为完全相关l lr r=1 1,为,为完全正相关完全正相关l lr r=-1-1,为完全负正相关为完全负正相关n nr r=0=0,不存在不存在线性线性线性线性相关相关关系关系n n-1-1 r r 0 0,为负相关为负相关n n0 0 r r 1 1,为正相关为正相关n n|r r|越越趋趋于于1 1表表示示关关系系越越强强;|r r|越越趋趋于于0 0表表示示关关系越弱系越弱2010年相关关系的性质相关关系的性质-1.0+1.00-0.

26、5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负负相关程度增加相关程度增加r正相关程度增加正相关程度增加2010年相关系数的性质相关系数的性质性质性质性质性质2 2:r r具有对称性。即具有对称性。即x x与与y y之间的相关系数和之间的相关系数和y y与与x x之间之间 的相关系数相等,即的相关系数相等,即r rxyxy=r ryxyx性质性质性质性质3 3:r r数值大小与数值大小与x x和和y y原点及尺度无关,即改变原点及尺度无关,即改变x x和和y y的的 数据原点及计量尺度,并不改变数据原点及计量尺度,并不改变r r数值大小数值大小性质性质性质性质4 4:仅

27、仅是仅仅是x x与与y y之间线性关系的一个度量,它不能用之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着,于描述非线性关系。这意为着,r r=0=0只表示两个只表示两个 变量之间不存在线性相关关系,并不说明变量之变量之间不存在线性相关关系,并不说明变量之 间没有任何关系间没有任何关系性质性质性质性质5 5:r r虽然是两个变量之间线性关系的一个度量,却不虽然是两个变量之间线性关系的一个度量,却不 一定意味着一定意味着x x与与y y一定有因果关系一定有因果关系2010年相关系数的经验解释相关系数的经验解释1.|r|0.8时,可视为两个变量之间高度相关2.0.5|r|0.8时,可视

28、为中度相关3.0.3|r|0.5时,视为低度相关4.|r|tt,拒绝,拒绝,拒绝,拒绝H0H0 若若若若 t t tt,接受,接受,接受,接受H0H0n n用用用用ExcelExcel中的中的中的中的【TDISTTDIST】函数得双尾函数得双尾函数得双尾函数得双尾计算计算计算计算P P值值值值,并于显并于显并于显并于显著性水平著性水平著性水平著性水平 比较,并作出决策比较,并作出决策比较,并作出决策比较,并作出决策 若若若若PP=64.9809t t(13-2)=2.201(13-2)=2.201,拒绝拒绝H H0 0,人均人均消费金额与人均国民收入之间的相关关系显著消费金额与人均国民收入之间

29、的相关关系显著2010年相关系数的显著性检验相关系数的显著性检验(例题分析例题分析)【例例例例8.38.3】对不良贷款与贷款余额之间的相关系数进行对不良贷款与贷款余额之间的相关系数进行显著性检显著性检(0.050.05)1.1.提提出假设:出假设:H H0 0:;H H1 1:0 02.2.计算计算检验的统计量检验的统计量3.3.根据根据显著性水平显著性水平 0.050.05,查,查t t分布表得分布表得t t(n n-2)=2.069-2)=2.069 由由于于 t t=7.5344=7.5344t t(25-2)=2.069(25-2)=2.069,拒拒绝绝H H0 0,不不良良贷贷款与贷

30、款余额之间存在着显著的正线性相关关系款与贷款余额之间存在着显著的正线性相关关系 2010年相关系数的显著性检验相关系数的显著性检验(例题分析例题分析)各相关系数检验的统计量各相关系数检验的统计量(套用上述公式)(套用上述公式)(套用上述公式)(套用上述公式)2010年 8.2.1 一元线性回归模型一元线性回归模型 8.2.2 参数的最小二乘估计参数的最小二乘估计 8.2.3 回归直线的拟合优度回归直线的拟合优度 8.2 一元线性回归一元线性回归2010年什么是回归分析?什么是回归分析?1.重重点点考考察察考考察察一一个个特特定定的的变变量量(因因变变量量),而而把把其其他他变变量量(自自变变量

31、量)看看作作是是影影响响这这一一变变量量的的因因素素,并并通通过过适适当当的的数数学学模模型型将将变变量量间的关系表达出来间的关系表达出来2.利用样本数据建立模型的估计方程利用样本数据建立模型的估计方程3.对模型进行显著性检验对模型进行显著性检验4.进进而而通通过过一一个个或或几几个个自自变变量量的的取取值值来来估估计计或预测因变量的取值或预测因变量的取值8.2.1 一元线性回归模型一元线性回归模型2010年回归分析与相关分析的区别回归分析与相关分析的区别1.相相相相关关关关分分分分析析析析中中中中,变变变变量量量量 x x 变变变变量量量量 y y 处处处处于于于于平平平平等等等等的的的的地

32、地地地位位位位;回回回回归归归归分分分分析析析析中中中中,变变变变量量量量 y y 称称称称为为为为因因因因变变变变量量量量,处处处处在在在在被被被被解解解解释释释释的的的的地地地地位,位,位,位,x x 称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化2.相相相相关关关关分分分分析析析析中中中中所所所所涉涉涉涉及及及及的的的的变变变变量量量量 x x 和和和和 y y 都都都都是是是是随随随随机机机机变变变变量量量量;回回回回归归归归分分分分析析析析中中中中,因因因因变变变变量量量量 y y 是是是是随随随随机机

33、机机变变变变量量量量,自自自自变变变变量量量量 x x 可可可可以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量3.相相相相关关关关分分分分析析析析主主主主要要要要是是是是描描描描述述述述两两两两个个个个变变变变量量量量之之之之间间间间线线线线性性性性关关关关系系系系的的的的密密密密切切切切程程程程度度度度;回回回回归归归归分分分分析析析析不不不不仅仅仅仅可可可可以以以以揭揭揭揭示示示示变变变变量量量量 x x 对对对对变变变变量量量量 y y 的影响大小,还可以由回归方程进行预测和控制的影

34、响大小,还可以由回归方程进行预测和控制的影响大小,还可以由回归方程进行预测和控制的影响大小,还可以由回归方程进行预测和控制 2010年回归模型回归模型1.回答“变量之间是什么样的关系?”2.方程中运用n被被被被预预预预测测测测或或或或被被被被解解解解释释释释的的的的变变变变量量量量称称称称为为为为因因因因变变变变量量量量(dependent(dependent variable)variable),用,用,用,用y y表示表示表示表示n用用用用来来来来预预预预测测测测或或或或用用用用来来来来解解解解释释释释因因因因变变变变量量量量的的的的一一一一个个个个或或或或多多多多个个个个变变变变量量量量

35、称为自变量称为自变量称为自变量称为自变量(independent variable)(independent variable),用,用,用,用x x表示表示表示表示 3.主要用于预测和估计2010年回归模型的类型回归模型的类型一个自变量一个自变量一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型回归模型回归模型多元回归多元回归多元回归多元回归一元回归一元回归一元回归一元回归线性线性线性线性回归回归回归回归非线性非线性非线性非线性回归回归回归回归线性线性线性线性回归回归回归回归非线性非线性非线性非线性回归回归回归回归2010年一

36、元线性回归一元线性回归1.涉及一个自变量的回归涉及一个自变量的回归2.因因变量变量y与自变量与自变量x之间为线性关系之间为线性关系3.因因变变量量与与自自变变量量之之间间的的关关系系用用一一个个线线性性方方程来表示程来表示2010年一元线性回归模型一元线性回归模型(linear regression model)1.描描描描述述述述因因因因变变变变量量量量 y y 如如如如何何何何依依依依赖赖赖赖于于于于自自自自变变变变量量量量 x x 和和和和误误误误差差差差项项项项 的的的的方程称为方程称为方程称为方程称为回归模型回归模型回归模型回归模型2.一元线性一元线性一元线性一元线性回归模型可表示为

37、回归模型可表示为回归模型可表示为回归模型可表示为 y y=+1 1 1 1 x x +n ny y 是是是是 x x 的线性函数的线性函数的线性函数的线性函数(部分部分部分部分)加上误差项加上误差项加上误差项加上误差项n n线性部分反映了由于线性部分反映了由于线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的的变化而引起的的变化而引起的 y y 的变化的变化的变化的变化n n误差项误差项误差项误差项 是随机变量是随机变量是随机变量是随机变量l l反反反反映映映映了了了了除除除除 x x 和和和和 y y 之之之之间间间间的的的的线线线线性性性性关关关关系系系系之之之之外

38、外外外的的的的随随随随机机机机因因因因素素素素对对对对 y y 的影响的影响的影响的影响l l是不能由是不能由是不能由是不能由 x x 和和和和 y y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性之间的线性关系所解释的变异性之间的线性关系所解释的变异性n n 0 0 和和和和 1 1 称为模型的参数称为模型的参数称为模型的参数称为模型的参数2010年一元线性回归模型一元线性回归模型(基本假定基本假定)1.因变量因变量因变量因变量x x与自变量与自变量与自变量与自变量y y之间具有线性关系之间具有线性关系之间具有线性关系之间具有线性关系2.在重复抽样中,自变量在重复抽样中,自变量在

39、重复抽样中,自变量在重复抽样中,自变量x x的取值是固定的,即假定的取值是固定的,即假定的取值是固定的,即假定的取值是固定的,即假定x x是非随机的是非随机的是非随机的是非随机的3.误差项误差项误差项误差项 满足满足满足满足l l正态性正态性正态性正态性。是是是是一个服从正态分布的随机变量,且期望一个服从正态分布的随机变量,且期望一个服从正态分布的随机变量,且期望一个服从正态分布的随机变量,且期望值为值为值为值为0 0,即,即,即,即 N N(0,(0,2 2)。对于一个给定的。对于一个给定的。对于一个给定的。对于一个给定的 x x 值,值,值,值,y y 的的的的期望值为期望值为期望值为期望

40、值为E(y)=E(y)=0 0+1 1x xl l方差齐性方差齐性方差齐性方差齐性。对于所有的。对于所有的。对于所有的。对于所有的 x x 值,值,值,值,的方差也都等于的方差也都等于的方差也都等于的方差也都等于 2 2 都都都都相同。同样,一个特定的相同。同样,一个特定的相同。同样,一个特定的相同。同样,一个特定的x x 值,值,值,值,y y 的方差也都等于的方差也都等于的方差也都等于的方差也都等于 2 2l l独立性独立性独立性独立性。独立性意味着对于一个特定的。独立性意味着对于一个特定的。独立性意味着对于一个特定的。独立性意味着对于一个特定的 x x 值,它所对值,它所对值,它所对值,

41、它所对应的应的应的应的 与其他与其他与其他与其他 x x 值所对应的值所对应的值所对应的值所对应的 不相关;对于一个特定的不相关;对于一个特定的不相关;对于一个特定的不相关;对于一个特定的 x x 值,它所对应的值,它所对应的值,它所对应的值,它所对应的 y y 值与其他值与其他值与其他值与其他 x x 所对应的所对应的所对应的所对应的 y y 值也不相值也不相值也不相值也不相关关关关2010年回归方程回归方程(regression equation)1.描描述述 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于 x 的的方方程称为程称为回归方程回归方程2.一元一元线性回归方程的形式如

42、下线性回归方程的形式如下3.E(y)=0+1 x方程的图示是一条直线,也称为方程的图示是一条直线,也称为方程的图示是一条直线,也称为方程的图示是一条直线,也称为直线回归方程直线回归方程直线回归方程直线回归方程 0 0是是是是回回回回归归归归直直直直线线线线在在在在 y y 轴轴轴轴上上上上的的的的截截截截距距距距,是是是是当当当当 x x=0=0 时时时时 y y 的的的的期期期期望值望值望值望值 1 1是是是是直直直直线线线线的的的的斜斜斜斜率率率率,称称称称为为为为回回回回归归归归系系系系数数数数,表表表表示示示示当当当当 x x 每每每每变变变变动动动动一个单位时,一个单位时,一个单位时

43、,一个单位时,y y 的平均变动值的平均变动值的平均变动值的平均变动值2010年估计的回归方程估计的回归方程(estimated regression equation)1.总总总总体体体体回回回回归归归归参参参参数数数数 和和和和 是是是是未未未未知知知知的的的的,必必必必须须须须利利利利用用用用样样样样本本本本数数数数据去估计据去估计据去估计据去估计2.用用用用样样样样本本本本统统统统计计计计量量量量 和和和和 代代代代替替替替回回回回归归归归方方方方程程程程中中中中的的的的未未未未知知知知参参参参数数数数 和和和和 ,就得到了,就得到了,就得到了,就得到了估计的回归方程估计的回归方程估计

44、的回归方程估计的回归方程3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为其其其其其其中中中中中中:是是是是是是估估估估估估计计计计计计的的的的的的回回回回回回归归归归归归直直直直直直线线线线线线在在在在在在 y y y 轴轴轴轴轴轴上上上上上上的的的的的的截截截截截截距距距距距距,是是是是是是直直直直直直线线线线线线的的的的的的斜斜斜斜斜斜率率率率率率,它它它它它它表表表表表表示示示示示示对对对对对对于于于于于于一一一一一一个个个个个个给给给给给给定定定定定定的的的的的的 x x x 的的的的的的值值值值值值,是是是是

45、是是 y y y 的的的的的的估估估估估估计值,也表示计值,也表示计值,也表示计值,也表示计值,也表示计值,也表示 x x x 每变动一个单位时,每变动一个单位时,每变动一个单位时,每变动一个单位时,每变动一个单位时,每变动一个单位时,y y y 的平均变动值的平均变动值的平均变动值的平均变动值的平均变动值的平均变动值 2010年参数的最小二乘估计参数的最小二乘估计1.德国科学家德国科学家Karl Gauss(17771855)提出用提出用最小化图中垂直方向的误差平方和来估计参数最小化图中垂直方向的误差平方和来估计参数 2.使因变量的观察值与估计值之间的误差平方和使因变量的观察值与估计值之间的

46、误差平方和达到最小来求得达到最小来求得 和和 的方法。即的方法。即3.用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表x与与y之之间间的的关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小8.2.2 参数的最小二乘估计参数的最小二乘估计2010年最小二乘估计的图示最小二乘估计的图示x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x x xi i i,y y yi ii)e ei i=y yi i-y yi i2010年参数的最小二乘估计参数的最小二乘估计(和和 的计算公式的计算公式)根据最小二乘法,可得求

47、解 和 的公式如下即该回归直线通过点(即该回归直线通过点(即该回归直线通过点(即该回归直线通过点(x x,y y)2010年估计方程的求法估计方程的求法(例题分析例题分析1)【例例8.9】求不良贷款对贷款余额的回归方程回归方程为:回归方程为:y=-0.8295+0.037895 x回回归归系系数数 =0.037895=0.037895 表表示示,贷贷款款余余额额每每增增加加1 1亿元,不良贷款平均增加亿元,不良贷款平均增加0.0378950.037895亿元亿元 2010年估计方程的求法估计方程的求法(例题分析例题分析)不良贷款对贷款余额回归方程的图示2010年参数的最小二乘估计参数的最小二乘

48、估计(例题分析例题分析)【例例例例8.68.6】估计的回归方程估计的回归方程 第第1步:步:选择【工具工具】下拉菜单,并选择【数据分析数据分析】选项第第2步:步:在分析工具中选择【回归回归】,选择【确定确定】第第2步:步:当对话框出现时 在【Y值输入区域值输入区域】设置框内键入Y的数据区域 在【X值输入区域值输入区域】设置框内键入X的数据区域 在【置信度置信度】选项中给出所需的数值 在【输出选项输出选项】中选择输出区域 在【残差残差】分析选项中选择所需的选项回归分析回归分析回归分析回归分析2010年估计方程的求法估计方程的求法(例题分析例题分析2)【例例】根据例10.1中的数据,配合人均消费金

49、额对人均国民收入的回归方程 根据 和 的求解公式得2010年估计估计(经验经验)方程方程(例题分析例题分析2)人均消费金额对人均国民收入的回归方程为y=54.22286+0.52638 x 2010年估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)2010年变差变差:1.1.因因因因变变变变量量量量 y y 的的的的取取取取值值值值是是是是不不不不同同同同的的的的,y y 取取取取值值值值的的的的这这这这种种种种波波波波动动动动称称称称为为为为变变差差。变差来源于两个方面变差来源于两个方面变差来源于两个方面变差来源于两个方面n n由于自变量由于自变量由于自变量由于自变量 x x

50、 的取值不同造成的的取值不同造成的的取值不同造成的的取值不同造成的n n除除除除 x x 以以以以外外外外的的的的其其其其他他他他因因因因素素素素(如如如如x x对对对对y y的的的的非非非非线线线线性性性性影影影影响响响响、测测测测量量量量误误误误差等差等差等差等)的影响的影响的影响的影响2.2.对对对对一一一一个个个个具具具具体体体体的的的的观观观观测测测测值值值值来来来来说说说说,变变变变差差差差的的的的大大大大小小小小可可可可以以以以通通通通过过过过该该该该实实实实际际际际观观观观测测测测值值值值与与与与其其其其均均均均值值值值之之之之差差差差 来来来来表表表表示示示示,n n次次次次

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁