计量经济学简单线性回归.pptx

上传人:莉*** 文档编号:73622466 上传时间:2023-02-20 格式:PPTX 页数:60 大小:906.26KB
返回 下载 相关 举报
计量经济学简单线性回归.pptx_第1页
第1页 / 共60页
计量经济学简单线性回归.pptx_第2页
第2页 / 共60页
点击查看更多>>
资源描述

《计量经济学简单线性回归.pptx》由会员分享,可在线阅读,更多相关《计量经济学简单线性回归.pptx(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第一章:简单线性回归1从2004中国国际旅游交易会上获悉,到2020年,中国旅游业总收入将超过3000亿美元,相当于国内生产总值的8%至11%。(资料来源:国际金融报2004年11月25日第二版)是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元?旅游业的发展与这种决定性因素的数量关系究竟是什么?怎样具体测定旅游业发展与这种决定性因素的数量关系?引子:中国旅游业总收入将超过中国旅游业总收入将超过30003000亿美元吗?亿美元吗?第1页/共60页第一节:回归分析与回归方程2 本节基本内容本节基本内容:回归与相关回归与相关 总体回归函总体回归函数数 随机扰动项随机扰动项 样本回

2、归函样本回归函数数 第2页/共60页第一节:回归分析与回归方程3 一、回归与相关一、回归与相关1.经济变量间的相互关系 熟知的关系:确定性的函数关系 现实的关系:不确定性的统计关系相关关系 (为随机变量)没有关系 第3页/共60页第一节:回归分析与回归方程4函数关系:对于任意X,有唯一的Y与其对应。确定函数的方法:描点、连线 待定系数法 Y=Kx+b (线性关系两点足矣)相关关系:某一个X对应的Y不唯一,不确定。由于大体上具有关系Y=Kx+b 因此该关系用Y=Kx+b+问题:如何确定K和b呢,因为任意两点确定的Y=Kx+b可能都不一样。第4页/共60页5相关关系的类型从涉及的变量数量看简单相关

3、;多重相关(复相关)从变量相关关系的表现形式看线性相关;非线性相关从变量相关关系变化的方向看正相关;负相关;不相关总体线性相关系数:样本相关系数第5页/共60页6 一、回归与相关一、回归与相关2.回归分析 Y的条件分布当解释变量(自变量)X取某固定值时(条件),Y的值不确定,Y的不同取值形成一定的分布,即Y的条件分布。Y的条件期望对于X的每一个取值,对Y所形成的分布确定其期望或均值,称为Y的条件期望或条件均值第6页/共60页7回归线:此时对于每一个X的取值,将有某一Y的条件期望 与之对应。将 轨迹连接所形成 的直线或曲线,称为回归线。这样,就将相关关系转换为我 们以前的函数关系。第7页/共60

4、页8回归线:此时对于每一个X的取值,将有某一Y的条件期望 与之对应。将 轨迹连接所形成 的直线或曲线,称为回归线。这样,就将相关关系转换为我 们以前的函数关系。第8页/共60页9回归函数:应变量Y的条件期望随解释变量X的变化而有规律的变化,如果把Y的条件期望表现为X的某种函数这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数举例:假如已知100个家庭构成的总体。第9页/共60页10每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X X100015002000250030003500400045005000550082096211081329163218422037227524

5、642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家132414001615194321852365265030213399庭庭1448165020372210239827893064消消1489171220782289248728533142费费1538177821792313251329343274支支1600184

6、12298239825383110出出17021886231624232567Y1900238724532610201224982487271025892586900115014001650190021502400265029003150例:100个家庭构成的总体 (单位:元)相关关系的一对多,转变为函数关系的一对一。相关关系的一对多,转变为函数关系的一对一。第10页/共60页 二、总体回归函数二、总体回归函数 1.1.总体回归函数的概念 前提:假如已知所研究的经济现象的总体应变量Y和解释变量X的每个观测值,可以计算出总体应变量Y的条件均值,并将其表现为解释变量 X的某种函数这个函数称为总体回

7、归函数(PRF)第11页/共60页2.2.总体回归函数的表现形式总体回归函数的表现形式(1)条件均值表现形式假如假如Y的条件均值的条件均值是解释变量是解释变量X的线性函数的线性函数,可表示为:可表示为:(2)个别值表现形式对于一定的对于一定的X,Y的各个别值的各个别值Yi分布在分布在的周围,若令各个的周围,若令各个Yi与条件均值与条件均值的偏差为的偏差为ui,显然显然ui是随机变量是随机变量,则有则有进而第12页/共60页13 三、随机扰动项三、随机扰动项概念:各个Yi值与条件均值的偏差ui代表排除在模型以外的所有因素(简单回归,就是指X以外的所有因素)对Y的影响。性质:ui是期望为0有一定分

8、布的随机变量。重要性:随机扰动项的性质决定着计量经济方法的选择。引入随机扰动项的原因:(1)未知影响因素的代表;(2)无法取得数据的已知影响因素的代表;(3)众多细小影响因素的综合代表;(4)模型的设定误差;(4)变量的观测误差;(5)变量内在随机性.第13页/共60页14 四、样本回归函数四、样本回归函数1 1样本回归线:对于X X的一定值,取得Y Y的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹称为样本回归线。2 2样本回归函数:如果把应变量Y的样本条件均值表示为解释变量X的某种函数,这个函数称为样本回归函数(SRF)。注意:由于每次抽样都能获得一个样本,就可以拟合一条样本回归线

9、,所以样本回归线随抽样波动而变化,可以有许多条(SRF不唯一)n 第14页/共60页15SRF2SRF1总体回归样本回归1样本回归2样本回归第15页/共60页均值表现:样本回归函数如果为线性函数,可表示为 其中:是与 相对应的 的样本条件均值 和 分别是样本回归函数的参数个值表现:应变量 的实际观测值 不完全等于样本条件均值 ,二者之差用 表示,称为剩余项或残差项:因此可表示为:163 3样本回归函数的表现形式样本回归函数的表现形式第16页/共60页174 4对样本回归的理解对样本回归的理解如果能够获得和的数值,显然:和是对总体回归函数参数和的估计是对总体条件期望的估计在概念上类似总体回归函数

10、中的,可视为对的估计。第17页/共60页18 样本回归函数与总体回归函数的关系 SRF PRF A 第18页/共60页 用样本回归函数用样本回归函数SRFSRF去估计总体回归函数去估计总体回归函数PRFPRF。由由于于样样本本对对总总体体总总是是存存在在代代表表性性误误差差,SRF SRF 总总会会过过高高或或过过低估计低估计PRFPRF。要解决的问题:要解决的问题:寻求一种规则和方法,使得到的寻求一种规则和方法,使得到的SRFSRF的参数的参数 和和 尽可能尽可能“接近接近”总体回归函数中的参数总体回归函数中的参数 和和 。这样的这样的“规则和方法规则和方法”有多种,最常用的是最小二乘法有多

11、种,最常用的是最小二乘法195 5回归分析的目的回归分析的目的第19页/共60页20第二节:简单线性回归模型的估计 本节基本内容本节基本内容:简单线性回归的基本假定简单线性回归的基本假定 普通最小二乘法普通最小二乘法 参数估计式的统计性质参数估计式的统计性质第20页/共60页21 一、简单线性回归基本假定一、简单线性回归基本假定(1 1)对模型和变量的假定如;假定解释变量X是非随机的,或者虽然是随机的,但与扰动项ui是不相关的;假定解释变量 在重复抽样中为固定值;假定变量和模型无设定误差。(2)对随机扰动项ui的假定(高斯假定)假定假定1 1:零均值假定:零均值假定 在给定X的条件下,ui的条

12、件期望为零。第21页/共60页22假定假定2 2:同方差假定:同方差假定在给定在给定X的条件下的条件下,ui的条件方差为某个常数的条件方差为某个常数假定假定3 3:无自相关假定:无自相关假定 随机扰动项随机扰动项ui的逐次值互不相关的逐次值互不相关假定假定4 4:随机扰动:随机扰动ui与解释变量与解释变量X 不相关不相关假定假定5 5:对随机扰动项分布的正态性假定:对随机扰动项分布的正态性假定第22页/共60页23二、普通最小二乘回归二、普通最小二乘回归OLS的基本思想不同的估计方法可得到不同的样本回归参数 和 ,所估计的 也不同。理想的估计方法应使 与 的差即剩余 越小越好因 可正可负,所以

13、可以取 最小,即现实中,由于样本量很小,对于每一个具体的X,对应的Yi往往只有一个值,无法取样本均值,即便有的X对应多个Yi,由于样本量的关系,这些不同X对应的也并非刚好在一条线上。因此我们只能找一条近似的直线,使得最小。第23页/共60页24用克莱姆法则求解得观测值形式的OLS估计式:其中 取偏导数为0,得正规方程第24页/共60页 2.无偏特性:3.最小方差特性:在所有的线性无偏估计中,OLS估计 具有最小方差 结论:在古典假定条件下,OLS估计式是最佳线性无 偏估计式(BLUE)251.线性特征:是 的线性函数三、三、OLSOLS估计式的统计性质:高斯定理估计式的统计性质:高斯定理第25

14、页/共60页26三、三、OLSOLS估计式的统计性质:高斯定理估计式的统计性质:高斯定理估计值偏倚概率密度 概 率 密 度 估计值无偏性有效性第26页/共60页27第三节 拟合优度的度量本节基本内容:什么是拟合优度什么是拟合优度 总变差的分解总变差的分解 可决系数可决系数第27页/共60页概念:样本回归线是对样本数据的一种拟合,不同估计方法可拟合出不同的回归线,拟合的回归线与样本观测值总有偏离。样本回归线对样本观测数据拟合的优劣程度 拟合优度拟合优度的度量建立在对总变差分解的基础上28 一、什么是拟合优度一、什么是拟合优度?第28页/共60页29二、总变差的分解二、总变差的分解分析Y Y 的观

15、测值、估计值与平均值的关系将上式两边平方加总,可证得 (TSSTSS)(ESSESS)(RSSRSS)总变差(TSSTSS):应变量Y Y的观测值与其平均值的离差平方和(总平方和)解释了的变差(ESSESS):应变量Y Y的估计值与其平均值的离差平方和(回归平方和)剩余平方和RSSRSS):应变量观测值与估计值之差的平方和(未解释的平方和)第29页/共60页30变差分解的图示变差分解的图示第30页/共60页31 三、可决系数三、可决系数以TSS同除总变差等式两边:或定义:回归平方和(解释了的变差ESS)在总变差(TSS)中所占的比重称为可决系数,用表示:或第31页/共60页作用:可决系数越大,

16、说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。特点:可决系数取值范围:随抽样波动,样本可决系数是随抽样而变动的随机变量可决系数是非负的统计32可决系数的作用和特点可决系数的作用和特点第32页/共60页 可决系数只是说明列入模型的所有解释变量对可决系数只是说明列入模型的所有解释变量对 因变量的联合的影响程度,不说明模型中每个因变量的联合的影响程度,不说明模型中每个 解释变量的影响程度(在多元中)解释变量的影响程度(在多元中).回归的主要目的如果是经济结构分析,不能只回归的主要目的如果是经济结构分析,不能只 追求高的可决系数

17、,而是要得到总体回归系数追求高的可决系数,而是要得到总体回归系数 可信的估计量,可决系数高并不表示每个回归可信的估计量,可决系数高并不表示每个回归 系数都可信任系数都可信任.如果建模的目的只是为了预测因变量值,不是如果建模的目的只是为了预测因变量值,不是 为了正确估计回归系数,一般可考虑有较高的为了正确估计回归系数,一般可考虑有较高的 可决系数可决系数.33运用可决系数时应注意运用可决系数时应注意第33页/共60页34第四节回归系数的区间估计和假设检验本节基本内容:OLSOLS估计的分布性质估计的分布性质 回归系数的区间估计回归系数的区间估计 回归系数的假设检验回归系数的假设检验第34页/共6

18、0页35一、一、OLSOLS估计的分布性质估计的分布性质是服从正态分布的随机变量,决定了也是服从正态分布的随机变量,是的线性函数,决定了也是服从正态分布的随机变量。期望期望:方差方差:标准差标准差:无偏估计无偏估计:第35页/共60页36根据本科知识(概率论)根据本科知识(概率论)在 已知时在 未知时第36页/共60页37二二、回归系数的区间估计回归系数的区间估计一般情况下,未知,以 为例,下式成立根据t分布的特点因此:同理:第37页/共60页38二二、回归系数的区间估计回归系数的区间估计再看:说明如下问题:说明如下问题:我们的初心是我们的初心是“探寻探寻”总体回归函数的总体回归函数的 和和

19、,上式告诉我们上式告诉我们 ,有有1-1-的可能性在的可能性在 向左右扩展(方向左右扩展(方圆)圆)的区间中,的区间中,同理。这说明同理。这说明 和和 就就 在在 和和 附近的方圆范围内。附近的方圆范围内。第38页/共60页39三三、回归系数的假设检验(非零检验回归系数的假设检验(非零检验)计量经济学研究的目的:计量经济学研究的目的:经济变量经济变量X X是否对是否对Y Y具有线性影响?即具有线性影响?即Y=Y=1 1+2 2X+uX+u是否成是否成立?如果总体回归方程中的立?如果总体回归方程中的 k k=0=0,特别是,特别是 2 2=0=0,说明,说明X X对对Y Y没有没有影响,否则影响

20、,否则X X对对Y Y有影响。有影响。但是我们永远无法得知但是我们永远无法得知 k k,我们只能获得我们只能获得 ,得知,得知 k k在在 的方圆范围内,的方圆范围内,但这一范围内有个数很特殊,就是但这一范围内有个数很特殊,就是0 0,那么那么 k k不会是不会是0 0吧,这很关键。吧,这很关键。关于关于 k k是否是是否是0 0的判断,就需要假设检验。的判断,就需要假设检验。第39页/共60页 以以 为例,前面已知:为例,前面已知:假定假定 (统计学叫原假设(统计学叫原假设H0H0:),则有),则有 如果如果 ,则符合常理,则符合常理,即即H0:H0:很有可能很有可能 如果如果 ,为小概率事

21、件,为小概率事件,即即H0:H0:不太可能不太可能40第40页/共60页如前,一方面取决于,一方面需要查表。在计量分析软件中,常用伴随概率P来判断的大小,因此软件会自动计算出P。那么什么是P,如何利用P呢?P指的是t分布的统计量大于的概率如果P很小,小于设定的,说明很大,必然在t分布边远的两侧,即,可能性太小,拒绝。41用用 P P 值判断参数的显著性值判断参数的显著性 P统计量 t第41页/共60页42本节主要内容:本节主要内容:回归分析结果的报告回归分析结果的报告 被解释变量平均值预测被解释变量平均值预测 被解释变量个别值预测被解释变量个别值预测第五节回归模型预测第42页/共60页经过模型

22、的估计、检验,得到一系列重要的数据,为了简明、清晰、规范地表述这些数据,计量经济学通常采用了以下规范化的方式:例如:回归结果为 43一、回归分析结果的报告一、回归分析结果的报告标准误差SEt 统计量可决系数和自由度第43页/共60页44 二、被解释变量平均值预测二、被解释变量平均值预测计量经济预测是一种条件预测条件预测:条件:条件:模型设定的关系设定的关系式不变不变;所估计的参数不变参数不变。解释变量解释变量在预测期的取值已作出预测取值已作出预测。对应变量的预测分为对应变量的预测分为对对平均值预测平均值预测和和对对个别值个别值预测预测对应变量的预测又分为对应变量的预测又分为点预测点预测和和区间

23、预测区间预测我我们们首首先先学学习习对对被被解解释释变变量量平平均均值值的的预预测测,即即对对给给定定X Xf f下,对应的所有的下,对应的所有的Y Y的均值的均值E E(Y|XY|Xf f)的预测。)的预测。对对E E(Y|XY|Xf f)的预测分为)的预测分为点预测点预测和和区间预测区间预测,显然点预测就是把,显然点预测就是把X Xf f代入所求的回归线。代入所求的回归线。进而:进而:红点是几呢?第44页/共60页45 二、被解释变量平均值预测二、被解释变量平均值预测u由于存在抽样波动,预测的平均值由于存在抽样波动,预测的平均值不一定等于真实平均不一定等于真实平均值值,那么我们苦苦想知道的

24、那么我们苦苦想知道的大致在哪个范围大致在哪个范围内呢?内呢?这就涉及到区间预测(类似前面的区间估计)这就涉及到区间预测(类似前面的区间估计)。u根据最小二乘法:根据最小二乘法:在 未知时 服从正态分布第45页/共60页46 二、被解释变量平均值预测二、被解释变量平均值预测根据t分布的特点因此有即我们想知道的 ,将以1-的可能性出现在区间L,R之中。即 出现在以 为中心,半径为 的方圆范围内。第46页/共60页47 三、被解释变量个值预测三、被解释变量个值预测对对X=Xf的前提下,对某一个的前提下,对某一个Yf 的的预测同样分为预测同样分为点预测点预测和和区间预测。区间预测。规定:点预测同样用如

25、下方式计算规定:点预测同样用如下方式计算那么,区间估计呢?那么,区间估计呢?由由于于某某个个具具体体的的Yf 是是随随机机变变量量,点点估估计计的的也也是是随随机机变变量量,令令,根根据据最最小小二二乘乘法法性性质质,也也是是正正态分布的随机变量。态分布的随机变量。可证明:可证明:某个黄点是几呢?第47页/共60页48 三、被解释变量个值预测三、被解释变量个值预测由此可知:根据t分布性质:进而可见,某个 同样落在以 为核心的方圆范围内,此时的方圆半径为 。第48页/共60页49 被解释变量均值预测与个值预测比较被解释变量均值预测与个值预测比较(1)两者的点估计是相同的。(2)两者的区间估计都是

26、在以 为中心,某个半径范围内;但是两者的区间半径不同。总体均值是个确定的值(固定的靶子),因此它与 (枪眼)的差异,只由 决定,即只受抽样波动(枪的好坏)影响;个值是个随机的值(流动的靶子),因此他与 的差异,由自身的随机性和 的抽样波动共同影响。因此对均值预测要比对个值预测更精确(更好瞄准)第49页/共60页 被解释变量均值预测与个值预测比较被解释变量均值预测与个值预测比较50SRFY的个别值的置信区间Y均值的置信区间第50页/共60页51第六节 案例分析提出问题:改革开放以来随着中国经济的快速发展,居民的消费水平也不断增长。但全国各地区经济发展速度不同,居民消费水平也有明显差异。为了分析什

27、么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。研究范围:全国各省市2002年城市居民家庭平均每人每年消费截面数据模型。第51页/共60页52理论分析:影响各地区城市居民人均消费支出的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入。从理论上说可支配收入越高,居民消费越多,但边际消费倾向大于0,小于1。建立模型:其中:Y城市居民家庭平均每人每年消费支出(元)X城市居民人均年可支配收入(元)第52页/共60页53数据:从2002年中国统计年鉴中得到地地 区区城市居民家庭平均城市居民家庭平均每人每年消费支出每人每年

28、消费支出(元元)Y城市居民人均城市居民人均年可支配收入年可支配收入(元元)X北京北京天津天津河北河北山西山西内蒙古内蒙古辽宁辽宁吉林吉林黑龙江黑龙江上海上海江苏江苏浙江浙江安徽安徽福建福建江西江西山东山东河南河南湖北湖北10284.607191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.9212463.929337.566679.685234.356051.066524.526260.166100.5613249.808177

29、.6411715.606032.409189.366334.647614.366245.406788.52地地 区区城市居民家庭平均城市居民家庭平均每人每年消费支出每人每年消费支出(元元)Y城市居民人均年城市居民人均年可支配收入可支配收入(元元)X湖南湖南广东广东广西广西海南海南重庆重庆四川四川贵州贵州云南云南西藏西藏陕西陕西甘肃甘肃青海青海宁夏宁夏新疆新疆5574.728988.485413.445459.646360.245413.084598.285827.926952.445278.045064.245042.526104.925636.406958.5611137.207315.32

30、6822.727238.046610.805944.087240.568079.126330.846151.446170.526067.446899.64第53页/共60页54估计参数具体操作:使用EViews 软件包。估计结果:假定模型中随机扰动满足基本假定,可用OLS法。第54页/共60页55模型检验模型检验1拟合优度检验:拟合优度检验:,说明,说明X对对Y的解释占了近的解释占了近94%2参数显著性检验:参数显著性检验:2对应的伴随概率对应的伴随概率P=0.000,说明,说明 2显著显著不为不为0;1对应的伴随概率对应的伴随概率P=0.334,说明,说明 1不具有显不具有显著性。著性。3经

31、济意义检验:经济意义检验:解释变量的系数为解释变量的系数为0.758511,说明城镇居民,说明城镇居民人均可支配收入每增加人均可支配收入每增加1元,人均年消费支出平均将增元,人均年消费支出平均将增加加0.758511元。这符合经济理论对边际消费倾向的界定元。这符合经济理论对边际消费倾向的界定。第55页/共60页56点预测:西部地区的城市居民人均年可支配收入第一步争取达到1000美元(按现有汇率即人民币8270元),代入估计的模型得第二步再争取达到1500美元(即人民币12405元),利用所估计的模型可预测这时城市居民可能达到的人均年消费支出水平第56页/共60页57区间预测平均值区间预测上下限:第57页/共60页58即是说:平均值置信度95%的预测区间为(6393.03,6717.23)元。平均值置信度95%的预测区间为(9292.33,10090.83)元。第58页/共60页第一章 结束59第59页/共60页60感谢您的观看!第60页/共60页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁