《《线性回归模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《线性回归模型》PPT课件.ppt(104页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学计量经济学理论理论方法方法EViewsEViews应用应用 郭存芝郭存芝 杜延军杜延军 李春吉李春吉 编著编著电子教案第二章第二章 一元线性回归模型一元线性回归模型 学习目的学习目的 理解回归模型的概念,学会对一元线性回归模型进行参数估计、检验和预测,为多元线性回归模型的学习打下基础。基本要求基本要求 1)理解样本回归模型、总体回归模型的概念;理解样本回归模型、总体回归模型的概念;2)掌握一元线性回归模型的普通最小二乘参数估计掌握一元线性回归模型的普通最小二乘参数估计方法,了解一元线性回归模型的基本假设、一元线性回方法,了解一元线性回归模型的基本假设、一元线性回归模型的最大似然参数估
2、计方法、一元线性回归模型的归模型的最大似然参数估计方法、一元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、一元线普通最小二乘参数估计量与样本回归线的性质、一元线性回归模型随机误差项方差的估计;性回归模型随机误差项方差的估计;3)学会对一元线性回归模型进行拟合优度检验,对学会对一元线性回归模型进行拟合优度检验,对一元线性回归模型的参数进行区间估计和假设检验;一元线性回归模型的参数进行区间估计和假设检验;4)学会进行一元线性回归模型被解释变量的总体均值学会进行一元线性回归模型被解释变量的总体均值和个别值预测;和个别值预测;5)学会利用学会利用Eviews软件进行一元线性回归模型的参软件进
3、行一元线性回归模型的参数估计、检验和预测。数估计、检验和预测。第二章第二章 一元线性回归模型一元线性回归模型 第二章第二章 一元线性回归模型一元线性回归模型回归模型概述 一元线性回归模型的参数估计 一元线性回归模型的拟合优度检验 一元线性回归模型的统计推断 一元线性回归模型的预测 案例分析 相关分析与回归分析相关分析与回归分析第一节第一节 回归模型概述回归模型概述 随机误差项随机误差项 总体回归模型总体回归模型 样本回归模型样本回归模型 1.经济变量之间的关系 一、相关分析与回归分析一、相关分析与回归分析 计量经济研究是对经济变量之间关系的研究,针对某一具体计量经济研究是对经济变量之间关系的研
4、究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间有经济问题展开研究时,首先需要考察的就是相关经济变量之间有没有关系、有什么样的关系。没有关系、有什么样的关系。确定的函数关系确定的函数关系 不确定的相关关系不确定的相关关系 经济变量之间的关系经济变量之间的关系 函数关系函数关系 指某一经济变量可直接表示为其他经济变量的确定的函数,指某一经济变量可直接表示为其他经济变量的确定的函数,函数表达式中没有未知参数,不存在参数估计的问题。函数表达式中没有未知参数,不存在参数估计的问题。1)某一商品的销售收入某一商品的销售收入Y与单价与单价P、销售数量、销售数量Q之间的关系之间的关系Y
5、=PQ 2)某一农作物的产量某一农作物的产量Q与单位面积产量与单位面积产量q、种植面积、种植面积S之间的关系之间的关系Q=q S例如例如:相关关系相关关系 指不同经济变量的变化趋势之间存在某种不确定的联系,某一或指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。一确定,但按某种规律有一定的取值范围。居民消费居民消费C与可支配收入与可支配收入Y之间的关系,可支配收入的取值确定后,之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一
6、确定,但有一定的取值范围,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y,遵,遵循边际消费倾向递减的规律。居民消费循边际消费倾向递减的规律。居民消费C与可支配收入与可支配收入Y之间的关系之间的关系可表示为可表示为C=+Y,、为待估参数。为待估参数。例如例如:相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。相关关系的分类相关关系的分类 a)a)按照涉及的变量的数量按照涉及的变量的数量 单相关(一元相关)复相关(多元相关)-指两个经济变量之间存在的相关关系指两个经济变量之间存在的相关关系 -指多个经济
7、变量之间存在的相关关系指多个经济变量之间存在的相关关系,可能是几个可能是几个经济变量的某种综合效果与一个经济变量有趋势方面的联系。经济变量的某种综合效果与一个经济变量有趋势方面的联系。相关关系的分类相关关系的分类 b)b)按照相关的程度按照相关的程度 完全相关不完全相关不相关介于完全相关与不相关之间的情况。介于完全相关与不相关之间的情况。极强的相关关系极强的相关关系,指某一或某几个经济变量的取值确定后,指某一或某几个经济变量的取值确定后,对应的另一经济变量的取值能唯一确定,实际上是确定的对应的另一经济变量的取值能唯一确定,实际上是确定的函数关系,所以函数关系可看作是相关关系的特例。函数关系,所
8、以函数关系可看作是相关关系的特例。极弱的相关关系极弱的相关关系,指某一或某几个经济变量的取值确定后,指某一或某几个经济变量的取值确定后,对应的另一经济变量不仅取值不能唯一确定,而且取值范对应的另一经济变量不仅取值不能唯一确定,而且取值范围也不能确定。围也不能确定。相关关系的分类相关关系的分类 c)c)按照相关的性质按照相关的性质正相关负相关指不同经济变量的变化趋势一致,即一个经济变量的指不同经济变量的变化趋势一致,即一个经济变量的取值由小变大时,另一经济变量的取值也由小变大;取值由小变大时,另一经济变量的取值也由小变大;指不同经济变量的变化趋势相反,即一个经济变量的指不同经济变量的变化趋势相反
9、,即一个经济变量的取值由小变大时,另一经济变量的取值由大变小。取值由小变大时,另一经济变量的取值由大变小。相关关系的分类相关关系的分类 c)c)按照相关的性质按照相关的性质线性相关非线性相关指相关变量之间的关系可由线性函数近似表示,即由指相关变量之间的关系可由线性函数近似表示,即由相关变量的取值绘制的散点图趋向于直线形式;相关变量的取值绘制的散点图趋向于直线形式;指相关变量之间的关系可由某种非线性函数近似表指相关变量之间的关系可由某种非线性函数近似表示,即由相关变量的取值绘制的散点图趋向于某种示,即由相关变量的取值绘制的散点图趋向于某种曲线形式。曲线形式。函数关系与相关关系的区别函数关系与相关
10、关系的区别 确定的函数关系可以直接用于经济活动,无需分析。确定的函数关系可以直接用于经济活动,无需分析。不确定的相关关系,隐含着某种经济规律,是有关研究的重点不确定的相关关系,隐含着某种经济规律,是有关研究的重点 2.相关分析 一、相关分析与回归分析一、相关分析与回归分析 研究变量之间的相关关系的形式和程度的一种统计分析方法,主要研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。绘制变量之间关系的散点图绘制变量之间关系的散点图例如:判断相关关系是线性相关还是非线性相判断相
11、关关系是线性相关还是非线性相关、正相关还是负相关;关、正相关还是负相关;计算变量之间的相关系数计算变量之间的相关系数度量变量之间的线性相关的程度、判断线度量变量之间的线性相关的程度、判断线性相关关系是正相关还是负相关性相关关系是正相关还是负相关 相关系数相关系数 十九世纪末十九世纪末英国著名统计学家卡尔英国著名统计学家卡尔皮尔逊(皮尔逊(Karl Pearson)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数)两个两个变变量量X和和Y的的总总体相关系数体相关系数为为其中,是变量X、Y的协方差,、分别是变量X、Y的方差。(2
12、-1)(2-2)(2-3)如果给定变量X、Y 的一组样本 ,则总体相关系数的估计样本相关系数为n,或相关系数的取值介于相关系数的取值介于 11之间,之间,取值为负表示两变量之间存在负相关关系;取值为负表示两变量之间存在负相关关系;取值为正表示两变量之间存在正相关关系;取值为正表示两变量之间存在正相关关系;取值为取值为 1表示两变量之间存在完全负相关关系;表示两变量之间存在完全负相关关系;取值为取值为0表示两变量不相关;表示两变量不相关;取值为取值为1表示两变量之间存在完全正相关关系。表示两变量之间存在完全正相关关系。3.回归分析 研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的研究不
13、仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础,一种分析理论与方法,是计量经济学的方法论基础,主要内容主要内容 1)设定理论模型,描述变量之间的因果关系;)设定理论模型,描述变量之间的因果关系;2)根据样本观察数据利用适当方法对模型参数进行估计,)根据样本观察数据利用适当方法对模型参数进行估计,得到回归方程;得到回归方程;3)对回归方程中的变量、方程进行显著性检验,推求参数)对回归方程中的变量、方程进行显著性检验,推求参数 的置信区间、模型的预测置信区间;的置信区间、模型的预测置信区间;4)利用回归模型解决实际经济问题。)利用回归模型解决实际经
14、济问题。例如:居民消费居民消费C与可支配收入与可支配收入Y之间不仅存在相关关系而且存在因之间不仅存在相关关系而且存在因果关系,不仅可以利用相关分析研究两者之间的相关程度,还可果关系,不仅可以利用相关分析研究两者之间的相关程度,还可以利用回归分析研究两者之间的具体依存关系。可以将以利用回归分析研究两者之间的具体依存关系。可以将C作为被作为被解释变量、解释变量、Y作为解释变量,根据相关经济理论,设定含有待估作为解释变量,根据相关经济理论,设定含有待估参数参数 、的理论模型的理论模型C=+Y,估计模型中的参数,估计模型中的参数 、,得,得到回归方程,进行相关统计检验和推断,利用回归模型进行结构到回归
15、方程,进行相关统计检验和推断,利用回归模型进行结构分析、经济预测、政策评价等。分析、经济预测、政策评价等。4.相关分析与回归分析之间的关系联系:联系:1)都是对存在相关关系的变量的统计相关关系的研究;)都是对存在相关关系的变量的统计相关关系的研究;2)都能测度线性相关程度的大小;)都能测度线性相关程度的大小;3)都能判断线性相关关系是正相关还是负相关。)都能判断线性相关关系是正相关还是负相关。区别:区别:1)相关分析相关分析仅仅是从统计数据上测度变量之间的相关程度,仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相不考虑两者之间是否存在因果关系,因而变
16、量的地位在相 关分析中是对等的;关分析中是对等的;回归分析回归分析是对变量之间的因果关系的分析,变量的地位是是对变量之间的因果关系的分析,变量的地位是 不对等的,有被解释变量和解释变量之分。不对等的,有被解释变量和解释变量之分。2)相关分析相关分析主要关注变量之间的相关程度和性质,不关注变主要关注变量之间的相关程度和性质,不关注变 量之间的具体依赖关系。量之间的具体依赖关系。回归分析回归分析在关注变量之间的相关程度和性质的同时,更关注变量在关注变量之间的相关程度和性质的同时,更关注变量 之间的具体依赖关系,因而可以深入分析变量间的依存关系,有之间的具体依赖关系,因而可以深入分析变量间的依存关系
17、,有 可能达到掌握其内在规律的目的,具有更重要的实践意义。可能达到掌握其内在规律的目的,具有更重要的实践意义。二、二、随机误差项随机误差项含有随机误差项是含有随机误差项是计量经济学模型计量经济学模型与与数理经济模型数理经济模型的一大区别。的一大区别。例如:对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。加,但要素的边际产出递减。数理数理经济经济模型模型用确定性的函数描述用确定性的
18、函数描述经济变经济变量之量之间间的理的理论论关系,关系,对这对这一一经济经济活活动动,笼统笼统地描述地描述为为或具体地用某一种生或具体地用某一种生产产函数描述函数描述为为其中,其中,Q表示表示产产出,出,T表示技术,表示技术,K表示资本,表示资本,L表示劳动,表示劳动,A、是未知参数。是未知参数。二、二、随机误差项随机误差项含有随机误差项是含有随机误差项是计量经济学模型计量经济学模型与与数理经济模型数理经济模型的一大区别。的一大区别。例如:对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出
19、随着投入要素的增加而增等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。加,但要素的边际产出递减。计计量量经济经济学模型学模型用随机方程揭示用随机方程揭示经济变经济变量之量之间间的因果关系,的因果关系,对对于于这这一一经济经济活活动动,与上述数理,与上述数理经济经济模型相模型相对应对应,描述,描述为为或描述或描述为对为对数数线线性函数形式性函数形式其中,其中,是随机是随机误误差差项项。随机误差项随机误差项称为随机扰动项或随机干扰项(stochastic disturbance)一般用希腊字母或表示存在原因存在原因 第一,人类的经济行为本身带有随机性;第一,
20、人类的经济行为本身带有随机性;第二,通常一个变量总是受众多因素的影响;第二,通常一个变量总是受众多因素的影响;第三,任何函数反映经济变量之间的关系都只是一种简化反映;第三,任何函数反映经济变量之间的关系都只是一种简化反映;第四,经济数据来源于调查统计,而非严格的控制实验;第四,经济数据来源于调查统计,而非严格的控制实验;结论结论 一个经济变量通常不能被另一个经济变量一个经济变量通常不能被另一个经济变量完全精确完全精确地决定,需要地决定,需要引入随机误差项来反映各种误差的综合影响,主要包括:引入随机误差项来反映各种误差的综合影响,主要包括:1)变量的内在随机性的影响;)变量的内在随机性的影响;2
21、)解释变量中被忽略的因素的影响;)解释变量中被忽略的因素的影响;3)模型关系设定误差的影响;)模型关系设定误差的影响;4)变量观察值的观察误差的影响;)变量观察值的观察误差的影响;5)其他随机因素的影响。)其他随机因素的影响。三、三、总体回归模型总体回归模型1 1总体回归曲线与总体回归函数总体回归曲线与总体回归函数 给定解释变量条件下被解释变量的期望轨迹称为给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线总体回归曲线(population regression curve),或),或总体回归线总体回归线(population regression line)。)。描述总体回归曲线的函数称
22、为描述总体回归曲线的函数称为总体回归函数总体回归函数(population regression function)。)。对对于只有于只有一个解一个解释变释变量量X的情形,总体回归函数为的情形,总体回归函数为(2-4)与之与之对应对应,是是X的函数。的函数。,都有被解,都有被解释变释变量量Y的条件期望的条件期望表示表示对对于解于解释变释变量量X的每一个取值的每一个取值 对对于含有于含有多个解多个解释变释变量量 、的情形,的情形,总总体回体回归归函数函数为为(2-5)表示表示对对于解于解释变释变量量的每一的每一组组取取值值,都有被解,都有被解释变释变量量Y的条件期望的条件期望与之与之对应对应,是
23、是的函数。的函数。、例2-1 假假设设一个由一个由100个家庭构成的个家庭构成的总总体,并假体,并假设这设这100个家庭的个家庭的月可支配收入水平只限于月可支配收入水平只限于1300元、元、1800元、元、2300元、元、2800元、元、3300元、元、3800元、元、4300元、元、4800元、元、5300元、元、5800元元10种情况,每个家庭的月可支配收入与消种情况,每个家庭的月可支配收入与消费费数据如表数据如表2-1所示,所示,要研究要研究这这一一总总体的家庭月消体的家庭月消费费支出支出Y与家庭月可支配收入与家庭月可支配收入X之之间的关系,以便根据已知的家庭月可支配收入水平测算该总间的
24、关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。体的家庭月消费支出平均水平。可支配收入可支配收入X1300180023002800330038004300480053005800消消费费支出支出Y10331126120711201208125613271439158411281167123112881371143914521533159716761793145515011635172817891835188619432033217822942351241017881835187219031965206121572206228923142390242624582478
25、25431966204821222213231523572369239824522501253425682610265927232197228623152386246725812623267727102985300430823119310224362588267227362801289329023027315532602765285329003021306531463278330534233022315634013669表表2-1 100个家庭的月可支配收入与消费数据个家庭的月可支配收入与消费数据 单位:元单位:元 家庭消费支出主要取决于家庭可支配收入,但不是唯一取决于家庭可支家庭消费支出主要
26、取决于家庭可支配收入,但不是唯一取决于家庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不同家庭的消费支出各不相同。同家庭的消费支出各不相同。由于是由于是对总对总体的考察,由表体的考察,由表2-1可求得家庭可支配收入可求得家庭可支配收入X为某一特定数值为某一特定数值时家庭消费支出时家庭消费支出Y的条件分布(的条件分布(conditional distribution)例如,例如,X=2300条件下,条件下,Y=1371的条件概率等于的条件概率等于1/11,即,即 由此可求得由此可求得对应对应于家庭可支配收入
27、于家庭可支配收入X的各个水平的家庭消费支出的各个水平的家庭消费支出Y的的条件条件 均值均值(conditional mean)或称为)或称为条件期望条件期望(conditional expectation),),如表如表2-2所示。所示。析:表表2-2 100个家庭的月可支配收入与消费数据个家庭的月可支配收入与消费数据 单位:元单位:元 可支配收入可支配收入X1300180023002800330038004300480053005800E(Y/Xi)1122132414251926217923892681284730843312 由表由表2-1、表、表2-2中的数据绘制不同可支配收入家庭的消
28、费支出散中的数据绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的总体回归曲线,如图点图、家庭消费支出与可支配收入关系的总体回归曲线,如图2-1所示。所示。从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体趋势随可支配收入的增加而增加,总体回归曲线反映了这一趋势。趋势随可支配收入的增加而增加,总体回归曲线反映了这一趋势。事实上,经济活动中的总体包含的个体的数量往往非常多,一般不事实上,经济活动中的总体包含的个体的数量往往非常多,一般不大可能像例大可能像例2-1假设的那样得到总体中所有个体的观察数据,因
29、此也就不假设的那样得到总体中所有个体的观察数据,因此也就不大可能依据总体的所有观察数据计算得到被解释变量大可能依据总体的所有观察数据计算得到被解释变量Y的条件期望,无的条件期望,无法画出精确的总体回归曲线,相应地,总体回归函数的具体形式也无法法画出精确的总体回归曲线,相应地,总体回归函数的具体形式也无法精确确定。所以,对于总体回归函数,通常只能根据经济理论或实践经精确确定。所以,对于总体回归函数,通常只能根据经济理论或实践经验进行设定,也就是说,通常需要对总体回归函数作出合理的假设。验进行设定,也就是说,通常需要对总体回归函数作出合理的假设。2 2总体回归模型总体回归模型 可由其期望可由其期望
30、值值 和随机和随机误误差差项项 表示表示为为 对对于只有于只有一个解一个解释变释变量量X的情形,第的情形,第i个个体的被解释变量的观察值个个体的被解释变量的观察值 (2-6)(2-7)可由其期望可由其期望值值 和随机和随机误误差差项项 表示表示为为 对对于含有于含有多个解多个解释变释变量量 的情形,第的情形,第i个个体的被解个个体的被解释变释变量的量的观观察察值值 、(2-6)或式()或式(2-7)是总体回归函数的个别值表示方式,因为引入了随机)是总体回归函数的个别值表示方式,因为引入了随机误差项,称为误差项,称为总体回归函数的随机设定形式总体回归函数的随机设定形式,也是因为引入了随机误差项,
31、也是因为引入了随机误差项,成为计量经济学模型,称为成为计量经济学模型,称为总体回归模型总体回归模型(population regression model)。)。或或 ,是,是 或或 对应对应的的的平均状的平均状态态,反映解,反映解释变释变量量对对被解被解释变释变量的影响,称量的影响,称为为系系统统性(性(systematic)部分或确定性(部分或确定性(deterministic)部分;部分;另一部分另一部分是随机是随机误误差差项项 ,是,是观观察察值值 围绕围绕它的期望它的期望值值 或或反映解反映解释变释变量之外的量之外的诸诸多随机因素多随机因素对对被解被解释变释变量的影响,称量的影响,称
32、为为非系非系统统性性(nonsystematic)部分或随机()部分或随机(stochastic)部分。部分。总总体回体回归归模型中,模型中,观观察察值值 是两部分之和,是两部分之和,一部分一部分是是 的期望的期望值值的离差(的离差(deviation),),3 3线性总体回归模型线性总体回归模型确定性部分为线性函数的总体回归模型称为确定性部分为线性函数的总体回归模型称为线性总体回归模型线性总体回归模型。线性总体回归模型是计量经济学中线性总体回归模型是计量经济学中最常见最常见的总体回归模型。的总体回归模型。只含有只含有一个解释变量一个解释变量的线性总体回归模型称为的线性总体回归模型称为一元线性
33、总体回归模型,一元线性总体回归模型,简称一元线性回归模型或简单线性回归模型(简称一元线性回归模型或简单线性回归模型(simple linear regression model),),其一般形式是其一般形式是(2-8)其中,其中,Y为被解释变量,为被解释变量,X为解释变量,为解释变量,、为为待估参数,待估参数,为为随机随机误误差差项项,为观测值为观测值下下标标,为样为样本容量。本容量。称为回归系数称为回归系数(regression coefficients),),3 3线性总体回归模型线性总体回归模型确定性部分为线性函数的总体回归模型称为线性总体回归模型。确定性部分为线性函数的总体回归模型称为
34、线性总体回归模型。线性总体回归模型是计量经济学中线性总体回归模型是计量经济学中最常见最常见的总体回归模型。的总体回归模型。含有含有多个解多个解释变释变量量的的线线性性总总体回体回归归模型称模型称为为多元多元线线性性总总体回体回归归模型模型,简简称称多元多元线线性回性回归归模型(模型(multiple linear regression model),其一般形式是),其一般形式是 (2-9)其中,其中,Y为被解释变量,为被解释变量,为为解解释变释变量,量,为为待估参数,即回待估参数,即回归归系数,系数,、为为随机随机误误差差项项,为观测值为观测值下下标标,为样为样本容量。本容量。注意:这里所说的
35、线性函数和通常意义下的线性函数不同,这里的线性函数指这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也可以不是线性的。可以不是线性的。例如:都是线性回归模型。都是线性回归模型。注意:这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也可以不是线性的。可
36、以不是线性的。例如:都不是线性回归模型。都不是线性回归模型。对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可化为线性回归模型的一般形式。化为线性回归模型的一般形式。例如:模型模型 令令,可将模型化,可将模型化为为 4 4线性回归模型的普遍性线性回归模型的普遍性例如,著名的例如,著名的Cobb-Dauglas生产函数表现为幂函数形式,生产函数表现为幂函数形式,著名的菲利普斯曲线(著名的菲利普斯曲线(Phillips curves)表现为双曲线形式。)表现为双曲线形式。一般情况下,对于只含有乘、除、指数、幂运算的非线性关系,可通过
37、一般情况下,对于只含有乘、除、指数、幂运算的非线性关系,可通过对对数变化数变化化为线性关系,以化为线性关系,以Cobb-Dauglas生产函数生产函数为例,方程两边取对数,可化为线性形式为例,方程两边取对数,可化为线性形式对于其他复杂的函数形式,可通过对于其他复杂的函数形式,可通过级数展开级数展开化为线性形式化为线性形式 ,然后在点,然后在点 可先根据所掌握的信息确定参数可先根据所掌握的信息确定参数、的一组初始值的一组初始值、(),处对模型作泰勒级数展开,并取一阶近似值,得处对模型作泰勒级数展开,并取一阶近似值,得 例如,对于模型例如,对于模型 余余项项整理得整理得+余余项项+余余项项令令,余
38、余项项原模型可化为原模型可化为四、样本回归模型四、样本回归模型1 1样本回归函数与样本回归曲线样本回归函数与样本回归曲线根据样本数据对总体回归函数作出的估计称为根据样本数据对总体回归函数作出的估计称为样本回归函数样本回归函数。由样本回归函数绘制的曲线称为由样本回归函数绘制的曲线称为样本回归曲线样本回归曲线(样本回归线)。(样本回归线)。例2-2 假设没有取得总体中所有家庭的可支配收入与消费支出数据,而是按可支假设没有取得总体中所有家庭的可支配收入与消费支出数据,而是按可支配收入水平的不同水平调查取得了一组有代表性的样本,如表配收入水平的不同水平调查取得了一组有代表性的样本,如表2-3所示。所示
39、。表表2-3 家庭月可支配收入与消费支出的一个样本家庭月可支配收入与消费支出的一个样本 单位:元单位:元 可支配收入可支配收入X1300180023002800330038004300480053005800消消费费支出支出Y1126132714391886220623982677289330653401 以例2-1为例(假假设设一个由一个由100个家庭构成的个家庭构成的总总体,并假体,并假设这设这100个家庭的月可个家庭的月可支配收入水平只限于支配收入水平只限于1300元、元、1800元、元、2300元、元、2800元、元、3300元、元、800元、元、4300元、元、4800元、元、530
40、0元、元、5800元元10种情况,每个家庭的月可支配收入与消种情况,每个家庭的月可支配收入与消费费数据如表数据如表2-1所示,要研究所示,要研究这这一一总总体的家庭月消体的家庭月消费费支出支出Y与家庭月可支配收入与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。支出平均水平。)若将家庭月可支配收入若将家庭月可支配收入X与消与消费费支出支出Y的的总总体回体回归归函数函数设设定定为为一元一元线线性回性回归归函数的形式函数的形式,从而得到,从而得到样样本回本回归归函数函数可采用适当
41、方法根据可采用适当方法根据表表2-32-3中的数据得到参数中的数据得到参数、的估的估计计、根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的样本回归线,如图散点图、家庭消费支出与可支配收入关系的样本回归线,如图2-2所示。所示。从图中可以清晰地看出,样本回归线是通过对样本数据的较好的拟合对总从图中可以清晰地看出,样本回归线是通过对样本数据的较好的拟合对总体回归线作出的一种估计。体回归线作出的一种估计。2样本回归模型 引入引入样样本回本回归归函数中的代表各种随机因素影响的随机函数中的代表各
42、种随机因素影响的随机变变量,量,称称为为样样本残差本残差项项、回回归归残差残差项项或或样样本剩余本剩余项项、回回归归剩余剩余项项,简简称称残差残差项项或剩余或剩余项项(residual),通常用),通常用表示表示。在样本回归函数中引入残差项后,得到的是随机方程,成为在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为了计量经济学模型,称为样本回归模型样本回归模型。对于例对于例2-2中的样本回归函数中的样本回归函数 引入引入残差残差项项可得可得样样本回本回归归模型模型例如:3线性样本回归模型确定性部分确定性部分+随机部分随机部分 =样本回归模型样本回归模型确定性部分是线性函
43、数的样本回归模型称为确定性部分是线性函数的样本回归模型称为线性样本回归模型线性样本回归模型。只含有一个解释变量的线性样本回归模型称为只含有一个解释变量的线性样本回归模型称为一元线性样本回归模型一元线性样本回归模型,其一般形式是其一般形式是 (2-10)其中,其中,Y为被解释变量,为被解释变量,X为解释变量,为解释变量,、的估的估计计,是参数是参数为观测值为观测值下下标标,为样为样本容量。本容量。为为残差残差项项,3线性样本回归模型确定性部分确定性部分+随机部分随机部分 =样本回归模型样本回归模型确定性部分是线性函数的样本回归模型称为确定性部分是线性函数的样本回归模型称为线性样本回归模型线性样本
44、回归模型。含有多个解释变量的线性样本回归模型称为含有多个解释变量的线性样本回归模型称为多元线性样本回归模型,多元线性样本回归模型,其一般形式是其一般形式是(2-11)为观测值为观测值下下标标,为样为样本容量。本容量。为为残差残差项项,其中,其中,Y为被解释变量,为被解释变量,为解释变量,为解释变量,、的估的估计计,是参数是参数、一元线性回归模型的基本假设一元线性回归模型的基本假设第二节第二节 一元线性回归模型的参数估计一元线性回归模型的参数估计 参数的普通最小二乘估计参数的普通最小二乘估计 参数的最大似然估计参数的最大似然估计 普通最小二乘参数估计量的性质普通最小二乘参数估计量的性质 普通最小
45、二乘样本回归函数的性质普通最小二乘样本回归函数的性质 随机误差项方差的估计随机误差项方差的估计一、一元线性回归模型的基本假设 一元线性回归模型的基本假设包括一元线性回归模型的基本假设包括对解释变量的假设对解释变量的假设、对随机误差项的对随机误差项的假设假设、对模型设定的假设对模型设定的假设几个方面,主要如下:几个方面,主要如下:1)解释变量是确定性变量,不是随机变量。解释变量是确定性变量,不是随机变量。2)随机误差项具有随机误差项具有0均值、同方均值、同方差,且在不同样本点之间是独立差,且在不同样本点之间是独立的,不存在序列相关,即的,不存在序列相关,即3)随机随机误误差差项项与解与解释变释变
46、量不相关。即量不相关。即4)随机随机误误差差项项服从正服从正态态分布,即分布,即5)回归模型是正确设定的。回归模型是正确设定的。这这5条假设中的前条假设中的前4条是线性回归模型的条是线性回归模型的古典假设古典假设,也称为,也称为高斯假设高斯假设,满足古典,满足古典假设的线性回归模型称为假设的线性回归模型称为古典线性回归模型古典线性回归模型(classical linear regression model)。)。在这在这5条假设中,若前两条假设满足,第条假设中,若前两条假设满足,第3条自然满足,因为前两条假设成立时有条自然满足,因为前两条假设成立时有且由第且由第2条假设有条假设有 因为因为二、
47、参数的普通最小二乘估计二、参数的普通最小二乘估计 普通最小二乘法(普通最小二乘法(ordinary least squares,OLS)的)的基本思想基本思想使样本回归函数尽可能好地拟合样本数据使样本回归函数尽可能好地拟合样本数据最小二乘法以最小二乘法以(2-12)表示被解释变量的估计值与实际观察值的偏差总体上最小,表示被解释变量的估计值与实际观察值的偏差总体上最小,称为称为最小二乘准则最小二乘准则。对于一元线性回归模型对于一元线性回归模型 最小二乘参数估最小二乘参数估计计就是要求使就是要求使(2-13)达到最小的参数达到最小的参数的估的估计计。根据微根据微积积分中求极限的原理,要使式分中求极
48、限的原理,要使式(2-13)达到最小,)达到最小,式式(2-13)对对 的一的一阶阶偏偏导导数数应应等于等于0 0,即,即(2-14)整理得整理得(2-15)解得解得(2-16)这这就是参数就是参数的的普通最小二乘估普通最小二乘估计量计量(ordinary least squares estimators)方程组(方程组(2-14)或()或(2-15)称为)称为正规方程组正规方程组。记记、,由于由于式(式(2-16)可改写为)可改写为(2-17)称称为为参数参数的的普通最小二乘估普通最小二乘估计量的离差形式计量的离差形式(deviation form)若一元线性回归模型中没有常数项,即模型为若
49、一元线性回归模型中没有常数项,即模型为 可得普通最小二乘参数估可得普通最小二乘参数估计计量量为为(2-18)这这里需要明确两个概念里需要明确两个概念估估计计量量(estimator)、)、估估计值计值(estimate)。)。估估计计量指以公式表示的参数的估量指以公式表示的参数的估计计,是随机,是随机变变量,其随机性源于被解量,其随机性源于被解释变释变量量。因。因为为等于其条件均等于其条件均值值与随机与随机误误差差项项之和,是一个随机之和,是一个随机变变量。估量。估计值计值指指把样本数据代入参数估计公式得到的参数估计的具体数值,是确定的数字。把样本数据代入参数估计公式得到的参数估计的具体数值,
50、是确定的数字。例2-3 以例2-2为例(假假设设一个由一个由100个家庭构成的个家庭构成的总总体,并假体,并假设这设这100个家庭的月可个家庭的月可支配收入水平只限于支配收入水平只限于1300元、元、1800元、元、2300元、元、2800元、元、3300元、元、800元、元、4300元、元、4800元、元、5300元、元、5800元元10种情况,每个家庭的月可支配收入与消种情况,每个家庭的月可支配收入与消费费数据如表数据如表2-1所示,要研究所示,要研究这这一一总总体的家庭月消体的家庭月消费费支出支出Y与家庭月可支配收入与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该