《计量经济学一元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《计量经济学一元线性回归模型.ppt(163页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学计量经济学理论理论方法方法EViewsEViews应用应用 郭存芝郭存芝 杜延军杜延军 李春吉李春吉 编著编著第二章第二章 一元线性回归模型一元线性回归模型 学习目的学习目的 理解回归模型的概念,学会对一元理解回归模型的概念,学会对一元线性回归模型进行参数估计、检验和预线性回归模型进行参数估计、检验和预测,为多元线性回归模型的学习打下基测,为多元线性回归模型的学习打下基础。础。基本要求基本要求1)理解样本回归模型、总体回归模型的概念;理解样本回归模型、总体回归模型的概念;2)掌握一元线性回归模型的普通最小二乘参数估计方法,了解一元线性掌握一元线性回归模型的普通最小二乘参数估计方法,了
2、解一元线性回归模型的基本假设、一元线性回归模型的最大似然参数估计方法、一回归模型的基本假设、一元线性回归模型的最大似然参数估计方法、一元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、一元元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、一元线性回归模型随机误差项方差的估计;线性回归模型随机误差项方差的估计;3)学会对一元线性回归模型进行拟合优度检验,对一元线性回归模型的学会对一元线性回归模型进行拟合优度检验,对一元线性回归模型的参数进行区间估计和假设检验;参数进行区间估计和假设检验;4)学会进行一元线性回归模型被解释变量的总体均值和个别值预测;学会进行一元线性回归模型被解释变
3、量的总体均值和个别值预测;第二章第二章 一元线性回归模型一元线性回归模型 第二章第二章 一元线性回归模型一元线性回归模型回归模型概述回归模型概述 一元线性回归模型的参数估计一元线性回归模型的参数估计 一元线性回归模型的拟合优度检验一元线性回归模型的拟合优度检验 一元线性回归模型的统计推断一元线性回归模型的统计推断 一元线性回归模型的预测一元线性回归模型的预测 案例分析案例分析 相关分析与回归分析相关分析与回归分析第一节第一节 回归模型概述回归模型概述 随机误差项随机误差项 总体回归模型总体回归模型 样本回归模型样本回归模型 1.1.经济变量之间的关系经济变量之间的关系 计量经济研究是对经济变量
4、之间关系的研究,针对某一具体计量经济研究是对经济变量之间关系的研究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间有经济问题展开研究时,首先需要考察的就是相关经济变量之间有没有关系、有什么样的关系。没有关系、有什么样的关系。确定的函数关系确定的函数关系 不确定的相关关系不确定的相关关系 经济变量之间的关系经济变量之间的关系 一、相关分析与回归分析一、相关分析与回归分析函数关系函数关系 指某一经济变量可直接表示为其他经济变量的确定的函数,指某一经济变量可直接表示为其他经济变量的确定的函数,函数表达式中没有未知参数,不存在参数估计的问题。函数表达式中没有未知参数,不存在参数估计
5、的问题。1)某一商品的销售收入某一商品的销售收入Y与单价与单价P、销售数量销售数量Q之间的关系之间的关系Y=PQ 2)某一农作物的产量某一农作物的产量Q与单位面积产量与单位面积产量q、种植面积种植面积S之间的关系之间的关系Q=q S例如例如:一、相关分析与回归分析一、相关分析与回归分析相关关系相关关系 指不同经济变量的变化趋势之间存在某种不确定的联系,某一或指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。一确定,但按某种规律有一定
6、的取值范围。居民消费居民消费C与可支配收入与可支配收入Y之间的关系,可支配收入的取值之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,确定后,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y,遵循边际消费倾向递减的规律。居民消费遵循边际消费倾向递减的规律。居民消费C与可与可支配收入支配收入Y之间的关系可表示为之间的关系可表示为C=+Y,、为待估参为待估参数。数。例如例如:相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。一、相关分析与回归分析一、相关分析与回归分析相关关
7、系的分类相关关系的分类 a)a)按照涉及的变量的数量按照涉及的变量的数量 单相关单相关(一元相关一元相关)复相关复相关(多元相关多元相关)-指两个经济变量之间存在的相关关系指两个经济变量之间存在的相关关系 -指多个经济变量之间存在的相关关系指多个经济变量之间存在的相关关系,可能是几个可能是几个经济变量的某种综合效果与一个经济变量有趋势方面的联系。经济变量的某种综合效果与一个经济变量有趋势方面的联系。一、相关分析与回归分析一、相关分析与回归分析相关关系的分类相关关系的分类 b)b)按照相关的程度按照相关的程度 完全相关完全相关不完全相关不完全相关不相关不相关介于完全相关与不相关之间的情况。介于完
8、全相关与不相关之间的情况。极强的相关关系极强的相关关系,指某一或某几个经济变量的取值确指某一或某几个经济变量的取值确定后,对应的另一经济变量的取值能唯一确定,实际定后,对应的另一经济变量的取值能唯一确定,实际上是确定的函数关系,所以函数关系可看作是相关关上是确定的函数关系,所以函数关系可看作是相关关系的特例。系的特例。极弱的相关关系极弱的相关关系,指某一或某几个经济变量的取值确指某一或某几个经济变量的取值确定后,对应的另一经济变量不仅取值不能唯一确定,定后,对应的另一经济变量不仅取值不能唯一确定,而且取值范围也不能确定。而且取值范围也不能确定。一、相关分析与回归分析一、相关分析与回归分析相关关
9、系的分类相关关系的分类 c)c)按照相关的性质按照相关的性质正相关正相关负相关负相关指不同经济变量的变化趋势一致,即一个经济变量的指不同经济变量的变化趋势一致,即一个经济变量的取值由小变大时,另一经济变量的取值也由小变大;取值由小变大时,另一经济变量的取值也由小变大;指不同经济变量的变化趋势相反,即一个经济变量的指不同经济变量的变化趋势相反,即一个经济变量的取值由小变大时,另一经济变量的取值由大变小。取值由小变大时,另一经济变量的取值由大变小。一、相关分析与回归分析一、相关分析与回归分析相关关系的分类相关关系的分类 c)c)按照相关的性质按照相关的性质线性相关线性相关非线性相关非线性相关指相关
10、变量之间的关系可由线性函数近似表示,即由指相关变量之间的关系可由线性函数近似表示,即由相关变量的取值绘制的散点图趋向于直线形式;相关变量的取值绘制的散点图趋向于直线形式;指相关变量之间的关系可由某种非线性函数近似表指相关变量之间的关系可由某种非线性函数近似表示,即由相关变量的取值绘制的散点图趋向于某种示,即由相关变量的取值绘制的散点图趋向于某种曲线形式。曲线形式。一、相关分析与回归分析一、相关分析与回归分析函数关系与相关关系的区别函数关系与相关关系的区别 确定的函数关系可以直接用于经济活动,无需分析。确定的函数关系可以直接用于经济活动,无需分析。不确定的相关关系,隐含着某种经济规律,是有关研究
11、的重点不确定的相关关系,隐含着某种经济规律,是有关研究的重点 一、相关分析与回归分析一、相关分析与回归分析 2.2.相关分析相关分析 研究变量之间的相关关系的形式和程度的一种统计分析方法,主要研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。绘制变量之间关系的散点图绘制变量之间关系的散点图例如例如:判断相关关系是线性相关还是非线性相判断相关关系是线性相关还是非线性相关、正相关还是负相关;关、正相关还是负相关;计算变量之间的相关系数计算变量之间的相关系数度量变量之间的线性相
12、关的程度、判断线度量变量之间的线性相关的程度、判断线性相关关系是正相关还是负相关性相关关系是正相关还是负相关 一、相关分析与回归分析一、相关分析与回归分析相关系数相关系数 十九世纪末十九世纪末英国著名统计学家卡尔英国著名统计学家卡尔皮尔逊(皮尔逊(Karl Pearson)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数)两个两个变变量量X和和Y的的总总体相关系数体相关系数为为其中,其中,是是变变量量X、Y的的协协方差,方差,、分分别别是是变变量量X、Y的方差。的方差。(2-1)一、相关分析与回归分析一、相关分析与回归分析(
13、2-2)(2-3)如果如果给给定定变变量量X、Y 的一的一组样组样本本 ,则总则总体相关系数的估体相关系数的估计计样样本相关系数本相关系数为为n,或或相关系数的取值介于相关系数的取值介于 11之间,之间,取值为负表示两变量之间存在负相关关系;取值为负表示两变量之间存在负相关关系;取值为正表示两变量之间存在正相关关系;取值为正表示两变量之间存在正相关关系;取值为取值为 1表示两变量之间存在完全负相关关系;表示两变量之间存在完全负相关关系;取值为取值为0表示两变量不相关;表示两变量不相关;取值为取值为1表示两变量之间存在完全正相关关系。表示两变量之间存在完全正相关关系。一、相关分析与回归分析一、相
14、关分析与回归分析对变量间对变量间统计依赖关系统计依赖关系的考察主要是通过的考察主要是通过相关分析相关分析(correlation analysis)correlation analysis)或或回归分析回归分析(regression analysis)regression analysis)来完成的:来完成的:例如例如:函数关系:函数关系:统计依赖关系统计依赖关系/统计相关关系:统计相关关系:3.3.回归分析回归分析 研究研究不仅存在相关关系而且存在因果关系不仅存在相关关系而且存在因果关系的变量之间的依存关系的的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础,一种分析理论与方
15、法,是计量经济学的方法论基础,主要内容主要内容 1)设定理论模型,)设定理论模型,描述变量之间的因果关系描述变量之间的因果关系;2)根据样本观察数据利用适当方法对模型参数进行估计,)根据样本观察数据利用适当方法对模型参数进行估计,得到回归方程得到回归方程;3)对回归方程中的)对回归方程中的变量、方程进行显著性检验变量、方程进行显著性检验,推求,推求参数参数 的置信区间、模型的预测置信区间的置信区间、模型的预测置信区间;4)利用回归模型解决实际经济问题。)利用回归模型解决实际经济问题。一、相关分析与回归分析一、相关分析与回归分析 4.4.相关分析与回归分析之间的关系相关分析与回归分析之间的关系联
16、系:联系:1)都是对)都是对存在相关关系存在相关关系的变量的的变量的统计相关关系统计相关关系的研究;的研究;2)都能测度线性)都能测度线性相关程度的大小相关程度的大小;3)都能判断线性相关关系是)都能判断线性相关关系是正相关还是负相关正相关还是负相关。4.4.相关分析与回归分析之间的关系相关分析与回归分析之间的关系区别:区别:1)相关分析相关分析仅仅是从统计数据上测度变量之间的相关程度,仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而不考虑两者之间是否存在因果关系,因而变量的地位在相变量的地位在相 关分析中是对等的;关分析中是对等的;回归分析回归分析是对变量之间的
17、因果关系的分析,是对变量之间的因果关系的分析,变量的地位是变量的地位是 不对等的不对等的,有被解释变量和解释变量之分。,有被解释变量和解释变量之分。2)相关分析相关分析主要关注变量之间的主要关注变量之间的相关程度和性质相关程度和性质,不关注变,不关注变 量之间的具体依赖关系。量之间的具体依赖关系。回归分析回归分析在关注变量之间的相关程度和性质的同时,更关注变量在关注变量之间的相关程度和性质的同时,更关注变量 之间的具体依赖关系,因而可以深入分析变量间的依存关系,有之间的具体依赖关系,因而可以深入分析变量间的依存关系,有 可能达到掌握其内在规律可能达到掌握其内在规律的目的,具有更重要的实践意义。
18、的目的,具有更重要的实践意义。习习 题题下表列出若干对自变量与因变量。对每一对变量,你认下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。?并说明理由。因因变变量量自自变变量量GNP利率利率个人个人储储蓄蓄利率利率小麦小麦产产出出降雨量降雨量美国国防开支美国国防开支前前苏联苏联国防开国防开支支棒球明星本棒球明星本垒垒打的次数打的次数其年薪其年薪总统总统声誉声誉任任职时间职时间学生学生计计量量经济经济学成学成绩绩其其统计统计学成学成绩绩日本汽日本汽车车的的进进口量口量美国人均国民美国人均国
19、民收入收入含有随机误差项是含有随机误差项是计量经济学模型计量经济学模型与与数理经济模型数理经济模型的一大区别。的一大区别。例如例如:对于供给不足下的生产活动,可以认为产出是由资本、劳动、对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。的增加而增加,但要素的边际产出递减。数理经济模型数理经济模型用确定性的函数描述用确定性的函数描述经济变经济变量之量之间间的理的理论论关系,关系,对这对这一一经济经济活活动动,笼统笼统地描述地描述为为或具体地用某一
20、种生或具体地用某一种生产产函数描述函数描述为为其中,其中,Q表示表示产产出,出,T表示技术,表示技术,K表示资本,表示资本,L表示劳动,表示劳动,A、是未知参数。是未知参数。二、随机误差项二、随机误差项例如例如:对于供给不足下的生产活动,可以认为产出是由资本、劳动、对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。的增加而增加,但要素的边际产出递减。计量经济学模型计量经济学模型用随机方程揭示用随机方程揭示经济变经济变量之量之间间的因果关系,的因
21、果关系,对对于于这这一一经济经济活活动动,与上述数理,与上述数理经济经济模型相模型相对应对应,描述,描述为为或描述或描述为对为对数数线线性函数形式性函数形式其中,其中,是随机是随机误误差差项项。二、随机误差项二、随机误差项随机误差项随机误差项称为随机扰动项或随机干扰项(称为随机扰动项或随机干扰项(stochastic disturbance)一般用希腊字母一般用希腊字母或或表示表示存在原因存在原因 第一,人类的第一,人类的经济行为本身经济行为本身带有随机性;带有随机性;第二,通常一个变量第二,通常一个变量总是受众多因素总是受众多因素的影响;的影响;第三,任何函数反映经济变量之间的关系都只是第三
22、,任何函数反映经济变量之间的关系都只是一种简化反映一种简化反映;第四,经济数据来源于调查统计,而第四,经济数据来源于调查统计,而非严格的控制实验非严格的控制实验;二、随机误差项二、随机误差项结论结论 一个经济变量通常不能被另一个经济变量一个经济变量通常不能被另一个经济变量完全精确完全精确地决定,需要地决定,需要引入随机误差项来反映各种误差的引入随机误差项来反映各种误差的综合影响综合影响,主要包括:,主要包括:1)变量的内在变量的内在随机性的影响;随机性的影响;2)解释变量中)解释变量中被忽略的因素被忽略的因素的影响;的影响;3)模型关系设定模型关系设定误差的影响;误差的影响;4)变量观察值的)
23、变量观察值的观察误差观察误差的影响;的影响;5)其他随机因素其他随机因素的影响。的影响。二、随机误差项二、随机误差项 有何特性?有何特性?l众多因素对被解释变量Y的影响代表的综合体l对Y的影响方向有正有负l由于是次要因素代表,对Y的总平均影响可能是0l对Y的影响是非趋势性的,而是随机扰动。二、随机误差项二、随机误差项习习 题题例例1、令、令kids表示一名妇女生育孩子的数目,表示一名妇女生育孩子的数目,educ表示该表示该妇女接受过教育的年数。生育率对教育年数的简单回归模妇女接受过教育的年数。生育率对教育年数的简单回归模型为型为(1)随机扰动项包含什么样的因素?它们可能与教育水)随机扰动项包含
24、什么样的因素?它们可能与教育水平相关吗?平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。件不变下的影响吗?请解释。习题答案习题答案(1)收入、年龄、家庭状况、政府的相关政策等也是影)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教关,如收入水平与教育水平往往呈正相关、年
25、龄大小与教育水平呈负相关等。育水平呈负相关等。(2)当归结在随机扰动项中的重要影响因素与模型中的)当归结在随机扰动项中的重要影响因素与模型中的教育水平教育水平educ相关时,上述回归模型不能够揭示教育对相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设与随机扰动项相关的情形,基本假设4不满足。不满足。1 1总体回归曲线与总体回归函数总体回归曲线与总体回归函数 给定解释变量条件下给定解释变量条件下被解释变量的被解释变量的期望轨迹期望轨迹称为称为总体回归曲线总体回归曲线(popul
26、ation regression curve),),或或总体回归线总体回归线(population regression line)。)。描述总体回归曲线的函数称为描述总体回归曲线的函数称为总体回归函数总体回归函数(population regression function)。)。三、总体回归模型三、总体回归模型对对于只有于只有一个解一个解释变释变量量X的情形,总体回归函数为的情形,总体回归函数为(2-4)与之与之对应对应,是是X的函数。的函数。,都有被解,都有被解释变释变量量Y的的条件期望条件期望表示表示对对于解于解释变释变量量X的每一个取值的每一个取值 对对于含有于含有多个解多个解释变释
27、变量量 、的情形,的情形,总总体回体回归归函数函数为为(2-5)表示表示对对于解于解释变释变量量的每一的每一组组取取值值,都有被解,都有被解释变释变量量Y的的条件期望条件期望与之与之对应对应,是是的函数。的函数。、三、总体回归模型三、总体回归模型例2-1 假假设设一个由一个由100个家庭构成的个家庭构成的总总体,并假体,并假设这设这100个家庭的个家庭的月可支配收入水平只限于月可支配收入水平只限于1300元、元、1800元、元、2300元、元、2800元、元、3300元、元、3800元、元、4300元、元、4800元、元、5300元、元、5800元元10种情况,每个家庭的月可支配收入与消种情况
28、,每个家庭的月可支配收入与消费费数据如表数据如表2-1所示,所示,要研究要研究这这一一总总体的家庭月消体的家庭月消费费支出支出Y与家庭月可支配收入与家庭月可支配收入X之之间的关系,以便根据已知的家庭月可支配收入水平测算该总间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。体的家庭月消费支出平均水平。可支配收入可支配收入X1300180023002800330038004300480053005800消消费费支出支出Y103311261207112012081256132714391584112811671231128813711439145215331597167
29、617931455150116351728178918351886194320332178229423512410178818351872190319652061215722062289231423902426245824782543196620482122221323152357236923982452250125342568261026592723219722862315238624672581262326772710298530043082311931022436258826722736280128932902302731553260276528532900302130653146327
30、8330534233022315634013669表表2-1 100个家庭的月可支配收入与消费数据个家庭的月可支配收入与消费数据 单位:元单位:元 家庭消费支出主要取决于家庭可支配收入,但不是唯一取决于家家庭消费支出主要取决于家庭可支配收入,但不是唯一取决于家庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不同家庭的消费支出各不相同。收入相同的不同家庭的消费支出各不相同。由于是由于是对总对总体的考察,由表体的考察,由表2-1可求得家庭可支配收入可求得家庭可支配收入X为某一特定数值为某一特定数值时家庭消费支出时家庭
31、消费支出Y的条件分布(的条件分布(conditional distribution)例如,例如,X=2300条件下,条件下,Y=1371的条件概率等于的条件概率等于1/11,即,即 由此可求得由此可求得对应对应于家庭可支配收入于家庭可支配收入X的各个水平的家庭消费支出的各个水平的家庭消费支出Y的的条件条件 均值均值(conditional mean)或称为或称为条件期望条件期望(conditional expectation),),如表如表2-2所示。所示。析:表表2-2 100个家庭的月可支配收入与消费数据个家庭的月可支配收入与消费数据 单位:元单位:元 可支配收入可支配收入X1300180
32、023002800330038004300480053005800E(Y/Xi)1122132414251926217923892681284730843312 由表由表2-1、表、表2-2中的数据绘制不同可支配收入家庭的消费支出散中的数据绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的总体回归曲线,如图点图、家庭消费支出与可支配收入关系的总体回归曲线,如图2-1所示。所示。从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体趋势随可支配收入的增加而增加,总体回归曲线反映了这一趋势。趋势随可支配收入的
33、增加而增加,总体回归曲线反映了这一趋势。回归函数(回归函数(PRF)说明被解释变量说明被解释变量Y的平均状态(总的平均状态(总体条件期望)随解释变量体条件期望)随解释变量X变化的规律。变化的规律。含义:含义:函数形式:函数形式:可以是线性或非线性的。可以是线性或非线性的。将居民消费支出看成是其可支配收入的线性函数时将居民消费支出看成是其可支配收入的线性函数时:为为一一线性函数。线性函数。其中,其中,0 0,1 1是未知参数,称为是未知参数,称为回归系回归系数数(regression coefficients)。)。三、总体回归模型三、总体回归模型 事实上,经济活动中的总体包含的个体的数量往往非
34、常多,一般不事实上,经济活动中的总体包含的个体的数量往往非常多,一般不大可能像例大可能像例2-1假设的那样假设的那样得到总体中所有个体的观察数据得到总体中所有个体的观察数据,因此也就不,因此也就不大可能依据总体的所有观察数据大可能依据总体的所有观察数据计算得到被解释变量计算得到被解释变量Y的条件期望的条件期望,无,无法画出精确的总体回归曲线,相应地,总体回归函数的具体形式也无法法画出精确的总体回归曲线,相应地,总体回归函数的具体形式也无法精确确定。精确确定。所以,所以,对于总体回归函数对于总体回归函数,通常只能根据经济理论或实践经验进行,通常只能根据经济理论或实践经验进行设定,也就是说,设定,
35、也就是说,通常需要对总体回归函数作出合理的假设通常需要对总体回归函数作出合理的假设。三、总体回归模型三、总体回归模型2 2总体回归模型总体回归模型 可由其期望可由其期望值值 和随机和随机误误差差项项 表示表示为为 对对于只有于只有一个解一个解释变释变量量X的情形,第的情形,第i个个体的被解释变量的观察值个个体的被解释变量的观察值 (2-6)(2-7)可由其期望可由其期望值值 和随机和随机误误差差项项 表示表示为为 对对于含有于含有多个解多个解释变释变量量 的情形,第的情形,第i个个体的被解个个体的被解释变释变量的量的观观察察值值 、(2-6)或式()或式(2-7)是总体回归函数的个别值表示方式
36、,因为引入了随机)是总体回归函数的个别值表示方式,因为引入了随机误差项,称为误差项,称为总体回归函数的随机设定形式总体回归函数的随机设定形式,也,也是因为引入了随机误差项是因为引入了随机误差项,成为计量经济学模型,称为成为计量经济学模型,称为总体回归模型总体回归模型(population regression model)。)。三、总体回归模型三、总体回归模型 或或 ,是,是 或或 对应对应的的的平均状的平均状态态,反映解释变量对被解释变量的影响反映解释变量对被解释变量的影响,称,称为为系系统统性(性(systematic)部分或确定性(部分或确定性(deterministic)部分;部分;另
37、一部分另一部分是随机是随机误误差差项项 ,是,是观观察察值值 围绕围绕它的期望它的期望值值 或或反映解释变量之外的诸多随机因素对被解释变量的影响,称为反映解释变量之外的诸多随机因素对被解释变量的影响,称为非系统性非系统性(nonsystematic)部分或随机(部分或随机(stochastic)部分。部分。总总体回体回归归模型中,模型中,观观察察值值 是两部分之和,是两部分之和,一部分一部分是是 的期望的期望值值的离差(的离差(deviation),),三、总体回归模型三、总体回归模型例:例:个别家庭的消费支出为:个别家庭的消费支出为:(*)式称为)式称为总体回归函数(方程)总体回归函数(方程
38、)PRFPRF的随机设定形式。的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响素的随机性影响。(1)该收入水平下所有家庭的平均消费支出该收入水平下所有家庭的平均消费支出E(Y|XE(Y|Xi i),称为称为系统性(系统性(systematic)或确定性或确定性(deterministic)部分部分。(2)其他随机或非确定性()其他随机或非确定性(nonsystematic)部分部分 i。即,给定收入水平即,给定收入水平Xi,个别家庭的支出可表示为两部分之和个别家庭的支出可表示为两部分之和:(*)由于方程中
39、引入了随机项,成为计量经济学模型,因此由于方程中引入了随机项,成为计量经济学模型,因此也称为也称为总体回归模型总体回归模型。三、总体回归模型三、总体回归模型3 3线性总体回归模型线性总体回归模型确定性部分为线性函数确定性部分为线性函数的总体回归模型称为的总体回归模型称为线性总体回归模型线性总体回归模型。线性总体回归模型是计量经济学中线性总体回归模型是计量经济学中最常见最常见的总体回归模型。的总体回归模型。只含有只含有一个解释变量一个解释变量的线性总体回归模型称为的线性总体回归模型称为一元线性总体回归模型,一元线性总体回归模型,简称一元线性回归模型或简单线性回归模型(简称一元线性回归模型或简单线
40、性回归模型(simple linear regression model),),其一般形式是其一般形式是(2-8)其中,其中,Y为被解释变量,为被解释变量,X为解释变量,为解释变量,、为为待估参数,待估参数,为为随机随机误误差差项项,为观测值为观测值下下标标,为样为样本容量。本容量。称为称为回归系数回归系数(regression coefficients),),三、总体回归模型三、总体回归模型3 3线性总体回归模型线性总体回归模型 含有含有多个解多个解释变释变量量的的线线性性总总体回体回归归模型称模型称为为多元多元线线性性总总体回体回归归模型模型,简简称称多元多元线线性回性回归归模型(模型(m
41、ultiple linear regression model),),其一般形式是其一般形式是 (2-9)其中,其中,Y为被解释变量,为被解释变量,为为解解释变释变量,量,为为待估参数,即待估参数,即回回归归系数系数,、为为随机随机误误差差项项,为观测值为观测值下下标标,为样为样本容量。本容量。三、总体回归模型三、总体回归模型 注意:注意:这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也,即待估参数都只以一次方出现,解释变量可以是线性的,也可
42、以不是线性的。可以不是线性的。例如:例如:都是线性回归模型。都是线性回归模型。三、总体回归模型三、总体回归模型 注意:例如:都不是线性回归模型。都不是线性回归模型。三、总体回归模型三、总体回归模型 对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可化为线性回归模型的一般形式。化为线性回归模型的一般形式。例如:模型模型 令令,可将模型化,可将模型化为为 三、总体回归模型三、总体回归模型4 4线性回归模型的普遍性线性回归模型的普遍性例如,著名的例如,著名的Cobb-Dauglas生产函数表现为幂函数形式,生产函数表现为幂函数形式,著
43、名的菲利普斯曲线(著名的菲利普斯曲线(Phillips curves)表现为双曲线形式。表现为双曲线形式。一般情况下,对于只含有乘、除、指数、幂运算的非线性关系,可通过一般情况下,对于只含有乘、除、指数、幂运算的非线性关系,可通过对对数变化数变化化为线性关系化为线性关系,以,以Cobb-Dauglas生产函数生产函数为例,方程两边取对数,可化为线性形式为例,方程两边取对数,可化为线性形式三、总体回归模型三、总体回归模型对于其他复杂的函数形式,可通过对于其他复杂的函数形式,可通过级数展开级数展开化为线性形式化为线性形式 ,然后在点,然后在点 可先根据所掌握的信息确定参数可先根据所掌握的信息确定参
44、数、的一组初始值的一组初始值、(),处处对模型作泰勒级数展开对模型作泰勒级数展开,并取一阶近似值,得,并取一阶近似值,得 例如,对于模型例如,对于模型 余余项项整理得整理得+余余项项三、总体回归模型三、总体回归模型+余余项项令令,余余项项原模型可化为原模型可化为三、总体回归模型三、总体回归模型 总体的信息往往无法掌握,现实的情况只能是在一总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。次观测中得到总体的一个样本。问题问题1:能从一次抽样中获得总体的近似的信息吗?能从一次抽样中获得总体的近似的信息吗?回答:能回答:能四、样本回归模型四、样本回归模型问题问题2:如果可以,如
45、何从抽样中获得总体的近似信息?如果可以,如何从抽样中获得总体的近似信息?1 1样本回归函数与样本回归曲线样本回归函数与样本回归曲线根据样本数据根据样本数据对总体回归函数作出的估计称为对总体回归函数作出的估计称为样本回归函数样本回归函数。由样本回归函数绘制的曲线称为由样本回归函数绘制的曲线称为样本回归曲线样本回归曲线(样本回归线)。(样本回归线)。四、样本回归模型四、样本回归模型例2-2 假设没有取得总体中所有家庭的可支配收入与消费支出数据,而假设没有取得总体中所有家庭的可支配收入与消费支出数据,而是按可支配收入水平的不同水平调查是按可支配收入水平的不同水平调查取得了一组有代表性的样本取得了一组
46、有代表性的样本,如,如表表2-3所示。所示。表表2-3 家庭月可支配收入与消费支出的一个样本家庭月可支配收入与消费支出的一个样本 单位:元单位:元 可支配收入可支配收入X1300180023002800330038004300480053005800消消费费支出支出Y1126132714391886220623982677289330653401 以例以例2-1为例(为例(假假设设一个由一个由100个家庭构成的个家庭构成的总总体,并假体,并假设这设这100个家个家庭的月可支配收入水平只限于庭的月可支配收入水平只限于1300元、元、1800元、元、2300元、元、2800元、元、3300元、元、
47、800元、元、4300元、元、4800元、元、5300元、元、5800元元10种情况,每个种情况,每个家庭的月可支配收入与消家庭的月可支配收入与消费费数据如表数据如表2-1所示,要研究所示,要研究这这一一总总体的家体的家庭月消庭月消费费支出支出Y与家庭月可支配收入与家庭月可支配收入X之间的关系,以便根据已知的之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。)家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。)若将家庭月可支配收入若将家庭月可支配收入X与消与消费费支出支出Y的的总总体回体回归归函数函数设设定定为为一元一元线线性回性回归归函数的形式函数的形式
48、,从而得到,从而得到样样本回本回归归函数函数可采用适当方法根据可采用适当方法根据表表2-32-3中的数据得到参数中的数据得到参数、的估的估计计、四、样本回归模型四、样本回归模型 根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的样本回归线,如图散点图、家庭消费支出与可支配收入关系的样本回归线,如图2-2所示。所示。从图中可以清晰地看出,样本回归线是通过从图中可以清晰地看出,样本回归线是通过对样本数据的较好的拟合对样本数据的较好的拟合对总对总体回归线作出的一种估计。体回归线作出的一种估计。
49、这里这里将将样本回归线样本回归线看成看成总体回归线总体回归线的近似替代的近似替代则则 注意:注意:回回归归分分析析的的主主要要目目的的:根根据据样样本本回回归归函函数数SRF,估估计计总体回归函数总体回归函数PRF。注意:注意:这里这里PRF可能永可能永远无法知道。远无法知道。即,根据即,根据 估计估计2 2样本回归模型样本回归模型 引入引入样样本回本回归归函数中的函数中的代表各种随机因素影响的随机变量,代表各种随机因素影响的随机变量,称称为为样样本残差本残差项项、回回归归残差残差项项或或样样本剩余本剩余项项、回回归归剩余剩余项项,简简称称残差残差项项或剩余或剩余项项(residual),),
50、通常用通常用表示表示。在样本回归函数中引入残差项后,得到的是随机方程,成为在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为了计量经济学模型,称为样本回归模型样本回归模型。对于例对于例2-2中的样本回归函数中的样本回归函数 引入引入残差残差项项可得可得样样本回本回归归模型模型例如:四、样本回归模型四、样本回归模型3 3线性样本回归模型线性样本回归模型确定性部分确定性部分+随机部分随机部分 =样本回归模型样本回归模型确定性部分是线性函数的样本回归模型称为确定性部分是线性函数的样本回归模型称为线性样本回归模型线性样本回归模型。只含有一个解释变量的线性样本回归模型称为只含有一