《元线性回归模型(2).ppt》由会员分享,可在线阅读,更多相关《元线性回归模型(2).ppt(99页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第二章第二章 经典单方程计量经济学模型:经典单方程计量经济学模型:一元线性回归模型一元线性回归模型 回归分析概述回归分析概述 一元线性回归模型的参数估计一元线性回归模型的参数估计 一元线性回归模型检验一元线性回归模型检验一元线性回归模型预测一元线性回归模型预测实例分析实例分析2授课目标与要求:授课目标与要求:经典单方程计量经济学模型的一元线性回归模型,是经典单方程计量经济学模型的一元线性回归模型,是课程最基础的内容。通过教学,要求学生达到:课程最基础的内容。通过教学,要求学生达到:理解经典线性单方程计量经济学模型的数理统计学基理解经典线性单方程计量经济学模型的数理统计学基础,包括回归分析、假
2、设检验和区间估计;础,包括回归分析、假设检验和区间估计;熟练掌握经典线性单方程计量经济学模型的理论与方熟练掌握经典线性单方程计量经济学模型的理论与方法,包括基本假设、模型估计和统计检验;法,包括基本假设、模型估计和统计检验;理解最小二乘原理和最大或然原理,以及在模型估计理解最小二乘原理和最大或然原理,以及在模型估计中的应用。中的应用。本章重点和难点:本章重点和难点:第二节:一元线性回归模型的参数估计第二节:一元线性回归模型的参数估计 第三节:一元线性回归模型的统计检验第三节:一元线性回归模型的统计检验 32.1 2.1 回归分析概述回归分析概述一、一、回归分析的基本概念回归分析的基本概念二、二
3、、简单线性相关分析简单线性相关分析三、三、总体回归函数(总体回归函数(PRFPRF)四、四、随机扰动项随机扰动项五、五、样本回归函数(样本回归函数(SRFSRF)4一、回归分析的基本概念一、回归分析的基本概念 变量间的关系变量间的关系 相关分析的基本概念相关分析的基本概念 回归分析的基本概念回归分析的基本概念 几点注意事项几点注意事项 51.1.变量间的关系变量间的关系确定性关系或函数关系:研究的是确定现象非随机变确定性关系或函数关系:研究的是确定现象非随机变量间的关系。量间的关系。统计依赖或相关关系:研究的是随机变量间的非确定统计依赖或相关关系:研究的是随机变量间的非确定关系。关系。又分为简
4、单相关(存在于两个变量之间的相关又分为简单相关(存在于两个变量之间的相关关系)和多重相关(存在于三个及以上变量之间的相关系)和多重相关(存在于三个及以上变量之间的相关关系)。关关系)。模糊关系(随机变量的似有似无)模糊关系(随机变量的似有似无)62 2、相关分析的基本概念、相关分析的基本概念相关关系,相关关系,是指两个或两个以上的变量,其是指两个或两个以上的变量,其样本序列观测样本序列观测值值之间表现出来的随机数学关系,常用相关系数来衡量,之间表现出来的随机数学关系,常用相关系数来衡量,主要用来判断变量间是否相关。如果两个变量样本序列观主要用来判断变量间是否相关。如果两个变量样本序列观测值之间
5、的相关系数的绝对值为测值之间的相关系数的绝对值为1 1,则二者之间具有完全的,则二者之间具有完全的相关关系。相关关系。偏相关关系,偏相关关系,是指一个变量与其他两个或两个以上变量的是指一个变量与其他两个或两个以上变量的线性组合之间的相关关系。该变量与每一个变量间的相关线性组合之间的相关关系。该变量与每一个变量间的相关系数又称系数又称偏相关系数。偏相关系数。因果关系,因果关系,是指两个或两个以上的变量,在行为机制等方是指两个或两个以上的变量,在行为机制等方面上的依赖性。面上的依赖性。因果关系有单向因果关系和双向因果关系因果关系有单向因果关系和双向因果关系之分。之分。如:价格与供给,价格与需求,投
6、资与如:价格与供给,价格与需求,投资与GDPGDP等。等。具有具有因果关系的变量之间一定具有数学上的相关关系;而因果关系的变量之间一定具有数学上的相关关系;而具有相关关系的变量之间并不一定就具有因果关系。具有相关关系的变量之间并不一定就具有因果关系。如:如:GDPGDP与一棵小树的生长速度,中国与一棵小树的生长速度,中国GDPGDP与印度人口的关系。与印度人口的关系。相关分析,相关分析,是判断变量之间是否具有相关关系的一种数学是判断变量之间是否具有相关关系的一种数学分析方法,一般是通过计算变量之间的相关系数来实现。分析方法,一般是通过计算变量之间的相关系数来实现。7对变量间对变量间统计依赖关系
7、统计依赖关系的考察主要是通过的考察主要是通过相关分析相关分析(correlation)或或回归分析(回归分析(regression)来完成的。来完成的。相关分析是讨论变量之间相关程度的一种统计分析方法。相关分析是讨论变量之间相关程度的一种统计分析方法。在相关分析中,通常假设两个变量:在相关分析中,通常假设两个变量:对其是同等看待的,对其是同等看待的,不考虑其因果关系,不考虑其因果关系,对自变量和因变量不加区别,对自变量和因变量不加区别,两个变量均是两个变量均是随机变量随机变量。正相关正相关线性相关线性相关 不相关不相关 相关系数相关系数(-11)统计依赖关系统计依赖关系 负相关负相关 有因果关
8、系有因果关系 回归分析回归分析 正相关正相关无因果关系无因果关系 相关分析相关分析 非线性相关非线性相关 不相关不相关 负相关负相关83 3、回归分析的基本概念、回归分析的基本概念回归分析,回归分析,回归分析也是判断变量间是否相关的一种数学回归分析也是判断变量间是否相关的一种数学分析方法,他着重判断一个随机变量与一个或几个可控变分析方法,他着重判断一个随机变量与一个或几个可控变量之间是否具有依赖关系的计算方法和理论。量之间是否具有依赖关系的计算方法和理论。其目的其目的在于通过后者的已知或设定值,去估计和(或)预在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。测前者的(总体)均
9、值。因果分析,因果分析,是分析变量之间的原因和结果。由于回归分析是分析变量之间的原因和结果。由于回归分析的特定功能,回归分析也通常被用来进行变量之间的因果的特定功能,回归分析也通常被用来进行变量之间的因果分析。但仅靠回归分析还不能对变量间的因果关系做出最分析。但仅靠回归分析还不能对变量间的因果关系做出最后的判断,必须与经济行为的定性分析等相结合。后的判断,必须与经济行为的定性分析等相结合。回归分析是计量经济学的方法论基础,其主要内容包括:回归分析是计量经济学的方法论基础,其主要内容包括:根据样本观察值对经济计量模型参数进行估计,求得回归根据样本观察值对经济计量模型参数进行估计,求得回归方程;方
10、程;对回归方程、参数估计值进行显著性检验;对回归方程、参数估计值进行显著性检验;利用回归方程进行分析、评价及预测。利用回归方程进行分析、评价及预测。94 4、注意事项、注意事项不线性相关并不意味着不相关。不线性相关并不意味着不相关。有相关关系并不意味着一定有因果关系。有相关关系并不意味着一定有因果关系。回归分析和相关分析:都是回归分析和相关分析:都是研究随机变量间的统计研究随机变量间的统计依赖关系,并能测度线性依赖程度的大小,不关注依赖关系,并能测度线性依赖程度的大小,不关注具体的依赖关系。但它们并不意味着一定有因果关具体的依赖关系。但它们并不意味着一定有因果关系。系。相关分析:仅仅从统计数据
11、上测度变量间的相关程相关分析:仅仅从统计数据上测度变量间的相关程度,无需考察两者间的因果关系,度,无需考察两者间的因果关系,对称地对待任何对称地对待任何(两个)变量,两个变量都被看作是随机的。(两个)变量,两个变量都被看作是随机的。回归分析:更注重变量间的因果关系和具体的依赖回归分析:更注重变量间的因果关系和具体的依赖关系,关系,对变量的处理方法存在不对称性,即区分应对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量),前者变量(被解释变量)和自变量(解释变量),前者是随机变量,后者不是。是随机变量,后者不是。10二、简单线性相关分析二、简单线性相关分析 总体相关系数总
12、体相关系数 样本相关系数样本相关系数 样本相关系数的取值范围样本相关系数的取值范围 相关系数的显著性检验相关系数的显著性检验 线性相关理论的局限性线性相关理论的局限性111 1、总体相关系数、总体相关系数总体相关系数。总体相关系数。通过观察散点图只能得到两个变量之通过观察散点图只能得到两个变量之间相关关系的一个粗略概念。要想精确刻画他们之间间相关关系的一个粗略概念。要想精确刻画他们之间的相关程度,需要采用一个数量指标的相关程度,需要采用一个数量指标相关系数来描相关系数来描述。大致进行分析判断。两个变量述。大致进行分析判断。两个变量X、Y之间真实的相之间真实的相关程度,使用总体相关系数关程度,使
13、用总体相关系数来表示的,即:来表示的,即:=Cov(X,Y)/(Var(X)Var(Y)1/2=XY/(X2Y2)1/2可以证明总体相关系数的取值范围定义为可以证明总体相关系数的取值范围定义为-1到到1之间,之间,即:即:-1,1,当,当其取不同值时,两变量间的相关其取不同值时,两变量间的相关关系也就确定了。关系也就确定了。122 2、样本相关系数、样本相关系数样本相关系数。样本相关系数。由于由于两个变量两个变量X、Y之间的总体相关系数之间的总体相关系数一般无一般无法获得,因此经常用某个特定的样本相关系数法获得,因此经常用某个特定的样本相关系数r作为总体相关系作为总体相关系数数的一个估计值(或
14、替代值)。假定:有一个样本容量为的一个估计值(或替代值)。假定:有一个样本容量为n的的样本,在样本,在X、Y平面上的散点图如下:平面上的散点图如下:今令均值为:今令均值为:X=Xi/n,Y=Yi/n;令离差变量为:令离差变量为:xi=Xi-X,yi=Yi-Y。Yi在散点图上作均值在散点图上作均值X、Y的直线。的直线。.xi、yi表示第表示第i个观测点与均值个观测点与均值 .(X、Y)偏离的远近和方向。偏离的远近和方向。.在散点图上:在散点图上:在散点图上:在散点图上:当当(Xi,Yi)落在落在 Y .、象限时,象限时,xi、yi同号,同号,.yi .即即xiyi0;否则;否则xiyi0;否则;
15、否则xiyi r时,则时,则X,Y显著线性相关,否显著线性相关,否则不显著。则不显著。165 5、线性相关理论的局限性、线性相关理论的局限性 上述线性相关理论,上述线性相关理论,只适应于两个变量间的线性关系,当只适应于两个变量间的线性关系,当r=0时,只表示时,只表示X,Y线性无关,并不意味着线性无关,并不意味着X,Y相互独立。相互独立。线性相关理论,线性相关理论,只能反映变量之间相互关系的密切程度,只能反映变量之间相互关系的密切程度,并不意味着任何函数关系。并不意味着任何函数关系。X,Y间的高度相关可能源于以下几种情况:间的高度相关可能源于以下几种情况:、X,Y间间存在因果关系;存在因果关系
16、;、X,Y同时受到某个因素的影响,但并同时受到某个因素的影响,但并无因果关系,如时间;无因果关系,如时间;、X,Y间的相关关系纯属偶然,间的相关关系纯属偶然,称之为假相关、伪相关或偶然相关。称之为假相关、伪相关或偶然相关。线性相关系数线性相关系数r是用来衡量所有观测值的点是用来衡量所有观测值的点(Xi,Yi)围绕直围绕直线的密集程度线的密集程度,但它不能确定直线方程及其任何形式,不,但它不能确定直线方程及其任何形式,不能给出该直线的函数式及其参数值。能给出该直线的函数式及其参数值。不同斜率的直线,其相关系数可能是相同的。不同斜率的直线,其相关系数可能是相同的。17三、总体回归函数三、总体回归函
17、数 回归分析回归分析 案例分析案例分析 总体回归函数总体回归函数181 1、回归分析、回归分析回归分析:回归分析:相关关系的特征是不确定性,一个变量不能依相关关系的特征是不确定性,一个变量不能依据其他有关变量的数值,精确地、一一对应地求出其数值。据其他有关变量的数值,精确地、一一对应地求出其数值。但是,我们可以根据大量的统计数据,找出变量之间在数但是,我们可以根据大量的统计数据,找出变量之间在数量变化方面的统计规律,这种统计规律所表现出来的数量量变化方面的统计规律,这种统计规律所表现出来的数量关系就叫做关系就叫做回归关系回归关系,描述这种回归关系的数学公式就称,描述这种回归关系的数学公式就称为
18、为回归方程回归方程;有关回归关系的计算方法和理论称为有关回归关系的计算方法和理论称为回归分析回归分析。又分为:。又分为:一元回归分析(方程)、多元回归分析(方程);线性回一元回归分析(方程)、多元回归分析(方程);线性回归分析(方程)、非线性回归分析(方程)。归分析(方程)、非线性回归分析(方程)。回归分析回归分析关心的是根据解释变量的已知或给定值,考察被关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的之统计相关的被解释变量所有可能出现的对应值的平均值对应值的平均值
19、对应值的平均值对应值的平均值回归分析回归分析的主要目的有三点:的主要目的有三点:、根据样本观测值,对模、根据样本观测值,对模型参数进行估计,求得回归方程;型参数进行估计,求得回归方程;、对回归方程、模型、对回归方程、模型参数估计值进行显著性检验;参数估计值进行显著性检验;、利用回归方程进行预测、利用回归方程进行预测和控制。和控制。192 2、案例分析:、案例分析:案例案例2.1.22.1.2:一个假想的社区有一个假想的社区有100100户家庭组成,要研究户家庭组成,要研究该社区每月该社区每月家庭消费支出家庭消费支出Y Y与每月与每月家庭可支配收入家庭可支配收入X X的关的关系。系。即如果知道了
20、家庭的月收入,能否预测该社区家即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平?庭的平均月消费支出水平?为达到此目的,将该为达到此目的,将该100100户家庭划分为组内收入差不大户家庭划分为组内收入差不大(可支配收入水平)的(可支配收入水平)的1010组,以分析每一可支配收入组组,以分析每一可支配收入组的家庭消费支出。的家庭消费支出。由于不确定因素的影响,对同一收入水平由于不确定因素的影响,对同一收入水平X X,不同家庭,不同家庭的消费支出可能不完全相同;见下表:的消费支出可能不完全相同;见下表:21但由于调查的完备性,给定收入水平但由于调查的完备性,给定收入水平X X的消费支
21、出的消费支出Y Y的的分布是确定的,即以分布是确定的,即以X X的给定值为条件的的给定值为条件的Y Y的的条件分布条件分布(Conditional distributionConditional distribution)是已知的,例如:)是已知的,例如:P(Y=561|X=800P(Y=561|X=800)=1/4=1/4。因此,给定收入因此,给定收入X X的某一个值的某一个值X Xi,可得消费支出,可得消费支出Y Y的的条件条件均值均值(conditional meanconditional mean)或)或条件期望值条件期望值(conditional expectationconditi
22、onal expectation):):E(Y|X=XE(Y|X=Xi)。该例中:该例中:E(Y|XE(Y|Xi=800)=605=800)=605描出散点图发现:虽然不同的家庭其消费支出存在差描出散点图发现:虽然不同的家庭其消费支出存在差异,但是,随着收入的增加,消费异,但是,随着收入的增加,消费“平均地说平均地说”也在也在增加,且增加,且Y Y的条件均值均落在一根正斜率的直线上。这的条件均值均落在一根正斜率的直线上。这条直线称为条直线称为总体回归线总体回归线。05001000150020002500300035005001000150020002500300035004000每月可支配收入
23、X(元)每月消费支出Y(元)233 3、总体回归函数、总体回归函数在给定解释变量在给定解释变量Xi条件下被解释变量条件下被解释变量Yi的期望轨迹称为的期望轨迹称为总体总体回归线回归线(population regression line),或更一般地称为),或更一般地称为总体总体回归曲线回归曲线(population regression curve)。)。相应的函数:相应的函数:称为(双变量)称为(双变量)总体回归函数总体回归函数(population regression function,PRF)。)。含义:含义:回归函数(回归函数(PRF)说明被解释变量)说明被解释变量Y的平均状态(总
24、的平均状态(总体条件期望)随解释变量体条件期望)随解释变量X变化的规律。变化的规律。函数形式:函数形式:可以可以是线性或非线性的。是线性或非线性的。案例中,将居民消费支出看成是其可支配收入的线性函数案例中,将居民消费支出看成是其可支配收入的线性函数时,为一时,为一线性函数线性函数:其中,其中,0,1是未知参数,称为是未知参数,称为总体回归系数总体回归系数(regression coefficients)。)。24四、随机扰动项四、随机扰动项 随机扰动项随机扰动项 总体回归模型总体回归模型 引入随机误差项的主要原因引入随机误差项的主要原因251 1、随机扰动项、随机扰动项在案例在案例2.1.2中
25、,总体回归函数说明在给定的收入水平中,总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平下,该社区家庭平均的消费支出水平Y。但对某一个别的家庭,其消费支出但对某一个别的家庭,其消费支出Yi可能与该平均水可能与该平均水平平Y有偏差,并且聚集在平均水平有偏差,并且聚集在平均水平Y 的周围。的周围。对任何个别家庭,记:对任何个别家庭,记:称称 i为观察值为观察值Yi围绕它的期望值的围绕它的期望值的离差离差(deviation),它),它是一个不可观测的随机变量,又称为是一个不可观测的随机变量,又称为随机干扰项随机干扰项(stochastic disturbance)或)或随机误差项
26、随机误差项(stochastic error)。)。观测值点的散布情况表明了经济行为间的真实关系,直观测值点的散布情况表明了经济行为间的真实关系,直线仅仅表示了这种真实关系的理论部分,观测值的点线仅仅表示了这种真实关系的理论部分,观测值的点与直线的偏离程度与直线的偏离程度离差离差 i,表示了这种真实关系的,表示了这种真实关系的随机成分。随机成分。262 2、总体回归模型、总体回归模型在例在例2.1.2中,给定收入水平中,给定收入水平Xi,个别家庭的支出可表示为两个别家庭的支出可表示为两部分之和:部分之和:Yi=E(Y|Xi)+i=0+1Xi+i 该收入水平下所有家庭的平均消费支出该收入水平下所
27、有家庭的平均消费支出E(Y|Xi),称为,称为系系统性(统性(systematic)或或确定性(确定性(deterministic)部分;部分;其他称为其他称为随机随机或或非确定性非确定性(nonsystematic)部分部分 i。上式又上式又称为称为总体回归函数(总体回归函数(PRF)的随机设定形式。表明被的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响,的随机性影响,就成为这些随机影响因素的综合代表。就成为这些随机影响因素的综合代表。由于方程中引入了随机项,成为计量经济学模型,因此也由于方程中引入了随机项
28、,成为计量经济学模型,因此也称其为称其为总体回归模型总体回归模型。随机扰动项。随机扰动项 i=Yi-E(Yi)不难证明,对应于不难证明,对应于Xi值的条件下,值的条件下,Yi的期望值即:的期望值即:E(Yi)。那。那么么Yi的期望值的期望值E(Yi)的轨迹就称作总体回归直线,相应的方的轨迹就称作总体回归直线,相应的方程:程:E(Yi)=0+1Xi 就是就是总体回归方程总体回归方程,0,1称作总体称作总体回归方程的参数。回归方程的参数。273 3、引入随机误差项的主要原因、引入随机误差项的主要原因引入随机误差项主要包括下列因素:引入随机误差项主要包括下列因素:自变量的省略,某些影响因素被省略,产
29、生了随机误自变量的省略,某些影响因素被省略,产生了随机误差;差;模型设定误差,因为种种原因,模型的数学形式存在模型设定误差,因为种种原因,模型的数学形式存在缺陷,如:线性模型与非线性模型的交换使用,就会缺陷,如:线性模型与非线性模型的交换使用,就会导致随机误差的产生;导致随机误差的产生;归并误差与测量误差,在数据的收集与整理过程中,归并误差与测量误差,在数据的收集与整理过程中,总要产生某些主管或客观上的数据误差;总要产生某些主管或客观上的数据误差;其他随机因素,经济活动中,总会存在某些主管或客其他随机因素,经济活动中,总会存在某些主管或客观上的偶然影响因素。观上的偶然影响因素。产生并设计随机误
30、差项的主要原因:产生并设计随机误差项的主要原因:理论的含糊性;理论的含糊性;数据的欠缺;数据的欠缺;节省原则。节省原则。28五、样本回归函数(五、样本回归函数(SRF)案例分析案例分析 样本回归函数(样本回归函数(SRFSRF)样本回归模型样本回归模型 回归分析的主要目的回归分析的主要目的 一元线性回归方程和回归模型小结一元线性回归方程和回归模型小结291 1、案例分析、案例分析案例案例2.1.3:能从一次抽样中获得总体的近似的信息吗能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?如果可以,如何从抽样中获得总体的近似信息?在案例在案例2.1.2的总体中有如下一个
31、样本,能否从该样本的总体中有如下一个样本,能否从该样本估计总体回归函数估计总体回归函数PRF?回答:能?回答:能表表2.1.3 家庭消费支出与可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本画一条直线以尽好地拟合该散点图,由于样本取自总画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为体,可以该直线近似地代表总体回归线。该直线称为样本回归线样本回归线(sample regression lines)。)。X 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 Y 594 638 1122 11
32、55 1408 1595 1969 2078 2585 2530 302 2、样本回归函数(、样本回归函数(SRFSRF)该样本的该样本的散点图散点图(scatter diagram):记样本回归线的函数形式为:记样本回归线的函数形式为:称为称为样本回归函数样本回归函数(sample regression function,SRF)31注意:注意:这里将这里将样本回归线样本回归线看成是看成是总体回归线总体回归线的近似的近似替代替代323 3、样本回归模型、样本回归模型同样地,样本回归函数也有如下的随机形式:同样地,样本回归函数也有如下的随机形式:其中:其中:Yi为真实的样本观测值;残差为真实的
33、样本观测值;残差ei=Yi-i是随机扰是随机扰动项动项 i的估计值,代表了其他影响因素的集合。的估计值,代表了其他影响因素的集合。由于方程中引入了随机项,成为计量经济模型,因此由于方程中引入了随机项,成为计量经济模型,因此也称为也称为样本回归模型样本回归模型(sample regression modelsample regression model)。)。334 4、回归分析的主要目的、回归分析的主要目的回归分析的回归分析的主要目的:主要目的:就是要采用就是要采用有效的估计有效的估计方法,根据方法,根据样本回归函样本回归函数数SRFSRF,估计,估计总体回归函总体回归函数数PRFPRF。使估
34、。使估计得到的样计得到的样本回归方程本回归方程尽可能接近尽可能接近真实的总体真实的总体回归方程。回归方程。根据根据SRF SRF:估计估计PRF PRF:有关关系如图。有关关系如图。345 5、一元线性回归方程和回归模型小结、一元线性回归方程和回归模型小结 一元线性理论方程:一元线性理论方程:Y Yi=0 0+1 1X Xi一元线性总体回归方程:一元线性总体回归方程:E(E(Y Yi)=0 0+1 1X Xi一元线性总体回归模型:一元线性总体回归模型:Y Yi=0 0+1 1X Xi+i一元线性样本回归方程:一元线性样本回归方程:一元线性样本回归模型:一元线性样本回归模型:抽样误差:抽样误差:
35、i-E(Yi)=iei2.2 2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 一、一、一元线性回归模型的基本假设一元线性回归模型的基本假设 二、二、参数的普通最小二乘估计(参数的普通最小二乘估计(OLSOLS)三、三、参数估计的最大或然法参数估计的最大或然法(ML)(ML)四、四、最小二乘估计量的性质最小二乘估计量的性质 五、五、参数估计量的概率分布及随机干参数估计量的概率分布及随机干扰项方差的估计扰项方差的估计 36说说 明明单方程计量经济学模型分为:单方程计量经济学模型分为:线性模型线性模型和和非线性模型非线性模型线性模型中,变量之间的关系呈线性关系线性模型中,变量之间的关系
36、呈线性关系非线性模型中,变量之间的关系呈非线性关系非线性模型中,变量之间的关系呈非线性关系一元线性回归模型是最简单的模型一元线性回归模型是最简单的模型:只有一个解释变:只有一个解释变量量 Yi=0+1Xi+i i=1,2,n其中:其中:Y为被解释变量,为被解释变量,X为解释变量,为解释变量,0与与 1为为待估待估参数参数,为为随机干扰项随机干扰项回归分析的主要目的回归分析的主要目的是要通过样本回归函数(模型)是要通过样本回归函数(模型)SRF尽可能准确地估计总体回归函数(模型)尽可能准确地估计总体回归函数(模型)PRF。估计方法估计方法有多种,其中最广泛使用的是有多种,其中最广泛使用的是普通最
37、小二乘普通最小二乘法法(ordinary least squares,OLS)。)。37一、线性回归模型的基本假设一、线性回归模型的基本假设为保证参数估计量具有良好的性质,通常对模型提为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。这些假设与所采用的估计方法紧出若干基本假设。这些假设与所采用的估计方法紧密相关,如果实际模型满足这些基本假设,普通最密相关,如果实际模型满足这些基本假设,普通最小二乘法(小二乘法(OLSOLS)就是比较适用的估计方法,否则,)就是比较适用的估计方法,否则,OLSOLS就不再适用,进而需要使用其他估计方法。因就不再适用,进而需要使用其他估计方法。因此,这里
38、的基本假定并不是针对模型的,而是针对此,这里的基本假定并不是针对模型的,而是针对OLSOLS的。的。线性回归模型的基本假设主要有四条:线性回归模型的基本假设主要有四条:随机假定随机假定 自变量假定自变量假定 因变量假定因变量假定 其他假定其他假定381 1、随机假定、随机假定随机假定:随机假定:是关于是关于 i值分布的假定,值分布的假定,i是一个随是一个随机变量,不包含对机变量,不包含对Y的系统影响。的系统影响。零期望值假定:零期望值假定:E(i)=0,随机扰动项随机扰动项 i=Yi-E(Yi),就样本总体而言,就样本总体而言,i的平均扰动程度为零,的平均扰动程度为零,也就是说也就是说 i的随
39、机扰动相互抵消;的随机扰动相互抵消;同方差假定:同方差假定:Var(i)=E i-E(i)2=E(i2)=2,即对于即对于X的任何值,的任何值,i 的波动是一样;的波动是一样;正态性假定:正态性假定:i N(0,2),对于任一,对于任一Xi,i 是是一个关于他们的零均值对称的正态分布;一个关于他们的零均值对称的正态分布;无自相关假定:无自相关假定:Cov(i,j)=E i-E(i)j-E(j)=E(i j)=E(i)E(j)=0,ij。对于不同观测对于不同观测值的值的 i 与与 j 完全相互独立,互不相关、互不干完全相互独立,互不相关、互不干扰。扰。392 2、自变量假定、自变量假定自变量假定
40、:自变量假定:是关于是关于Xi的假定,的假定,Xi在回归分析中是固定取值在回归分析中是固定取值的确定性变量,即非随机变量。的确定性变量,即非随机变量。Xi与与 i互不相关假定:互不相关假定:即即Xi与与 i 是相互独立地影响是相互独立地影响Yi的的;Cov(Xi,i)=EXi-E(Xi)i-E(i)=00=0。Xi是确定性变量假定:是确定性变量假定:即即Xi作为解释变量,没有测量、统作为解释变量,没有测量、统计等误差;计等误差;解释变量无自相关性假定:解释变量无自相关性假定:解释变量的各个观测值不能近解释变量的各个观测值不能近似相同,或与常量之间不存在某种线性关系,各个解释变似相同,或与常量之
41、间不存在某种线性关系,各个解释变量之间也不存在线性相关。量之间也不存在线性相关。随着样本容量的无限增加,解释变量随着样本容量的无限增加,解释变量X的样本方差趋于的样本方差趋于一有限常数。即:一有限常数。即:该假设旨在排除时间序列数据出现持续上升或下降的变量作该假设旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的效,而且往往产生所谓的伪回归问题伪回归问题(spurious regression problem)。)。403 3、因变量假定、因变量假定因变量假定:因变量假定:是关
42、于是关于Yi的假定,的假定,Yi在分析中是一个随机变量。在分析中是一个随机变量。同方差假定:同方差假定:Var(Yi)=EYi-E(Yi)2=E(i2)=2;无自相关假定:无自相关假定:Cov(Yi,Yj)=EYi-E(Yi)Yj-E(Yj)=E(i j)=E(i)E(j)=0,ij。对于不同观测值的对于不同观测值的Yi 与与Yj完全完全相互独立,互不相关、互不干扰;相互独立,互不相关、互不干扰;Yi的分布假定:的分布假定:Yi (0+1Xi,2),Yi是一个关于他们的是一个关于他们的均值对称的分布。均值对称的分布。以上假设也称为线性回归模型的以上假设也称为线性回归模型的以上假设也称为线性回归
43、模型的以上假设也称为线性回归模型的经典假设经典假设经典假设经典假设或或或或高斯高斯高斯高斯(GaussGauss)假设)假设)假设)假设,满足满足满足满足经典假设经典假设经典假设经典假设的线性回归模型的线性回归模型的线性回归模型的线性回归模型,也称也称也称也称为为为为经典线性回归模型经典线性回归模型经典线性回归模型经典线性回归模型(Classical Linear Regression Classical Linear Regression Model,Model,CLRMCLRM)。414 4、其他假定、其他假定其他假定:其他假定:是关于方程形式的假定。是关于方程形式的假定。综合变量应能够正
44、确归并,即综合变量应能够正确归并,即Xi与与Y Yi分别表示各自的分别表示各自的项目之和变量;项目之和变量;所关心的方程已经被识别,即假定要估计其系数的关所关心的方程已经被识别,即假定要估计其系数的关系式具有唯一(不同其他)的数学形式;系式具有唯一(不同其他)的数学形式;关系式的确定是正确的,即关系式的确定是正确的,即模型没有设定偏误。模型没有设定偏误。假定假定在确定解释变量的过程中,没有出现任何误差,即已在确定解释变量的过程中,没有出现任何误差,即已经把所有重要的回归自变量明确地包括在模型中了,经把所有重要的回归自变量明确地包括在模型中了,其数学形式也是正确的。其数学形式也是正确的。42二、
45、参数的普通最小二乘估计(二、参数的普通最小二乘估计(OLS)最佳原则:最佳原则:对于样本回归直线的确定,是以能够最好对于样本回归直线的确定,是以能够最好的拟合观测值为准则的。这个准则要求:选择最佳的的拟合观测值为准则的。这个准则要求:选择最佳的参数,使全部观测值的残差平方和达到最小,即:参数,使全部观测值的残差平方和达到最小,即:ei2=Min。普通最小二乘法普通最小二乘法 几种离差变换形式几种离差变换形式 431 1、普通最小二乘法、普通最小二乘法给定一组样本观测值(给定一组样本观测值(Xi,Yi)()(i=1,2,n),要求样),要求样本回归函数尽可能好地拟合这组值。本回归函数尽可能好地拟
46、合这组值。普通最小二乘法普通最小二乘法(Ordinary least squares,OLS)给出)给出的判断标准是:使二者之差(残差)的平方和最小。的判断标准是:使二者之差(残差)的平方和最小。ei2=由于是已知的观测值,那么根据极值的性质,应有两由于是已知的观测值,那么根据极值的性质,应有两个关于未知参数的一阶条件,从而使:个关于未知参数的一阶条件,从而使:ei2=Min 。44方程组(*)称为正规方程组正规方程组(normal equations)。45记上述参数估计量可以写成:称为称为OLS估计量的估计量的离差形式离差形式(deviation form)。)。由于参数的估计结果是通过最
47、小二乘法得到的,故称其为由于参数的估计结果是通过最小二乘法得到的,故称其为普通最小二乘估计量普通最小二乘估计量(ordinary least squares estimators)。)。462 2、几种离差变换形式、几种离差变换形式总体回归模型的离差形式:总体回归模型的离差形式:yi=1xi+i-对总体回归模型对总体回归模型Yi=0+1Xi+i,两端连加并同除,两端连加并同除n,得到:,得到:Y=0+1X+;两式相减得到离差形式:;两式相减得到离差形式:yi=1xi+i-样本回归直线的离差形式:样本回归直线的离差形式:对对样样本本回回归归直直线线:,两两端端连连加加并并同同除除n,得得到到样样
48、本本均均值值回回归归直直线线方方程程。两两式式相相减减,并并根根据据均均值值性性质质,得得到到样样本本回回归直线的离差形式:归直线的离差形式:正规方程组的离差形式:正规方程组的离差形式:eixi=0 根根据据已已知知一一阶阶条条件件:ei=0,eiXi=0,将将xi=Xi-X代代入入第第二二式得到:式得到:eixi=0;将将样本回归模型样本回归模型的离差形式的离差形式:+ei 代入代入eixi=0,即:即:()xi=0 即可以得到样本回归模型的参数估计值的表达式。即可以得到样本回归模型的参数估计值的表达式。注意:注意:Yi=Y,Xi=X;xi=0,yi=0 iixy1b=iixy1b-47三、
49、参数估计的最大或然法三、参数估计的最大或然法(ML)基本原理基本原理 似(或)然函数似(或)然函数 参数的最大或然估计量参数的最大或然估计量 案例分析案例分析481 1、基本原理、基本原理最大或(似)然法最大或(似)然法(Maximum Likelihood,简称简称ML),是从最大,是从最大或然原理出发发展起来的其他估计方法的基础。或然原理出发发展起来的其他估计方法的基础。最大似然最大似然原原理能更本质地揭示通过样本估计总体参数的内在机理。理能更本质地揭示通过样本估计总体参数的内在机理。当从模型总体中随机抽取当从模型总体中随机抽取当从模型总体中随机抽取当从模型总体中随机抽取n n组样本观测值
50、后:组样本观测值后:组样本观测值后:组样本观测值后:对于对于最小二乘法最小二乘法,最合理的参数估计量应该使得模型能够最好地拟合样本数据;最合理的参数估计量应该使得模型能够最好地拟合样本数据;对于对于最大或然法最大或然法,最合理的参数估计量应该使得从模型中抽,最合理的参数估计量应该使得从模型中抽取该取该n组样本观测值的概率最大。组样本观测值的概率最大。从总体中经过从总体中经过n次随机取样,抽到样本容量为次随机取样,抽到样本容量为n的样本观测值,的样本观测值,在任一次随机抽取中,样本观测值都以一定的概率出现,如在任一次随机抽取中,样本观测值都以一定的概率出现,如果已经知道总体的参数,则由变量的频率