《一元线性回归模型(计量经济学).ppt》由会员分享,可在线阅读,更多相关《一元线性回归模型(计量经济学).ppt(124页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 经典单方程计量经济学模型:经典单方程计量经济学模型:一元线性回归模型一元线性回归模型 n n2.1 2.1 回归分析概述回归分析概述 n n2.2 2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设n n2.3 2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计 n n2.4 2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验n n2.5 2.5 一元线性回归模型的预测一元线性回归模型的预测n n2.6 2.6 一元线性回归建模实例一元线性回归建模实例2.1 2.1 回归分析概述回归分析概述n n一、变量间的关系及回归分析的基本概念一、变量间的关系及
2、回归分析的基本概念n n二、总体回归函数二、总体回归函数n n三、随机扰动项三、随机扰动项n n四、样本回归函数四、样本回归函数一、变量间的关系及回归分析的基本概念一、变量间的关系及回归分析的基本概念1 1、变量间的关系、变量间的关系、变量间的关系、变量间的关系(1 1 1 1)确定性关系或函数关系:)确定性关系或函数关系:)确定性关系或函数关系:)确定性关系或函数关系:研究的是确定现研究的是确定现研究的是确定现研究的是确定现象非随机变量间的关系。象非随机变量间的关系。象非随机变量间的关系。象非随机变量间的关系。(2)统计依赖或相关关系:研究的是非确定现)统计依赖或相关关系:研究的是非确定现象
3、随机变量间的关系。象随机变量间的关系。n n对变量间统计依赖关系的考察主要是通过对变量间统计依赖关系的考察主要是通过相关分析相关分析(correlation analysis)或回归分或回归分析析(regression analysis)来完成的。来完成的。n n相关分析主要研究随机变量间的相关形式相关分析主要研究随机变量间的相关形式及相关程度。变量间的相关程度可通过计及相关程度。变量间的相关程度可通过计算相关系数来考察。算相关系数来考察。n n具有相关关系的变量有时存在因果关系,具有相关关系的变量有时存在因果关系,这时,我们可以通过回归分析来研究它们这时,我们可以通过回归分析来研究它们之间的
4、具体依存关系。之间的具体依存关系。课堂思考题课堂思考题课堂思考题课堂思考题两者的区别两者的区别n n一方面,相关分析仅关注变量间的联系程一方面,相关分析仅关注变量间的联系程度,不关注具体的依赖关系;而回归分析度,不关注具体的依赖关系;而回归分析则关注变量间的具体依赖关系(因果关系)则关注变量间的具体依赖关系(因果关系),研究如何通过解释变量的变化来估计或,研究如何通过解释变量的变化来估计或预测被解释变量的变化。预测被解释变量的变化。n n另一方面,在相关分析中,变量的地位是另一方面,在相关分析中,变量的地位是对称的。而在回归分析中,变量的地位是对称的。而在回归分析中,变量的地位是不对称的,有解
5、释变量与被解释变量之分。不对称的,有解释变量与被解释变量之分。课堂思考题课堂思考题课堂思考题课堂思考题2 2、回归分析的基本概念、回归分析的基本概念n n回归分析回归分析回归分析回归分析(regression analysis)(regression analysis)(regression analysis)(regression analysis)是研究一个变量是研究一个变量是研究一个变量是研究一个变量关于另一个(些)变量的具体依赖关系的计算方关于另一个(些)变量的具体依赖关系的计算方关于另一个(些)变量的具体依赖关系的计算方关于另一个(些)变量的具体依赖关系的计算方法和理论。其目的在于通
6、过后者的已知或设定值,法和理论。其目的在于通过后者的已知或设定值,法和理论。其目的在于通过后者的已知或设定值,法和理论。其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。去估计和(或)预测前者的(总体)均值。去估计和(或)预测前者的(总体)均值。去估计和(或)预测前者的(总体)均值。n n前者称为前者称为前者称为前者称为被解释变量被解释变量被解释变量被解释变量(Explained VariableExplained VariableExplained VariableExplained Variable)或)或)或)或应变量(应变量(应变量(应变量(Dependent V
7、ariableDependent VariableDependent VariableDependent Variable)。)。)。)。n n后者称为后者称为后者称为后者称为解释变量解释变量解释变量解释变量(Explanatory VariableExplanatory VariableExplanatory VariableExplanatory Variable)或)或)或)或自变量(自变量(自变量(自变量(Independent VariableIndependent VariableIndependent VariableIndependent Variable)。)。)。)。课堂思
8、考题课堂思考题课堂思考题课堂思考题n n回归分析构成计量经济学的方法论基础,其主回归分析构成计量经济学的方法论基础,其主回归分析构成计量经济学的方法论基础,其主回归分析构成计量经济学的方法论基础,其主要内容包括:要内容包括:要内容包括:要内容包括:(1 1)根据样本观察值对经济计量模型参数)根据样本观察值对经济计量模型参数)根据样本观察值对经济计量模型参数)根据样本观察值对经济计量模型参数进行估计,求得回归方程;进行估计,求得回归方程;进行估计,求得回归方程;进行估计,求得回归方程;(2 2)对回归方程、参数估计值进行显著性)对回归方程、参数估计值进行显著性)对回归方程、参数估计值进行显著性)
9、对回归方程、参数估计值进行显著性检验;检验;检验;检验;(3 3)利用回归方程进行分析、评价及预测。)利用回归方程进行分析、评价及预测。)利用回归方程进行分析、评价及预测。)利用回归方程进行分析、评价及预测。二、总体回归函数二、总体回归函数n n回归分析关心的是根据解释变量的已知或回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相当解释变量取某个确定值时,与之统计相关的被解释变量所有可能值的平均值关的被解释变量所有可能值的平均值。n n例:一个假想的社区有例:一个假想的社区有99户家庭组成,要户家庭组
10、成,要研究该社区每月家庭消费支出研究该社区每月家庭消费支出Y与每月家庭与每月家庭可支配收入可支配收入X的关系。的关系。即如果知道了家庭的即如果知道了家庭的月收入,能否预测该社区家庭的平均月消月收入,能否预测该社区家庭的平均月消费支出水平。费支出水平。n n为达到此目的,将该为达到此目的,将该99户家庭划分为组内户家庭划分为组内收入差不多的收入差不多的10组,以分析每一收入组的组,以分析每一收入组的家庭消费支出。家庭消费支出。课堂思考题课堂思考题课堂思考题课堂思考题一个抽样n n由由于于调调查查的的完完备备性性,给给定定收收入入水水平平X的的消消费费支支出出Y的的分分布布是是确确定定的的。即即以
11、以X的的给给定定值值为为条条件件的的Y的的分分布布是是已已知知的的,如如 P(Y=561|X=800)=1/4。n n进进而而,给给定定某某收收入入Xi,可可得得消消费费支支出出Y的的条条件均值,如件均值,如 E(Y|X=800)=605。n n这这样样,可可依依次次求求出出所所有有不不同同可可支支配配收收入入水水平平下下相相应应家家庭庭消消费费支支出出的的条条件件概概率率和和条条件件均均值值,见表见表2.1.2.描描描描出出出出散散散散点点点点图图图图可可可可以以以以发发发发现现现现:随随随随着着着着收收收收入入入入的的的的增增增增加加加加,消消消消费费费费“平平平平均均均均地地地地说说说说
12、”也也也也在在在在增增增增加加加加,且且且且Y Y的的的的条条条条件件件件均均均均值值值值均均均均落落落落在在在在一一一一根正斜率的直线上,这条直线称为总体回归线。根正斜率的直线上,这条直线称为总体回归线。根正斜率的直线上,这条直线称为总体回归线。根正斜率的直线上,这条直线称为总体回归线。表表表表2.1.2 2.1.2 各收入水平组家庭消费支出的条件均值各收入水平组家庭消费支出的条件均值各收入水平组家庭消费支出的条件均值各收入水平组家庭消费支出的条件均值课堂思考题课堂思考题课堂思考题课堂思考题050010001500200025003000350050010001500200025003000
13、35004000每月可支配收入X(元)每月消费支出Y(元)n n在给定解释变量在给定解释变量在给定解释变量在给定解释变量X Xi i条件下被解释变量条件下被解释变量条件下被解释变量条件下被解释变量Y Yi i的期望的期望的期望的期望轨迹称为总体回归线(轨迹称为总体回归线(轨迹称为总体回归线(轨迹称为总体回归线(population regression population regression lineline),或更一般地称为),或更一般地称为),或更一般地称为),或更一般地称为总体回归曲线总体回归曲线总体回归曲线总体回归曲线。称为(双变量)称为(双变量)总体回归函数总体回归函数(popu
14、lation regression function,PRF)。相应的函数相应的函数:n n总体回归函数说明被解释变量总体回归函数说明被解释变量Y Y的平均状的平均状态(总体条件期望)随解释变量态(总体条件期望)随解释变量X X变化的变化的规律。至于具体的函数形式,则由所考规律。至于具体的函数形式,则由所考察的总体的特征和经济理论来决定。察的总体的特征和经济理论来决定。n n在在例例2.1中,将居民消费支出看成是其可中,将居民消费支出看成是其可支配收入的线性函数时,该总体回归函支配收入的线性函数时,该总体回归函数为数为:它是它是一个线性函数。其中,一个线性函数。其中,0 0,1 1是未知是未知
15、参数,称为参数,称为回归系数回归系数(regression coefficients)。)。三、随机扰动项三、随机扰动项n n总体回归函数说明在给定的收入水平总体回归函数说明在给定的收入水平总体回归函数说明在给定的收入水平总体回归函数说明在给定的收入水平X X X Xi i i i下,该下,该下,该下,该社区家庭的社区家庭的社区家庭的社区家庭的平均平均平均平均消费支出水平。消费支出水平。消费支出水平。消费支出水平。n n但对某一个别的家庭,其消费支出可能与该平但对某一个别的家庭,其消费支出可能与该平但对某一个别的家庭,其消费支出可能与该平但对某一个别的家庭,其消费支出可能与该平均水平有偏差。对
16、每个个别家庭,记均水平有偏差。对每个个别家庭,记均水平有偏差。对每个个别家庭,记均水平有偏差。对每个个别家庭,记n n为观察值为观察值为观察值为观察值Y Y Y Yi i i i围绕它的期望值围绕它的期望值围绕它的期望值围绕它的期望值E(Y|XE(Y|XE(Y|XE(Y|Xi i i i)的离差。它的离差。它的离差。它的离差。它是一个不可观测的随机变量,称为是一个不可观测的随机变量,称为是一个不可观测的随机变量,称为是一个不可观测的随机变量,称为随机误差项随机误差项随机误差项随机误差项或随机干扰项。或随机干扰项。或随机干扰项。或随机干扰项。n n例例例例2.12.1中,给定收入水平中,给定收入
17、水平中,给定收入水平中,给定收入水平X Xi i,个别家庭的支出可个别家庭的支出可个别家庭的支出可个别家庭的支出可表示为两部分之和:表示为两部分之和:表示为两部分之和:表示为两部分之和:n n(1 1)该收入水平下所有家庭的平均消费支出)该收入水平下所有家庭的平均消费支出)该收入水平下所有家庭的平均消费支出)该收入水平下所有家庭的平均消费支出E(Y|XE(Y|Xi i),称为系统性或确定性部分;,称为系统性或确定性部分;,称为系统性或确定性部分;,称为系统性或确定性部分;n n(2 2)其他随机或非确定性部分)其他随机或非确定性部分)其他随机或非确定性部分)其他随机或非确定性部分 i i。n
18、n称为称为总体回归函数(总体回归函数(PRFPRF)的随机设定)的随机设定形式形式。表明被解释变量除了受解释变。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的量的系统性影响外,还受其他因素的随机性影响。随机性影响。n n由于方程中引入了随机项,成为计量由于方程中引入了随机项,成为计量经济学模型,因此也称为经济学模型,因此也称为总体回归模总体回归模型型。n n随机误差项主要包括下列因素随机误差项主要包括下列因素:在解释变量中被忽略的因素的影响;在解释变量中被忽略的因素的影响;在解释变量中被忽略的因素的影响;在解释变量中被忽略的因素的影响;变量观测值的观测误差的影响;变量观测值的观测误
19、差的影响;变量观测值的观测误差的影响;变量观测值的观测误差的影响;模型关系的设定误差的影响;模型关系的设定误差的影响;模型关系的设定误差的影响;模型关系的设定误差的影响;其它随机因素的影响。其它随机因素的影响。其它随机因素的影响。其它随机因素的影响。四、样本回归函数四、样本回归函数n n由于总体回归函数所需全部数据的获取往由于总体回归函数所需全部数据的获取往往是非常困难的,有时甚至是不可能的,往是非常困难的,有时甚至是不可能的,于是我们关心:于是我们关心:能从一次抽样中获得总体的近似的信息吗?能从一次抽样中获得总体的近似的信息吗?能从一次抽样中获得总体的近似的信息吗?能从一次抽样中获得总体的近
20、似的信息吗?如果可以,如何从抽样中获得总体的近似信息如果可以,如何从抽样中获得总体的近似信息如果可以,如何从抽样中获得总体的近似信息如果可以,如何从抽样中获得总体的近似信息?n n仍以例(仍以例(仍以例(仍以例(回顾回顾回顾回顾)为例,假设总体中有如下一个)为例,假设总体中有如下一个)为例,假设总体中有如下一个)为例,假设总体中有如下一个样本,能否从该样本估计总体回归函数?样本,能否从该样本估计总体回归函数?样本,能否从该样本估计总体回归函数?样本,能否从该样本估计总体回归函数?回答:能。回答:能。在例中的应用表表表表2.1.3 2.1.3 家庭消费支出与可支配收入的一个随机样本家庭消费支出与
21、可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本课堂思考题课堂思考题课堂思考题课堂思考题该样本的散点图(该样本的散点图(scatter diagram):n n 画一条直线以尽好地拟合该散点图,由画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表于样本取自总体,可以该直线近似地代表总体回归线。该直线称为总体回归线。该直线称为样本回归线样本回归线。n n 记样本回归线的函数形式为:记样本回归线的函数形式为:称为称为样本回归函数样本回归函数。课堂思考题课堂思考题课堂思考题课堂思考题样本回归模型样本回归模型样本回归模型样本回归模
22、型将样本回归线看成总体回归线的近似替代,则有将样本回归线看成总体回归线的近似替代,则有将样本回归线看成总体回归线的近似替代,则有将样本回归线看成总体回归线的近似替代,则有于是于是同样地,样本回归函数也有如下的随机形式:同样地,样本回归函数也有如下的随机形式:由于方程中引入了随机项,成为计量经济模型,由于方程中引入了随机项,成为计量经济模型,因此也称为因此也称为样本回归模型样本回归模型。课堂思考题课堂思考题课堂思考题课堂思考题 回归分析的主要目的,就是根根据据样样本本回回归函数归函数SRF,估计总体回归函数,估计总体回归函数PRF。即,由即,由 估计估计注意:这里注意:这里PRF(总体回归函数)
23、(总体回归函数)可能永远无法知道可能永远无法知道第一节课堂思考题第一节课堂思考题n n什么是什么是回归分析回归分析?回归分析和相关分析是回归分析和相关分析是一回事吗一回事吗,为什么?,为什么?n n以例为例,概述以例为例,概述总体回归函数总体回归函数和和样本回归样本回归函数函数有什么区别(提示:有什么区别(提示:Y,家庭个数)。,家庭个数)。n n样本(总体)回归函数和样本(总体)回样本(总体)回归函数和样本(总体)回归模型有什么区别归模型有什么区别?2.2 2.2 一元线性回归模型的基本假一元线性回归模型的基本假设设n n一元线性回归模型:只有一个解释变量一元线性回归模型:只有一个解释变量i
24、=1,2,nY为为被解释变量被解释变量,X为为解释变量解释变量,0与与 1为待估为待估参数参数,为为随机干扰项随机干扰项。n n回归分析的主要目的是要通过样本回归回归分析的主要目的是要通过样本回归函数(模型)函数(模型)SRF尽可能准确地估计总尽可能准确地估计总体回归函数(模型)体回归函数(模型)PRF。n n为保证参数估计量具有良好的性质,通为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。常对模型提出若干基本假设。n n假设假设1:回归模型是正确设定的。:回归模型是正确设定的。n n假设假设2:解释变量:解释变量X是确定性变量,不是随是确定性变量,不是随机变量。机变量。n n假设
25、假设3:解释变量:解释变量X在所抽取的样本中具有在所抽取的样本中具有变异性,而且随着样本容量的无限增加,变异性,而且随着样本容量的无限增加,解释变量解释变量X的样本方差趋于一个非零的有限的样本方差趋于一个非零的有限常数。常数。课堂思考题课堂思考题课堂思考题课堂思考题n n假设假设4:随机误差项:随机误差项 具有给定具有给定X条件下的零条件下的零均值、同方差和不序列相关性:均值、同方差和不序列相关性:E(E(i i|X|Xi i)=0 i=1,2,)=0 i=1,2,n,nVar(Var(i i|X|Xi i)=)=2 2 i=1,2,i=1,2,n,nCov(Cov(i i,j j|X|Xi
26、i,X,Xj j)=0 ij i,j=1,2,)=0 ij i,j=1,2,n,nn n假设假设5:随机误差项与解释变量之间不相关。:随机误差项与解释变量之间不相关。n n假设假设6:随机误差项服从零均值、同方差的:随机误差项服从零均值、同方差的正态分布。正态分布。课堂思考题课堂思考题课堂思考题课堂思考题n n以上假设称为线性回归模型的经典假设。以上假设称为线性回归模型的经典假设。n n满足该假设的线性回归模型称为经典线性满足该假设的线性回归模型称为经典线性回归模型。回归模型。第二节课堂思考题第二节课堂思考题n n一元线性回归模型的基本假设一元线性回归模型的基本假设有哪些?有哪些?2.3 2.
27、3 一元线性回归模型的参数估一元线性回归模型的参数估计计n n一、参数的普通最小二乘估计(一、参数的普通最小二乘估计(OLSOLS)n n二、最小二乘估计量的性质二、最小二乘估计量的性质 n n三、参数估计量的概率分布及随机干扰项三、参数估计量的概率分布及随机干扰项方差的估计方差的估计 n n四、某城市消费规律研究四、某城市消费规律研究n n一元线性回归模型的参数估计,是在一组一元线性回归模型的参数估计,是在一组样本观测值样本观测值(xi,yi),i=1,2,n下,通过一定下,通过一定的参数估计方法,估计出样本回归线。的参数估计方法,估计出样本回归线。n n最常用的是普通最小二乘法(最常用的是
28、普通最小二乘法(Ordinary least squares,OLS)估计。)估计。n n除此之外,还有其他的估计方法,如最大除此之外,还有其他的估计方法,如最大似然法(似然法(ml)和矩法()和矩法(mm),有兴趣的),有兴趣的同学可自学。同学可自学。给定一组样本观测值(给定一组样本观测值(给定一组样本观测值(给定一组样本观测值(X Xi i,Y,Yi i)()()()(i=1,2,ni=1,2,n)要求)要求)要求)要求样本回归函数尽可能好地拟合这组值样本回归函数尽可能好地拟合这组值样本回归函数尽可能好地拟合这组值样本回归函数尽可能好地拟合这组值.普通最小二乘法(普通最小二乘法(普通最小二
29、乘法(普通最小二乘法(Ordinary least squares,Ordinary least squares,OLSOLS)给出的判断标准是:二者之差的平方和最)给出的判断标准是:二者之差的平方和最)给出的判断标准是:二者之差的平方和最)给出的判断标准是:二者之差的平方和最小。小。小。小。一、参数的普通最小二乘估计一、参数的普通最小二乘估计课堂思考题课堂思考题课堂思考题课堂思考题n n根据微积分的知识,当根据微积分的知识,当根据微积分的知识,当根据微积分的知识,当QQ对两个参数的偏导数对两个参数的偏导数对两个参数的偏导数对两个参数的偏导数为为为为0 0时,时,时,时,QQ达到最小,即:达到
30、最小,即:达到最小,即:达到最小,即:记记解方程得到参数估计量:解方程得到参数估计量:由于参数的估计结果是通过最小二乘法得到的,故由于参数的估计结果是通过最小二乘法得到的,故称为普通称为普通最小二乘估计量(最小二乘估计量(ordinary least squares estimators)。课堂思考题课堂思考题课堂思考题课堂思考题例:在上述家庭可支配收入例:在上述家庭可支配收入-消费支出例中,对于消费支出例中,对于所所抽出的一组样本数抽出的一组样本数,参数估计的计算可通过下面的,参数估计的计算可通过下面的表进行。表进行。系数估计表表2.3.1 2.3.1 参数估计计算表参数估计计算表因此,由该
31、样本估计的回归方程为:因此,由该样本估计的回归方程为:拟合优度统计检验预测根据公式与根据公式与前页的计算前页的计算:四、最小二乘估计量的性质四、最小二乘估计量的性质n n当模型参数估计出后,需考虑参数估计值当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。或者说需考察参数估计量的统计性质。n n一个用于考察总体的估计量,可从如下几一个用于考察总体的估计量,可从如下几个方面考察其优劣性:个方面考察其优劣性:线性性,即它是否是另一随机变量的线性函数;线性性,即它是否是另一随机变量的线性函数;线性性,即它是否
32、是另一随机变量的线性函数;线性性,即它是否是另一随机变量的线性函数;无偏性,即它的均值或期望值是否等于总体的无偏性,即它的均值或期望值是否等于总体的无偏性,即它的均值或期望值是否等于总体的无偏性,即它的均值或期望值是否等于总体的真实值;真实值;真实值;真实值;有效性,即它是否在所有线性无偏估计量中具有效性,即它是否在所有线性无偏估计量中具有效性,即它是否在所有线性无偏估计量中具有效性,即它是否在所有线性无偏估计量中具有最小方差。有最小方差。有最小方差。有最小方差。n n 这三个准则也称作估计量的小样本性质。这三个准则也称作估计量的小样本性质。这三个准则也称作估计量的小样本性质。这三个准则也称作
33、估计量的小样本性质。n n拥有这类性质的估计量称为最佳线性无偏估计量拥有这类性质的估计量称为最佳线性无偏估计量拥有这类性质的估计量称为最佳线性无偏估计量拥有这类性质的估计量称为最佳线性无偏估计量(best liner unbiased estimator,BLUEbest liner unbiased estimator,BLUE)。)。)。)。课堂思考题课堂思考题课堂思考题课堂思考题n n当不满足小样本性质时,需进一步考察估当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:计量的大样本或渐近性质:渐近无偏性,即样本容量趋于无穷大时,是否渐近无偏性,即样本容量趋于无穷大时,是否渐近无
34、偏性,即样本容量趋于无穷大时,是否渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;它的均值序列趋于总体真值;它的均值序列趋于总体真值;它的均值序列趋于总体真值;一致性,即样本容量趋于无穷大时,它是否依一致性,即样本容量趋于无穷大时,它是否依一致性,即样本容量趋于无穷大时,它是否依一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;概率收敛于总体的真值;概率收敛于总体的真值;概率收敛于总体的真值;渐近有效性,即样本容量趋于无穷大时,是否渐近有效性,即样本容量趋于无穷大时,是否渐近有效性,即样本容量趋于无穷大时,是否渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致
35、估计量中具有最小的渐近方差。它在所有的一致估计量中具有最小的渐近方差。它在所有的一致估计量中具有最小的渐近方差。它在所有的一致估计量中具有最小的渐近方差。n n高斯高斯马尔可夫定理马尔可夫定理(Gauss-Markov theorem):在给定经典线性回归的假定下,:在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无最小二乘估计量是具有最小方差的线性无偏估计量。偏估计量。五、参数估计量的概率分布及随机干扰项方五、参数估计量的概率分布及随机干扰项方差的估计差的估计 2、随机误差项、随机误差项 的方差的方差 2的估计的估计 2又称为总体方差又称为总体方差。由于随机项由于随机项 i不可
36、观测,只能从不可观测,只能从 i的估计的估计残差残差ei出发对总体方差进行估计。出发对总体方差进行估计。可以证明,可以证明,2的最小二乘估计量为的最小二乘估计量为它是关于它是关于 2的无偏估计量。的无偏估计量。课堂思考题课堂思考题课堂思考题课堂思考题其中其中六、某城市消费规律研究六、某城市消费规律研究n n1、设计方程:、设计方程:Y=C(1)+C(2)*XY=C(1)+C(2)*XX=X=可支配收入可支配收入可支配收入可支配收入Y=Y=消费性支出消费性支出消费性支出消费性支出2、搜集并整理数据、搜集并整理数据预测估计结果估计结果3、利用软件进行参数估计、利用软件进行参数估计统计检验预测4、写
37、出回归结果、写出回归结果n n利用利用输出结果输出结果替换方程的系数:替换方程的系数:Y=C(1)+C(2)*XY=C(1)+C(2)*XX=X=可支配收入可支配收入可支配收入可支配收入Y=Y=消费性支出消费性支出消费性支出消费性支出n n得到:得到:Y=237.75+0.75*XY=237.75+0.75*X预测课堂思考题课堂思考题课堂思考题课堂思考题第第3节课堂思考题节课堂思考题n n概述概述最小二乘法估计最小二乘法估计。n n最小二乘估计量有哪些统计最小二乘估计量有哪些统计性质性质?n n随机干扰项方差的最小二乘估计量随机干扰项方差的最小二乘估计量是?是?n n回顾回顾“六、某城市消费规
38、律研究六、某城市消费规律研究”,概括建,概括建模步骤。模步骤。第第3节课后练习题节课后练习题n n本章练习题本章练习题1111的(的(1 1),),P60P60。n n本章练习题本章练习题1212的(的(1 1),),P61P61。2.4 2.4 一元线性回归模型的统计检一元线性回归模型的统计检验验n n一、拟合优度检验一、拟合优度检验 n n二、变量的显著性检验二、变量的显著性检验 n n三、参数的置信区间三、参数的置信区间n n回归分析是要通过样本所估计的参数来回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本代替总体的真实参数,或者说是用样本回归线代替总体回归线。回归线
39、代替总体回归线。n n尽管从统计性质上已知,如果有足够多尽管从统计性质上已知,如果有足够多的重复的重复 抽样,参数的估计值的期望(均抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。次抽样中,估计值不一定就等于该真值。n n那么,在一次抽样中,参数的估计值那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这与真值的差异有多大,是否显著,这就需要进一步进行统计检验。就需要进一步进行统计检验。n n主要包括拟合优度检验、变量的显著主要包括拟合优度检验、变量的显著性检验及参数的区间估计。性检验及参数的区间估
40、计。一、拟合优度检验一、拟合优度检验n n拟合优度检验:对样本回归直线与样本观拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。测值之间拟合程度的检验。n n度量拟合优度的指标:判定系数(可决系度量拟合优度的指标:判定系数(可决系数)数)R R2 2 1 1、总离差平方和的分解(、总离差平方和的分解(R R2 2的推导)的推导)已知由一组样本观测值(已知由一组样本观测值(Xi,Yi),),i i=1,2,得到如下样本回归直线得到如下样本回归直线 R2的定义 由由前图前图可以看出,如果可以看出,如果Yi=i (ei=0)即实际)即实际观测值落在样本回归观测值落在样本回归“线线”上,则拟
41、合最好上,则拟合最好。对于所有样本点,则需考虑这些点与样本均值离对于所有样本点,则需考虑这些点与样本均值离差的平方和差的平方和,可以证明:可以证明:TSS=ESS+RSS记总体平方和总体平方和(Total Sum of Squares)回归平方和回归平方和(Explained Sum of Squares)残差平方和残差平方和(Residual Sum of Squares)n nY Y的观测值围绕其均值的总离差的观测值围绕其均值的总离差(TSS)(TSS)可可分解为两部分:一部分来自回归线分解为两部分:一部分来自回归线(ESSESS),另一部分则来自随机势力),另一部分则来自随机势力(RSS
42、RSS):):在给定样本中,在给定样本中,在给定样本中,在给定样本中,TSSTSS不变不变不变不变如果实际观测点离样本回归线越近,则如果实际观测点离样本回归线越近,则如果实际观测点离样本回归线越近,则如果实际观测点离样本回归线越近,则ESSESS在在在在TSSTSS中占的比重越大中占的比重越大中占的比重越大中占的比重越大可以用可以用可以用可以用ESS/TSSESS/TSS(=R=R2 2)来度量拟合的程度)来度量拟合的程度)来度量拟合的程度)来度量拟合的程度2、可决系数、可决系数R2 2统计量统计量 称称 R R2 2 为(样本)为(样本)可决系数可决系数/判定系数判定系数(coefficie
43、nt of determination)coefficient of determination)。可决系数的取值范围:可决系数的取值范围:(0(0,1)1)R R2 2越接近越接近1 1,说明实际观测点离样本线越近,拟合,说明实际观测点离样本线越近,拟合优度越高优度越高。R2的图示课堂思考题课堂思考题课堂思考题课堂思考题在在例例的的收入收入-消费支出消费支出例子中,根据相关计算,例子中,根据相关计算,有有这说明在家庭消费支出的总离差中,由家庭这说明在家庭消费支出的总离差中,由家庭可支配收入的离差解释的部分占可支配收入的离差解释的部分占99.35%99.35%,模,模型的拟合优度较高。型的拟合
44、优度较高。根据定义根据定义n n可以看出:可以看出:可决系数是一个非负的统计量。可决系数是一个非负的统计量。可决系数是一个非负的统计量。可决系数是一个非负的统计量。它也是随着抽样的不同而不同。它也是随着抽样的不同而不同。它也是随着抽样的不同而不同。它也是随着抽样的不同而不同。n n在多变量的情形下,可决系数需要调整在多变量的情形下,可决系数需要调整(见第(见第3章)。章)。二、变量的显著性检验二、变量的显著性检验n n回归分析是要判断解释变量回归分析是要判断解释变量X X是否是被解释是否是被解释变量变量Y Y的一个显著性的影响因素。的一个显著性的影响因素。n n在一元线性模型中,就是要判断在一
45、元线性模型中,就是要判断X X是否对是否对Y Y具有显著的线性性影响。这就需要进行变具有显著的线性性影响。这就需要进行变量的显著性检验。量的显著性检验。n n变量的显著性检验所应用的方法是数理统变量的显著性检验所应用的方法是数理统计学中的假设检验计学中的假设检验。n n计量经济学中,主要是针对变量的参数真计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验。值是否为零来进行显著性检验。1 1、假设检验、假设检验n n所谓所谓假设检验假设检验,就是事先对总体参数或总,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,
46、即判断样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定信息与原假设是否有显著差异,从而决定是否接受原假设。是否接受原假设。n n假设检验采用的逻辑推理方法是假设检验采用的逻辑推理方法是反证法反证法:先假定原假设正确,然后根据样本信息,先假定原假设正确,然后根据样本信息,先假定原假设正确,然后根据样本信息,先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从观察由此假设而导致的结果是否合理,从观察由此假设而导致的结果是否合理,从观察由此假设而导致的结果是否合理,从而判断是否接受原假设。而判断是否接受原假设。而判断是否接受原假设。而判断是否接受原假设
47、。n n判断结果合理与否,是基于判断结果合理与否,是基于“小概率事小概率事件不易发生件不易发生”这一原理的。这一原理的。2、变量的显著性检验、变量的显著性检验检验步骤:检验步骤:(1)对总体参数提出假设)对总体参数提出假设 H0:1=0,H1:1 0(2)以原假设)以原假设H0构造构造t统计量,并由样本计算其值统计量,并由样本计算其值(3)给定显著性水平)给定显著性水平,查,查t分布表得临界值分布表得临界值t /2(n-2)(4)比较,判断比较,判断 若若 ,则拒绝,则拒绝H0,接受,接受H1;若若 ,则拒绝,则拒绝H1,接受,接受H0;课堂思考题课堂思考题课堂思考题课堂思考题该统计量服从自由
48、度为该统计量服从自由度为n-2的的t分布,分布,检验的原假设为检验的原假设为 。而对于常数项而对于常数项 0,可构造如下,可构造如下t统计量统计量进行显著性检验:进行显著性检验:在在在在前述收入前述收入前述收入前述收入-消费支出例子消费支出例子消费支出例子消费支出例子中,首先计算随机干中,首先计算随机干中,首先计算随机干中,首先计算随机干扰性的方差的估计值:扰性的方差的估计值:扰性的方差的估计值:扰性的方差的估计值:由系数和由系数和标准差标准差,t t统计量的计算结果分别为:统计量的计算结果分别为:给定显著性水平给定显著性水平=0.05,查,查t分布表(教材分布表(教材354页,页,或或下页下
49、页)得临界值)得临界值 t 0.05/2(8)=2.306|t1|2.306,说明,说明家庭可支配收入在家庭可支配收入在95%95%的置信度下的置信度下显著,即通过了变量的显著性检验。显著,即通过了变量的显著性检验。同同样样地地,|t|t2 2|2.306,表表明明在在95%95%的的置置信信度度下下,拒拒绝绝截距项为零的假设。截距项为零的假设。置信区间课堂思考题课堂思考题课堂思考题课堂思考题用伴随概率判断显著性用伴随概率判断显著性n n在在Eviews软件给出的计算结果中,没有给软件给出的计算结果中,没有给出检验的临界值,作为一种等价的做法,出检验的临界值,作为一种等价的做法,给出了变量显著
50、性检验的伴随概率给出了变量显著性检验的伴随概率n n这是一种更精确、方便的检验方法。这是一种更精确、方便的检验方法。n n对于变量显著性的对于变量显著性的t检验:检验:若伴随概率的数值小于若伴随概率的数值小于若伴随概率的数值小于若伴随概率的数值小于0.010.01,则说明变量在,则说明变量在,则说明变量在,则说明变量在0.010.01的水平上是显著的;的水平上是显著的;的水平上是显著的;的水平上是显著的;若伴随概率的数值小于若伴随概率的数值小于若伴随概率的数值小于若伴随概率的数值小于0.050.05,则说明变量在,则说明变量在,则说明变量在,则说明变量在0.050.05的水平上是显著的;的水平