《计量经济学研精选文档.ppt》由会员分享,可在线阅读,更多相关《计量经济学研精选文档.ppt(157页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学研本讲稿第一页,共一百五十七页 第一章第一章 导导 论论1.1 1.1 计量经济学概述计量经济学概述Econometrics中文译名:计量经济学、经济计量学一、计量经济学定义一、计量经济学定义计量经济学是经济学的一个分支,是以经济理论为前提利用数学、统计学、计算技术,根据实际观测资料来研究经济关系与经济活动数量规律,并以建立和应用计量量经济模型为核心的一门科学。本讲稿第二页,共一百五十七页二、计量经济学的产生及发展二、计量经济学的产生及发展 早在17世纪英国经济学家、统计学家威廉.配第(W.Petty)在政治算术一书中运用统计学方法研究社会经济问题。1838年法国数理经济学家古诺(A
2、.Cournot)出版了财富理论的数学原理,认为需求、供给、价格之间可视为函数关系,用数学语言系统阐述了某些经济规律。1874年法国经济学家瓦尔拉斯(L.Walras)在纯粹政治经济学纲要中提出“一般均衡理论”,使用联立方程组进行一般均衡条件研究。1890年马歇尔(A.Marshell)的经济学原理问世后,数学方法在当时西方经济理论研究中已成了不可缺少的工具。20世纪20年代末30年代初爆发了世界性的经济大危机,使西方经济关于资本主义市场经济能够自行调节、保持均衡发展的传统理论陷于破产。许多问题困扰着决策者。例如:在一次衰退中,有人提出消减工资-可增加企业利润-刺激生产;有人提出增加工资-刺激
3、消费者需求-刺激生产。有人提出降低利率-刺激企业投资;有人提出提高利率-增加银行存款-提高银行贷款能力-增加企业投资。定性分析无法给出解决方案,必须进行定量分析。1926年挪威的经济学家费瑞希(Ragnar Frish)提出计量经济学一词,是诞生标志。本讲稿第三页,共一百五十七页1930年年底在美国俄亥俄州克里富兰城,由费里希、丁伯根和费歇尔等经济学家发起成立了“国际计量经济学学会”。1933年正式出版了计量经济学会刊Econometrics,标志计量经济学已成为一门独立的新兴学科。20世纪30至60年代主要研究微观经济。如费瑞希研究需求弹性、边际生产力,柯布道格拉斯研究生产函数等。20世纪4
4、0年代至70年代,重点研究宏观经济;美国著名经济学家克莱因发表了美国经济变动1921-1941、美国的一个计量经济模型1929-1952 等论文,泰尔(H.Theil)发表了二阶段最小二乘法等。20世纪80年代至今计量经济学的理论及应用都有了较大的发展。英国学者亨德利英国学者亨德利(D.F.Hundry)提出了协整理论,使计量经济学进入一个新的理论体系,对策论、贝叶斯理论等在计量经济学中具体的应用。可以说经济学的数量化和定量化是经济学迅速科学化的标志,数学推动了经济学的发展。计量经济学越来越受到经济学家们的重视,正如克莱因所说:“计量经济学已经在经济学科中居于最重要的地位。”“在大多数的大学与
5、学院中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分。”萨缪尔森甚至说:“二战之后的经济学是计量经济学时代。”据统计,在诺贝尔经济学奖的获奖成果中,3/4都与计量经济学密切相关。本讲稿第四页,共一百五十七页三、计量经济学在我国的发展三、计量经济学在我国的发展1959年中国社会科学院的学者考察前苏联后,提出引入计量经济学。1979年成立了中国数量经济研究会和数量经济研究所,并出版了会刊数量经济技术经济研究。1980年克莱因应邀来华讲学。1982年召开了第一届数量经济学会年会。1998年经教育部专业教学指导委员会审定“计量经济学”被确认为经济类个专业八门核心课程之一。(八门核心课程:政治
6、经济学、西方经济学、计量经济学、货币银行学、财政学、统计学、会计学、国际经济学)本讲稿第五页,共一百五十七页四、计量经济学与其它学科的关系四、计量经济学与其它学科的关系1、计量经济学与数理经济学、计量经济学与数理经济学区别:数理经济学区别:数理经济学通过数学符号阐述经济理论,用精确的数学形式表达各种经济关系。所采用的模型称数理经济模型,不为参数提供数值。(模型是对现实的描述和模拟。对现实的各种不同描述和模拟方法,就构成了各种不同的模型。)计量经济学计量经济学用数学形式表达经济关系,但不假定这种经济关系是精确的。采用的模型为计量经济模型。在模型中列出起主要作用的经济变量,并含有一个随机变量。给出
7、模型参数估计值。联系联系:数理经济学与理论经济学的区别只是表述形式不同,它把经济关系数学化、公式化,为计量经济学研究奠定了基础。本讲稿第六页,共一百五十七页2 2、计量经济学与经济统计学、计量经济学与经济统计学区别:区别:经济统计学经济统计学是指对经济统计资料的收集加工和整理,并列表图示形式表达数据,以描述在整个观察期间的发展形式,而并不利用所收集的数据来验证经济理论。计量经济学计量经济学利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。联系联系:计量经济学研究离不开经济统计资料3 3、计量经济学与数理统计学、计量经济学与数理统计学区别:数理统计学区别:数理统计学是以概率论为基础
8、,研究随机现象规律性的学科。偏重于数学推导。有严格的假定条件。计量经济学计量经济学是在数理统计学基础上开发出的特有的分析方法技术。联系联系:数理统计学是计量经济学研究的基础,数理统计方法是计量经济研究中的主要建模工具。本讲稿第七页,共一百五十七页五、计量经济学内容体系五、计量经济学内容体系从学科角度分为:从学科角度分为:广义计量经济学、狭义计量经济学广义计量经济学、狭义计量经济学广义的计量经济学广义的计量经济学:包括回归分析、投入产出分析、时间序列分析等。即数量经济学。狭义的计量经济学狭义的计量经济学:只包括回归分析。即通常提及的计量经济学。从内容角度分为:从内容角度分为:理论计量经济学(方法
9、论):理论计量经济学(方法论):研究如何建立合适的方法去测定由计量经济模型所确定的经济关系。研究目的在于为应用计量经济学提供方法论。应用计量经济学(实际应用):应用计量经济学(实际应用):研究目的在于进行经济结构分析、经济预测、经济政策评价、检验与发展经济理论。本讲稿第八页,共一百五十七页1.2 1.2 计量经济学基本概念计量经济学基本概念一、经济变量:一、经济变量:用来描述经济因素数量水平的指标。经济变量可分为若干类型:1 1、解释变量、被解释变量、解释变量、被解释变量2 2、内生变量、外生变量、内生变量、外生变量3 3、滞后变量、滞后变量4 4、前定变量、前定变量5 5、控制变量、控制变量
10、(政策变量)政策变量)6 6、虚拟变量、虚拟变量二、数据二、数据1 1、时间序列数据、时间序列数据2 2、截面数据、截面数据3 3、混合数据、混合数据(面板数据)面板数据)4 4、虚拟变量数据、虚拟变量数据本讲稿第九页,共一百五十七页三、计量经济模型三、计量经济模型 模型模型是对现实的描述与模拟。对现实的各种不同描述和模拟方法就构成了各种不同的模型。经济数学模型经济数学模型是用数学方法描述经济活动。所采用的数学方法不同,构成各类不同的经济数学模型。计量经济模型计量经济模型是用随机性的数学方程描述经济活动,揭示经济活动中各个因素之间的定量关系。计量经济模型中,每一个特定方程的解释变量的系数称为变
11、量参数。参数。变量参数一般未知,需要根据样本信息加以估计,由于抽样误差及估计方法的误差,所得到的参数估计值与总体参数的真值并不一致,通常选择参数估计值时应参照无偏性、最小方差性及一致性准则。本讲稿第十页,共一百五十七页1.3 计量经济学研究经济问题的步骤一、模型设计二、收集样本数据三、估计参数四、模型检验 五、应用模型本讲稿第十一页,共一百五十七页1.41.4 相关知识回顾相关知识回顾一、1、随机事件:结果具有不确定性的事件。2、概率:某随机事件在试验中发生的可能性的大小。其值在0到1之间,必然事件的概率为1,不可能事件的概率为0。3、随机变量:如果一个变量在随机试验中取得不同的值,而这些数值
12、在试验前无法确定,对于一次具体的试验,其取值又是确定的。随机变量分为离散型的随机变量和连续型的随机变量。本讲稿第十二页,共一百五十七页4、离散型随机变量:只取有限个或至多可列个可能值的随机变量。5、离散型随机变量的概率分布函数:给定随机变量 ,它的取值不超过实数x的事件的概率 P(x)是x的函数,称为 的概率分布函数,简称分布函数,记为F(x)=P(x),-x+6、离散型随机变量的数学期望(均值):将随机变量的每一个可能取值乘以该值发生的概率再相加。记为:E(x)=x i p i7、离散型随机变量的方差:是随机变量的可能取值与均值之差的平方的均值,记为:D(x)=E(xi-E(x)2=(xi-
13、E(x)2 p i本讲稿第十三页,共一百五十七页8、连续型随机变量:若随机变量 可取某个区间c,d或(-,+)中的一切值,而且其分布函数能表示为 F(x)=其中 f(y)0,则称 为连续型随机变量,称 f(y)为 的概率密度函数(或分布密度函数)。9、连续型随机变量的概率分布:连续型随机变量在区间(x1,x2)上的概率分布为:P(x1,x2)=其中,f(x)称为概率密度函数10、连续型随机变量的均值与方差:E(x)=D(x)=(x-E(x)2 f(x)dx本讲稿第十四页,共一百五十七页 7、几种常用的连续型随机变量的分布正态分布正态分布若随机变量的概率密度函数为 其中 ,与 均为常数,相应的分
14、布函数为 则称该随机变量服从正态分布,记N()N(0,1)称为标准正态分布。小大0本讲稿第十五页,共一百五十七页 -分布:设x1,x2,,xn是相互独立,且同服从于N(0,1)分布的随机变量,则称随机变量 =所服从的分布为 -分布。定理1 -分布密度函数为 其中,参数n称自由度,n=6n=2n=10本讲稿第十六页,共一百五十七页 t-分布设xN(0,1),Y (n),且x和Y相互独立,则称随机变量所服从的分布为t-分布,n 称为它的自由度,记Tt(n)。定理1 T的分布密度函数为定理2 设xN(,),Y (n),且x和Y相互独立,则随机变量 t(n)0n=5n=2xt(x;n)本讲稿第十七页,
15、共一百五十七页F-分布设x和Y是相互独立的 -分布的随机变量,自由度分别为m和n,则称随机变量 所服从的分布为F-分布,(m,n)称为它的自由度,记为FF(m,n)。定理1 F-分布的概率密度函数为 f(x)xm=10,n=10m=10,n=4本讲稿第十八页,共一百五十七页二、求偏导数二、求偏导数三、矩阵求秩三、矩阵求秩本讲稿第十九页,共一百五十七页第二章第二章 简单的一元线性回归模型简单的一元线性回归模型 2.1 一元线性回归模型的概念与基本假设一元线性回归模型的概念与基本假设形如:y=b0+b1x+u(或 yt=b0+b1xt+ut,t=1,2,)的模型称为简单的一元线性回归模型。其中u(
16、ut)为随机误差项,随机误差项u包括:1、模型中省略掉的影响因素造成的误差2、模型设定误差3、变量的测量误差4、随机误差线性线性是指y关于b0、b1线性本讲稿第二十页,共一百五十七页 为对上述模型中的参数b0、b1使用普通最小二乘法进行估计,因此对 u 作如下假设(称古典假定):E(ut)=0,t=1,2,Var(ut)=E(ut2)=,t=1,2,cov(ut,us)=E(ut us)=0 ,t s,t=1,2,cov(ut,Xt)=0 ,t=1,2,ut N(0,),X是确定的变量。未知。本讲稿第二十一页,共一百五十七页2.2 模型参数的最小二乘估计模型参数的最小二乘估计一、最小二乘估计量
17、:一、最小二乘估计量:是指使残差平方和 最小的估计量。其中Yt 是观测值,为估计值 。应用极值原理,得到参数的估计式为 则回归方程为:二、最小二乘估计量的统计性质:二、最小二乘估计量的统计性质:线性性(可表示成Y的线性函数)无偏性(参数估计量的数学期望等于这个参数)有效性(最小方差性)本讲稿第二十二页,共一百五十七页三、三、参数估计量的分布、随机项方差的估计量、参数估计量的分布、随机项方差的估计量、参数(回归系数)的区间估计参数(回归系数)的区间估计2.3 一元线性回归模型的假设检验一元线性回归模型的假设检验一、模型估计式检验的必要性二、模型估计式的理论检验三、回归参数估计量的显著性检验回归参
18、数估计量的显著性检验 检验检验 与 是否显著成立。也即b0和b1是否显著为零。本讲稿第二十三页,共一百五十七页检验的步骤(以 为例):(1)提出原假设 H0:b1=0 备择假设 H1:b1 0 (2)计算统计量:T=其中,是 标准差的估计值。(3)给定显著水平 ,查自由度为 n-2 的 t 分布表,得临界值 t/2(n-2)。(4)如果 t/2(n-2),接受H0:b1=0,X与Y线性不显著。如果 t/2(n-2),拒绝H0:b1=0,接受备择假设H1:b1 0,X与Y线性显著,即认为 显著成立。对 的显著性检验只需把上述的b1()换成b0()即可。本讲稿第二十四页,共一百五十七页 四、拟合优
19、度测定四、拟合优度测定1、总离差(变差)平方和的分解公式总离差(变差)平方和的分解公式 总离差(变差)平方和=回归(解释变差)平方和+残差(未解释变差)平方和 记 TSS=ESS+RSS2、样本决定系数样本决定系数 样本决定系数取值区间0,13、相关系数及显著性检验相关系数及显著性检验 相关关系及种类相关关系及种类 客观世界中的许多现象都存在一定的关系,这种关系一般可通过数量关系反映出来,这种关系归纳起来可分为两种:一种是确定性关系,称为函数关系函数关系;另一种是非确定性关系称为相关关系相关关系。本讲稿第二十五页,共一百五十七页相关关系的种类相关关系的种类:两个现象按相关程度的不同分为两个现象
20、按相关程度的不同分为不相关不相关:两个现象互不影响,彼此数量变化相互独立。完全相关完全相关:一个现象的数量变化由另一个现象的数量变化所唯一确定。此种相关关系实际是函数关系,所以函数关系是相关关系的特例。不完全相关不完全相关:介于不相关与完全相关之间。按相关方向不同分为按相关方向不同分为正相关:正相关:两现象之间的数值变化呈同方向变动。负相关:负相关:两现象之间的数值变化呈反方向变动。按相关的形式不同分为按相关的形式不同分为线性相关:线性相关:如果两现象的对应数据在散点图中的分布近似表现为直线形式非线性相关:非线性相关:如果两现象的对应数据在散点图中的分布表现为各种不同的曲线形式按相关因素的多少
21、分为按相关因素的多少分为简单相关简单相关:指两个现象的相关关系。复相关(多重相关复相关(多重相关):指三个或三个以上现象之间的相关关系。本讲稿第二十六页,共一百五十七页相关系数相关系数变量之间线性相关的程度,常用相关系数度量。总体相关系数的取值范围为-1,1,当取值为0时表示总体x与y不相关,取1(-1)时表示总体x与y完全正相关或完全负相关相关分析与回归分析区别及联系相关分析与回归分析区别及联系联系联系:相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。相关分析和回归分析的有关指标之间存在计算上的内在联系。区别区别:回归分析强调因果关系,变量分为解释变量和被解释变量。相关分析不
22、关心因果关系,变量是对等的关系决定系数与相关系数的关系决定系数与相关系数的关系本讲稿第二十七页,共一百五十七页五、正态性检验:Jarque-Bera检验(雅克-贝拉检验、JB检验)检验ut是否服从正态分布ut 不可观测,可根据它的近似值et来研究,JB检验是依据OLS的et对大样本的一种检验方法(或称渐进检验)。首先计算偏度系数S(对概率密度函数对称性的度量)本讲稿第二十八页,共一百五十七页本讲稿第二十九页,共一百五十七页2.4 利用一元线性回归方程进行预测利用一元线性回归方程进行预测 一元线性回归方程为 1 1、点预测、点预测:已知x的一特定值x0,利用回归方程求得y0的估计值(点预测值):
23、2 2、区间预测、区间预测:y y0 0的预测区间的预测区间给定显著水平 ,在100(1-)%的置信水平下,y0的预测区间为:其中,本讲稿第三十页,共一百五十七页均值均值E(yE(y0 0)的预测区间的预测区间给定显著水平 ,在100(1-)%的置信水平下,查自由度为n-2的t分布表得临界值E(y0)的预测区间为:本讲稿第三十一页,共一百五十七页 第三章第三章 多元线性回归模型多元线性回归模型3.1 多元线性回归模型的估计多元线性回归模型的估计一、概念一、概念:多元线性回归模型形如:y=b0+b1x1+b2x2+bkxk+u ,或 yt=b0+b1x1t+b2x2t+bktxkt+ut ,t=
24、1,2,,n 即 其中u为随机项,包含的内容与一元情形相同。本讲稿第三十二页,共一百五十七页将多元线性回归模型写成矩阵形式:Y=Xb+u Y=Xb+u Y=X=b=u=Y=X=b=u=为了对多元线性回归模型的参数采用普通最小二乘法进行估计,作如下假设:E(ut)=0,t=1,2,n Var(ut)=,t=1,2,n cov(ut,uj)=0,t j,t=1,2,n cov(ut,xjt)=0,t=1,2,n,j=1,2,k。ut N(0,),xjt是确定的变量。未知。r(X X)=k+1F 时,拒绝H0:b1=b2=bk=0,则认为回归方程显著成立,当 F t/2 时,拒绝H0:bi=0,接受
25、H1:bi 0,认为参数估计值显著成立当 0,L0,K0,y0两边取对数得 :lny=lnA+lnL+lnK+u令 y*=lny,L*=lnL,K*=lnK,a=lnA 则原模型化为 y*=a+L*+K*+u3、指数函数模型y=aebx+u ,a0,两边取对数得 :lny=lna+bx+u令 y*=lny ,b0=lna 则原模型化为 y*=b0+bx+u本讲稿第四十五页,共一百五十七页4 4、成长曲线模型(新产品销售)、成长曲线模型(新产品销售)逻辑成长(逻辑成长(S)S)曲线模型曲线模型经过简化变为其函数图形如图 y y K K t t可化为线性模型。龚珀兹成长曲线模型龚珀兹成长曲线模型与
26、逻辑成长曲线图形类似可化为线性模型。本讲稿第四十六页,共一百五十七页(二)内蕴非线性模型(二)内蕴非线性模型内蕴非线性模型是指不论经过怎样的替换,都不能化成线性回归模型的非线性回归模型。例如:y=AL K +u ,A0,L0,K0,y0Y=a0+a1x1a2+a3x2a4+u(消费函数模型C=b0+b1yb2+u)求此类模型的参数估计值,采用高斯-牛顿迭代法。迭代估计法基本思想:迭代估计法基本思想:通过泰勒级数展开先使非线性函数在某一组初始参数估计值附近线性化,然后对这一线性模型应用OLS法,得出一组新的参数估计值。再使非线性函数在新参数估计值附近线性化,对新的线性模型再应用OLS法,又得出一
27、组新的参数估计值。不断重复上述过程,直到参数估计值收敛为止。本讲稿第四十七页,共一百五十七页本讲稿第四十八页,共一百五十七页 第四章第四章 异方差异方差4.1 异方差性异方差性1 1、概念、概念若Var(ut)=(t=1,2,n),则称ut存在异方差。2 2、异方差产生的原因、异方差产生的原因经济现象本身存在异方差性;模型忽略了某些变量;模型的形式设定不当;统计资料存在误差等。4.2、异方差性的后果、异方差性的后果若仍用OLS估计参数,则参数估计值仍是无偏的,但不具有最小方差性;变量的显著性检验失去了意义;模型的预测精度降低。4.3 异方差性检验异方差性检验方法有多种:图示法、Goldfeld
28、-Quand(戈德菲尔特-夸特检验)、Glejser(戈里瑟)检验等。由于异方差存在是由于解释变量取不同值产生的,所以,这些检验方法的思路就是检验随机项的方差与解释变量之间的相关性。本讲稿第四十九页,共一百五十七页这些方法中,如果是一元线性回归模型,应用图示法较简单,即做出x与y的散点图,如果这些点在两条平行直线内,则随机项同方差,否则异方差。多元情形下,可采用其他方法,如戈里瑟检验法。哥德非尔特哥德非尔特-夸特检验(夸特检验(G-QG-Q检验)检验)若随机项方差又逐渐增大的可能将解释变量由小到大排序,被解释变量与之对应,将样本按解释变量大小分成两部分,利用两组样本分别建立线性回归模型,并求出
29、各自的残差平方和,若两者之间存在较大差异,则存在异方差,若差异不大则具有等方差性。一般把样本中间部分(约c=n/4)去掉,用剩余的两部分分别作回归求出残差平方和,RSS1和RSS2本讲稿第五十页,共一百五十七页本讲稿第五十一页,共一百五十七页H.White test(怀特检验)要求大样本以二元线性回归模型yt=b0+b1x1t+b2x2t+vt为例步骤:1、用OLS估计模型,算出残差平方和et2,作辅助回归模型:et2=a0+a1x1t+a2x2t+a3x1t2+a4x2t2+a5x1tx2t+vt2、原假设H0:a0=a1=a2=a3=a4=a5=03、H0成立条件下,统计量nR2渐进地服从
30、自由度为5的 分布(一元自由度为2)4、给定显著水平,查表得临界值,当nR2大于临界值时,则拒绝H0,存在异方差;当nR2小于临界值时,则接受H0,不存在异方差;本讲稿第五十二页,共一百五十七页Glejser test(戈里瑟检验)和Park test(帕克检验)戈里瑟提出如下假定函数形式:本讲稿第五十三页,共一百五十七页4.4 异方差性的解决方法异方差性的解决方法(1 1)模型变换法)模型变换法设线性回归模型为:Yt=b0+b1x1t+bkxkt+ut,t=1,2,n随机项存在异方差,由于随机项的方差与x有关,可设:Var(ut)=f(x1t,xkt),f(x1t,xkt)0,为常数。则可用
31、 去除线性回归模型两端,得:令本讲稿第五十四页,共一百五十七页则Var()=,Cov(,)=0,i j,i,j=1,2,n这样,异方差模型就变成等方差模型,如果其他假定都满足,则可应用OLS进行参数估计。函数 f 如何选取有很大的随意性。戈里瑟检验提供了相应的信息。如假设:Var(ut)=Xjt 或 Var(ut)=X2jt(2 2)加权最小二乘法()加权最小二乘法(WLSWLS)加权最小二乘法就是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。设线性回归模型为如下矩阵形式:Y=Xb+Y=Xb+存在异方差,其他假定均满足。则模型的期望、方差协方差阵为:本讲
32、稿第五十五页,共一百五十七页E()=0,=0,Var-Cov()=E()=W=W W=W=即随机项存在异方差性。由于W W是正定对称阵,则存在非奇异阵 ,使得 W W=用 左乘模型两端,得新模型:Y Y=X bX b+令令Y*=Y X*=X u*=Y*=Y X*=X u*=则模型变为 Y*=X*b+u*Y*=X*b+u*本讲稿第五十六页,共一百五十七页该模型具有同方差性,对该模型应用普通最小二乘估计,得参数估计量为:加权最小二乘估计量具有线性性、无偏性、最小方差性。(3)模型的对数变换若在模型yt=b0+b1xt+ut中,变量yt、xt分别用lnyt、lnxt取代,对lnyt=b0+b1lnx
33、t+ut进行回归,通常可降低异方差的影响。本讲稿第五十七页,共一百五十七页第五章第五章 自相关自相关5.1 自相关性自相关性1 1、概念、概念自相关(或序列相关)是指随机变量u不同期值相关。即Cov(ui,uj)0,i j,i,j=1,2,n2 2、自相关产生的原因、自相关产生的原因被解释变量存在自相关;一些不重要的且不同期取值相关的解释变量含在u中;模型设定的偏误及数据资料调整;u本身有自相关。3 3、自相关的后果、自相关的后果如果随机项存在自相关,用OLS估计参数,出现后果:得到的参数估计量仍是无偏的,但不具有最小方差性;参数估计值的显著性T检验及回归方程显著性F检验失效本讲稿第五十八页,
34、共一百五十七页5.2 自相关形式自相关形式1、若随机变量的取值只与前一期取值有关,即 ut=f(ut-1),则称u为一阶自相关一阶自相关。2、如果u一阶自相关,且形如:ut=ut-1+,为随机变量,且满足古典假定:E()=0 Var()=E()=,t=1,2,n Cov()=E()=0,t1 t2,t1,t2=1,2,n Cov(ut-1,)=E(ut-1 )=0 则称u具有一阶自回归形式一阶自回归形式本讲稿第五十九页,共一百五十七页3、若随机变量的取值只与前几期取值有关,即ut=f(ut-1,ut-2,),则称u为高阶自相关高阶自相关。4、如果u高阶自相关,且形如:称u具有高阶自回归形式高阶
35、自回归形式。5.3 自相关检验自相关检验1、图示法 以t为横轴,et为纵轴作图,残差et随时间的变化呈现有规律的变动,则et存在自相关,即ut存在自相关。本讲稿第六十页,共一百五十七页2、Durbin-Watson检验(DW检验)。适用于检验一阶自回归形式一阶自回归形式。D-W检验内容:计算D-W统计量 可以证明此值约在04之间。根据样本容量n和解释变量数k查D-W分布表,得到临界值dl和du,然后按照下列标准考察计算得到的D-W值,以判断模型的自相关状态。不能确定无一阶自回归形式不能确定负自相关0dldu24-du4-dl4正自相关本讲稿第六十一页,共一百五十七页注意:(1)、D-W检验只能
36、判断是否存在一阶自相关,对于高阶自相关或非自相关皆不适用。(2)、不适用于联立方程组中的各方程随机项的序列相关检验。(3)、不适用于模型中含有滞后的被解释变量的情况。例:yt=b0+b1xt+b2yt-1+ut此时即使模型存在自相关,DW值也经常接近2,因此不能用D-W检验。杜宾提出了Durbin-h统计量:杜宾证明:当一阶自相关系数 时,h统计量近似服从标准正态分布,所以利用正态分布可以对一阶自相关性进行检验。本讲稿第六十二页,共一百五十七页3、回归检验法建立线性回归模型,用ols法求出残差et(为ut的估计值)建立et与et-1、et-2的相互关系模型(用多种函数形式试验)对不同的形式用o
37、ls进行参数估计,再进行显著性检验,如果估计是显著成立,说明随机项ut存在序列相关。4、高阶自回归形式检验Breusch-Godfrey(布罗斯-戈弗雷)检验或拉格朗日乘数检验 对模型y=b0+b1x1i+bkxki+ut 设自相关形式为:本讲稿第六十三页,共一百五十七页本讲稿第六十四页,共一百五十七页5.4 自相关模型的经济计量方法自相关模型的经济计量方法针对自相关产生的原因,可给出不同的处理方法。如果是模型中省略了重要的解释变量,使随机项产生了 自相关,则应重新建立模型;如果是模型建立不当,应重新建立模型;如果是由于数据加工的原因,可增加样本容量、变换数据处理形式等。除了上述原因外还存在自
38、相关,这就是真正的自相关。如果模型存在真正自相关,其他假定都满足,则可采用广义最小二乘法、差分法、迭代法等估计参数。本讲稿第六十五页,共一百五十七页(1 1)广义差分法)广义差分法若自相关系数已知若自相关系数已知以一元为例,设模型为Yt=b0+b1Xt+ut ,t=1,2,n (1)随机项具有一阶自回归形式随机项具有一阶自回归形式:ut=ut-1+,是随机变量,满足前述假定。将模型(1)减去(1)滞后一期并乘以 得:Yt-Yt-1=b0(1-)+b1(Xt-Xt-1)+(2)令Yt*=Yt-Yt-1 Xt*=Xt-Xt-1 ,t=2,n此种变换称为广义差分变换。这种变换损失了一个观测值,为避免
39、损失,K.R.凯迪雅勒提出做如下变换:Y1*=Y1 X1*=X1(2)式写成:Y1*=b0(1-)+b1 Xt*+(3)这样就可对(3)应用OLS进行参数估计。如果是多元线性回归模型,处理方法类似。本讲稿第六十六页,共一百五十七页本讲稿第六十七页,共一百五十七页本讲稿第六十八页,共一百五十七页(3)迭代估计或Cochranc-Orcutt(科克伦-奥克特)估计本讲稿第六十九页,共一百五十七页本讲稿第七十页,共一百五十七页(2 2)广义最小二乘法()广义最小二乘法(GLSGLS)适用于异方差及自相关(方差及协方差已知)的情况。加权最小二乘法是广义最小二乘法的特例。设线性回归模型为如下矩阵形式:Y
40、=Xb+U Y=Xb+U存在异方差及自相关,其他假定均满足。则模型的期望、方差协方差阵为:E(U U)=0 ,=0 ,Var-Cov(U U)=E()=W=W W=W=本讲稿第七十一页,共一百五十七页设W W是已知的正定对称阵,则存在非奇异阵,使得 从而用 左乘模型两端,得新模型:Y=XbY=Xb+U令令Y*=Y X*=X U*=Y*=Y X*=X U*=U 则模型变为 Y*=X*b+U*Y*=X*b+U*该模型具有同方差性,对该模型应用普通最小二乘估计,得参数估计量为:广义最小二乘估计量具有线性性、无偏性、最小方差性。本讲稿第七十二页,共一百五十七页 第六章第六章 多重共线性多重共线性6.1
41、 多重共线性多重共线性1 1、概念、概念多重共线性包括解释变量之间完全线性关系完全线性关系和接近线性关系接近线性关系。完全线性关系完全线性关系是指多元线性回归模型解释变量之间出现了线性相关。即存在不全为零的常数 ,使得 x1t+x2t+xkt=0接近线性关系接近线性关系是指多元线性回归模型解释变量接近线性相关。即存在不全为零的常数 ,使得 x1t+x2t+xkt 0或 x1t+x2t+xkt+ut=0ut为随机项。解释变量之间不存在完全的和接近的线性关系,则称无多重共线性。本讲稿第七十三页,共一百五十七页2 2、多重共线性产生的原因、多重共线性产生的原因各经济变量之间的内在联系(生产函数中肥料
42、、种植面积等具有同方向变动趋势);经济变量数据在时间上具有同方向变动趋势;模型中引入了滞后变量(如Xt,Xt-1)6.2 多重共线性的后果多重共线性的后果解释变量之间如果存在多重共线性,仍用普通最小二乘法会产生以下后果:若解释变量之间存在完全多重共线性,则无法求出参数估计值(因 的逆不存在);若解释变量之间存在不完全线性关系,参数可以估计,但参数的方差很大,在对参数进行T检验时,增大了接受零假设的可能性,错误地舍弃了重要的解释变量。预测也就失效。也会导致参数的符号不符合经济意义。本讲稿第七十四页,共一百五十七页6.3 多重共线性的检验多重共线性的检验检验方法主要有判定系数法、相关系数法(适用于
43、两个解释变量的情形)、方差膨胀因子检验、逐步回归法等。判定系数法:对于 k个解释变量,把其中一个解释变量对其他k-1个解释变量进行线性回归,然后根据其判定系数的大小,来判定是否存在多重共线性。即分别做以下回归:X1=a1X2+a2X3+ak-1Xk+utX2=a1X1+a2X3+ak-1Xk+utXk=a1X1+a2X2+ak-1Xk-1+ut各回归方程的判定系数为R12,R22,Rk2,从中找出最大者,如Rj2,若Rj2接近于1,则可判定Xj与其他解释变量中的一个或多个相关程度高。从而判定原模型中由于引进了解释变量Xj,而导致高度的多重共线性。本讲稿第七十五页,共一百五十七页方差膨胀因子检验
44、 对于多元线性回归模型,参数b1估计值方差可以表示成本讲稿第七十六页,共一百五十七页6.4 克服多重共线性的方法克服多重共线性的方法1 1、除去不重要的解释变量、除去不重要的解释变量;2 2、利用已知信息。、利用已知信息。柯布-道格拉斯生产函数,当规模报酬不变时,就可消除解释变量之间存在的多重共线性。Y=AL K eu ,A0,L0,K0,Y0两边取对数得 :lnY=lnA+lnL+lnK+u若 则 ln =lnA+ln +u令 Y*=ln ,X*=ln ,a=lnA ,则原模型化为 Y*=a+X*+u这是不存在多重共线性的一元线性回归模型。本讲稿第七十七页,共一百五十七页3 3、逐步回归法、
45、逐步回归法步骤(1)设有k个解释变量,分别建立k个一元线性回归模型,取显著成立中样本决定系数最大的一个为基本方程。(2)在基本方程中分别引入第二个变量,建立k-1个二元线性回归模型,从中选较优的:如果新引进的解释变量符合经济意义,使拟合优度R2有所提高,并且每个参数统计检验显著,则引入该变量;如果新引进的解释变量不能提高拟合优度R2,对其他参数无明显影响,则可舍弃改变量;如果新引进的解释变量提高拟合优度R2,对其他参数的符号和数值有明显影响,统计检验也不显著,可以断定新引入的解释变量引起了多重共线性。在共线性程度最高的两个解释变量中,舍弃对被解释变量影响较小的。(3)在选定的二元线性回归模型中
46、,再加入第三个变量,如此下去,直至无法引入新变量为止。4 4、改变模型的形式、改变模型的形式;5 5、增加样本容量、增加样本容量;本讲稿第七十八页,共一百五十七页 第七章第七章 单方程回归模型的几个专题单方程回归模型的几个专题7.1 虚拟变量虚拟变量7.1.1 7.1.1 概念概念一、在现实经济生活中,除了一些可以直接获得实际观测数据的定量变量外,还有一些定性(或属性)因素变量,例如年龄、性别、天气等,在一般情况下是不可计量的,称这样的变量为虚拟变量虚拟变量。二、经济模型中引入虚拟变量的作用1、可以描述和测量定性(或属性)因素的影响;2、能正确反映经济变量之间的相互关系,提高模型的精度;3、便
47、于处理异常数据。本讲稿第七十九页,共一百五十七页三、虚拟变量取值为了将这些变量引入模型,必须将其数量化,比如当虚拟变量起作用时取值为1(或0),不起作用时取值为0(或1)。含有虚拟变量的模型称虚拟变量模型。虚拟变量通常作为解释变量。7.1.2 虚拟变量的设置1、虚拟变量的设置规则(1)一个因素m个属性,在模型中引入m-1个虚拟变量,否则产生多重共线性。(2)m个因素各两种属性,则引入m个虚拟变量。(3)虚拟变量的取值(1或0)应从分析问题的目的出发予以界定。(4)虚拟变量在单一方程中可作为解释变量,也可作为被解释变量。本讲稿第八十页,共一百五十七页2、虚拟变量的引入方式(1)一个因素两种属性,
48、模型中引入一个虚拟变量例1:研究消费问题时,消费主要是由收入决定,但同时必须考虑一些反常年份,如战争、天灾等。假如边际消费倾向不变,可设消费函数模型为 Ct=b0+b1xt+b3Dt+ut,Ct:消费,xt:收入,Dt=当这一模型满足普通最小二乘法假定条件时,可应用普通最小二乘法求出消费函数回归方程:本讲稿第八十一页,共一百五十七页 例2:对某地区生产同一产品的各企业生产进行研究,产量(Y)不仅受资金投入(K)、劳动力投入(L)影响,而且与生产工艺有关,假设用甲、乙两种不同的生产工艺,就可以建立虚拟变量模型。引入虚拟变量本讲稿第八十二页,共一百五十七页(2)一个因素多个(m个)属性,引入m-1
49、个虚拟变量,这样可避免产生多重共线性。例:设公司职员的年薪(y)与工龄(x)及学历(D)有关,学历因素分三种属性:大专以下、本科、研究生,应设置两个虚拟变量。虚拟变量模型为 yt=b0+b1xt+b2D1t+b3D2t+ut(3)多个(m)因素两种属性,引入个虚拟变量。例:住房消费问题支出的影响因素有可支配收入、城乡差异、不同收入层次等因素,虚拟变量模型为 yt=b0+b1xt+b2D1t+b3D2t+ut本讲稿第八十三页,共一百五十七页2、虚拟变量的引入方式(1)加法引入虚拟变量(2)乘法引入虚拟变量(3)加法和乘法引入虚拟变量7.1.3 虚拟变量的特殊应用1、调整季节波动例如:利用季节数据
50、分析某公司利润(y)与销售收入(x)之间的关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量,利润函数为 yt=b0+b1xt+a1D1t+a2D2t+a3D3t+ut本讲稿第八十四页,共一百五十七页2、检验模型结构的稳定性设同一总体两个样本的回归模型分别为样本1:yt=b0+b1xt+ut样本2:yt=a0+a1xt+ut设虚拟变量将样本1与样本2合并,建立以下模型:yt=b0+(a0-b0)Dt+b1xt+(a1-b1)xtDt+ut利用t检验判断a0-b0和a1-b1是否显著为零。当a0=b0和a1=b1显著成立时,表明两模型之间没有显著差异,称为“重合回归”,模型结构稳定。当a