《《多元回归模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多元回归模型》PPT课件.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 经典单方程计量经济学模型:经典单方程计量经济学模型:多元线性回归模型多元线性回归模型Multiple Linear Regression Modeli=1,2,n 总体回归模型:总体回归模型:总体回归函数的随机表达形式总体回归函数的随机表达形式k为解释变量的数目。习惯上,把常数项看成为为解释变量的数目。习惯上,把常数项看成为虚变量的系数,该虚变量的样本观测值始终取虚变量的系数,该虚变量的样本观测值始终取1 1。于是,模型中解释变量的数目为。于是,模型中解释变量的数目为(k+1+1)。j j称为称为回归参数回归参数(regression coefficient)。)。一、多元线性回
2、归模型一、多元线性回归模型3.1 3.1 多元线性回归模型概述多元线性回归模型概述(Regression Analysis)总体回归函数:总体回归函数:描述在给定解释变量描述在给定解释变量Xi条件下条件下被解释变量被解释变量Yi的条件均值。的条件均值。j也被称为也被称为偏回归系数偏回归系数(partial regression coefficients),表示在其他解释变量保持不变,表示在其他解释变量保持不变的情况下,的情况下,Xj每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的变化。的变化。或者说或者说j给出了给出了Xj的单位变化对的单位变化对Y均值的均值的“直直接接”或或“净净”
3、(不含其他变量)影响。(不含其他变量)影响。总体回归函数总体回归函数总体回归模型的矩阵表示总体回归模型的矩阵表示(了解)(了解)样本回归函数与样本回归模型样本回归函数与样本回归模型从一次抽样中获得的总体回归函数的近似,称为从一次抽样中获得的总体回归函数的近似,称为样样本回归函数(本回归函数(sample regression function)。样本回归函数的随机形式,称为样本回归函数的随机形式,称为样本回归模型样本回归模型(sample regression model)。样本回归函数的矩阵表示样本回归函数的矩阵表示(了解)(了解)二、多元线性回归模型的基本假设二、多元线性回归模型的基本假设
4、(主要归纳如下四方面)(主要归纳如下四方面)假设假设1,解释变量是非随机的或固定的,解释变量是非随机的或固定的,且各且各X之间互不相关(无多重共线性);之间互不相关(无多重共线性);假设假设2,随机误差项具有零均值、同方差,随机误差项具有零均值、同方差及不序列相关性;及不序列相关性;假设假设3,解释变量与随机项不相关;,解释变量与随机项不相关;假设假设4,随机项满足正态分布。,随机项满足正态分布。3.2 3.2 多元线性回归模型的估计多元线性回归模型的估计 一、普通最小二乘估计一、普通最小二乘估计 二、最大或然估计二、最大或然估计 (略)略)三、矩估计(略)三、矩估计(略)四、参数估计量的性质
5、四、参数估计量的性质 五、样本容量问题五、样本容量问题六、估计实例六、估计实例 1 1、普通最小二乘估计、普通最小二乘估计最小二乘原理:最小二乘原理:根据被解释变量的所有观测值根据被解释变量的所有观测值与估计值之差的平方和最小的原则求得参数估与估计值之差的平方和最小的原则求得参数估计量。计量。一、普通最小二乘估计一、普通最小二乘估计(OLS)(OLS)已知已知假定假定 步骤步骤:(了解):(了解)正规方程组正规方程组的的矩阵形式矩阵形式(了解)(了解)条件?条件?在满足基本假设的情况下,多元线性模型在满足基本假设的情况下,多元线性模型结构参数结构参数 的的普通最小二乘估计普通最小二乘估计、最大
6、或最大或然估计然估计及及矩估计矩估计具有具有线性性线性性、无偏性无偏性、有有效性效性。同时,随着样本容量增加,参数估计量具同时,随着样本容量增加,参数估计量具有有渐近无偏性渐近无偏性、渐近有效性渐近有效性、一致性一致性。二、参数估计量的性质二、参数估计量的性质1 1、最小样本容量最小样本容量 所谓所谓“最小样本容量最小样本容量”,即从最小二乘原理和最,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。量如何,所要求的样本容量的下限。样本最小容量必须不少于模型中解释变量的样本最小容量必须不少于模型中解释变量的数
7、目(包括常数项)数目(包括常数项),即 n k+1为什么?为什么?三、样本容量问题三、样本容量问题2 2、满足基本要求的样本容量、满足基本要求的样本容量 从统计检验的角度:从统计检验的角度:n 30 时,时,Z检验才能应用;检验才能应用;n-k 8 8时时,t分布较为稳定。分布较为稳定。一般经验认为一般经验认为:当当n 30或者至少或者至少n 3(k+1)时,才能说满足时,才能说满足模型估计的基本要求。模型估计的基本要求。模型的良好性质只有在大样本下才能得到理论模型的良好性质只有在大样本下才能得到理论上的证明。上的证明。地区城镇居民消费模型地区城镇居民消费模型被解释变量:地区城镇居民人均消费被
8、解释变量:地区城镇居民人均消费Y解释变量:解释变量:地区城镇居民人均可支配收入地区城镇居民人均可支配收入X1前一年地区城镇居民人均消费前一年地区城镇居民人均消费X2样本:样本:2006年,年,31个地区个地区四、例题四、例题数据数据变量间关系变量间关系变量间关系变量间关系OLSOLS估计估计OLSOLS估计结果估计结果3.3 3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model 一、拟合优度检验一、拟合优度检验 二、方程的显著性检验二、方程的显著性检验(F(F检验检验)三、变量的显
9、著性检验(三、变量的显著性检验(t t检验)检验)四、参数的置信区间四、参数的置信区间 可决系数(可决系数(Coefficient of Determination)该统计量越接近于该统计量越接近于1,模型的拟合优度越高。,模型的拟合优度越高。从从R2的表达式的表达式中发现,如果在模型中增加解释中发现,如果在模型中增加解释变量,变量,R2往往增大。往往增大。这就给人一个错觉:要使得模型拟合得好,只这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。要增加解释变量即可。但是,由增加解释变量引起的但是,由增加解释变量引起的R2的增大与拟合的增大与拟合好坏无关好坏无关,所以所以R R2 2需
10、调整。需调整。一、拟合优度检验一、拟合优度检验 Goodness of Fit 调整的可决系数调整的可决系数(adjusted coefficient of determination)其中:其中:n-k-1为残差平方和的自由度,为残差平方和的自由度,n-1为总体平为总体平方和的自由度。方和的自由度。调整的可决系数多大才是合适的?调整的可决系数多大才是合适的?3、赤池信息准则和施瓦茨准则、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有拟合优度,常用的标准还有:赤池信息准则赤池信息准则(Akaike in
11、formation criterion,AIC)施瓦茨准则施瓦茨准则(Schwarz criterion,SC)这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC值或值或SCSC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。地区城镇居民消费模型(地区城镇居民消费模型(k=2)地区城镇居民消费模型(地区城镇居民消费模型(k=1)与与k=2比较,变化不大比较,变化不大二、方程的显著性检验二、方程的显著性检验(F(F检验检验)Testing the Overall Significance of a Multiple Regression
12、(the F test)方程的显著性检验,旨在对模型中被解释变量方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系与解释变量之间的线性关系在总体上在总体上是否显著成是否显著成立作出推断。立作出推断。在多元模型中,即检验模型在多元模型中,即检验模型中的中的参数参数 j是否显是否显著不为著不为0。在原假设在原假设H0成立的条件下成立的条件下,统计量,统计量 给定显著性水平给定显著性水平,可得到临界值,可得到临界值F(k,n-k-1),由样本求出统计量,由样本求出统计量F的数值,通过的数值,通过 F F F(k,n-k-1)或或 F F F(k,n-k-1)来拒绝或接受原假设来拒绝或接
13、受原假设H0,以判定原方程总体上的,以判定原方程总体上的线性关系是否显著成立。线性关系是否显著成立。关于拟合优度检验与方程显著性检验关系关于拟合优度检验与方程显著性检验关系的讨论的讨论 对于一般的实际问题,在对于一般的实际问题,在5%5%的显著性水平下,的显著性水平下,F F统计量的临界值所对应的统计量的临界值所对应的R R2 2的水平是较低的。的水平是较低的。所以,不宜过分注重所以,不宜过分注重R R2 2值,应注重模型的经济意值,应注重模型的经济意义;在进行总体显著性检验时,显著性水平应该义;在进行总体显著性检验时,显著性水平应该控制在控制在5%5%以内。以内。方程的方程的总体线性总体线性
14、关系显著关系显著不等于不等于每个解释变量每个解释变量对被解释变量的影响都是显著的。对被解释变量的影响都是显著的。必须对每个解释变量进行显著性检验,以决定必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。是否作为解释变量被保留在模型中。这一检验是由对变量的这一检验是由对变量的 t 检验完成的。检验完成的。三、变量的显著性检验(三、变量的显著性检验(t t检验)检验)Testing the Significance of Variables(the t test)t t检验检验 设计原假设与备择假设:设计原假设与备择假设:H1:i 0 0 给定显著性水平给定显著性水平,可得到
15、临界值,可得到临界值t/2(n-k-1),由样本求出统计量由样本求出统计量t的数值,通过的数值,通过|t|t|t/2(n-k-1)或或|t|t|t/2(n-k-1)判断拒绝或不拒绝原假设判断拒绝或不拒绝原假设H0,从而,从而判定对应的解判定对应的解释变量是否应包括在模型中。释变量是否应包括在模型中。H0:i=0=0 (i=1,2k)参数的置信区间参数的置信区间在在(1-(1-)的置信水平下的置信水平下四、参数的置信区间四、参数的置信区间 Confidence Interval of Parameter如何才能缩小置信区间?如何才能缩小置信区间?增大样本容量增大样本容量n n,因为在同样的样本容
16、量下,因为在同样的样本容量下,n n越越大,大,t t分布表中的临界值越小,同时,增大样本容分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小。量,还可使样本参数估计量的标准差减小。提高模型的拟合优度提高模型的拟合优度,因为样本参数估计量的标,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差准差与残差平方和呈正比,模型优度越高,残差平方和应越小。平方和应越小。提高样本观测值的分散度提高样本观测值的分散度,一般情况下,样本观一般情况下,样本观测值越分散测值越分散,(XX)-1的分母的的分母的|XX|的值越大,致的值越大,致使区间缩小。使区间缩小。3.5 3
17、.5 回归模型的其他函数形式回归模型的其他函数形式 一、模型的类型与变换一、模型的类型与变换 二、非线性回归实例二、非线性回归实例 三、非线性最小二乘估计(略)三、非线性最小二乘估计(略)说说 明明在实际经济活动中,经济变量的关系是复杂的,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。直接表现为线性关系的情况并不多见。如著名的如著名的恩格尔曲线恩格尔曲线(Engle curves)表现为表现为幂函幂函数曲线数曲线形式、宏观经济学中的形式、宏观经济学中的菲利普斯曲线菲利普斯曲线(Pillips cuves)表现为)表现为双曲线双曲线形式等。形式等。但是,大部分非线性
18、关系又可以通过一些简单但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。而可以运用线性回归模型的理论方法。一、模型的类型与变换一、模型的类型与变换 1 1、倒数模型、多项式模型与变量的直接置换法、倒数模型、多项式模型与变量的直接置换法 例如,描述税收与税率关系的例如,描述税收与税率关系的拉弗曲线:拉弗曲线:抛物线抛物线 s=a+b r+c r2 c0 s:税收;:税收;r:税率:税率设设X1=r,X2=r2,则原方程变换为则原方程变换为 s=a+b X1+c X2 c0 2、幂函数模型、指数
19、函数模型与对数变换法、幂函数模型、指数函数模型与对数变换法 例如,例如,Cobb-Dauglas生产函数生产函数:幂函数:幂函数 Q=AK L Q:产出量,:产出量,K:投入的资本;:投入的资本;L:投入的劳动:投入的劳动 方程两边取对数:方程两边取对数:ln Q=ln A+ln K+ln L 再令再令lnQ=Y、lnK=X1、lnL=X2即实现了模型即实现了模型线性化线性化3、复杂函数模型与级数展开法、复杂函数模型与级数展开法(了解)(了解)方程两边取对数后,得到:方程两边取对数后,得到:(1+2=1)Q:产出量,产出量,K:资本投入,:资本投入,L:劳动投入:劳动投入 :替代参数,:替代参
20、数,1、2:分配参数:分配参数例如,常替代弹性CES生产函数 将式中将式中ln(1K-+2L-)在在=0处展开台劳级数处展开台劳级数,取关取关于于 的线性项,即得到一个线性近似式。的线性项,即得到一个线性近似式。如取如取0阶、阶、1阶、阶、2阶项,可得阶项,可得 二、可化为线性的非线性回归实例二、可化为线性的非线性回归实例 (结合(结合EVIEWS演示)演示)例例 建立中国城镇居民食品消费需求函数模型建立中国城镇居民食品消费需求函数模型。根据需求理论,居民对食品的消费需求函数大致为根据需求理论,居民对食品的消费需求函数大致为 Q:居民对食品的需求量,居民对食品的需求量,X:消费者的消费支出总额
21、消费者的消费支出总额P1:食品价格指数,:食品价格指数,P0:居民消费价格总指数。:居民消费价格总指数。零阶齐次性零阶齐次性,当所有商品和消费者货币支出总额按同,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变一比例变动时,需求量保持不变(*)(*)为了进行比较,将同时估计(为了进行比较,将同时估计(*)式与()式与(*)式。)式。根据根据恩格尔定律恩格尔定律,居民对,居民对食品的消费支出食品的消费支出与居民的与居民的总总支出支出间呈间呈幂函数幂函数的变化关系的变化关系:首先首先,确定具体的函数形式确定具体的函数形式对数变换对数变换:考虑到考虑到零阶齐次性零阶齐次性时时(*)(*
22、)(*)式也可看成是对(式也可看成是对(*)式施加如下约束而得)式施加如下约束而得因因此此,对对(*)式式进进行行回回归归,就就意意味味着着原原需需求函数满足零阶齐次性条件求函数满足零阶齐次性条件。X:人均消费:人均消费X1:人均食品:人均食品消费消费GP:居民消费:居民消费价格指数价格指数FP:居民食品:居民食品消费价格指数消费价格指数Q:人均食品消:人均食品消费(费(90年价)年价)P0:居民消费:居民消费价格缩减指数价格缩减指数(1990=100)P1:居民食品:居民食品消费价格缩减消费价格缩减指数指数(1990=100)按(按(*)式估计)式估计具体解释估计结果及其经济含义。具体解释估计结果及其经济含义。按(按(*)式估计)式估计具体解释估计结果及其经济含义。具体解释估计结果及其经济含义。