《CHP3多元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《CHP3多元线性回归模型.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第三章 多元线性回归模型(2)一、基本概念回顾二、基本假设三、检验四、自变量关系 2一,概念:1、偏回归系数:o1、与双变量模型一样分为确定性成分和随机性成分。o2、Y X U也分别为被解释变量、解释变量 随机扰动项。o3 不同的是回归系数我们称之为偏回归系数3偏回归系数o讨论:经济学中的比较静态分析与偏回归系数的含义!o问题:我们如何评价某一解释变量对被解释变量的真实影响?n如:如:如何评价如何评价X2对对Y变化的真实贡献?变化的真实贡献?控制住X3影响!4如何控制住如何控制住X3影响?影响?o以生产函数为例n假定在度量劳动投入X2的单位变化对产出的影响时,我们要控制资本投入X3的线性影响
2、。o为此目的可进行如下步骤:做Y 对X3的回归的回归做X2对X3的回归的回归除去X3对Y 的影响的影响Yi的值(的值(“净化净化”了的了的Y)除去X3对X2 的影响的影响X2i的值的值(“净化净化”了的了的X25步骤三6一一般形式:对于有般形式:对于有 个解释变量的线性回归模型个解释变量的线性回归模型 模型中参数模型中参数 是偏回归系数,是偏回归系数,样本容量为样本容量为偏偏回回归归系系数数:控控制制其其它它解解释释量量不不变变的的条条件件下下,第第 个个解解释释变变量量的单位变动对应变量平均值的影响。的单位变动对应变量平均值的影响。7指对各个回归系数而言是指对各个回归系数而言是“线性线性”的
3、,对变量则的,对变量则可是线性的,也可是非线性的可是线性的,也可是非线性的例如:生产函数例如:生产函数取自然对数取自然对数2、线性、线性83、多元总体与样本回归函数、多元总体与样本回归函数9 用矩阵表示用矩阵表示10二、多元二、多元线性回性回归模型的基本假定模型的基本假定 假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。假设2,随机误差项具有零均值、同方差及不序列相关性。11 假设3,解释变量与随机项不相关 假设4,随机项满足正态分布 12上述假设的上述假设的矩阵符号表示矩阵符号表示 式:式:假设1,nk维矩阵X是非随机的,且X的秩=k,即X满秩。假设2,回忆回忆线性代
4、数线性代数中关于满秩、线性中关于满秩、线性无关无关!对角线说明了扰动项的同方差性!对对角线说明了扰动项的同方差性!对角线之外说明了扰动项的序列无关性!角线之外说明了扰动项的序列无关性!13假设4,向量 有一多维正态分布,即 假设3,E(X)=0,即 转置转置假设5,回归模型的设定是正确的。141、修正的可决系数、修正的可决系数可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。三、多元回归检验152、F检验163、判定系数与F之间的关系:多元回归总体的显著性检验与判定系数的显著性检验是等价的。o4、T检验17四、自变量关系o1、筛选自变量,
5、偏F。与FC1819o判定系数比较的前提条件:n被解释变量相同:不同解释变量的判定系数不可比n样本容量相同n矫正的判定系数可作为增减变量的依据2、判定系数3、受限最小二乘:有约束条件的模型受限最小二乘:有约束条件的模型2021但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR 与 RSSU的差异变小。可用可用RSSR-RSSU的大小来检验约束的真实性的大小来检验约束的真实性于是:讨论:讨论:如果约束条件无效,RSSR 与 RSSU的差异较大,计算的F值也较大。于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。注意,k
6、U-kR恰为约束条件的个数。这里的里的F检验适合所有关于参数适合所有关于参数线性性约束的束的检验如:多元回归中对方程总体线性性方程总体线性性的F检验:H0:j=0 j=1,2,k这里:受约束回归模型为这里,运用了ESSR 0。利用约束条件判定对回归模型增加或减少解释变量利用约束条件判定对回归模型增加或减少解释变量考虑如下两个回归模型(*)(*)(*)式可看成是(*)式的受约束回归:受约束回归:H0:相应的统计量为:如果约束条件为真,即额外的变量Xk+1,Xk+q对没有解释能力,则统计量较小;否则,约束条件为假,意味着额外的变量对有较强的解释能力,则统计量较大。因此,可通过F的计算算值与临界界值
7、的比较,来判断额外变量是否应包括在模型中。讨论:讨论:统计量的另一个等价式量的另一个等价式 利用有限最小二乘判定参数的稳定性利用有限最小二乘判定参数的稳定性 1、邹氏参数氏参数稳定性定性检验 建立模型时往往希望模型的参数是稳定的,即所谓的结构不构不变,这将提高模型的预测与分析功能。如何检验如何检验?假设需要建立的模型需要建立的模型为在 两 个 连 续 的 时 间 序 列(1,2,,n1)与(n1+1,,n1+n2)中,相应的模型分别为:合并两个时间序列为(1,2,,n1,n1+1,,n1+n2),则可写出如下无约束回无约束回归模型 如果=,表示没有发生结构变化,因此可针对如下假设进行检验:H0
8、:=(*)式施加上述约束后变换为受约束受约束回归模型(*)(*)因此,检验的F统计量为:记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和,容易验证,于是参数稳定性的检验步骤:参数稳定性的检验步骤:(1)分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方:RSS1与RSS2 (2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR (3)计算F统计量的值,与临界值比较:若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。该 检 验 也 被 称 为 邹邹 氏氏 参参 数数 稳稳 定定 性性 检检 验验(Chow test for paramet
9、er stability)。2、邹氏氏预测检验 上述参数稳定性检验要求n2k。如果出现n2F(n2,n1-k-1),则拒绝原假设,认为预测期发生了结构变化。例例 中国城镇居民食品人均消费需求的邹氏检验。1、参数稳定性检验、参数稳定性检验19811994:RSS1 19952001:(9.96)(7.14)(-5.13)(1.81)19812001:(14.83)(27.26)(-3.24)(-11.17)给定=5%,查表得临界值F 判断:判断:F值临界界值,拒,拒绝参数参数稳定的原假定的原假设,表,表明中国城明中国城镇居民食品人均消居民食品人均消费需求在需求在1994年前后年前后发生了生了显著
10、著变化。化。2、邹氏预测邹氏预测检验检验给定=5%,查表得临界值F判断判断:F值临界界值,拒,拒绝参数参数稳定的原假定的原假设 *四、非线性约束四、非线性约束 也可对模型参数施加非线性约束非线性约束,如对模型施加非线性约束12=1,得到受受约束回束回归模型模型:该 模 型 必 需 采 用 非非 线线 性性 最最 小小 二二 乘乘 法法(nonlinear least squares)进行估计。非非线线性性约约束束检检验验是建立在最最大大似似然然原原理理基础上的,有最最大大似似然然比比检验、沃沃尔德德检验与拉拉格朗日乘数格朗日乘数检验.1、最大似然比、最大似然比检验(likelihood rat
11、io test,LR)估计估计:无约束回归模型与受约束回归模型,方法方法:最大似然法,检验检验:两个似然函数的值的差异是否“足够”大。记L(,2)为一似然函数:无约束回归无约束回归:Max:受约束回归受约束回归:Max:或求极值:g():以各约束条件为元素的列向量,:以相应拉格朗日乘数为元素的行向量 约束:g()=0 受受约束束的函数的函数值不会超不会超过无无约束束的函数的函数值,但如果约束条件为真约束条件为真,则两个函数值就非常“接近接近”。由此,定义似然比似然比(likelihood ratio):如果如果比值很小,说明说明两似然函数值差距较大,则应拒绝拒绝约束条件为真的假设;如果如果比值
12、接近于,说明说明两似然函数值很接近,应接受接受约束条件为真的假设。具体具体检验时,由于大样本下:h是约束条件的个数。因此:通通过LR统计量的量的 2分布特性来分布特性来进行判断。行判断。在中国城中国城镇居民人均食品消居民人均食品消费需求例需求例中,对零阶零阶齐次性齐次性的检验:LR=-2(38.57-38.73)=0.32 给出=5%、查得临界界值 2(1),判断判断:LR 2(1),不拒绝原约束的假设,不拒绝原约束的假设,表明表明:中国城中国城镇居民居民对食品的人均消食品的人均消费需求函数需求函数满足零足零阶齐次性条件次性条件。、沃、沃尔德德检验(Wald test,W)沃尔德检验中,只须估
13、计无约束模型。如对 在所有古典假设都成立的条件下,容易证明 因此,在1+2=1的约束条件下 记 可建立沃尔德统计量沃尔德统计量:如果有h个约束条件,可得到h个统计量z1,z2,zh 约束条件为真时,可建立大样本大样本下的服从自由度为h的渐近 2 分布统计量 其中,Z为以zi为元素的列向量,C是Z的方差-协方差矩阵。因此,W从从总体上体上测量了无量了无约束回束回归不不满足足约束条件的程度。束条件的程度。对对非线性约束非线性约束,沃尔德统计量,沃尔德统计量W的算法描述要复杂得多。的算法描述要复杂得多。3、拉格朗日乘数、拉格朗日乘数检验 拉格朗日乘数检验则只需估计受约束受约束模型.受约束回归是求最大
14、似然法的极值问题:是拉格朗日乘数行向量,衡量各约束条件对最大似然函数值的影响程度。如果某一约束为真,则该约束条件对最大似然函数值的影响很小,于是,相应的拉格朗日乘数的值应接近于零。因此,拉格朗日乘数检验就是检验某些拉格朗日乘数的值是否“足够大”,如果“足够大”,则拒绝约束条件为真的假设。拉格朗日统计量LM本身是一个关于拉格朗日乘数的复杂的函数,在各约束条件为真的情况下,服从一自由度恰为约束条件个数的渐近2分布。n为样本容量,R2为如下被称为辅助回归辅助回归(auxiliary regression)的可决系数:如果约束是非线性的,辅助回归方程的估计比较复杂,但仍可按(*)式计算LM统计量的值。
15、最后,一般地有最后,一般地有:LMLRW 同样地,如果为线性约束,LM服从一精确的2分布:(*)453、受约束的OLSo一般的多元模型都是非受限 (约束)模型。因此我们用OLS估计时,称为非受限最小二乘。o经济理论有时会提出某一回归模型中的系数满足一些线性等式约束条件。o当具备这个约束条件后,方程是否有效,要进行检验o例如,考虑柯布一道格拉斯生产函数中的规模报酬不变n每一同比例的投入变化有同比例的产出变化o即o检验中,有两种方法(t检验和F检验)46对模型施加约束得或(*)(*)如果对(*)式回归得出则由约束条件可得:47 但是但是,如果如果约束条件束条件为真真,则受受约束束回回归模型与模型与
16、无无约束束回回归模型具有相同的解模型具有相同的解释能力能力,RSSR 与 RSSU的差异变小。如果约束条件无效,RSSR 与 RSSU的差异较大,计算的F值也较大于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。48t检验49七、参数的置信区七、参数的置信区间 参参数数的的置置信信区区间用来考察:在在一一次次抽抽样中中所所估估计的参数的参数值离参数的真离参数的真实值有多有多“近近”。在变量的显著性检验中已经知道:在变量的显著性检验中已经知道:50容易推出容易推出:在(1-)的置信水平下j的置信区间是 其中,t/2为显著性水平为、自由度为n-k-1的临
17、界值。51如何才能缩小置信区间?如何才能缩小置信区间?增大样本容量增大样本容量n n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的拟合优度提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小,置信区间的就越窄。在实际应用中,我们希望置信度越高越好,置信区在实际应用中,我们希望置信度越高越好,置信区间越小越好。间越小越好。52第五节 案例分析案例:中国税收增长的分析中国税收增长的分析提出问题提出问题改革开放以来,随着经济体制改革的深化和经济的快速增改革开放以来,随着经济体制改革
18、的深化和经济的快速增长,中国的财政收支状况发生很大变化,为了研究影响中长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。经济模型。53理论分析理论分析影响中国税收收入增长的主要因素可能有:影响中国税收收入增长的主要因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本)从宏观经济看,经济整体增长是税收增长的基本源泉。源泉。(2)社会经济的发展和社会保障等都对公共财政提出)社会经济的
19、发展和社会保障等都对公共财政提出要求,公共财政的需求对当年的税收收入可能会有要求,公共财政的需求对当年的税收收入可能会有一定的影响。一定的影响。(3)物价水平。中国的税制结构以流转税为主,以现)物价水平。中国的税制结构以流转税为主,以现行价格计算的行价格计算的GDP和经营者的收入水平都与物价水和经营者的收入水平都与物价水平有关。平有关。(4)税收政策因素。)税收政策因素。54 以以各项税收收入各项税收收入Y 作为被解释变量作为被解释变量 以以GDP表示经济整体增长水平表示经济整体增长水平 以财政支出表示公共财政的需求以财政支出表示公共财政的需求 以以商品零售价格指数商品零售价格指数表示物价水平
20、表示物价水平 税收政策因素较难用数量表示税收政策因素较难用数量表示,暂时不予考虑暂时不予考虑建立模型55模型设定为模型设定为:其中:其中:各项税收收入(亿元)各项税收收入(亿元)国内生产总值(亿元)国内生产总值(亿元)财政支出(亿元)财政支出(亿元)商品零售价格指数(商品零售价格指数(%)56数据来源:中国统计年鉴其中:各项税收收入(亿元)国内生产总值(亿元)财政支出(亿元)商品零售价格指数(%)数据收集57假定模型中随机项满足基本假定,可用假定模型中随机项满足基本假定,可用OLS法估计法估计其参数。其参数。具体操作:具体操作:用用EViews软件,估计结果为:软件,估计结果为:参数估计58t
21、检验:检验:给定给定 ,查,查t分布表,在自由度为分布表,在自由度为 时临界值为时临界值为 ,因为,因为 的参数对应的的参数对应的t统计量均大于统计量均大于2.080,这这说明在说明在5%的显著性水平下,斜率系数均显著不的显著性水平下,斜率系数均显著不为零,表明国内生产总值、财政支出、商品零售为零,表明国内生产总值、财政支出、商品零售价格指数对财政收入分别都有显著影响。价格指数对财政收入分别都有显著影响。59本模型中本模型中所估计的参数的符号与经济理论分析一致,说明所估计的参数的符号与经济理论分析一致,说明在其他因素不变的情况下,国内生产总值每增加在其他因素不变的情况下,国内生产总值每增加1
22、1亿元,平均说来财政收入将增加万元;财政支出亿元,平均说来财政收入将增加万元;财政支出每增加每增加1 1亿元,平均说来财政收入将增加万元亿元,平均说来财政收入将增加万元;商商品零售物价指数每增加品零售物价指数每增加1%,平均说来财政收入将平均说来财政收入将增加亿元增加亿元。经济意义检验 60 1.1.多元线性回归模型是将总体回归函数描述为一多元线性回归模型是将总体回归函数描述为一 个被解释变量与多个解释变量之间线性关系的个被解释变量与多个解释变量之间线性关系的 模型。模型。通常多元线性回归模型可以用矩阵形式表示:通常多元线性回归模型可以用矩阵形式表示:2.2.多元线性回归模型中对随机扰动项多元
23、线性回归模型中对随机扰动项u u的假定的假定:零零 均值假定、同方差假定、无自相关假定、随机均值假定、同方差假定、无自相关假定、随机 扰动与解释变量不相关假定、正态性假定、无扰动与解释变量不相关假定、正态性假定、无 多重共线性假定。多重共线性假定。第三章第三章 小结小结613.3.多元线性回归模型参数的最小二乘估计式及期多元线性回归模型参数的最小二乘估计式及期 望、方差和标准误差:望、方差和标准误差:4.4.在基本假定满足的条件下,多元线性回归模型在基本假定满足的条件下,多元线性回归模型 最小二乘估计式是最佳线性无偏估计式。最小二乘估计式是最佳线性无偏估计式。625.多元线性回归模型中参数区间
24、估计的方法。多元线性回归模型中参数区间估计的方法。6.多重可决系数的意义和计算方法:多重可决系数的意义和计算方法:修正可决系数的作用和方法:修正可决系数的作用和方法:637.F检验是对多元线性回归模型中所有解释变量联检验是对多元线性回归模型中所有解释变量联 合显著性的检验,合显著性的检验,F检验是在方差分析基础上进检验是在方差分析基础上进 行的行的。648.多元回归分析中,为了分别检验当其它解释变量不多元回归分析中,为了分别检验当其它解释变量不变时,各个解释变量是否对被解释变量有显著影响,变时,各个解释变量是否对被解释变量有显著影响,需要分别对所估计的各个回归系数作需要分别对所估计的各个回归系数作t检验。检验。659.9.利用多元线性回归模型作被解释变量平均值预利用多元线性回归模型作被解释变量平均值预 测与个别值预测的方法。测与个别值预测的方法。点预测:点预测:平均值:平均值:个别值:个别值: