《3[1].1_多元线性回归模型_.ppt》由会员分享,可在线阅读,更多相关《3[1].1_多元线性回归模型_.ppt(111页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 经典单方程计量经济学模经典单方程计量经济学模型:多元回归型:多元回归 多元线性回归模型多元线性回归模型 多元线性回归模型的参数估计多元线性回归模型的参数估计多元线性回归模型的统计检验多元线性回归模型的统计检验多元线性回归模型的预测多元线性回归模型的预测回归模型的其他形式回归模型的其他形式回归模型的参数约束回归模型的参数约束3.1 多元线性回归模型多元线性回归模型 一、多元线性回归模型一、多元线性回归模型 二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定【引例引例】中国汽车的保有量会达到中国汽车的保有量会达到1.41.4亿辆吗亿辆吗?中国经济的快速发展,使居民收入不断增
2、加,中国经济的快速发展,使居民收入不断增加,数以百万计的中国人开始得以实现拥有汽车的梦想,数以百万计的中国人开始得以实现拥有汽车的梦想,中国也成为世界上成长最快的汽车市场。中国交通部中国也成为世界上成长最快的汽车市场。中国交通部副部长在中国交通可持续发展论坛上做出预测副部长在中国交通可持续发展论坛上做出预测 :“2020:“2020年,中国的民用汽车保有量将比年,中国的民用汽车保有量将比20032003年的数字增长年的数字增长倍,达到倍,达到1.41.4亿辆左右亿辆左右”。是什么因素导致中国汽车数量的增长是什么因素导致中国汽车数量的增长?影响中国汽车行业发展的因素并不是单一的,经影响中国汽车行
3、业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境,都会使中国汽车行业面临机遇道路发展、内外环境,都会使中国汽车行业面临机遇和挑战。和挑战。分析中国汽车行业未来的趋势分析中国汽车行业未来的趋势,应具体分析这样一些问题:应具体分析这样一些问题:中国汽车市场发展的状况如何?中国汽车市场发展的状况如何?(用销售量观测)(用销售量观测)影响中国汽车销量的主要因素是什么?影响中国汽车销量的主要因素是什么?(如收入、价格、费用、道路状况、能源、政策环境等)(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对
4、汽车销量影响的性质怎样?(正、负)各种因素对汽车销量影响的性质怎样?(正、负)各种因素影响汽车销量的具体数量关系是什么?各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?的产业政策?很明显,只用一个解释变量已很难分析汽车产业的发很明显,只用一个解释变量已很难分析汽车产业的发展展,还需要寻求有更多个解释变量情况的回归分析方法。还需要寻求有更多个解释变量情况的回归分析方法。怎样分析多种因素的影响?怎样分析多种因素的影响?一、多元线性回归模型一、多元
5、线性回归模型 多元线性回归模型多元线性回归模型:表现在线性回归模型中的解释表现在线性回归模型中的解释变量有多个。变量有多个。一般表现形式:一般表现形式:(3.1.1)其中其中:k为解释变量的数目,为解释变量的数目,j称为称为回归参数回归参数(regression coefficient)。)。习习惯惯上上:把把常常数数项项看看成成为为一一虚虚变变量量的的系系数数,该该虚虚变量的样本观测值始终取变量的样本观测值始终取1。这样:。这样:模型中解释变量的数目为(模型中解释变量的数目为(k+1)也也被被称称为为总总体体回回归归函函数数的的随随机机表表达达形形式式。它的它的非随机表达式非随机表达式为为:
6、方程表示:方程表示:各变量各变量X值固定时值固定时Y的平均响应。的平均响应。j也也被被称称为为偏偏回回归归系系数数,表表示示在在其其他他解解释释变变量量保保持持不不变变的的情情况况下下,Xj每每变变化化1个个单单位位时时,Y的的均均值值E(Y)的的变化变化;或或者者说说 j给给出出了了Xj的的单单位位变变化化对对Y均均值值的的“直直接接”或或“净净”(不含其他变量)影响。(不含其他变量)影响。(3.1.2)个解释变量的多元线性回归模型的个解释变量的多元线性回归模型的 个观测个观测样本,可表示为样本,可表示为 总体回归模型总体回归模型n n个随机方程的个随机方程的矩阵表达式矩阵表达式为为 其中其
7、中(3.1.3)样本回归函数样本回归函数:用来估计总体回归函数:用来估计总体回归函数其其随机表示式随机表示式:ei 称为称为残差残差或或剩余项剩余项(residuals),可看成可看成是总体回归函数中随机扰动项是总体回归函数中随机扰动项 i 的近似替代。的近似替代。样本回归函数样本回归函数的的矩阵表达矩阵表达:或或其中:其中:(3.1.4)(3.1.5)(3.1.6)(3.1.7)二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定 假设假设1 1:解释变量是非随机的或固定的,且各:解释变量是非随机的或固定的,且各X Xi i之间互不之间互不 相关(无多重共线性)。相关(无多重共线性)
8、。假设假设2 2:随机误差项具有零均值、同方差及不序列相关性:随机误差项具有零均值、同方差及不序列相关性假设假设3 3:解释变量与随机项不相关:解释变量与随机项不相关 假设假设4 4:随机项满足正态分布:随机项满足正态分布 为了使参数估计量具有良好的统计性质,对多元线为了使参数估计量具有良好的统计性质,对多元线性回归模型(性回归模型(3.3.13.3.1)式子可作出类似于一元线性回归分)式子可作出类似于一元线性回归分析那样的若干基本假设。析那样的若干基本假设。上述假设的上述假设的矩阵符号表示矩阵符号表示 式:式:假设假设1:n(k+1)矩阵矩阵X是非随机的,且是非随机的,且X的秩的秩=k+1,
9、即即X 满秩。满秩。假设假设2:假设假设3:E(X)=0,即即 假设假设4:向量:向量 有一多维正态分布,即有一多维正态分布,即 同一元回归一样,多元回归还具有如下两个重要假设:同一元回归一样,多元回归还具有如下两个重要假设:假设假设5,样本容量趋于无穷时,各解释变量的方差趋于,样本容量趋于无穷时,各解释变量的方差趋于 有界常数,即有界常数,即n时,时,或或 其中其中Q为一非奇异固定矩阵,矩阵为一非奇异固定矩阵,矩阵x是由各解释变是由各解释变量的离差为元素组成的量的离差为元素组成的n k阶矩阵阶矩阵 假设假设6 6:回归模型的设定是正确的。:回归模型的设定是正确的。3.2 多元线性回归模型的估
10、计多元线性回归模型的估计 估计方法估计方法:OLS、ML或者或者MM一、普通最小二乘估计一、普通最小二乘估计 二、最大或然估计二、最大或然估计 三、参数估计量的性质三、参数估计量的性质 四、四、样本容量问题样本容量问题五、五、估计实例估计实例 一、普通最小二乘估计一、普通最小二乘估计对于随机抽取的对于随机抽取的n n组观测值组观测值如果如果样本函数样本函数的参数估计值已经得到,则有:的参数估计值已经得到,则有:i=1,2n (3.2.1)根据根据最小二乘原理最小二乘原理,参数估计值应使得剩余平方,参数估计值应使得剩余平方和达到最小,和达到最小,1 1、普通最小二乘估计、普通最小二乘估计即即 (
11、3.2.2)利用微积分知识,只要求利用微积分知识,只要求Q关于待估参数的偏导关于待估参数的偏导数,并令其值为零,即数,并令其值为零,即就得到待估参数估计值的正规方程组:就得到待估参数估计值的正规方程组:(*)在在(*)(*)式中,移项得:式中,移项得:解这个解这个k1个方程组成的线性代数方程组,即可个方程组成的线性代数方程组,即可得到得到k1个待估参数的估计值个待估参数的估计值 (3.2.3)(3.2.3)(3.2.3)的正规方程组的正规方程组的的矩阵形式矩阵形式即即由于由于XX满秩,故有满秩,故有 (3.2.4)(3.2.5)对于对于(*)(*)式,注意到式,注意到用矩阵形式表示:我们可以得
12、到正规方程的另一种形式用矩阵形式表示:我们可以得到正规方程的另一种形式 (3.2.6)(3.2.6)(3.2.6)式是多元回归模型式是多元回归模型正规方程的离差形式。正规方程的离差形式。由此容易得到多元回顾分析中由此容易得到多元回顾分析中样本回归函数的离样本回归函数的离差形式差形式i=1,2n (3.2.7)其其矩阵形式矩阵形式为为 其中其中在在离差形式下,参数的最小二乘估计结果离差形式下,参数的最小二乘估计结果为为 (3.2.8)(3.2.9)其参数的最小二乘估计量如下:其参数的最小二乘估计量如下:最简单的多元线性回归模型是二元线性回归模型。最简单的多元线性回归模型是二元线性回归模型。二元线
13、性回归模型的一般形式为:二元线性回归模型的一般形式为:1 1、2 2称为称为偏回归系数偏回归系数。例例3.2.1 3.2.1 在在例例2.1.12.1.1的的家庭收入家庭收入-消费支出消费支出例中,例中,可求得可求得 于是于是 对于多元回归模型对于多元回归模型估计值与观测值之间的残差:估计值与观测值之间的残差:残差的平方和为:残差的平方和为:2 2、随机干扰项、随机干扰项的方差的普通最小二乘估计的方差的普通最小二乘估计因为因为由于被解释变量的由于被解释变量的为为对称等幂矩阵对称等幂矩阵,即,即所以所以所以所以 (3.2.10)其中其中k为解释变量的个数为解释变量的个数二、最大或然估计二、最大或
14、然估计*(ML)对于多元线性回归模型对于多元线性回归模型易知易知 Y的随机抽取的的随机抽取的n组样本观测值的联合概率组样本观测值的联合概率即为变量即为变量Y的的似然函数似然函数 其中其中 (3.2.11)对数似然函数为对数似然函数为对对数似然函数求极大值,也就是对对对数似然函数求极大值,也就是对 求极小值。求极小值。因此,参数的因此,参数的最大或然估计最大或然估计为为显然结果与参数的普通最小二乘估计相同显然结果与参数的普通最小二乘估计相同 (3.2.12)(3.2.13)与一元回归相仿,容易得出多元回归下随机干与一元回归相仿,容易得出多元回归下随机干扰项方程的扰项方程的方差估计方差估计为:为:
15、(3.2.14)三、参数估计量的性质三、参数估计量的性质 在满足基本假设的情况下,其结构参数在满足基本假设的情况下,其结构参数 的的普通最普通最小二乘估计小二乘估计、最大或然估计最大或然估计及及矩估计矩估计仍具有:仍具有:线性性线性性、无偏性无偏性、有效性有效性。同时,随着样本容量增加,参数估计量具有:同时,随着样本容量增加,参数估计量具有:渐近无偏性、渐近有效性、一致性渐近无偏性、渐近有效性、一致性。1、线性性、线性性 其中其中,C=(XX)-1 X 为一仅与固定的为一仅与固定的X有关的向量;有关的向量;可见参数估计量是被解释变量可见参数估计量是被解释变量Y的线性组合。的线性组合。由于由于
16、2、无偏性、无偏性 这里利用了假设这里利用了假设:E(X)=0 (3.2.17)3、有效性(最小方差性)、有效性(最小方差性)(3.2.17)首先给出参数估计量首先给出参数估计量 的的方差方差协方差矩阵协方差矩阵:这里利用了这里利用了和和I为单位矩阵为单位矩阵 根据根据高斯高斯马尔可夫定理马尔可夫定理,(,(3.2.183.2.18)式表示的方)式表示的方差在所有无偏估计的方差中是最小的,所以该参数估计差在所有无偏估计的方差中是最小的,所以该参数估计量具有有效性。量具有有效性。其中其中事实上,事实上,是其他方法得到的关于是其他方法得到的关于的线性无偏估的线性无偏估计量:计量:,D为一固定矩阵,
17、为一固定矩阵,于是于是根据根据 是无偏性要求是无偏性要求由于由于 于是于是 的的方差方差协方差协方差矩阵为:矩阵为:DD为主对角线元素非负的对称矩阵,由此得为主对角线元素非负的对称矩阵,由此得四、样本容量问题四、样本容量问题 所谓所谓“最小样本容量最小样本容量”,即从最小二乘原理和最,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。何,所要求的样本容量的下限。1、最小样本容量最小样本容量 样本最小容量必须不少于模型中解释变量的数样本最小容量必须不少于模型中解释变量的数目(包括常数项)目(包括常数项),即
18、即 n k+1因为,因为,无多重共线性要求:秩无多重共线性要求:秩(X)=k+1 2 2、满足基本要求的样本容量、满足基本要求的样本容量 从统计检验的角度:从统计检验的角度:n 30 时,时,Z检验才能应用;检验才能应用;n-k 8时时,t分布较为稳定分布较为稳定 一般经验认为一般经验认为:当当n 30或者至少或者至少n 3(k+1)时,才能说满足模时,才能说满足模型估计的基本要求。型估计的基本要求。模型的良好性质只有在大样本下才能得模型的良好性质只有在大样本下才能得到理论上的证明到理论上的证明 五、多元线性回归模型的参数估计实例五、多元线性回归模型的参数估计实例 例例3.2.2 在例在例2.
19、5.1中,已建立了中,已建立了中国居民人均消费中国居民人均消费 一元线性模型。这里我们再考虑建立多元一元线性模型。这里我们再考虑建立多元 线性模型。线性模型。解释变量:人均解释变量:人均GDP:GDPP 前期消费:前期消费:CONSP(-1)估计区间:估计区间:19792000年年Eviews软件估计结果软件估计结果Eviews软件估计结果软件估计结果 由表可知:由表可知:所以随机干扰项的方差估计值为:所以随机干扰项的方差估计值为:【练习练习】我国国有独立核算工业企业生产函数。根据生我国国有独立核算工业企业生产函数。根据生 产函数理论,生产函数的基本形式为:产函数理论,生产函数的基本形式为:Y
20、=f(t,L,L,),其中,其中L、K分别为生产过程中投分别为生产过程中投 入的劳动与资本,时间变量入的劳动与资本,时间变量t反映技术进步的影反映技术进步的影 响,下表列出了我国响,下表列出了我国19781994年期间国有独年期间国有独 立核算工业企业的有关统计资料,其中产出立核算工业企业的有关统计资料,其中产出Y 为工业总产值(可比价),为工业总产值(可比价),L、K分别为年末职分别为年末职 工人数和固定资产净值(可比价)。试使用工人数和固定资产净值(可比价)。试使用 Eviews软件建立线性生产函数:软件建立线性生产函数:其相关数据资料见下表。其相关数据资料见下表。我国国有独立核算工业企业
21、统计资料我国国有独立核算工业企业统计资料年份年份时间时间t工业总产值工业总产值Y(亿元)(亿元)职工人数职工人数L(万人)(万人)固定资产固定资产K(亿元)(亿元)197813289.1831392225.70197923581.2632082376.34198032782.1733342522.81198143877.8634882700.90198254151.2535822902.19198364541.0536323141.76198474946.1136693350.95198585586.1438153835.79198695931.3639554302.251987106601.
22、6040864786.051988117434.0642295251.901989127721.0142735808.711990137949.5543646365.791991148634.8044727071.351992159705.5245217757.2519931610261.6544988628.7719941710928.6645459374.341.建立工作文件:建立工作文件:cheate A 78942.输入统计资料:输入统计资料:DATA Y L K3.生成时间变量生成时间变量t:GENR T=TREND(77)4.建立回归模型:建立回归模型:LS Y C T L K可得
23、到可得到Dependent Variable:YMethod:Least SquaresDate:02/21/08 Time:22:07Sample:1978 1994Included observations:17VariableCoefficientStd.Errort-StatisticProb.C-675.32082682.060-0.2517920.8051T77.67893115.67310.6715380.5136L0.6666650.8536260.7809800.4488K0.7764170.1044597.4327450.0000R-squared0.995764 Mean
24、 dependent var6407.249Adjusted R-squared0.994786 S.D.dependent var2486.742S.E.of regression179.5630 Akaike info criterion13.42125Sum squared resid419157.5 Schwarz criterion13.61730Log likelihood-110.0807 F-statistic1018.551Durbin-Watson stat1.510903 Prob(F-statistic)0.000000 因此,我国国有独立工业企业的生产函数为:因此,我
25、国国有独立工业企业的生产函数为:模型的计算结果表明,我国国有独立核算工业企业模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为的劳动力边际产出为0.6667,资金的边际产出为,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增技术进步的影响使工业总产值平均每年递增77.86亿元。亿元。但是模型中除资金变量但是模型中除资金变量K之外,其他变量(包括常数项)之外,其他变量(包括常数项)所对应回归系数的估计误差都比较大。所对应回归系数的估计误差都比较大。3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验 一、拟合优度检验一、拟合优度检验 二、方程的显著性检验二
26、、方程的显著性检验(F(F检验检验)三、变量的显著性检验(三、变量的显著性检验(t t检验)检验)四、参数的置信区间四、参数的置信区间 多元线性回归模型的参数估计出来后,即求出样多元线性回归模型的参数估计出来后,即求出样本回归函数后,还要进一步对该样本回归函数进行统本回归函数后,还要进一步对该样本回归函数进行统计检验,以判断估计的可靠性。包括拟合优度检验、计检验,以判断估计的可靠性。包括拟合优度检验、方程总体线性的显著性检验、变量的显著性检验,以方程总体线性的显著性检验、变量的显著性检验,以及参数的置信区间估计等方面。及参数的置信区间估计等方面。一、拟合优度检验一、拟合优度检验 1、可决系数与
27、调整的可决系数、可决系数与调整的可决系数则则 总总离差离差平方和的分解平方和的分解由于由于=0所以有:所以有:注意:注意:一个有趣的现象一个有趣的现象即:即:总体离差平方和可分解为回归平方和与残差平方和总体离差平方和可分解为回归平方和与残差平方和 两部分。两部分。(3.3.1)(3.3.1)因此,可用回归平方和占总离差平方和的比重来衡因此,可用回归平方和占总离差平方和的比重来衡量样本回归线对样本观测值的拟合程度:量样本回归线对样本观测值的拟合程度:该统计量越接近于该统计量越接近于1 1,模型的拟合优度越高。,模型的拟合优度越高。回归平方和反映了总体离差平方和中可由样本回归回归平方和反映了总体离
28、差平方和中可由样本回归线解释的部分。它越大,残差平方和越小,表明样本回线解释的部分。它越大,残差平方和越小,表明样本回归线与样本观测值的拟合程度越高。归线与样本观测值的拟合程度越高。(3.3.2)(3.3.2)【问题问题】在应用过程中发现,如果在模型中增加一个解释变在应用过程中发现,如果在模型中增加一个解释变量,量,R2往往增大往往增大 这就给人这就给人一个错觉一个错觉:要使得模型拟合得好,只要增:要使得模型拟合得好,只要增加解释变量即可。加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起但是,现实情况往往是,由增加解释变量个数引起的的R2的增大与拟合好坏无关,的增大与拟合好坏无关,
29、R2需调整。需调整。调整的可决系数调整的可决系数(adjusted coefficient of determination)在样本容量一定的情况下,增加解释变量必定使在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以得自由度减少,所以调整的思路是调整的思路是:将残差平方和与总将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响对拟合优度的影响:其中:其中:n-k-1为残差平方和的自由度,为残差平方和的自由度,n-1为总体平为总体平方和的自由度。方和的自由度。(3.3.3)(3.3.3)(3.3.4)(3.3.4
30、)没有绝对的标准,要看具体情况而定,模型的没有绝对的标准,要看具体情况而定,模型的拟合优度并不是判断模型质量的唯一标砖,有时甚拟合优度并不是判断模型质量的唯一标砖,有时甚至为了追求模型的经济意义,可以牺牲一点拟合优度。至为了追求模型的经济意义,可以牺牲一点拟合优度。在例在例3.2.2中,中,比,比2.5.1中的中的 大,大,应该说这是很好的拟合结果了。应该说这是很好的拟合结果了。二、方程的显著性检验二、方程的显著性检验(F检验检验)方程的显著性检验,旨在对模型中被解释变量与解方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系释变量之间的线性关系在总体上在总体上是否显著成立作出推断
31、。是否显著成立作出推断。1、方程显著性的、方程显著性的F检验检验 即检验模型即检验模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n中的参数中的参数 j是否显著不为是否显著不为0。可提出如下可提出如下原假设原假设与与备择假设备择假设:H0:0=1=2=k=0 H1:j不全不全为为0 F检验的思想检验的思想来自于总离差平方和的分解式:来自于总离差平方和的分解式:TSS=ESS+RSS 如果这个比值较大,则如果这个比值较大,则X的联合体对的联合体对Y的解释程度的解释程度高,可认为总体存在线性关系,反之总体上可能不存高,可认为总体存在线性关系,反之总体上可能不存在线性关系。在线性关系。
32、因此因此,可通过该比值的大小对总体线性关系进行推可通过该比值的大小对总体线性关系进行推断。断。根据数理统计学中的知识,在原假设根据数理统计学中的知识,在原假设H0成立的成立的条件下,统计量条件下,统计量 服从自由度为服从自由度为(k,n-k-1)的的F分布分布 给定显著性水平给定显著性水平,可得到临界值,可得到临界值F(k,n-k-1),由样本求出统计量由样本求出统计量F的数值,通过的数值,通过 F F(k,n-k-1)或或 F F(k,n-k-1)来拒绝或接受原假设来拒绝或接受原假设H0,以判定原方程,以判定原方程总体上总体上的线的线性关系是否显著成立。性关系是否显著成立。(3.3.7)(3
33、.3.7)对于中国居民人均消费支出的例子:对于中国居民人均消费支出的例子:可以计算得到可以计算得到F=2057.3 给定显著性水平给定显著性水平 =0.05,查分布表,得到临界值:,查分布表,得到临界值:F(2(2,19)=)=3.52(例中解释变量数目为例中解释变量数目为2 2,样本容量为,样本容量为2222)显然有显然有 F F(k,n-k-1)即二个模型的线性关系在即二个模型的线性关系在95%的水平下显著成立。的水平下显著成立。2、关于拟合优度检验与方程显著性检验关系关于拟合优度检验与方程显著性检验关系 的讨论的讨论 拟拟合合优优度度检检验验和和方方程程总总体体线线性性的的显显著著性性检
34、检验验是是从从不不同同原原理理出出发发的的两两类类检检验验,拟拟合合优优度度检检验验是是从从已已经经得得到到估估计计的的模模型型出出发发,检检验验它它对对样样本本观观测测值值的的拟拟合合程程度度;总总体体线线性性的的显显著著性性检检验验是是从从样样本本观观测测值值出出发发检检验验模模型型总总体体线线性性关关系系的的显显著著性性;但但是是两两者者又又是是关关联联的的,模模型型对对样样本本观观测测值值的的拟拟合合优优度度高高,模模型型总总体体线线性性关关系系的的显显著性就强。著性就强。由由可推出:可推出:与与或或(3.3.8)(3.3.8)(3.3.9)(3.3.9)在在中国居民人均收入中国居民人
35、均收入-消费消费二元模型二元模型中中,如果我们首先得到如果我们首先得到 为为0.19350.1935,肯定认为该模型质量,肯定认为该模型质量 不高,但是殊不知它的总体线性关系的显著水平都达不高,但是殊不知它的总体线性关系的显著水平都达到到 9595。这样,在应用中不必对这样,在应用中不必对过分的苛求,重要的是过分的苛求,重要的是需考察模型的经济关系是否合理。需考察模型的经济关系是否合理。三、变量的显著性检验(三、变量的显著性检验(t检验)检验)方程的方程的总体线性总体线性关系显著关系显著 每个解释变量每个解释变量对被对被解释变量的影响都是显著的解释变量的影响都是显著的 因此,必须对每个解释变量
36、进行显著性检验,以因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。决定是否作为解释变量被保留在模型中。这一检验是由对变量的这一检验是由对变量的 t 检验完成的。检验完成的。1、t统计量统计量 由上一节可知参数估计量的方差为:由上一节可知参数估计量的方差为:以以cjj表示矩阵表示矩阵(XX)-1 主对角线上的第主对角线上的第j个元素,个元素,于是参数估计量的方差为:于是参数估计量的方差为:易知易知(3.3.10)(3.3.10)服从如下的正态分布,即服从如下的正态分布,即将将做标准化变换:做标准化变换:其中其中 2为随机误差项的方差,在实际计算时,为随机误差项的方差
37、,在实际计算时,用它的估计量代替用它的估计量代替:当为大样本时,用估计的参数标准误差对当为大样本时,用估计的参数标准误差对 作标准化变换,所得作标准化变换,所得Z统计量仍可视为服从正态分布。统计量仍可视为服从正态分布。当为小样本时,用估计的参数标准误差对当为小样本时,用估计的参数标准误差对 作标准化变换,所得作标准化变换,所得t 统计量仍可视为服从统计量仍可视为服从t分布。分布。因此,可构造如下因此,可构造如下t 统计量统计量(3.3.11)(3.3.11)该统计量即为用于变量显著性检验的该统计量即为用于变量显著性检验的t统计量。统计量。2、t检验检验 设计原假设与备择假设:设计原假设与备择假
38、设:H1:i 0 给定显著性水平给定显著性水平,可得到临界值,可得到临界值t/2(n-k-1),由样本求出统计量由样本求出统计量t的数值,通过的数值,通过|t|t/2(n-k-1)或或|t|t/2(n-k-1)来拒绝或接受原假设来拒绝或接受原假设H0,从而从而判定对应的解释变判定对应的解释变量是否应包括在模型中。量是否应包括在模型中。H0:i=0 (i=1,2k)注意:注意:一元线性回归中,一元线性回归中,t t检验与检验与F F检验一致检验一致 一方面一方面,t检验与检验与F检验都是对相同的原假设检验都是对相同的原假设H0:1=0 进行进行检验检验;另一方面另一方面,两个统计量之间有如下关系
39、:,两个统计量之间有如下关系:在在中中国国居居民民人人均均收收入入-消消费费支支出出二二元元模模型型例例中中,由应用软件计算出参数的由应用软件计算出参数的t值:值:给定显著性水平给定显著性水平=0.05,查得相应临界值:,查得相应临界值:t0.025(19)=2.093。可可见见,计计算算的的所所有有t值值都都大大于于该该临临界界值值,所所以以拒拒绝绝原原假假设设。即即:包包括括常常数数项项在在内内的的3个个解解释释变变量量都都在在95%的水平下显著,都通过了变量显著性检验。的水平下显著,都通过了变量显著性检验。四、参数的置信区间四、参数的置信区间 参参数数的的置置信信区区间间用用来来考考察察
40、:在在一一次次抽抽样样中中所所估估计计的的参数值离参数的真实值有多参数值离参数的真实值有多“近近”。在变量的显著性检验中已经知道:在变量的显著性检验中已经知道:容易推出:在容易推出:在(1-)的置信水平下的置信水平下 i的置信区间是的置信区间是 其中,其中,t/2为显著性水平为为显著性水平为 、自由度为、自由度为n-k-1的的临界值。临界值。(3.3.12)(3.3.12)在在中国居民人均收入中国居民人均收入-消费支出消费支出二元模型二元模型例中例中,给定给定=0.05,查表得临界值:,查表得临界值:t0.025(19)=2.093计算得参数的置信区间:计算得参数的置信区间:0:(44.284
41、,197.116)1:(0.0937,0.3489)2:(0.0951,0.8080)从回归计算中已得到:从回归计算中已得到:如何才能缩小置信区间?如何才能缩小置信区间?增大样本容量增大样本容量n,因为在同样的样本容量下,因为在同样的样本容量下,n越越大,大,t分布表中的临界值越小,同时,增大样本容分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;量,还可使样本参数估计量的标准差减小;提高模型的拟合优度提高模型的拟合优度,因为样本参数估计量的标,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差准差与残差平方和呈正比,模型优度越高,残差平方和应越小。平方
42、和应越小。提高样本观测值的分散度提高样本观测值的分散度,一般情况下,样本观测一般情况下,样本观测值越分散,值越分散,(XX)-1的分母的的分母的|XX|的值越大,致使的值越大,致使区间缩小。区间缩小。值值得得注注意意的的是是,置置信信度度的的高高低低与与置置信信区区间间的的大大小小存存在在此此消消彼彼涨涨的的关关系系。置置信信度度越越高高,在在其其他他情情况况不不变变时时,临临界界值值t/2越越大大,置置信信区区间间越越大大;如如果果要要求求速速效效置置信信区区间间,在在其其他他情情况况不不变变时时,就就必必须须降降低低对对置置信信度度的的要要求。求。3.4 多元线性回归模型的预测多元线性回归
43、模型的预测 一、一、E(Y0)的置信区间的置信区间 二、二、Y0的置信区间的置信区间对于模型对于模型 给给 定定 样样 本本 以以 外外 的的 解解 释释 变变 量量 的的 观观 测测 值值X0=(1,X10,X20,Xk0),可以得到被解释变量的预测值:可以得到被解释变量的预测值:它可以是总体均值它可以是总体均值E(Y0)或个值或个值Y0的预测。的预测。但严格地说,这只是被解释变量的预测值的估计但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。值,而不是预测值。为了进行科学预测,还需求出预测值的置信区间,为了进行科学预测,还需求出预测值的置信区间,包括包括E(Y0)和和Y0的的置信
44、区间置信区间。一、一、E(Y0)的置信区间的置信区间 从参数估计量的性质的讨论中易知从参数估计量的性质的讨论中易知 由于由于为标量,因此为标量,因此其中利用了其中利用了所以所以 于是,得到于是,得到(1-)的置信水平下的置信水平下E(Y0)的的置信区间置信区间:其中,其中,t t/2/2为为(1-(1-)的置信水平下的的置信水平下的临界值临界值。随机干扰项的样本估计量随机干扰项的样本估计量,可构造如下,可构造如下t 统计量统计量(3.4.1)二、二、Y0的置信区间的置信区间 如果已经知道实际的预测值如果已经知道实际的预测值Y0,那么预测误差为:那么预测误差为:则则 e0 服从正态分布,即服从正
45、态分布,即 构造构造t 统计量统计量 可得给定可得给定(1-)的置信水平下的置信水平下Y0的的置信区间置信区间:随机干扰项的样本估计量随机干扰项的样本估计量,可得,可得e 0 的方差的估计量为:的方差的估计量为:(3.4.2)中国居民人均收入消费支出中国居民人均收入消费支出二元模型二元模型例中:例中:2001年人均年人均GDP:4033.1元,元,于是于是人均居民消费的预测值人均居民消费的预测值为为 2001=120.7+0.22134033.1+0.45151690.8=1776.8(元)元)实测值(实测值(90年价)年价)=1782.2元,相对误差:元,相对误差:0.31%预测的置信区间预
46、测的置信区间:于是于是E(2001)的的95%的置信区间为的置信区间为:或或 (1741.8,1811.7)或或 (1711.1,1842.4)同样,易得同样,易得2001的的95%的置信区间为的置信区间为 为了对上述内容形成明晰的思路,现举为了对上述内容形成明晰的思路,现举一一例例。补充例题补充例题 某公司利润(某公司利润(Y,百万元)与,百万元)与A产品销售量产品销售量 (X1,万吨)和,万吨)和B产品销售量(产品销售量(X2,万吨),万吨)的资料如下表所示:的资料如下表所示:年年份份1986198919901991199219931994199519961997Y292427252628
47、30282827X145424445434644454443X216141513131416161515要求要求:(1):(1)用用OLS法估计法估计 (2)(2)以以95%95%的置信概率检验模型的有效性。的置信概率检验模型的有效性。解解:(1)根据样本资料,用根据样本资料,用Eviews软价计算得:软价计算得:则样本回归方程为则样本回归方程为:样本回归方程说明样本回归方程说明:当:当B产品销售保持不变时,产品销售保持不变时,A产产 品销售量增加品销售量增加1 1万吨,公司利润平万吨,公司利润平 均增加均增加0.5640.564百万元;当百万元;当A产品销产品销 售量不变时,售量不变时,B产
48、品销售量增加产品销售量增加1 1 万吨,公司利润平均增加万吨,公司利润平均增加1.0991.099百百 万元;当万元;当A、B两种产品产量均为两种产品产量均为 零时,公司平均亏损零时,公司平均亏损13.82013.820百万百万 元。元。(2)根据根据Eviews软价计算得:软价计算得:样本回归方程标准差(样本回归方程标准差(S.E.of regression)为:为:s21.071R20.728 估计标准误差说明估计标准误差说明:回归方程与各观测点的平均误差:回归方程与各观测点的平均误差 为为1.071百万元;百万元;可决系数说明可决系数说明:回归方程的解释能力是:回归方程的解释能力是72.
49、8%,即,即A、B两种产品的销量能解释公司得润变两种产品的销量能解释公司得润变 动的动的72.8%。F检验说明检验说明:A、B两种产品的销售量对公司利润的共两种产品的销售量对公司利润的共 同影响是显著的。同影响是显著的。也说明:也说明:R2所测定的回归方程的解释功效为所测定的回归方程的解释功效为72.8,这在统计上是显著的。这在统计上是显著的。由上表格可得:由上表格可得:进一步计算:进一步计算:t检验说明检验说明:A产品销售量对公司利润的线性影响是不产品销售量对公司利润的线性影响是不 显著的,而显著的,而B产品销售量对公司利润的线产品销售量对公司利润的线 性影响是显著的。在实际研究中,针对性影
50、响是显著的。在实际研究中,针对 这一结果应考虑从模型中舍去,重新估这一结果应考虑从模型中舍去,重新估 计一元线性回归模型。计一元线性回归模型。3.5 回归模型的其他函数形式回归模型的其他函数形式 一、模型的类型与变换一、模型的类型与变换 二、非线性回归实例二、非线性回归实例 在实际经济活动中,经济变量的关系是复杂在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。的,直接表现为线性关系的情况并不多见。如著名的如著名的恩格尔曲线恩格尔曲线(Engle curves)(Engle curves)表现为表现为幂函数曲线幂函数曲线形式、宏观经济学中的菲利普斯曲线形式、宏观经济学