《计量经济学第四章精选PPT.ppt》由会员分享,可在线阅读,更多相关《计量经济学第四章精选PPT.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学第四章1第1页,此课件共81页哦第第4 4章章 多元回归:估计与假设检验多元回归:估计与假设检验4.1 三变量线性回归三变量线性回归4.2 多元回归模型的古典假定多元回归模型的古典假定4.3 多元回归的参数估计多元回归的参数估计4.5 实例:古董钟拍卖价格一例实例:古董钟拍卖价格一例4.4 多元判定系数多元判定系数R24.6 普通最小二乘估计量的分布普通最小二乘估计量的分布 主主 要要 内内 容容2第2页,此课件共81页哦第第4 4章章 多元回归:估计与假设检验多元回归:估计与假设检验4.7 多元回归的参数显著性检验多元回归的参数显著性检验4.8 多元回归的总体显著性检验多元回归的总
2、体显著性检验4.9 模型的设定误差模型的设定误差4.10 校正的判定系数校正的判定系数4.11 何时增加新的解释变量何时增加新的解释变量4.12 受限最小二乘受限最小二乘4.13 实例实例 主主 要要 内内 容容3第3页,此课件共81页哦4.1 三变量线性回归模型三变量线性回归模型 Y=69.4620-0.5814X1 Y=81.2267-0.6384X1 1.4449 X2 Y:劳动力参与率劳动力参与率 X1:失业率(代表经济形势):失业率(代表经济形势)X2:小时工资:小时工资4第4页,此课件共81页哦一个三变量回归模型的例子一个三变量回归模型的例子 在研究某种商品需求量的例子中,除价格之
3、外,我们还可在研究某种商品需求量的例子中,除价格之外,我们还可以考虑收入的影响,于是得到如下方程以考虑收入的影响,于是得到如下方程:4.1 三变量线性回归模型三变量线性回归模型总体回归方程:总体回归方程:E(Y|X2,X3)=B1+B2X2i+B3X3i总体回归方程的随机形式:总体回归方程的随机形式:Yi=B1+B2X2i+B3X3i+ui注意:注意:线性都是指参数线性。线性都是指参数线性。5第5页,此课件共81页哦 可以写出对应的样本回归函数:可以写出对应的样本回归函数:=b1+b2X2i+b3X3i和随机样本回归函数:和随机样本回归函数:Yi=b1+b2X2i+b3X3i+ei6第6页,此
4、课件共81页哦 相同相同的是:多元回归也是条件回归,同时的是:多元回归也是条件回归,同时Y也由两部分组成:由两部分组成:系统成分系统成分B1+B2X2+B3X3,由,由X2、X3决定的决定的Y的均值;的均值;非系统成分非系统成分ui,由除,由除X2、X3以外的随机因素决定。以外的随机因素决定。1.1.与两变量回归方程的异同与两变量回归方程的异同 不同不同的是多元回归方程中有两个或两个以上的解释的是多元回归方程中有两个或两个以上的解释变量变量。4.1 三变量线性回归模型三变量线性回归模型7第7页,此课件共81页哦2.2.偏回归系数偏回归系数 B2表示当表示当其他条件不变时(包括其他条件不变时(包
5、括X3 不变),不变),X2变变动一个单位动一个单位Y的均值的改变量;的均值的改变量;B3表示当表示当其他条件不变时(包括其他条件不变时(包括X2 不变)不变),X3变变动一个单位动一个单位Y的均值的改变量。的均值的改变量。B2、B3称为称为偏回归系数(偏回归系数(partial regression):):4.1 二元线性回归模型二元线性回归模型8第8页,此课件共81页哦 简言之,偏回归系数反映了当模型中的其他解释变量简言之,偏回归系数反映了当模型中的其他解释变量为常量时,另一个解释变量对应变量均值的影响。多元回为常量时,另一个解释变量对应变量均值的影响。多元回归模性的这个特性不但能使我们引
6、入多个解释变量,而且归模性的这个特性不但能使我们引入多个解释变量,而且能够能够“分离分离”出每个解释变量出每个解释变量X对应变量对应变量Y的影响。的影响。9第9页,此课件共81页哦4.2 多元回归模型的假定多元回归模型的假定 3.误差项同方差误差项同方差 var(ui)=2模型的基本假定:模型的基本假定:1.回归模型是参数线性,并且是正确设定回归模型是参数线性,并且是正确设定4.误差项无自相关误差项无自相关 cov(ui,uj)=0 2.误差项均值为零误差项均值为零 E(ui|Xi)=010第10页,此课件共81页哦6.解释变量之间不存在完全共线性解释变量之间不存在完全共线性(New)7.为了
7、假设检验,我们假定误差项为了假设检验,我们假定误差项 ui N(0,2)5.解释变量与误差项不相关解释变量与误差项不相关 cov(Xji,ui)=0,i=1,2,3,n ,j=1,2,k(n代表样本容量,代表样本容量,k代表解释变量的个数。代表解释变量的个数。)4.2 多元回归模型的假定多元回归模型的假定 11第11页,此课件共81页哦多重共线性的含义多重共线性的含义 假定假定6表明了解释变量表明了解释变量X2和和X3之间不存在完全的线性之间不存在完全的线性关系,用统计语言,称为关系,用统计语言,称为非共线性非共线性或或非多重共线性非多重共线性。非多重共线性的含义非多重共线性的含义:解释变量之
8、间不存在完全的线性:解释变量之间不存在完全的线性关系(关系(一个解释变量不能表示为另一个解释变量的完全线一个解释变量不能表示为另一个解释变量的完全线性函数性函数);4.2 多元回归模型的假定多元回归模型的假定 12第12页,此课件共81页哦 如果有下面的式子成立:如果有下面的式子成立:或者或者 表明两个解释变量之间完全线性相关。将其带入表明两个解释变量之间完全线性相关。将其带入(4-1)式,可得)式,可得13第13页,此课件共81页哦 完全多重共线性的含义:完全多重共线性的含义:解释变量之间存在完全的解释变量之间存在完全的线性关系(其中一个变量可以表示为其变量的线性函线性关系(其中一个变量可以
9、表示为其变量的线性函数);数);多重共线性(一般是指高度多重共线性)的含义:多重共线性(一般是指高度多重共线性)的含义:解解释变量之间存在高度线性相关。释变量之间存在高度线性相关。14第14页,此课件共81页哦 结论:结论:在存在完全共线性的情况下,在存在完全共线性的情况下,不能估不能估计出计出B2和和B3的值,也就是说不能估计解释变量的值,也就是说不能估计解释变量X2和和X3各自对应变量的影响。各自对应变量的影响。15第15页,此课件共81页哦4.3 多元回归参数的估计多元回归参数的估计 多元回归参数的最小二乘估计量多元回归参数的最小二乘估计量 是使残差平方和达到最小的估计量是使残差平方和达
10、到最小的估计量 只是一元回归的推广只是一元回归的推广 在古典假设下,在古典假设下,OLS估计量是线性无偏有效估计量估计量是线性无偏有效估计量 16第16页,此课件共81页哦 普通最小二乘法普通最小二乘法(ordinary least squares,OLS)是根据样是根据样本回归函数:本回归函数:Yi=b1+b2X2i+b3X3i+ei来估计总体回归函数:来估计总体回归函数:Yi=B1+B2X2i+B3X3i+ui的一种方法。的一种方法。一、最小二乘原理一、最小二乘原理17第17页,此课件共81页哦 最小二乘法的最小二乘法的基本原则基本原则是求出使全部观测值的残差平方是求出使全部观测值的残差平
11、方和最小的参数值。其中残差和最小的参数值。其中残差ei的定义为的定义为 ei=实际的实际的Yi-估计的估计的Yi =Yi-=Yi-b1-b2X2i b3X3i同时将两边平方求和,得:同时将两边平方求和,得:最小二乘法就是使最小二乘法就是使RSS最小化。最小化。18第18页,此课件共81页哦 上式的最小化过程将用到偏微分。通过求偏导,上式的最小化过程将用到偏微分。通过求偏导,我们可以得到下面的正规方程:我们可以得到下面的正规方程:19第19页,此课件共81页哦 三个方程三个未知数,通过对上面的方程作简单的三个方程三个未知数,通过对上面的方程作简单的代数变换,可求得三个代数变换,可求得三个OLS估
12、计量的表达式:估计量的表达式:20第20页,此课件共81页哦 得到截距和偏回归系数的估计量之后,我们同样可得到截距和偏回归系数的估计量之后,我们同样可以推导出这些估计量的方差及标准差(方法与一元回以推导出这些估计量的方差及标准差(方法与一元回归类似)。归类似)。这些方差或标准差表示了估计量由于样本这些方差或标准差表示了估计量由于样本的改变而发生的变化。的改变而发生的变化。与一元回归一样,需要标准差是与一元回归一样,需要标准差是出于两个目的:出于两个目的:(1)建立真实参数值的置信区间。)建立真实参数值的置信区间。(2)检检验统计假设。下面我们只给出相关的公式,具体证明过验统计假设。下面我们只给
13、出相关的公式,具体证明过程和前面类似。程和前面类似。21第21页,此课件共81页哦22第22页,此课件共81页哦 在上面三个式子中,在上面三个式子中,表示总体误差项的同方差,表示总体误差项的同方差,它的无偏估计量是:它的无偏估计量是:上式自由度为上式自由度为(n-3),这是因为在估计,这是因为在估计RSS时,必须先时,必须先求出三个参数求出三个参数(b1,b2,b3)的估计量,的估计量,“消耗了消耗了”三个自由度。三个自由度。因此对于任何回归模型来说,它的自由度为因此对于任何回归模型来说,它的自由度为(n-k),其中其中 k 为为待估参数的个数待估参数的个数。23第23页,此课件共81页哦 下
14、面给出一个比较简便的计算下面给出一个比较简便的计算RSS的方法:的方法:因此一旦得到偏斜率的值,就很容易求得残差平方和。因此一旦得到偏斜率的值,就很容易求得残差平方和。24第24页,此课件共81页哦 在古典线性回归模型的基本假定下,在古典线性回归模型的基本假定下,OLS估计量是估计量是最优线最优线性无偏估计量性无偏估计量。同样,这个性质对于多元回归也成立。同样,这个性质对于多元回归也成立。我们还可以把解释变量的个数推广到三个以上,只是我们还可以把解释变量的个数推广到三个以上,只是计算公式会变得比较复杂,在这种情况下,我们通常扩展计算公式会变得比较复杂,在这种情况下,我们通常扩展用矩阵语言来证明
15、。在这本书里不涉及。用矩阵语言来证明。在这本书里不涉及。二、多元回归二、多元回归OLS估计量的性质估计量的性质25第25页,此课件共81页哦4.4 估计多元回归方程的拟合优度:估计多元回归方程的拟合优度:多元判定系数多元判定系数R2 在上一章的时候我们定义了判定系数在上一章的时候我们定义了判定系数r2,用来度量拟合,用来度量拟合的样本回归直线的拟合优度;也就是说,的样本回归直线的拟合优度;也就是说,r2给出了单个解释变给出了单个解释变量量X对应变量对应变量Y变动的解释比例或解释的百分比。这一概念变动的解释比例或解释的百分比。这一概念可以推广到包含若干个解释变量的回归模型中。我们将度可以推广到包
16、含若干个解释变量的回归模型中。我们将度量这个信息的量称为量这个信息的量称为多元判定系数多元判定系数,用符号,用符号R2表示,从概表示,从概念上讲,它与念上讲,它与r2是类似的。是类似的。26第26页,此课件共81页哦1.R2的公式的公式 称为总离差平方和,记为称为总离差平方和,记为TSS称为回归平方和,称为回归平方和,记为记为ESS称为残差平方和,称为残差平方和,记为记为RSS首先定义首先定义从而有从而有 TSS=ESSRSS 说明总离差可以分解为两个部分:一部分归于说明总离差可以分解为两个部分:一部分归于回归直线,一部分归于随机因素。回归直线,一部分归于随机因素。27第27页,此课件共81页
17、哦同一元回归相同,我们定义同一元回归相同,我们定义 注意:注意:只有回归方程中包含截距项时上式才只有回归方程中包含截距项时上式才 有意义有意义 回归平方和与总离差回归平方和与总离差平方和的比值平方和的比值28第28页,此课件共81页哦我们可以证明:我们可以证明:因此:因此:29第29页,此课件共81页哦2.R2的含义的含义 回归模型对应变量变动的解释程度回归模型对应变量变动的解释程度。例如:某个例子里例如:某个例子里R2=0.9894,它表示约,它表示约99%的应变的应变量变化可以由解释变量来解释。量变化可以由解释变量来解释。与与r2相同,相同,R2的值也在的值也在0和和1之间,之间,R2越接
18、近于越接近于1,表示,表示估计的样本回归直线拟合的越好。估计的样本回归直线拟合的越好。30第30页,此课件共81页哦3.多元判定系数与多元相关系数的关系多元判定系数与多元相关系数的关系 R2正的平方根正的平方根(R),称为,称为多元相关系数多元相关系数,或或复相关系数复相关系数;R度量了度量了Y与所有解释变量的相关程度。与所有解释变量的相关程度。R只取正值。只取正值。31第31页,此课件共81页哦4.5 实例实例:古董钟拍卖价格一例古董钟拍卖价格一例 提提 出出 问问 题题 德国一钟表公司每年都举行钟表拍卖会。而且德国一钟表公司每年都举行钟表拍卖会。而且认为拍卖价格与钟表的年代和竞标人数相关。
19、认为拍卖价格与钟表的年代和竞标人数相关。Y:拍卖价格:拍卖价格 X2:钟表的年代:钟表的年代 X3:竞标的人数:竞标的人数 我们可以先验地预期我们可以先验地预期X2和和X3的系数都为正。的系数都为正。32第32页,此课件共81页哦 数据:数据:表表4-1 回归结果回归结果:对回归结果的分析对回归结果的分析 分析结论分析结论分分 析析 问问 题题(eq01)4.5 实例实例:古董钟拍卖价格一例古董钟拍卖价格一例 33第33页,此课件共81页哦34第34页,此课件共81页哦 在第三章我们分别考虑了钟表年代和竞标人数对拍在第三章我们分别考虑了钟表年代和竞标人数对拍卖价格的影响,结果如下:卖价格的影响
20、,结果如下:35第35页,此课件共81页哦36第36页,此课件共81页哦 在本章我们使用多元回归模型估计,结果如下:在本章我们使用多元回归模型估计,结果如下:37第37页,此课件共81页哦=-1336.049+12.74X2i+85.764X3i Se=(175.27)(0.91)(8.80)t=(-7.62)(13.97)(9.74)p值值=(0.0000)(0.0000)(0.0000)R2=0.890638第38页,此课件共81页哦分分 析析 结结 论论 X2 的系数的系数12.74,表示在其他条件不变,表示在其他条件不变时,钟表年代每增加时,钟表年代每增加1年,拍卖价格平均上年,拍卖价
21、格平均上升升12.74单位。单位。X3的斜率系数的斜率系数85.76,表示在其他条件不,表示在其他条件不变时,竞标人数每增加变时,竞标人数每增加1个,则拍卖价格平均个,则拍卖价格平均上升上升85.76单位。单位。截距项没有意义。截距项没有意义。4.5 实例实例:古董钟拍卖价格一例古董钟拍卖价格一例 39第39页,此课件共81页哦 多元判定系数多元判定系数R2为为0.8906,表示两个解,表示两个解释变量解释了拍卖价格释变量解释了拍卖价格89.06%的变异的变异。40第40页,此课件共81页哦4.6 多元回归的假设检验多元回归的假设检验 虽然虽然R2度量了估计的回归直线的拟合优度,但是度量了估计
22、的回归直线的拟合优度,但是它本身不能告诉我们估计的回归系数是否统计上显著它本身不能告诉我们估计的回归系数是否统计上显著的,即是否显著为的,即是否显著为0。有的可能是显著的,有的可能不。有的可能是显著的,有的可能不是显著的,那我们如何判断呢?是显著的,那我们如何判断呢?而且,由于存在抽样误差,我们无法知道总体而且,由于存在抽样误差,我们无法知道总体信息。因此,必须对回归系数进行显著性检验。信息。因此,必须对回归系数进行显著性检验。如:我们要检验如:我们要检验 钟表年代对拍卖价格有没有影响,钟表年代对拍卖价格有没有影响,即检即检验:验:B2=0。我们如何进行检验呢?我们如何进行检验呢?41第41页
23、,此课件共81页哦 当真实的误差方差不知道的情况下,我们用误差当真实的误差方差不知道的情况下,我们用误差方差的估计量方差的估计量 代替误差方差代替误差方差 2,用于参数显著性检,用于参数显著性检验的统计量验的统计量不是正态分布不是正态分布(k为回归参数个数为回归参数个数(包括截距项包括截距项)。与一元回归一样,我们首先需要知道估计量与一元回归一样,我们首先需要知道估计量b2的抽样的抽样分布。在双变量模型中我们假定误差项服从正态分布,则分布。在双变量模型中我们假定误差项服从正态分布,则有有b1,b2服从正态分布。服从正态分布。同样在多元回归时也存在这个性同样在多元回归时也存在这个性质质。42第4
24、2页,此课件共81页哦4.7 对偏回归参数进行假设检验对偏回归参数进行假设检验 对钟表拍卖一例进行参数显著性检验对钟表拍卖一例进行参数显著性检验 1.显著检验法显著检验法 2.置信区间法置信区间法 43第43页,此课件共81页哦我们做如下假设:我们做如下假设:H0:B2=0,H1:B2 0(即假设钟表年代对拍卖价格没有影响即假设钟表年代对拍卖价格没有影响)根据上述假设,构造如下统计量:根据上述假设,构造如下统计量:(注:(注:B2=0)服从自由度为服从自由度为(n-3=29)的的 t 分布。(可得分布。(可得t=13.96)根据)根据 t 值我们能否拒绝原假设,就需要用到我们前面介绍的置值我们
25、能否拒绝原假设,就需要用到我们前面介绍的置信区间法和显著性检验法。信区间法和显著性检验法。44第44页,此课件共81页哦1.显著检验法显著检验法 我们需要将计算得到我们需要将计算得到 t 值和给定显著性水平下的临值和给定显著性水平下的临界值界值ta/2或或ta 相比较,进行选择。相比较,进行选择。(如:如:a=5%,ta/2=2.045,ta=1.699,由于由于|t|=13.96 ta/2=2.045,所以拒绝原假设。,所以拒绝原假设。)实际上,我们可以不指定实际上,我们可以不指定a,直接根据,直接根据p值来确定。值来确定。同样我们可以根据经济意义选择进行单边假设检验还同样我们可以根据经济意
26、义选择进行单边假设检验还是双边检验。是双边检验。45第45页,此课件共81页哦2.置信区间法置信区间法 我们可以构造我们可以构造95%的置信区间:的置信区间:P(-2.045 t 2.045)=0.95可以得到置信区间为:可以得到置信区间为:P(-2.045 (b2-B2)/se(b2)2.045)=0.95 b2-2.045 se(b2)B2 b2+2.045 se(b2)即:即:12.7413-2.0450.9123 B2 12.7413-2.0450.912310.8757 B214.6069上式给出了上式给出了B2的一个的一个95%置信区间。由于该区间不包括置信区间。由于该区间不包括B
27、2=0,所以,拒绝零假设。,所以,拒绝零假设。46第46页,此课件共81页哦 在上面的基础上作如下思考,在上面的基础上作如下思考,投标人数对中标价格有投标人数对中标价格有没有影响:没有影响:H0:B3=0,H1:B30(即假设投标人数对中标价格没有影响即假设投标人数对中标价格没有影响)构造如下统计量:构造如下统计量:(注:(注:B3=0)服从自由度为服从自由度为(n-3)的的t分布。根据置信区间法和显著性检验法分布。根据置信区间法和显著性检验法进行检验。进行检验。47第47页,此课件共81页哦4.8 对联合假设的检验对联合假设的检验 1.1.联合假设联合假设 我们在进行参数显著性检验时,只是检
28、验某一个参我们在进行参数显著性检验时,只是检验某一个参数为零的假设。现在考虑假设:数为零的假设。现在考虑假设:这个零假设称为这个零假设称为联合假设联合假设,即,即B2和和B3同时为零,等同同时为零,等同于假定于假定X2和和X 3一起对一起对Y无影响。无影响。48第48页,此课件共81页哦等同于等同于:即即X2和和X 3对应变量变化的解释比例为零。对这两个中对应变量变化的解释比例为零。对这两个中任何一个假设进行检验称为任何一个假设进行检验称为对估计的总体回归线的显著对估计的总体回归线的显著性检验,即检验性检验,即检验Y是否与是否与X2和和X 3线性相关。线性相关。49第49页,此课件共81页哦
29、需要注意的是:需要注意的是:在实践中的许多多元回归模型中,一在实践中的许多多元回归模型中,一个或多个解释变量各自对应变量没有影响,但集体却对个或多个解释变量各自对应变量没有影响,但集体却对应变量有影响,应变量有影响,这属于多重共线性问题这属于多重共线性问题。这意味着前面讨。这意味着前面讨论的论的 t 检验虽然对于检验单个回归系数的统计显著性是有检验虽然对于检验单个回归系数的统计显著性是有效的,但是对于联合假设却是无效的。效的,但是对于联合假设却是无效的。50第50页,此课件共81页哦由回归直线所解释的由回归直线所解释的由回归直线所不能解释的由回归直线所不能解释的51第51页,此课件共81页哦4
30、.8 对联合假设的检验对联合假设的检验 2.方差分析方差分析 其基本思想:其基本思想:对于数据的波动设法将分为两部分,对于数据的波动设法将分为两部分,一部分一部分是纯粹由是纯粹由随机误差引起的随机误差引起的,另一部分,另一部分除了随机误差的影响外还包除了随机误差的影响外还包含着因素效应的影响。对这两部分进行比较,如果后含着因素效应的影响。对这两部分进行比较,如果后者明显大于前者,就说明因素的效应是显著的。者明显大于前者,就说明因素的效应是显著的。52第52页,此课件共81页哦4.8 对联合假设的检验对联合假设的检验 我们首先看下面的恒等式:我们首先看下面的恒等式:TSS=ESS+RSS即:即:
31、将将TSS分解为两个部分,一部分(分解为两个部分,一部分(ESS)由回归模型解释,)由回归模型解释,另一部分(另一部分(RSS)不能由模型解释。对)不能由模型解释。对TSS的各个部分进的各个部分进行的研究称为行的研究称为方差分析方差分析(关键是对全部数据的波动程度进关键是对全部数据的波动程度进行分解行分解)。每个平方和都具有相应的自由度每个平方和都具有相应的自由度依赖于依赖于独立观察的数目。独立观察的数目。53第53页,此课件共81页哦方差来源平方和(SS)自由度(d.f.)MSS=SS/d.f.ESS k-1RSS n-kTSS n-1 k 为待估计的参数个数。为待估计的参数个数。54第54
32、页,此课件共81页哦3.F 统计量的含义统计量的含义 根据上面的介绍,若满足古典线性回归的基根据上面的介绍,若满足古典线性回归的基本本 假定,零假设为:假定,零假设为:,我们可,我们可以定义统计量以定义统计量:4.8 对联合假设的检验对联合假设的检验 55第55页,此课件共81页哦 可见可见X2和和X 3对对Y的解释程度越高,的解释程度越高,F值越值越大。其中大。其中n为观察值的数,为观察值的数,k为待估计的参数为待估计的参数个数(观察我们的例子)。个数(观察我们的例子)。因此,因此,F值越大,值越大,越有理由拒绝原假设。越有理由拒绝原假设。其含义为:其含义为:56第56页,此课件共81页哦
33、我们可以将上面直观的语言加以正规化。如,我我们可以将上面直观的语言加以正规化。如,我们利用显著性检验法:们利用显著性检验法:计算出计算出F值,将其与值,将其与F临界值作比临界值作比较。较。如果计算的如果计算的F值超过值超过F临界值,则拒绝零假设。如临界值,则拒绝零假设。如果果F值不超过值不超过F临界值,则不能拒绝零假设,临界值,则不能拒绝零假设,认为解释认为解释变量一起对应变量有影响。变量一起对应变量有影响。(看例子看例子)57第57页,此课件共81页哦钟表拍卖一例的方差分析表钟表拍卖一例的方差分析表 58第58页,此课件共81页哦4.F 与与R2的关系的关系 可以证明:可以证明:这两个统计量
34、是同方向变动,这两个统计量是同方向变动,R2等于等于0时,时,F等于等于0;R2越大,越大,F值越大;值越大;R2等于等于1时,时,F无穷大。无穷大。59第59页,此课件共81页哦方差来源平方和(SS)自由度(d.f.)MSS=SS/d.f.ESS2RSS n-3TSS n-1 我们可以将方差分析表作如下变换我们可以将方差分析表作如下变换(用(用R2的形式进的形式进行行F 检验便于计算)检验便于计算)60第60页,此课件共81页哦 在钟表拍卖的例子中在钟表拍卖的例子中61第61页,此课件共81页哦4.9 从多元回归模型到一元回归模型:从多元回归模型到一元回归模型:设定误差设定误差 我们通过两个
35、模型的比较来考虑模型设定误差问题。我们通过两个模型的比较来考虑模型设定误差问题。t=(-0.7248)(5.8457)r2=0.5325 F=34.1723 p值值=(0.4742)(0.0000)模型一模型一:=-191.6662+10.4856X2i Se=(264.4393)(1.7937)模型二模型二:p值值=(0.0015)(0.0258)=807.9501+54.572X3i t=(3.4962)(2.3455)r2=0.1549 F=5.501762第62页,此课件共81页哦=-1336.049+12.74X2i+85.764X3i Se=(175.27)(0.91)(8.80)
36、t=(-7.62)(13.97)(9.74)p值值=(0.0000)(0.0000)(0.0000)R2=0.8906 模型三:模型三:63第63页,此课件共81页哦我们会注意到几个不同的地方:我们会注意到几个不同的地方:(1)模型一和模型二中的斜率系数与模型三不同。模型一和模型二中的斜率系数与模型三不同。(2)三个模型中截距相差很大。三个模型中截距相差很大。(3)模型三中的模型三中的R2也与前两个双变量模型中的也与前两个双变量模型中的r2明显不同。明显不同。为什么会产生如上这些结果呢?为什么会产生如上这些结果呢?64第64页,此课件共81页哦 在模型三中,我们推导钟表年代(在模型三中,我们推
37、导钟表年代(X2)对拍卖价格影响时,)对拍卖价格影响时,是在假设竞标人数(是在假设竞标人数(X3)是常数的条件下;)是常数的条件下;在模型一中,我们只是简单的略去竞标人数(在模型一中,我们只是简单的略去竞标人数(X3)这个)这个变量。变量。换句话说:在模型三中钟表年代(换句话说:在模型三中钟表年代(X2)对拍卖价格的影响)对拍卖价格的影响是净影响或净效果;而在模型一中竞标人数(是净影响或净效果;而在模型一中竞标人数(X3)的影响并)的影响并未略去。所以,在未略去。所以,在模型一中的钟表年代(模型一中的钟表年代(X2)系数反映了总效)系数反映了总效果果直接的钟表年代(直接的钟表年代(X2)的效果
38、与间接的竞标人数()的效果与间接的竞标人数(X3)的效果。这两个模型的差异很好的反映了偏回归系数的)的效果。这两个模型的差异很好的反映了偏回归系数的“偏偏”的含义。的含义。65第65页,此课件共81页哦 在前面我们已经讨论过了在前面我们已经讨论过了X2和和X3无论是各自的,还是联合无论是各自的,还是联合地都对中标价格有重要的影响,因此,我们在模型一和二中地都对中标价格有重要的影响,因此,我们在模型一和二中略去任何一个解释变量,都会导致略去任何一个解释变量,都会导致(模型的模型的)设定误差设定误差或或设定设定偏差偏差。结论:结论:在建立模型时,经济理论和实践经验都很重要,丢掉在建立模型时,经济理
39、论和实践经验都很重要,丢掉必要变量或加入无关变量都会导致设定误差。必要变量或加入无关变量都会导致设定误差。66第66页,此课件共81页哦4.10 校正的判定系数校正的判定系数 从上面三个模型的比较我们可以得到从上面三个模型的比较我们可以得到R2的一个重要性的一个重要性质:质:随着模型中解释变量个数的增多,随着模型中解释变量个数的增多,R2值就越大。值就越大。问题:问题:若想更大比例的解释应变量的变动,是不是只需要若想更大比例的解释应变量的变动,是不是只需要不断地增加解释变量的个数就可以了?不断地增加解释变量的个数就可以了?如果为了得到较高的如果为了得到较高的R2,不断增加解释变量的个数,表面,
40、不断增加解释变量的个数,表面上模型的拟和程度较好,但可能导致模型设定误差。上模型的拟和程度较好,但可能导致模型设定误差。注意:我们在注意:我们在R2的定义中没有考虑到自由度。(例子)的定义中没有考虑到自由度。(例子)67第67页,此课件共81页哦 为了克服随解释变量个数增加而增加的缺点,再为了克服随解释变量个数增加而增加的缺点,再定义一个拟合优度的定义一个拟合优度的 度量指标,它能根据模型中解释度量指标,它能根据模型中解释变量的个数进行调整,我们称为变量的个数进行调整,我们称为校正的判定系数校正的判定系数:的实质:对增加的变量个数的惩罚的实质:对增加的变量个数的惩罚。68第68页,此课件共81
41、页哦校正的判定系数有以下性质:校正的判定系数有以下性质:(1)若)若k 1,则,则 。即,随着模型中解释变量的增加,。即,随着模型中解释变量的增加,校正的判定系数校正的判定系数 越来越小于非校正的判定系数越来越小于非校正的判定系数R2,这似,这似乎是对增加变量的乎是对增加变量的“惩罚惩罚”。(2)虽然非校正的判定系数)虽然非校正的判定系数R2总为正,但校正的判定系数总为正,但校正的判定系数 可能为负。可能为负。校正判定系数可以使我们对应变量相同解释变量校正判定系数可以使我们对应变量相同解释变量个数不同的两个回归模型作比较。个数不同的两个回归模型作比较。69第69页,此课件共81页哦4.11 什
42、么时候增加新的解释变量什么时候增加新的解释变量 当增加变量使校正的判定系数值增加时,就当增加变量使校正的判定系数值增加时,就 可以增加解释变量。(只要增加的变量的系可以增加解释变量。(只要增加的变量的系 数的数的|t|值大于值大于1,就会增加。)就会增加。)但应注意,虽然增加解释变量使但应注意,虽然增加解释变量使 增加,也增加,也 要判断其经济意义之后才能最后确定是否将要判断其经济意义之后才能最后确定是否将 其加入模型。其加入模型。比较前面的三个模型。比较前面的三个模型。70第70页,此课件共81页哦71第71页,此课件共81页哦4.12 受限最小二乘受限最小二乘 将表将表4-4中的(中的(1
43、)式称为)式称为受限模型受限模型(restricted model)隐含假定钟表年代和竞标人数对中标价格没有隐含假定钟表年代和竞标人数对中标价格没有影响。影响。将表将表4-4中的(中的(4)式称为)式称为非受限模型非受限模型(unrestricted model)包含了所有相关变量。包含了所有相关变量。使用使用OLS对(对(1)式的估计,称为受限最小二乘法()式的估计,称为受限最小二乘法(RLS),),对(对(4)式的估计称为非受限最小二乘法()式的估计称为非受限最小二乘法(UNLS)。)。72第72页,此课件共81页哦 如何判断施加的约束是有效的,可通过下面的如何判断施加的约束是有效的,可通
44、过下面的F检验。检验。表示受限模型表示受限模型(restricted model)得到的得到的 表示非受限模型表示非受限模型(unrestricted model)得到的得到的 73第73页,此课件共81页哦 在误差项服从正态分布的假定下,可以证明:在误差项服从正态分布的假定下,可以证明:要注意:要注意:m表示受限的个数(约束个数)表示受限的个数(约束个数)k表示非受限模型中参数的个数。表示非受限模型中参数的个数。这个检验的这个检验的原假设为:受限模型的约束是合理的原假设为:受限模型的约束是合理的。74第74页,此课件共81页哦 在例子中:在例子中:要注意:要注意:m表示受限的个数(约束个数)
45、表示受限的个数(约束个数)=2。获此获此F值的概率非常小(临界值约为值的概率非常小(临界值约为3.34),),F值的绝对值值的绝对值远远大于临界值,拒绝原假设。得出结论:认为约束是不合远远大于临界值,拒绝原假设。得出结论:认为约束是不合理的。理的。75第75页,此课件共81页哦 比较模型二约束的合理性:比较模型二约束的合理性:要注意:要注意:m=1。要注意:要注意:进行比较的两个模型被解释变量必须相同进行比较的两个模型被解释变量必须相同。76第76页,此课件共81页哦 4.13 实例实例 1.税收政策对公司资本结构的影响税收政策对公司资本结构的影响 2.牙买加对进口的需求牙买加对进口的需求 3
46、.英国对酒精饮料的需求英国对酒精饮料的需求4.第一章的例子第一章的例子77第77页,此课件共81页哦1.税收政策对公司资本结构的影响税收政策对公司资本结构的影响 我们考虑下面的模型:我们考虑下面的模型:Y 杠杆利率杠杆利率(债务债务/产权产权)X2公司税率公司税率 X3个人税率个人税率X4资本所得税资本所得税 X5非债务避税非债务避税X6通货膨胀率通货膨胀率78第78页,此课件共81页哦解释变量系数(t值)解释变量系数(t值)X2公司税率 2.4(10.5)X3个人税率-1.2(-4.8)X4资本所得税 0.3(1.3)X5非债务避税-2.4(-4.8)X6通货膨胀率1.4(3.0)F=56.22F临=2.45n=48R2=0.87t0.025=2.0279第79页,此课件共81页哦2.牙买加对进口的需求牙买加对进口的需求 我们考虑下面的模型:我们考虑下面的模型:Y:进口量;:进口量;X2:个人消费支出;:个人消费支出;X3:进口价格:进口价格/国内价格(相对价格)国内价格(相对价格)80第80页,此课件共81页哦练习题:p91,Q4.1 Q4.6,p93,Q4.9 Q4.13;81第81页,此课件共81页哦