[数学]多元线性回归模型.ppt

上传人:豆**** 文档编号:25222331 上传时间:2022-07-10 格式:PPT 页数:80 大小:1.66MB
返回 下载 相关 举报
[数学]多元线性回归模型.ppt_第1页
第1页 / 共80页
[数学]多元线性回归模型.ppt_第2页
第2页 / 共80页
点击查看更多>>
资源描述

《[数学]多元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《[数学]多元线性回归模型.ppt(80页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数学多元线性回归模型3.1 模型的建立及其假定条件模型的建立及其假定条件 1 基本的概念基本的概念 在许多实际问题中,我们所研究的因变量的变动在许多实际问题中,我们所研究的因变量的变动可能不仅与一个解释变量有关。因此,有必要考虑可能不仅与一个解释变量有关。因此,有必要考虑线性模型的更一般形式,即线性模型的更一般形式,即多元线性回归模型多元线性回归模型: t=1,2,n 在这个模型中,在这个模型中,Y由由X1,X2,X3, XK所解释,有所解释,有K+1个未知参数个未知参数0 0、1 1、2 2、K K 。 这里,这里,“斜率斜率”j j的含义是其它变量不变的情况的含义是其它变量不变的情况下,下

2、,X Xj j改变一个单位对因变量所产生的影响。改变一个单位对因变量所产生的影响。u.22110kkXXXY 例例1 1: 其中,其中,Y=在食品上的总支出在食品上的总支出 X=个人可支配收入个人可支配收入 P=食品价格指数食品价格指数 用美国用美国1959-1983年的数据,得到如下回归结果(括号中数年的数据,得到如下回归结果(括号中数字为标准误差):字为标准误差): Y和和X的计量单位为的计量单位为10亿美元亿美元 (按按1972不变价格计算不变价格计算). u210PXY)114. 0()003. 0()6 . 9(99. 0739. 0112. 07 .1162RPXY多元线性回归模型

3、中斜率系数的含义多元线性回归模型中斜率系数的含义上例中斜率系数的含义说明如下:上例中斜率系数的含义说明如下: 价格不变的情况下,个人可支配收入每上升价格不变的情况下,个人可支配收入每上升10亿美元(亿美元(1个个billion),食品消费支出增加),食品消费支出增加1.12亿亿元(元(0.112个个 billion)。)。 收入不变的情况下,价格指数每上升一个点,收入不变的情况下,价格指数每上升一个点, 食品消费支出减少食品消费支出减少7.39亿元(亿元(0.739个个billion)回到一般模型回到一般模型 描 述 被 解 释 变 量描 述 被 解 释 变 量 Y 的 期 望 值 与 解 释

4、 变 量的 期 望 值 与 解 释 变 量X1,X2,XK线性关系的方程为线性关系的方程为这个式子为多元线性回归方程这个式子为多元线性回归方程,简称简称总体回归方程总体回归方程u.22110kkXXXY01122( )kkE YXXX对于对于n组观测值,有组观测值,有nKnKnnnnKKKKuXXXXYuXXXXYuXXXXY.332211022323222121021131321211101其矩阵形式为: 其中 nYYYY.21KnnKKXXXXXXX.1.1.11212111uXYnKuuuu.,.21210由于总体回归模型的参数由于总体回归模型的参数 都是未知都是未知的的,我们可以利用样

5、本观测值对它们进行估计我们可以利用样本观测值对它们进行估计,得到相应的估计的回归方程得到相应的估计的回归方程 上式为多元线性回归方程上式为多元线性回归方程,简称简称样本回归方程样本回归方程.估计的回归方程的矩阵表达形式为估计的回归方程的矩阵表达形式为01,k01122iiikkiYXXXYX2模型的假定模型的假定E(ui)=0, i=1,2,n 其矩阵表达形式为其矩阵表达形式为:E(U)=0(2)随机误差项有相同的方差随机误差项有相同的方差22( )()iiVar uE u (3)随机误差项彼此之间不相关随机误差项彼此之间不相关 ij将条件将条件(2)和和(3)结合起来结合起来,其相应的矩阵表

6、达形式其相应的矩阵表达形式为为(4)解释变量与随机误差项彼此不相关解释变量与随机误差项彼此不相关 i=1,2k j=1,2,.,n ( ,)()0ijijCov u uE u u( )( )( )()Var UE UE UUE UE UU2nI(,)0ijjCov Xu(5)解释变量解释变量X1,X2,Xk之间不存在精确的之间不存在精确的(完完全的全的)线性关系线性关系,即即rank(X)=k+1n 观测值的数目要大于待估计的参数的个数观测值的数目要大于待估计的参数的个数 (要有足够数量的数据来拟合回归线)。(要有足够数量的数据来拟合回归线)。(6)随机误差项服从正态分布随机误差项服从正态分布

7、,即即 i=1,2,n2(0,)iuN 3.2最小二乘法最小二乘法我们的多元线性回归模型是:我们的多元线性回归模型是: t=1,2,n问题是选择问题是选择 ,使得残差平方和最小。,使得残差平方和最小。 残差为残差为:k,.,10KtKtttttXXYYYe.110tktktttXXXYu.22110要使残差平方和要使残差平方和 为最小,则应有:为最小,则应有:我们得到如下我们得到如下K+1个方程(个方程(即正规方程):即正规方程): 21102.KtKtttXXYeQ0.,0,010KQQQ按矩阵形式,上述方程组可表示为按矩阵形式,上述方程组可表示为:tktKtKtktktttKttKtttt

8、tKttKtttKtKtYXXXXXYXXXXXXYXXXXXYXXn211022121201121110110.=)(XXXY即即YXXXYXXX1)()(的最小二乘估计量由上式得到2112111.KttKtKtKttttKttXXXXXXXXXXnK.10nKnKKnYYYXXXXXX.1.11212111211 上述结果,亦可从矩阵表示的模型上述结果,亦可从矩阵表示的模型 出发,出发, 完全用矩阵代数推导出来。完全用矩阵代数推导出来。 残差可用矩阵表示为:残差可用矩阵表示为: 其中:其中:XY YYeeeen.21UXY残差平方和残差平方和 )()(YYYY)()(XYXY)(XYXYX

9、XXYYXYYeeeSt2注意到上式中所有项都是标量,且注意到上式中所有项都是标量,且 故故令令用矩阵微分法,我们可得到用矩阵微分法,我们可得到 与采用标量式推导所得结果相同。由上述结果,我们有与采用标量式推导所得结果相同。由上述结果,我们有 )(XYYX2XXYXYYQ0)(QYXXXYXXX1)(离差形式的最小二乘估计量离差形式的最小二乘估计量多元线性回归模型的样本容量为多元线性回归模型的样本容量为n的样本观测的样本观测值的均值为值的均值为:得到多元线性回归模型的离差形式:得到多元线性回归模型的离差形式:01122kkYXXXu1 122iiikkiiyxxxuuyxv其相应的矩阵表达形式

10、为:其相应的矩阵表达形式为:得到其正规方程组:得到其正规方程组:并得到的最小二乘估计量:并得到的最小二乘估计量:x xx y1()x xx y2022-7-10中山学院经济与管理系中山学院经济与管理系213随机误差项的方差随机误差项的方差 的估计量的估计量 的无偏估计量是的无偏估计量是这是因为我们在估计这是因为我们在估计 的过程的过程中,失去了(中,失去了(K+1)个自由度。)个自由度。22) 1(22Kneik,. ,102022-7-10中山学院经济与管理系中山学院经济与管理系223.3最小二乘估计量的特性最小二乘估计量的特性1 线性性线性性2 无偏性无偏性3 最小方差性(有效性)最小方差

11、性(有效性)高斯高斯-马尔科夫(马尔科夫(Gauss-Markov)定理:)定理: 对于对于 以及标准假设条件(以及标准假设条件(1)-(5),普通最小二乘估计量是最佳线性无偏),普通最小二乘估计量是最佳线性无偏估计量(估计量(BLUE)u XY233.4 可决系数可决系数一可决系数一可决系数 对于一元线性回归模型对于一元线性回归模型 我们有我们有其中,其中, =残差平方和残差平方和2221YYeRi2ie01YXU24对于多元线性模型对于多元线性模型 我们可用同样的方法定义可决系数:我们可用同样的方法定义可决系数:为方便计算,我们也可以用矩阵形式表示为方便计算,我们也可以用矩阵形式表示uXX

12、YKK.110TSSESSTSSRSSRYYeRi112222或总离差平方和回归平方和2R25我们有:残差我们有:残差 ,其中,其中,残差平方和:残差平方和: YYeeene.21XY)()(2YYYYeeet)()(XYXY)(XYXYXXXYYXYYYXXXXXXYYXYY1)(XYYYYXXYYXYY26而而将上述结果代入将上述结果代入 的公式,得到:的公式,得到:2222YnYYYnYYY这就是决定系数这就是决定系数 的矩阵形式。的矩阵形式。2221YYeR222YYeYY22)(YnYYXYYYYnYY22YnYYYnXY2R2R27二修正决定系数:二修正决定系数: 残差平方和的一个

13、特点是,每当模型增加一个解释变量,残差平方和的一个特点是,每当模型增加一个解释变量,并用改变后的模型重新进行估计,残差平方和的值会减小。并用改变后的模型重新进行估计,残差平方和的值会减小。 由此可以推论,决定系数是一个与解释变量的个数有关由此可以推论,决定系数是一个与解释变量的个数有关的量:的量: 解释变量个数增加解释变量个数增加 减小减小 增大增大 也就是说,人们总是可以通过增加模型中解释变量的方法也就是说,人们总是可以通过增加模型中解释变量的方法来增大来增大 的值。因此,用的值。因此,用 来作为拟合优度的测度,不是来作为拟合优度的测度,不是十分令人满意的。十分令人满意的。 为此,我们定义修

14、正决定系数为此,我们定义修正决定系数 (Adjusted )如下:)如下:2R2e2R2R2R2R2R28 是经过自由度调整的可决系数,称为修正可决系数。是经过自由度调整的可决系数,称为修正可决系数。我们有:(我们有:(1) (2)仅当)仅当K=0时,等号成立。即时,等号成立。即 (3)当)当K增大时,二者的差异也随之增大。增大时,二者的差异也随之增大。 (4) 可能出现负值。可能出现负值。2R22RR22RR 2R) 1() 1(1222nYYKneR22) 1() 1(1YYKnen1)1)(1(12KnRn2022-7-10中山学院经济与管理系中山学院经济与管理系29例例1. 设设 n

15、= 20, k = 3, = 0.70 求求 。当。当n=10、n=5时,时, 分别等于多分别等于多少少2R2R2R30解:解: 下面改变下面改变n的值,看一看的值,看一看 的值如何变化。我们有的值如何变化。我们有 若若n = 10,则,则 = 0.55 若若n = 5, 则则 = - 0.20由本例可看出,由本例可看出, 有可能为负值。这与有可能为负值。这与 不同不同 ( )。)。644. 0)420()70. 01 (191) 1()1)(1(122knRnR2R102 R2R2R2R2R 3.5 3.5 显著性检验与置信区间显著性检验与置信区间 方程的方程的F F 检验,旨在对模型中被解

16、释变量与检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立解释变量之间的线性关系在总体上是否显著成立作出推断。作出推断。 1、方程显著性的、方程显著性的F检验检验 即检验模型即检验模型 Yi= 0+ 1X1i+ 2X2i+ + kXki+ i i=1,2, ,n中的参数中的参数 j是否显著不为是否显著不为0。 可提出如下原假设与备择假设:可提出如下原假设与备择假设: H0: 0= 1= 2= = k=0 H1: j不全为不全为0 根据数理统计学中的知识,在原假设根据数理统计学中的知识,在原假设H0成立成立的条件下,统计量的条件下,统计量 服从自由度为服从自由度为( (k

17、, n-k-1)1)的的F分布分布 给定显著性水平给定显著性水平 ,可得到临界值,可得到临界值F ( (k,n-k-1) ),由样本求出统计量由样本求出统计量F的数值,通过的数值,通过 F F F ( (k,n-k-1) ) 或或 F F F ( (k,n-k-1) )来拒绝或接受原假设来拒绝或接受原假设H0,以判定原方程总体上的,以判定原方程总体上的线性关系是否显著成立。线性关系是否显著成立。 (1)RSS kFESSnk2022-7-10中山学院经济与管理系中山学院经济与管理系33F ( (k,n-k-1) ) 2022-7-10中山学院经济与管理系中山学院经济与管理系34方差来源平方和自

18、由度均方回归RSSk RSS / (k)误差ESSn-k-1ESS / (n-k-1)总离差 TSSn-1YY yu u y 2 2、 t检验(变量的显著性检验)检验(变量的显著性检验) 方程的方程的总体线性总体线性关系显著关系显著 每个解释变量每个解释变量对对被解释变量的影响都是显著的被解释变量的影响都是显著的 因此,必须对每个解释变量进行显著性检验,因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。以决定是否作为解释变量被保留在模型中。 这一检验是由对变量的这一检验是由对变量的 t t 检验完成的。检验完成的。 t检验检验 1 1、 设计原假设与备择假设:设计原

19、假设与备择假设: H1: i 0 0 H0: i=0=0 i=1,2k) 2、构造、构造t统计量:统计量:2(1)jjjtt nkS2jS221()1niiijjujjyyCCnk 其中:其中: =(i=1,2k) 3 3、 给定显著性水平给定显著性水平 ,可得到临界值,可得到临界值t /2( (n-k-1) ),由样本求出统计量由样本求出统计量t的数值。的数值。 4 4、做出判断:、做出判断: 通过通过 |t|t| t /2( (n-k-1) ) 或或 |t|t| t /2( (n-k-1) )来拒绝或接受原假设来拒绝或接受原假设H0,从而,从而判定对应的解释变量是否判定对应的解释变量是否应

20、包括在模型中。应包括在模型中。 1122knkneiee2022-7-10中山学院经济与管理系中山学院经济与管理系38-t /2( (n-k-1) ) t /2( (n-k-1) ) 2022-7-10中山学院经济与管理系中山学院经济与管理系39下表给出了三变量模型的回归的结果:下表给出了三变量模型的回归的结果:方差来源平方和( S S )自由度( d . f . )平方和的均值( M S S )来自回归( R S S )65 965来自残差( E S S )总离差( T S S ) 6 6 0 4 21 4w回答以下问题:回答以下问题:1)样本容量是多少?)样本容量是多少?2) 求求ES S

21、?3) E S S与与R S S的自由度各是多少?的自由度各是多少?4) 求求R-square与与Adjusted R-square?2022-7-10中山学院经济与管理系中山学院经济与管理系40模型中的一些特殊解释变量模型中的一些特殊解释变量2022-7-10中山学院经济与管理系中山学院经济与管理系41 在很多情况下,人们用时间序列的观测在很多情况下,人们用时间序列的观测时期所代表的时间作为模型的解释变量,时期所代表的时间作为模型的解释变量,用来表示被解释变量随时间推移的自发用来表示被解释变量随时间推移的自发 变变化趋势。这种变量称为化趋势。这种变量称为时间变量时间变量,也叫做,也叫做趋势变

22、量趋势变量。一般。一般用T来表示时间变量表示时间变量.一般一般取取T=1,2,3,N 时间变量可以单独作一元线性回归模型时间变量可以单独作一元线性回归模型中的解释变量,也可以中的解释变量,也可以 作多元线性回归模作多元线性回归模型中的一个解释变量,其对应的回归系数型中的一个解释变量,其对应的回归系数表示被解释变量随时间变化的变化趋势表示被解释变量随时间变化的变化趋势 时间变量时间变量42虚拟变量(虚拟变量(Dummy variables)一虚拟变量的概念一虚拟变量的概念 在回归分析中,常常碰到这样一种情况,即因变量在回归分析中,常常碰到这样一种情况,即因变量的波动不仅依赖于那种能够很容易按某种

23、尺度定量的波动不仅依赖于那种能够很容易按某种尺度定量化的变量(如收入、产出、价格、身高、体重等),化的变量(如收入、产出、价格、身高、体重等),而且依赖于某些定性的变量(如性别、地区、季而且依赖于某些定性的变量(如性别、地区、季节)。节)。 这些变量只表示某种特征的存在与不存在,所以这些变量只表示某种特征的存在与不存在,所以称为称为定性变量定性变量。 2022-7-10中山学院经济与管理系中山学院经济与管理系43怎样才能把定性变量包括在模型中呢?怎样才能把定性变量包括在模型中呢?一个很好的方法是将它们一个很好的方法是将它们量化量化。 由于定性变量通常是表明某种特征或属性是由于定性变量通常是表明

24、某种特征或属性是否存在,所以量化的方法是取值否存在,所以量化的方法是取值0或或1,用用1表表示具有某一示具有某一“品质品质”或属性,用或属性,用0表示不具有表示不具有该该“品质品质”或属性或属性。这种变量在计量经济学中。这种变量在计量经济学中称为称为“虚拟变量虚拟变量”。比如。比如44如:如:01D城镇居民城镇居民农村居民农村居民01D销售旺季销售旺季销售淡季销售淡季01D政策紧缩政策紧缩政策宽松政策宽松01D本科以上学历本科以上学历本科以下学历本科以下学历2022-7-10中山学院经济与管理系中山学院经济与管理系45虚拟变量使得我们可以将那些无法定量化虚拟变量使得我们可以将那些无法定量化的变

25、量引入回归模型中。下面给出几个可的变量引入回归模型中。下面给出几个可以引入虚拟变量的例子以引入虚拟变量的例子46例例1:你在研究学历和收入之间的关系,在你的样:你在研究学历和收入之间的关系,在你的样本中,既有女性又有男性,你打算研究在此关系本中,既有女性又有男性,你打算研究在此关系中,性别是否中,性别是否 会导致差别。会导致差别。例例2:你在研究某省家庭收入和支出的关系,采集:你在研究某省家庭收入和支出的关系,采集的样本中既包括农村家庭,又包括城镇家庭,你的样本中既包括农村家庭,又包括城镇家庭,你打算研究二者的差别。打算研究二者的差别。 上述各例都可以用两种方法来解决,一种解决上述各例都可以用

26、两种方法来解决,一种解决方法是分别进行两类情况的回归,然后看参数是方法是分别进行两类情况的回归,然后看参数是否不同。另一种方法是用全部观测值作单一回归,否不同。另一种方法是用全部观测值作单一回归,将定性因素的影响用虚拟变量引入模型。将定性因素的影响用虚拟变量引入模型。2022-7-10中山学院经济与管理系中山学院经济与管理系472022-7-10中山学院经济与管理系中山学院经济与管理系485.回归模型可以只用虚拟变量作解释变量,也可回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起作解释变量以用定量变量和虚拟变量一起作解释变量 2022-7-10中山学院经济与管理系中山学院经济

27、与管理系502022-7-10中山学院经济与管理系中山学院经济与管理系520204060801000204060XY0102030405060700204060TY 情形 1(不同类别数据的截距和斜率不同) 情形 2(不同类别数据的截距和斜率不同) 2022-7-10中山学院经济与管理系中山学院经济与管理系552022-7-10中山学院经济与管理系中山学院经济与管理系56中国进出口贸易总额数据(1950-1984) (单位:百亿元人民币) 年 trade time D time D 年 trade time D time D 1950 0.415 1 0 0 1968 1.085 19 0 0

28、 1951 0.595 2 0 0 1969 1.069 20 0 0 1952 0.646 3 0 0 1970 1.129 21 0 0 1953 0.809 4 0 0 1971 1.209 22 0 0 1954 0.847 5 0 0 1972 1.469 23 0 0 1955 1.098 6 0 0 1973 2.205 24 0 0 1956 1.087 7 0 0 1974 2.923 25 0 0 1957 1.045 8 0 0 1975 2.904 26 0 0 1958 1.287 9 0 0 1976 2.641 27 0 0 1959 1.493 10 0 0 1

29、977 2.725 28 0 0 1960 1.284 11 0 0 1978 3.550 29 1 29 1961 0.908 12 0 0 1979 4.546 30 1 30 1962 0.809 13 0 0 1980 5.638 31 1 31 1963 0.857 14 0 0 1981 7.353 32 1 32 1964 0.975 15 0 0 1982 7.713 33 1 33 1965 1.184 16 0 0 1983 8.601 34 1 34 1966 1.271 17 0 0 1984 12.010 35 1 35 1967 1.122 18 0 0 2022-

30、7-10中山学院经济与管理系中山学院经济与管理系583.关于回归系数的其他检验关于回归系数的其他检验591若干个系数的显著性检验(联合假设检验)若干个系数的显著性检验(联合假设检验) 有时需要同时检验若干个系数是否为有时需要同时检验若干个系数是否为0,这可,这可以通过建立单一的原假设来进行。以通过建立单一的原假设来进行。 设要检验设要检验q个系数是否为个系数是否为0,即与之相对应的,即与之相对应的q个解释变量对因变量是否有影响。不失一般性,个解释变量对因变量是否有影响。不失一般性,可设原假设和备择假设为:可设原假设和备择假设为: H0: 1 =2 = =q q =0 H1: 至少存在一个至少存

31、在一个j不为不为0 (j=1,2,q)0 (j=1,2,q) (即即X1, Xq中某些变量对中某些变量对Y有有 影响影响)60分析:分析: 这实际上相当于检验这实际上相当于检验q个约束条件个约束条件 1= 0,2 = 0, ,q q = 0 是否同时成立。是否同时成立。若若H0为真,则正确的模型是:为真,则正确的模型是: 据此进行回归(有约束回归),得到残差平方和据此进行回归(有约束回归),得到残差平方和 ESSR是是H0为真时的残差平方和。为真时的残差平方和。若若H1为真,正确的模型即原模型:为真,正确的模型即原模型:tKtKttXXYu.110tKtKtqqtXXYu.1102110.Kt

32、RktqRqRtRXXYESS61 据此进行无约束回归(全回归),得到残差平方和据此进行无约束回归(全回归),得到残差平方和 ESS是是H1为真时的残差平方和。为真时的残差平方和。 如果如果H0为真,则不管为真,则不管X1, Xq这这q个变量是否包括在模个变量是否包括在模型中,所得到的结果不会有显著差别,因此应该有:型中,所得到的结果不会有显著差别,因此应该有: ESS ESSR 如果如果H1为真,则由上一节中所讨论的残差平方和为真,则由上一节中所讨论的残差平方和 的的特点,无约束回归增加了变量的个数,应有特点,无约束回归增加了变量的个数,应有 ESS ESSR 通过检验二者差异是否显著地大,

33、就能检验原假设是否成通过检验二者差异是否显著地大,就能检验原假设是否成立。立。2k110.KtttXXYESS2e62所使用的检验统计量是:所使用的检验统计量是: F(q, n-K-1)其中,其中,q为分子自由度,为分子自由度, n-K-1为分母自由度。为分母自由度。F统计量也可以用可决系数来表示统计量也可以用可决系数来表示:令令 表示有约束的回归模型的可决系数表示有约束的回归模型的可决系数 表示没有约束的回归模型的可决系数表示没有约束的回归模型的可决系数 )1(KnESSqESSESSFR2()RR2R22)1 (1)RRqRnk2( )(RF=2022-7-10中山学院经济与管理系中山学院

34、经济与管理系63 例:给定例:给定20组组Y, X1, X2, X3的观测值,试检验模的观测值,试检验模 型中型中X1和和X3对对Y是否有影响?是否有影响? 解:(解:(1)全回归估计)全回归估计 得到:得到:(2)有约束回归估计,即在)有约束回归估计,即在 的约束条的约束条件下件下 得到:得到: tttttXXXYu3322110225ESSetttXYu220220RESSe1302022-7-10中山学院经济与管理系中山学院经济与管理系64原假设原假设 H0: 1 = 3 = 0备择假设备择假设 H1: 至少存在一个至少存在一个j不为不为0 0 (j=1,2,q)(j=1,2,q)我们有

35、:我们有:n=20, q=2, K=3 6.1162522530)1(KnESSqESSESSFR用自由度(用自由度(2,16)查)查F分布表,分布表,5%显著性显著性水平下,水平下, =3.63F因为因为F=1.63.78,所以在显著性水平所以在显著性水平1%下下,拒拒绝原假设绝原假设,说明黑人对住房的需求与白人对住房的说明黑人对住房的需求与白人对住房的需求存在显著差异需求存在显著差异. 0.01(3,3114)3.78F2022-7-10中山学院经济与管理系中山学院经济与管理系702.关于利用不同样本得到的回归系数是否相等的检关于利用不同样本得到的回归系数是否相等的检验验 对于多元线性回归

36、模型对于多元线性回归模型:检验回归系数是否相等的假设为检验回归系数是否相等的假设为: 01122iiikkiiYXXXu01122jjjkkjjYbb Xb Xb Xv00011:,kkHbbb1:(0,1, )iiHb ik至少有一组2022-7-10中山学院经济与管理系中山学院经济与管理系71 对于两个回归模型用不同的样本估计得到其估计对于两个回归模型用不同的样本估计得到其估计的回归方程的回归方程:用用 , 分别表示它们的残差平方和分别表示它们的残差平方和.第一个第一个模型的样本容量为模型的样本容量为 ,第二个模型的样本容量为第二个模型的样本容量为 如果原假设是成立的话如果原假设是成立的话

37、,我们可以把两个模型合我们可以把两个模型合并为一个模型并为一个模型,两个样本观测值合并为一组观测值两个样本观测值合并为一组观测值,样本容量为样本容量为01122iiikkiYXXX01122jjjkkjYbb Xb Xb X1ESS2ESS1n2n12nn2022-7-10中山学院经济与管理系中山学院经济与管理系72合并的模型为合并的模型为:利用样本估计得到回归方程利用样本估计得到回归方程:其残差平方和用其残差平方和用 表示表示 我们使用我们使用Chow检验来检验两个模型回归系数是否检验来检验两个模型回归系数是否一致一致.采用的统计量为采用的统计量为: F(k+1, )01122iiikkii

38、YXXXu01122iiikkiYXXXESS合121212 (1)() 2(1)ESSESSESSkFESSESSnnk合()122(1)nnk2022-7-10中山学院经济与管理系中山学院经济与管理系73在给定的显著性水平下在给定的显著性水平下,得到相应的临界值得到相应的临界值如果如果 ,则否定原假设则否定原假设,即认为这即认为这两个回归模型存在显著区别两个回归模型存在显著区别,必须对两个模型分必须对两个模型分别进行估计别进行估计.如果如果 ,则接受原假设则接受原假设,表明两个模表明两个模型相同型相同,可以将两组样本观测值合并为一组进行可以将两组样本观测值合并为一组进行模型的估计模型的估计

39、 . 121,2(1)knnkF121,2(1)knnkFF121,2(1)knnkFF2022-7-10中山学院经济与管理系中山学院经济与管理系74例例:对于住房需求的问题对于住房需求的问题,我们现在建立两个回归模我们现在建立两个回归模型型,一个描述黑人的住房需求一个描述黑人的住房需求,一个描述白人的住一个描述白人的住房需求房需求.这两个模型为这两个模型为:现在我们检验黑人对住房的需求与白人对住房的需现在我们检验黑人对住房的需求与白人对住房的需求是否有区别求是否有区别,检验的假设为检验的假设为:012logloglog,QPYu黑人家庭012logloglog,QPYu黑人家庭0001122

40、Hbbb:,1(0,1,2)iiHb i:至少有一组2022-7-10中山学院经济与管理系中山学院经济与管理系75 利用白人家庭和黑人家庭的样本数据估计模型利用白人家庭和黑人家庭的样本数据估计模型,并并以以 , 分别表示它们的残差平方和分别表示它们的残差平方和,并有并有 在原假设成立的条件下在原假设成立的条件下,则可以将两个回归模型合则可以将两个回归模型合并为一个模型:并为一个模型: 利用全部利用全部3120个家庭的样本数据估计这个模型个家庭的样本数据估计这个模型,得到其残差平方和,得到其残差平方和ESS黑ESS白13640ESSESS黑白012logloglog,QPYu所有家庭ESS合=1

41、3838 2022-7-10中山学院经济与管理系中山学院经济与管理系76最后,计算最后,计算Chow检验的统计量:检验的统计量:因为因为F=15.07 所以在显著性水平所以在显著性水平1%下,拒绝原假设,表明下,拒绝原假设,表明黑人对住房的需求与白人对住房的需求存在显著的黑人对住房的需求与白人对住房的需求存在显著的差异。差异。12 (1)13838 13640 315.07() 2(1)13640 3120 6ESSESSESSkFESSESSnnk黑合白黑白()()()3.780.01(3,3114)F2022-7-10中山学院经济与管理系中山学院经济与管理系773.7预测预测一点预测一点预

42、测点预测就是将解释变量点预测就是将解释变量 的一组特定值的一组特定值,比如,比如代入估计的多元线性回归方程代入估计的多元线性回归方程得到被解释变量得到被解释变量 的点预测值的点预测值它可以是总体均值它可以是总体均值 或个值或个值Y0的预测的预测 12,kXXX).1(020100kXXXX01122iikkiiYXXXX0Y0011022000kkYXXXX00E Y X二、区间预测二、区间预测1 1、个别值、个别值Y0的区间预测的区间预测 如果已经知道实际的预测值如果已经知道实际的预测值Y0 ,那么预测误差为:,那么预测误差为:000YYe容易证明容易证明)(1 ()()()(01022100200XXXXXXXXEeEeVarE(e0)=0e0服从正态分布,即服从正态分布,即 )(1 (, 0(01020XXXXNe构造构造t统统计量计量 ) 1(000kntYYte2 2、平均值、平均值E(Y0)的区间预测的区间预测 容易证明容易证明 ),(020XX)X(XX100NY) 1(knt)E(YY00010XX)X(X于是,得到于是,得到(1-(1- ) )的置信水平下的置信水平下E(Y0)的的置信区间置信区间:010000100)()()(22XXXXXXXXtYYEtY

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 企业培训

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁