第六章 虚拟解释变量模型蓝色精选文档.ppt

上传人:石*** 文档编号:43980965 上传时间:2022-09-20 格式:PPT 页数:103 大小:3.96MB
返回 下载 相关 举报
第六章 虚拟解释变量模型蓝色精选文档.ppt_第1页
第1页 / 共103页
第六章 虚拟解释变量模型蓝色精选文档.ppt_第2页
第2页 / 共103页
点击查看更多>>
资源描述

《第六章 虚拟解释变量模型蓝色精选文档.ppt》由会员分享,可在线阅读,更多相关《第六章 虚拟解释变量模型蓝色精选文档.ppt(103页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第六章第六章 虚拟解释变虚拟解释变量模型蓝色量模型蓝色本讲稿第一页,共一百零三页第一节第一节 引引 言言 在经济计量分析中,在经济计量分析中,经常会碰到所经常会碰到所建模型的被解释变量不仅受诸如收入、建模型的被解释变量不仅受诸如收入、产量、价格、产量、价格、成本、需求、投资等数成本、需求、投资等数量变量的影响,而且也受到诸如战争、量变量的影响,而且也受到诸如战争、自然灾害、国际环境、季节变动以及政自然灾害、国际环境、季节变动以及政府经济政策变动等质量变量的影响。建府经济政策变动等质量变量的影响。建立经济计量模型若不考虑这些质量变量立经济计量模型若不考虑这些质量变量的影响作用,显然是不适宜的。的

2、影响作用,显然是不适宜的。2本讲稿第二页,共一百零三页 所以,在建立经济计量模型时,即要所以,在建立经济计量模型时,即要考虑数量变量,也要考虑质量变量。但是,考虑数量变量,也要考虑质量变量。但是,质量变量和数量变量不同,数量变量可以质量变量和数量变量不同,数量变量可以在事前规定好的尺度上,用不同的数值表在事前规定好的尺度上,用不同的数值表现出来,质量变量却只能以属性、种类的现出来,质量变量却只能以属性、种类的不同具体形式表现出来。不同具体形式表现出来。3本讲稿第三页,共一百零三页例例如如,性性别别可可表表现现为为男男或或女女;人人种种可可表表现现为为白白种种人人和和非非白白种种人人;宗宗教教信

3、信仰仰可可表表现现为为教教徒徒和和非非教教徒徒;政政府府的的经经济济政政策策可可表表现现为为改改革革开放前和改革开放后,如此等等。开放前和改革开放后,如此等等。4本讲稿第四页,共一百零三页 显显然然,这这种种不不同同的的具具体体形形式式是是无无法法直直接接引引入入经经济济计计量量模模型型中中去去的的。但但由由于于这这类类变变量量通通常常表表现现为为品品质质、属属性性、种种类类的的出出现现或或者者未未出出现现,所所以以我我们们可可以以根根据据质质量量变变量量的的这这一一特征将其数量化。特征将其数量化。5本讲稿第五页,共一百零三页 虚虚拟拟变变量量:给给定定某某一一质质量量变变量量某某属属性性的的

4、出出现现为为1,未未出出现现为为0,称称这这样样的变量为虚拟变量。的变量为虚拟变量。6本讲稿第六页,共一百零三页 把哪种情况取把哪种情况取0,哪种情况取,哪种情况取 1 要视研究情况而定。要视研究情况而定。0和和1只是一个符只是一个符号而已,不代表他们有高低的意义。号而已,不代表他们有高低的意义。7本讲稿第七页,共一百零三页 虚虚虚虚拟拟拟拟变变变变量量量量主主主主要要要要是是是是用用用用来来来来代代代代表表表表质质质质的的的的因因因因素素素素,但但但但是是是是有有有有些些些些情情情情况况况况下下下下也也也也可可可可以以以以用用用用来来来来代代代代表表表表数数数数量量量量因因因因素素素素。例例

5、例例如如如如建建建建立立立立储储储储蓄蓄蓄蓄函函函函数数数数时时时时,“收收收收入入入入”显显显显然然然然是是是是一一一一个个个个重重重重要要要要解解解解释释释释变变变变量量量量,虽虽虽虽然然然然是是是是“数数数数量量量量”因因因因素素素素,但但但但是是是是为为为为了了了了方方方方便便便便也也也也可以用虚拟变量表示。可以用虚拟变量表示。可以用虚拟变量表示。可以用虚拟变量表示。8本讲稿第八页,共一百零三页 虚拟解释变量模型的设定因为质的因虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的素的多少和这些因素特征的多少而引入的虚拟变量也会不同。虚拟变量也会不同。第二节第二节第二节第

6、二节 虚拟解释变量的设定虚拟解释变量的设定虚拟解释变量的设定虚拟解释变量的设定9本讲稿第九页,共一百零三页 以一个最简单的虚拟变量模型为例,如以一个最简单的虚拟变量模型为例,如果只包含一个质的因素,而且这个因素仅果只包含一个质的因素,而且这个因素仅有两个特征,则回归模型中只需引入一个有两个特征,则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素,虚拟变量。如果是含有多个质的因素,自然要引入多个虚拟变量。自然要引入多个虚拟变量。10本讲稿第十页,共一百零三页 如果只有一个质的因素,且具有如果只有一个质的因素,且具有m个特征,那么如果是含有截距项的,个特征,那么如果是含有截距项的,就要引入就

7、要引入m-1个虚拟变量;不含有截距项的,个虚拟变量;不含有截距项的,应该引入应该引入m个虚拟变个虚拟变量,这就是虚拟变量的设定原则。量,这就是虚拟变量的设定原则。11本讲稿第十一页,共一百零三页一一、截距变动模型和斜率变动模型、截距变动模型和斜率变动模型 (一)包含一个虚拟变量的截距变动模型(一)包含一个虚拟变量的截距变动模型 假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候只需要引入一个虚拟变量。种特征,这时候只需要引入一个虚拟变量。12本讲稿第十二页,共一百零三页 【例例8.1】假设有一个包括正常年份和非

8、假设有一个包括正常年份和非正常年份(亚洲金融危机或正常年份(亚洲金融危机或SARS的影响)的影响)居民消费的样本,并打算用这些数据估计居民消费的样本,并打算用这些数据估计消费函数。由于在正常年份和非正常年份消费函数。由于在正常年份和非正常年份居民在消费水平上存在明显差异,所以一居民在消费水平上存在明显差异,所以一些外界的影响是一个重要的解释变量。些外界的影响是一个重要的解释变量。13本讲稿第十三页,共一百零三页 用一个虚拟变量来表示这个质的因素,消费函数为用一个虚拟变量来表示这个质的因素,消费函数为 式中,式中,Yi=第个居民的消费水平,第个居民的消费水平,Xi=第个居民的收入水平,第个居民的

9、收入水平,D为虚为虚拟变量。我们用拟变量。我们用D=1表示正常年份这一特征,用表示正常年份这一特征,用D=0来表示非正常年来表示非正常年份份(8.1)14本讲稿第十四页,共一百零三页 假设假设E(u i)=0,式(式(8.1)可以写成可以写成(8.3)(8.2)15本讲稿第十五页,共一百零三页 式(式(8.2)和和式(式(8.3)分别为正常年份分别为正常年份和非正常年份的居民消费水平。二者具和非正常年份的居民消费水平。二者具有相同的斜率,但是截距不同。有相同的斜率,但是截距不同。16本讲稿第十六页,共一百零三页 对对 1 1 作作t t 检验,若检验,若 1 显著地不为显著地不为0,我们就认为

10、正常年份和非,我们就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若正常年份居民在消费行为上的差异是明显的。若 1 0,则正常年份,则正常年份的居民消费水平高于非正常年份的居民消费水平。的居民消费水平高于非正常年份的居民消费水平。利用最小二乘法对利用最小二乘法对式(式(8.1)进行估计,可得到进行估计,可得到(8.4)17本讲稿第十七页,共一百零三页 通过通过例例8.1,我们可以找出虚拟变量模型的,我们可以找出虚拟变量模型的一些特征。一些特征。用用用用“1”“1”“1”“1”来代表质的因素的哪个特征是可以任意设定的。我们一来代表质的因素的哪个特征是可以任意设定的。我们一来代表质的因素

11、的哪个特征是可以任意设定的。我们一来代表质的因素的哪个特征是可以任意设定的。我们一般认为,般认为,般认为,般认为,“1”“1”“1”“1”代表具有某些特征,但没有具体规定。在上例中,也可以代表具有某些特征,但没有具体规定。在上例中,也可以代表具有某些特征,但没有具体规定。在上例中,也可以代表具有某些特征,但没有具体规定。在上例中,也可以指定指定指定指定D=1D=1时为非正常年份,而时为非正常年份,而时为非正常年份,而时为非正常年份,而D=0D=0就必然为正常年份。在这种情况下,就必然为正常年份。在这种情况下,就必然为正常年份。在这种情况下,就必然为正常年份。在这种情况下,正常年份和非正常年份的

12、消费函数分别为正常年份和非正常年份的消费函数分别为正常年份和非正常年份的消费函数分别为正常年份和非正常年份的消费函数分别为18本讲稿第十八页,共一百零三页 如果我们绘制图形,得到的结果仍然是一样的。此时,如果我们绘制图形,得到的结果仍然是一样的。此时,1 1,非正常年份的线低于正常年份的线,代表非正常年份的消费水平低于非正常年份的线低于正常年份的线,代表非正常年份的消费水平低于正常年份的消费水平。正常年份的消费水平。19本讲稿第十九页,共一百零三页 虚拟变量虚拟变量D=0所代表的特性或状态所代表的特性或状态通常称为基础类型。和其它特征或状通常称为基础类型。和其它特征或状态比较的意义上说,基础类

13、型为对比态比较的意义上说,基础类型为对比的基础。的基础。20本讲稿第二十页,共一百零三页 模型中的系数模型中的系数0 为基础类型的截为基础类型的截距项,称为公共截距项;系数距项,称为公共截距项;系数1 称称为差别截距系数,指的是为差别截距系数,指的是 D 取取 1 时截时截距系数和基础类型的截距系数的差异。距系数和基础类型的截距系数的差异。21本讲稿第二十一页,共一百零三页 如果一个回归模型有截距项,而且这个质的因素又有两如果一个回归模型有截距项,而且这个质的因素又有两种特征,也就是将其分两类,则我们只需要引入一个虚拟变量。种特征,也就是将其分两类,则我们只需要引入一个虚拟变量。如我们的如我们

14、的例例8.1所示。如果一个回归方程有截距项,所示。如果一个回归方程有截距项,只有一个质的因只有一个质的因素影响被解释变量,它有个素影响被解释变量,它有个m特征,我们就要引入特征,我们就要引入m-1个虚拟变个虚拟变量;量;22本讲稿第二十二页,共一百零三页 如果回归方程没有截距项,那么这个质如果回归方程没有截距项,那么这个质的因素有多少个特征就要设多少个虚拟的因素有多少个特征就要设多少个虚拟变量,这就是虚拟变量的使用原则。变量,这就是虚拟变量的使用原则。23本讲稿第二十三页,共一百零三页 虚拟变量陷阱:如果虚拟变量设定不虚拟变量陷阱:如果虚拟变量设定不当,会使最小二乘法无解,称这种情当,会使最小

15、二乘法无解,称这种情况为虚拟变量陷阱。况为虚拟变量陷阱。24本讲稿第二十四页,共一百零三页 引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。(1)对有截距项的情况,我们如果设两个虚拟变量,则回归模型为对有截距项的情况,我们如果设两个虚拟变量,则回归模型为(8.7)25本讲稿第二十五页,共一百零三页式式(8.7)也可表示为也可表示为其中,其中,显然如下等式成立。,显然如下等式成立。(8.8)(8.9)26本讲稿第二十六页,共一百零三页 式式(8.9)表明模型表明模型(8.8)即原模型即原模型(8.7)中有完中有完全的多重共线性,将导致最

16、小二乘估计无解。全的多重共线性,将导致最小二乘估计无解。我们称该情景为掉入虚拟变量陷阱。所以,我们称该情景为掉入虚拟变量陷阱。所以,在有截距项的情况下,如果一个质的因素有在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通多少个特征就引入多少个虚拟变量是行不通的。的。27本讲稿第二十七页,共一百零三页 (2)对没有截距的情况,我们如果设两个虚拟变量,对没有截距的情况,我们如果设两个虚拟变量,显然显然模型模型(8.10)中,解释变量中,解释变量D1,D2和和X之间无完全的多重共线性。可之间无完全的多重共线性。可以使用普通最小二乘法估计以使用普通最小二乘法估计式(式(8.1

17、0)的参数。的参数。(8.10)28本讲稿第二十八页,共一百零三页 (二)斜率变动模型(二)斜率变动模型 在实际问题中,斜率单独变动出现的情在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速形一般比较少,它指的是改变了变动的速率也就是弹性。率也就是弹性。例如城镇居民家庭与农村例如城镇居民家庭与农村居民家庭的消费函数,居民家庭的消费函数,在边际消费倾向在边际消费倾向(斜率)上可能会有所不同,假设它们的(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。消费函数在截距项没有区别。29本讲稿第二十九页,共一百零三页那么回归模型可记为那么回归模型可记为(8.11)其中,其

18、中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个家庭的收入水平,第个家庭的收入水平,30本讲稿第三十页,共一百零三页式(式(8.11)可以表示为)可以表示为(8.12)(8.13)31本讲稿第三十一页,共一百零三页 (三)包含多个虚拟变量的截距变动模型(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国家可以是,很多质的因素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家分为发达国家、发展中国家、不发达国家。

19、32本讲稿第三十二页,共一百零三页 我国少数民族在很多问题上有差我国少数民族在很多问题上有差异,所以当把民族作为虚拟变量时,异,所以当把民族作为虚拟变量时,不能简单将其分为汉族和非汉族;季不能简单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我具有四个特征,按照前面的原则,我们要引入三个虚拟变量。们要引入三个虚拟变量。33本讲稿第三十三页,共一百零三页 例如,我们用季度资料研究各种商品消例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立费额在季节上有没有什么区别?可以建立模型如下:模型如下:(8.14)

20、其中,其中,其中,其中,YtYt=季度的消费,季度的消费,季度的消费,季度的消费,XtXt=季度的收入,对于四个季度,我们引入了三季度的收入,对于四个季度,我们引入了三季度的收入,对于四个季度,我们引入了三季度的收入,对于四个季度,我们引入了三个虚拟变量:个虚拟变量:个虚拟变量:个虚拟变量:34本讲稿第三十四页,共一百零三页这里,第四季度为基础类型,其截距项为这里,第四季度为基础类型,其截距项为0 。而其它三个季度的截。而其它三个季度的截距项分别为距项分别为 0+1,0+2 ,0+3 。1,2,3 代表季节变动代表季节变动引起的消费差异。引起的消费差异。35本讲稿第三十五页,共一百零三页四个季

21、度的回归模型分别为四个季度的回归模型分别为(8.15)(8.16)(8.17)(8.18)36本讲稿第三十六页,共一百零三页 (四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变模归模型的截距有影响,而且还会改变模归模型的截距有影响,而且还会改变模归模型的截距有影响,而且还会改变模型的斜率。型的斜率。型的斜率。型的斜率。37本讲稿第三十七页,共一百零三页 例如城镇居民和农村居民的消费

22、例如城镇居民和农村居民的消费函数不但在斜率上有差异,在截距上函数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同也是有可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程时考虑进来,我们可以得到回归方程 38本讲稿第三十八页,共一百零三页(8.19)式中,式中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个家庭的收入水平第个家庭的收入水平,39本讲稿第三十九页,共一百零三页 1和和 3 分别表示城镇居民家庭和农村居民家庭分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。的消费函数在截距和斜率上的差异。式(式(8.19)可以表示为)可以表示为(8.20

23、)(8.21)40本讲稿第四十页,共一百零三页 我们一般通过我们一般通过t t 检验来判定它们之间是否有差异。检验来判定它们之间是否有差异。1.1.若若10 0,30 0,则为截距和斜率同时变动模型;,则为截距和斜率同时变动模型;2.2.若若 10,0,3=0=0,则为截距变动模型;,则为截距变动模型;3.3.若若 1=0=0,3=0,=0,则表示城镇居民家庭和农村居则表示城镇居民家庭和农村居 民家庭有着完全民家庭有着完全相同的消费模式;相同的消费模式;4.4.若若 1=0=0,30,0,则为斜率变动模型,这种情况在现实中出现得不则为斜率变动模型,这种情况在现实中出现得不是很多。是很多。41本

24、讲稿第四十一页,共一百零三页 下面,以我国的农村和城市的消费样本下面,以我国的农村和城市的消费样本为例,实际体会虚拟变量模型从建模到检为例,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。验再到估计参数最后下结论的全过程。【例例8.2】已有数据资料为我国城镇居民家已有数据资料为我国城镇居民家庭庭1955年至年至1985年人均收入和人均储蓄。年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。关系而且收入的变化会引起储蓄的变化。42

25、本讲稿第四十二页,共一百零三页 假定它们之间为线性关系,我们可以建立储蓄模型如下假定它们之间为线性关系,我们可以建立储蓄模型如下 式中,式中,St=人均储蓄,人均储蓄,Xt=人均收入,人均收入,t=年份(年份(t=1955=1955,19561956,19851985)。)。(8.22)43本讲稿第四十三页,共一百零三页 把把19551955年作为基期并把该期的价格水平定为年作为基期并把该期的价格水平定为100,再分别扣除包,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计含在和中的物价上涨因素。用最小二乘法估计式(式(8.22),),得到得到 R2=0.833=0.833,DW=0.39

26、8=0.398 (8.22)44本讲稿第四十四页,共一百零三页 模型(模型(8.23)包含了这样一个假定,那包含了这样一个假定,那就是在就是在1955到到1985年期间我国城镇居民家年期间我国城镇居民家庭的储蓄行为大体保持不变。庭的储蓄行为大体保持不变。45本讲稿第四十五页,共一百零三页 这一假定实际上是行不通的,因为在这一假定实际上是行不通的,因为在十一届三中全会召开之后,居民的收入十一届三中全会召开之后,居民的收入大大增加,而且与居民储蓄有关的许多大大增加,而且与居民储蓄有关的许多重要因素在重要因素在1979年以后发生了明显变化。年以后发生了明显变化。在改革开放之前,在改革开放之前,我国居

27、民的收入水平我国居民的收入水平仅仅能够维持温饱水平,根本不可能有仅仅能够维持温饱水平,根本不可能有多少储蓄。多少储蓄。46本讲稿第四十六页,共一百零三页 1979年以后,我国居民的收入水平大年以后,我国居民的收入水平大幅度提高,同时,居民储蓄也在大幅度幅度提高,同时,居民储蓄也在大幅度增长。从这些可以看出来,增长。从这些可以看出来,1979年前后年前后两个时期,我国居民的边际储蓄倾向有两个时期,我国居民的边际储蓄倾向有显著性差异。显著性差异。47本讲稿第四十七页,共一百零三页 在改革开放前的大多数年份在改革开放前的大多数年份,我国我国的消费市场常常是供不应求的消费市场常常是供不应求,许多商品许

28、多商品要国家下达计划指标要国家下达计划指标,居民凭票证购买居民凭票证购买,经常出现的问题是顾客即使有钱也难经常出现的问题是顾客即使有钱也难买到需要的商品买到需要的商品,就不得不把钱存起来。就不得不把钱存起来。这时候的储蓄就带有非自愿的性质。这时候的储蓄就带有非自愿的性质。48本讲稿第四十八页,共一百零三页而在而在19791979年以后年以后,物资逐渐丰富物资逐渐丰富,商品的买卖也取消了票证的商品的买卖也取消了票证的限制限制,消费者储蓄的主要目的之一是购买高档耐用消费品,储消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有蓄不再具有“被迫被迫”的性质。的性质。49本讲稿第四十九页,共一百

29、零三页 为了验证城镇居民的储蓄行为是否为了验证城镇居民的储蓄行为是否有显著变化有显著变化,可以建立下面的截距和斜可以建立下面的截距和斜率同时变动模型。率同时变动模型。(8.24)式中式中,St和和Xt仍代表人均储蓄和人均收入仍代表人均储蓄和人均收入,DD为虚拟变量,为虚拟变量,50本讲稿第五十页,共一百零三页用最小二乘法估计用最小二乘法估计式式(8.24),可以得到可以得到(8.25)51本讲稿第五十一页,共一百零三页 其中其中,参数估计值下面括号中的数字为参数估计值下面括号中的数字为统计值。显然统计值。显然,在在1979年前后储蓄模型年前后储蓄模型的截距和斜率有明显差异。式的截距和斜率有明显

30、差异。式(8.25)可可以写为两个方程以写为两个方程(8.268.26)(8.278.27)52本讲稿第五十二页,共一百零三页 由以上模型可知,我国城镇居民的边由以上模型可知,我国城镇居民的边际储蓄倾向在际储蓄倾向在1979年以前仅为年以前仅为0.004,也也就是收入增加就是收入增加1元元,储蓄平均增加储蓄平均增加4厘厘;而从而从1979年到年到1985年这段时间年这段时间,城镇居城镇居民的边际储蓄倾向增至民的边际储蓄倾向增至0.256。53本讲稿第五十三页,共一百零三页 然而然而,在在式式(8.23)中得到的边际储蓄倾中得到的边际储蓄倾向却是向却是0.17。很明显。很明显,式式(8.23)既

31、不代既不代表改革开放之前城镇居民的消费行为表改革开放之前城镇居民的消费行为,也不能正确描述也不能正确描述1979年以后城镇居民年以后城镇居民储蓄与收入之间的关系。储蓄与收入之间的关系。54本讲稿第五十四页,共一百零三页我我们们单单从从模模型型的的拟拟合合也也可可以以看看出出引引进进虚虚拟拟变变量量可可以以改改善善估估计计效效果果。式式(8.23)中中的的随随机机误误差差项项存存在在正正自自相相关关(DW=0.398),拟拟合合优优度度效效果果也也不不太太好好(R2=0.833)。引引入入虚虚拟拟变变量量后后的的模模型型消消除除了了自自相相关关(DW=1.67),判判定定系系数数也也上上升升到到

32、0.967。所所以以,虚虚拟拟变变量量的引入很有必要。的引入很有必要。55本讲稿第五十五页,共一百零三页 二、多个质的因素的虚拟变量模型二、多个质的因素的虚拟变量模型 我们讨论的回归模型只包括一个质的因素,但是在很多情形下我们讨论的回归模型只包括一个质的因素,但是在很多情形下,往往往有两个以上的质的因素影响回归模型的被解释变量。例如往有两个以上的质的因素影响回归模型的被解释变量。例如,在考察居在考察居民的食品消费行为时民的食品消费行为时,可以考虑的质的因素有居民的性别、民族、受教可以考虑的质的因素有居民的性别、民族、受教育程度、地理区域等等。育程度、地理区域等等。56本讲稿第五十六页,共一百零

33、三页 再如再如,除收入水平外除收入水平外,冰琪凌消费量还会冰琪凌消费量还会受到季节和地区等质的因素影响。这些受到季节和地区等质的因素影响。这些质的因素可能不仅仅改变模型的截距和质的因素可能不仅仅改变模型的截距和斜率斜率,质的因素之间也往往有相互影响。质的因素之间也往往有相互影响。例如例如,高收入水平和低收入水平的居民高收入水平和低收入水平的居民在家电消费量上的差异会随着季节不同在家电消费量上的差异会随着季节不同而改变的。而改变的。为了方便为了方便,我们建立以下简单的食品消我们建立以下简单的食品消费模型费模型。57本讲稿第五十七页,共一百零三页(8.288.28)58本讲稿第五十八页,共一百零三

34、页 式式(8.28)中中,Ct和和At分别表示居民的食分别表示居民的食品消费和居民的收入品消费和居民的收入,D1,D2,D3,D4,D5是虚拟变量,分别表示性别因是虚拟变量,分别表示性别因素、年龄因素和学历因素。性别因素只素、年龄因素和学历因素。性别因素只有两个特征男和女,设一个虚拟变量有两个特征男和女,设一个虚拟变量D1。59本讲稿第五十九页,共一百零三页 年龄分为三个层次,年龄分为三个层次,25岁以下、岁以下、25到到50岁和岁和50岁以上,设二个虚拟变量岁以上,设二个虚拟变量D2和和D3。受教育程度分为三个层次。受教育程度分为三个层次,初中初中以下、高中和高中以上以下、高中和高中以上,设

35、二个虚拟变设二个虚拟变量量D4 和和D5。模型中还有虚拟变量之间。模型中还有虚拟变量之间的乘积,考虑了截距项的各种变化可的乘积,考虑了截距项的各种变化可能。能。60本讲稿第六十页,共一百零三页DiDi取值不同,截距不同,如:取值不同,截距不同,如:取值不同,截距不同,如:取值不同,截距不同,如:其余的依次类推。其余的依次类推。6 和和 7 为性别和年龄层次的相互影响系数。采用通为性别和年龄层次的相互影响系数。采用通常的统计检验方法对各种可能的情况进行检验。常的统计检验方法对各种可能的情况进行检验。61本讲稿第六十一页,共一百零三页 例如,如果例如,如果 1 在统计上显著说明性别这在统计上显著说

36、明性别这个质的因素会明显影响食品的消费量。个质的因素会明显影响食品的消费量。同时,同时,2 在统计上显著,就表明在统计上显著,就表明25岁以岁以下居民在食品消费上和别的层次的居民是下居民在食品消费上和别的层次的居民是有显著差异的,那么年龄也会是个很重要有显著差异的,那么年龄也会是个很重要的影响因素。的影响因素。62本讲稿第六十二页,共一百零三页上上上上述述述述假假假假定定定定虚虚虚虚拟拟拟拟变变变变量量量量仅仅仅仅仅仅仅仅影影影影响响响响回回回回归归归归模模模模型型型型的的的的截截截截距距距距,由由由由此此此此可可可可以以以以推推推推广广广广到到到到更更更更一一一一般般般般的的的的情情情情形形

37、形形,也也也也就就就就是是是是虚虚虚虚拟拟拟拟变变变变量量量量同同同同时时时时改改改改变变变变回回回回归归归归模模模模型型型型的的的的截截截截距距距距和和和和斜斜斜斜率率率率,那那那那样样样样考考考考虑虑虑虑得更周全,但是也会更复杂,在这里我们不作讨论。得更周全,但是也会更复杂,在这里我们不作讨论。得更周全,但是也会更复杂,在这里我们不作讨论。得更周全,但是也会更复杂,在这里我们不作讨论。63本讲稿第六十三页,共一百零三页第三节第三节第三节第三节 变参数模型和分段回归变参数模型和分段回归变参数模型和分段回归变参数模型和分段回归一、变参数模型一、变参数模型 从上一节的讨论可知,由于引入了虚拟变量

38、,回归模型的截距或斜从上一节的讨论可知,由于引入了虚拟变量,回归模型的截距或斜率不再是固定不变的。但是模型中参数的变化是离散的,而不是连续率不再是固定不变的。但是模型中参数的变化是离散的,而不是连续的。的。64本讲稿第六十四页,共一百零三页 例如,在例如,在式(式(8.24)中,只是假定在中,只是假定在1979年以前和年以前和1979年以后两个时期城镇年以后两个时期城镇居民有不同的消费行为,也就是说,回居民有不同的消费行为,也就是说,回归模型的截距和斜率并不是每年都发生归模型的截距和斜率并不是每年都发生变化。变参数模型是虚拟变量模型的推变化。变参数模型是虚拟变量模型的推广,它认为回归模型的截距

39、或斜率会随广,它认为回归模型的截距或斜率会随着样本观察值的改变而系统地改变。着样本观察值的改变而系统地改变。65本讲稿第六十五页,共一百零三页 (一)截距变动模型(一)截距变动模型 系统变参数模型也可以分为截距变动模型和截距、斜率同时变动模系统变参数模型也可以分为截距变动模型和截距、斜率同时变动模型。设线性回归模型为型。设线性回归模型为(8.28)66本讲稿第六十六页,共一百零三页 式中,式中,X=解释变量,解释变量,Y=被解释变量。被解释变量。如果的变化为非随机的,而且这种如果的变化为非随机的,而且这种变化完全由外生变量决定,那么式变化完全由外生变量决定,那么式(8.29)就是一个非随机变参

40、数模型。)就是一个非随机变参数模型。67本讲稿第六十七页,共一百零三页 我们观察到截距项和我们前面的虚拟变我们观察到截距项和我们前面的虚拟变量模型的截距项有所不同,下面多了一量模型的截距项有所不同,下面多了一个下标个下标t。这就是说,虽然回归模型斜率。这就是说,虽然回归模型斜率在整个样本时期保持不变,但是截距项在整个样本时期保持不变,但是截距项是随着时间的变化而变化的。是随着时间的变化而变化的。68本讲稿第六十八页,共一百零三页1t定义如下定义如下(8.308.30)式中,式中,0 0和和1 为我们要求的参数,也可以称为为我们要求的参数,也可以称为“超参数超参数”,ZtZt 是用来是用来解释解

41、释 1 1t t 变动情况的外生变量将变动情况的外生变量将式(式(8.30)代入代入式(式(8.29)中,整理中,整理得到得到69本讲稿第六十九页,共一百零三页(8.318.31)可用最小二乘法对可用最小二乘法对式(式(8.31)中的超参数和其它参数一并进行估计。)中的超参数和其它参数一并进行估计。如果如果Zt 为虚拟变量,那么为虚拟变量,那么式(式(8.31)就是一个虚拟变量模型,而且是就是一个虚拟变量模型,而且是一个截距项变动斜率不变的模型。因此,虚拟变量模型是变参数模型一个截距项变动斜率不变的模型。因此,虚拟变量模型是变参数模型的一种特殊形式。的一种特殊形式。70本讲稿第七十页,共一百零

42、三页 (二)截距和斜率同时变动模型(二)截距和斜率同时变动模型 和虚拟变量模型的思路一样,再来和虚拟变量模型的思路一样,再来讨论斜率和截距同时存在系统变动的情讨论斜率和截距同时存在系统变动的情况。我们只需要在况。我们只需要在式(式(8.31)的基础上的基础上进行改进。将换为,且假定有如下关系进行改进。将换为,且假定有如下关系式:式:(8.328.32)71本讲稿第七十一页,共一百零三页将式(将式(8.32)代入式()代入式(8.31),则有),则有(8.338.33)72本讲稿第七十二页,共一百零三页 以上模型只假定以上模型只假定 1t 和和 2t 存在系统变化,实际上还有很多参数存在系统变化

43、,实际上还有很多参数都可能存在这种变化,甚至可能存在都可能存在这种变化,甚至可能存在1t 和和 2t 等系数有可能不是线等系数有可能不是线性变化的,也就是说超参数本身可能不为常数。这种情况只是在理性变化的,也就是说超参数本身可能不为常数。这种情况只是在理论上提出来,实际操作会因为太复杂而没有太多的应用。论上提出来,实际操作会因为太复杂而没有太多的应用。73本讲稿第七十三页,共一百零三页用最小二乘估计得到用最小二乘估计得到用最小二乘估计得到用最小二乘估计得到式(式(式(式(8.338.33)中的参数估计值后,就可以对参数是中的参数估计值后,就可以对参数是中的参数估计值后,就可以对参数是中的参数估

44、计值后,就可以对参数是否存在系统变化进行统计检验。如果否存在系统变化进行统计检验。如果否存在系统变化进行统计检验。如果否存在系统变化进行统计检验。如果 1 11 1和和和和b bb b1 11 1在统计上不显著,就可在统计上不显著,就可在统计上不显著,就可在统计上不显著,就可以把以把以把以把 1 11 1和和和和 11看作常数;否则,我们认为看作常数;否则,我们认为看作常数;否则,我们认为看作常数;否则,我们认为 11 和和和和 22 存在系统变化。存在系统变化。存在系统变化。存在系统变化。74本讲稿第七十四页,共一百零三页 显然,如果错误地把显然,如果错误地把 1 和和2 当作常数,当作常数

45、,就等同于错误地解释了经济变量之间的就等同于错误地解释了经济变量之间的关系。此外,由于相当于省略了重要的关系。此外,由于相当于省略了重要的解释变量解释变量 Zt 和和 Wt ,还可能会产生自相,还可能会产生自相关等问题。关等问题。75本讲稿第七十五页,共一百零三页 (三)应用案例(三)应用案例 【例【例8.3】众所周知,我国居民的消费行为在经济体制改革开放前众所周知,我国居民的消费行为在经济体制改革开放前后存在巨大差异。但是,在这期间居民的消费行为是否也在不断变化后存在巨大差异。但是,在这期间居民的消费行为是否也在不断变化?我国的经济体制改革走的是一条渐进的道路,与居民消费有关的诸?我国的经济

46、体制改革走的是一条渐进的道路,与居民消费有关的诸多因素必然会随着改革开放的不断推进而逐步改变。多因素必然会随着改革开放的不断推进而逐步改变。76本讲稿第七十六页,共一百零三页 这些变化对居民消费的影响主要有三个这些变化对居民消费的影响主要有三个方面:方面:第一、第一、观念的变化。与改革开放观念的变化。与改革开放初期相比,初期相比,我国居民的观念已经发生了我国居民的观念已经发生了深刻的变化。人们的市场意识、风险意深刻的变化。人们的市场意识、风险意识、对通货膨胀的心理承受能力等均大识、对通货膨胀的心理承受能力等均大大增强;对大增强;对“铁铁”饭碗的依赖思想已明饭碗的依赖思想已明显减弱。显减弱。77

47、本讲稿第七十七页,共一百零三页 第二,消费者的经济决策权逐渐扩大,第二,消费者的经济决策权逐渐扩大,消费品市场供给日益丰富;劳动力市场消费品市场供给日益丰富;劳动力市场的建立使人们有越来越多的择业机会;的建立使人们有越来越多的择业机会;居民金融资产的迅速积累,使消费者可居民金融资产的迅速积累,使消费者可以在一定时间范围内提前或延期消费。以在一定时间范围内提前或延期消费。78本讲稿第七十八页,共一百零三页 第三,不确定因素增多。随着市场因素第三,不确定因素增多。随着市场因素的增多,经济生活的不确定因素也在增的增多,经济生活的不确定因素也在增加。例如,职工的实际收入已不再是完加。例如,职工的实际收

48、入已不再是完全全“刚性刚性”,个人的实际收入可能会因,个人的实际收入可能会因为通货膨胀、企业经济效益下降而减少。为通货膨胀、企业经济效益下降而减少。不确定因素的增加,迫使消费者在安排不确定因素的增加,迫使消费者在安排消费时更多顾及长远利益,消费行为渐消费时更多顾及长远利益,消费行为渐趋向理性。趋向理性。79本讲稿第七十九页,共一百零三页 综上所述,我们似乎没有理由认为居民消费行为在综上所述,我们似乎没有理由认为居民消费行为在19791979年以后是固年以后是固定不变的。但是这种变动是否显著?变动趋势是怎么样的?这一切还定不变的。但是这种变动是否显著?变动趋势是怎么样的?这一切还需要用系统变参数

49、模型加以验证。需要用系统变参数模型加以验证。80本讲稿第八十页,共一百零三页利用利用利用利用1979197919791979年至年至年至年至1997199719971997年我国城镇居民家庭收支调查资料,可以建立一年我国城镇居民家庭收支调查资料,可以建立一年我国城镇居民家庭收支调查资料,可以建立一年我国城镇居民家庭收支调查资料,可以建立一个简单的系统变参数模型:个简单的系统变参数模型:个简单的系统变参数模型:个简单的系统变参数模型:(8.348.34)式中,式中,XtXt和和YtYt分别代表城镇居民家庭某年人均实际收入和人均实际支分别代表城镇居民家庭某年人均实际收入和人均实际支出(以出(以19

50、801980年的价格水平为年的价格水平为100100,从收入和支出中分别扣除价格上涨,从收入和支出中分别扣除价格上涨因素的影响)。因素的影响)。t=年份,年份,ut=随机误差项。随机误差项。81本讲稿第八十一页,共一百零三页 注意到模型的截距注意到模型的截距1t 和边际消费和边际消费倾向倾向 2t 是随着时间的推移而不断变是随着时间的推移而不断变化的,也就是说,消费与收入的关系化的,也就是说,消费与收入的关系是逐年变化的。引起是逐年变化的。引起 1t 和和 2t 变化的变化的因素中有许多是不可观测或难以度量因素中有许多是不可观测或难以度量的,所以无法把这些因素作为解释变的,所以无法把这些因素作

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁