《计量经济学虚拟变量模型优秀PPT.ppt》由会员分享,可在线阅读,更多相关《计量经济学虚拟变量模型优秀PPT.ppt(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计量经济学虚拟变量计量经济学虚拟变量模型模型1现在学习的是第1页,共101页第一节第一节 虚拟变量的概念与设定虚拟变量的概念与设定 一、虚拟变量的概念一、虚拟变量的概念 在经济计量分析中,在经济计量分析中,经常会碰到所建模经常会碰到所建模型的被解释变量不仅受诸如收入、产量、型的被解释变量不仅受诸如收入、产量、价格、价格、成本、需求、投资等数量变量的成本、需求、投资等数量变量的影响,而且也受到诸如战争、自然灾害、影响,而且也受到诸如战争、自然灾害、国际环境、季节变动以及政府经济政策国际环境、季节变动以及政府经济政策变动等质量变量的影响。建立经济计量变动等质量变量的影响。建立经济计量模型若不考虑这
2、些质量变量的影响作用,模型若不考虑这些质量变量的影响作用,显然是不适宜的。显然是不适宜的。2现在学习的是第2页,共101页 所以,在建立经济计量模型时,即要所以,在建立经济计量模型时,即要考虑数量变量,也要考虑质量变量。但是,考虑数量变量,也要考虑质量变量。但是,质量变量和数量变量不同,数量变量可以质量变量和数量变量不同,数量变量可以在事前规定好的尺度上,用不同的数值表在事前规定好的尺度上,用不同的数值表现出来,质量变量却只能以属性、种类的现出来,质量变量却只能以属性、种类的不同具体形式表现出来。不同具体形式表现出来。3现在学习的是第3页,共101页例例如如,性性别别可可表表现现为为男男或或女
3、女;人人种种可可表表现现为为白白种种人人和和非非白白种种人人;宗宗教教信信仰仰可可表表现现为为教教徒徒和和非非教教徒徒;政政府府的的经经济济政政策策可可表表现现为为改改革革开开放前和改革开放后,如此等等。放前和改革开放后,如此等等。4现在学习的是第4页,共101页 显显然然,这这种种不不同同的的具具体体形形式式是是无无法法直直接接引引入入经经济济计计量量模模型型中中去去的的。但但由由于于这这类类变变量量通通常常表表现现为为品品质质、属属性性、种种类类的的出出现现或或者者未未出出现现,所所以以我我们们可可以以根根据据质质量量变变量量的的这这一特征将其数量化。一特征将其数量化。5现在学习的是第5页
4、,共101页 虚虚拟拟变变量量:给给定定某某一一质质量量变变量量某某属属性性的的出出现现为为1,未未出出现现为为0,称称这这样样的的变变量为虚拟变量。量为虚拟变量。6现在学习的是第6页,共101页 把哪种情况取把哪种情况取0,哪种情况取,哪种情况取 1 要视研究情况而定。要视研究情况而定。0和和1只是一个符只是一个符号而已,不代表他们有高低的意义。号而已,不代表他们有高低的意义。7现在学习的是第7页,共101页 虚虚虚虚拟拟拟拟变变变变量量量量主主主主要要要要是是是是用用用用来来来来代代代代表表表表质质质质的的的的因因因因素素素素,但但但但是是是是有有有有些些些些情情情情况况况况下下下下也也也
5、也可可可可以以以以用用用用来来来来代代代代表表表表数数数数量量量量因因因因素素素素。例例例例如如如如建建建建立立立立储储储储蓄蓄蓄蓄函函函函数数数数时时时时,“收收收收入入入入”显显显显然然然然是是是是一一一一个个个个重重重重要要要要解解解解释释释释变变变变量量量量,虽虽虽虽然然然然是是是是“数数数数量量量量”因因因因素素素素,但但但但是是是是为为为为了了了了方方方方便便便便也也也也可可可可以以以以用用用用虚虚虚虚拟拟拟拟变变变变量量量量表表表表示。示。示。示。8现在学习的是第8页,共101页 虚拟解释变量模型的设定因为质的因虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的
6、素的多少和这些因素特征的多少而引入的虚拟变量也会不同。虚拟变量也会不同。二、二、二、二、虚拟解释变量的设定虚拟解释变量的设定虚拟解释变量的设定虚拟解释变量的设定9现在学习的是第9页,共101页 以一个最简单的虚拟变量模型为例,如以一个最简单的虚拟变量模型为例,如果只包含一个质的因素,而且这个因素仅果只包含一个质的因素,而且这个因素仅有两个特征,则回归模型中只需引入一个有两个特征,则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素,虚拟变量。如果是含有多个质的因素,自然要引入多个虚拟变量。自然要引入多个虚拟变量。10现在学习的是第10页,共101页 如果只有一个质的因素,且具有如果只有一个
7、质的因素,且具有m个特征,个特征,那么如果是含有截距项的,就要引入那么如果是含有截距项的,就要引入m-1个虚个虚拟变量;不含有截距项的,拟变量;不含有截距项的,应该引入应该引入m个虚拟个虚拟变量,这就是虚拟变量的设定原则。变量,这就是虚拟变量的设定原则。11现在学习的是第11页,共101页 【例【例5.1】假设有一个包括正常年份和非假设有一个包括正常年份和非正常年份(亚洲金融危机或正常年份(亚洲金融危机或SARS的影响)的影响)居民消费的样本,并打算用这些数据估计居民消费的样本,并打算用这些数据估计消费函数。由于在正常年份和非正常年份消费函数。由于在正常年份和非正常年份居民在消费水平上存在明显
8、差异,所以一居民在消费水平上存在明显差异,所以一些外界的影响是一个重要的解释变量。些外界的影响是一个重要的解释变量。12现在学习的是第12页,共101页 用一个虚拟变量来表示这个质的因素,消费用一个虚拟变量来表示这个质的因素,消费函数为函数为 式中,式中,Yi=第个居民的消费水平,第个居民的消费水平,Xi=第个居第个居民的收入水平,民的收入水平,D为虚拟变量。我们用为虚拟变量。我们用D=1表表示正常年份这一特征,用示正常年份这一特征,用D=0来表示非正常年来表示非正常年份份(5.1)13现在学习的是第13页,共101页 用用用用“1”“1”“1”“1”来代表质的因素的哪个特征是来代表质的因素的
9、哪个特征是来代表质的因素的哪个特征是来代表质的因素的哪个特征是可以任意设定的。我们一般认为,可以任意设定的。我们一般认为,可以任意设定的。我们一般认为,可以任意设定的。我们一般认为,“1”“1”“1”“1”代表代表代表代表具有某些特征,但没有具体规定。在上例中,具有某些特征,但没有具体规定。在上例中,具有某些特征,但没有具体规定。在上例中,具有某些特征,但没有具体规定。在上例中,也可以指定也可以指定也可以指定也可以指定D=1D=1时为非正常年份,而时为非正常年份,而时为非正常年份,而时为非正常年份,而D=0D=0就必然就必然就必然就必然为正常年份。在这种情况下,正常年份和非正常为正常年份。在这
10、种情况下,正常年份和非正常为正常年份。在这种情况下,正常年份和非正常为正常年份。在这种情况下,正常年份和非正常年份的消费函数分别为年份的消费函数分别为年份的消费函数分别为年份的消费函数分别为14现在学习的是第14页,共101页 如果我们绘制图形,得到的结果仍然是如果我们绘制图形,得到的结果仍然是一样的。此时,一样的。此时,1 1,非正常年份的线低,非正常年份的线低于正常年份的线,代表非正常年份的消费水于正常年份的线,代表非正常年份的消费水平低于正常年份的消费水平。平低于正常年份的消费水平。15现在学习的是第15页,共101页 虚拟变量虚拟变量D=0所代表的特性或状态所代表的特性或状态通常称为基
11、础类型。和其它特征或状通常称为基础类型。和其它特征或状态比较的意义上说,基础类型为对比态比较的意义上说,基础类型为对比的基础。的基础。16现在学习的是第16页,共101页 模型中的系数模型中的系数0 为基础类型的截为基础类型的截距项,称为公共截距项;系数距项,称为公共截距项;系数1 称称为差别截距系数,指的是为差别截距系数,指的是 D 取取 1 时截时截距系数和基础类型的截距系数的差异。距系数和基础类型的截距系数的差异。17现在学习的是第17页,共101页 如果一个回归模型有截距项,而且这如果一个回归模型有截距项,而且这个质的因素又有两种特征,也就是将其分两个质的因素又有两种特征,也就是将其分
12、两类,则我们只需要引入一个虚拟变量。如我类,则我们只需要引入一个虚拟变量。如我们的们的例例5.1所示。如果一个回归方程有截距所示。如果一个回归方程有截距项,项,只有一个质的因素影响被解释变量,只有一个质的因素影响被解释变量,它有个它有个m特征,我们就要引入特征,我们就要引入m-1个虚拟个虚拟变量;变量;18现在学习的是第18页,共101页 如果回归方程没有截距项,那么这个质如果回归方程没有截距项,那么这个质的因素有多少个特征就要设多少个虚拟的因素有多少个特征就要设多少个虚拟变量,这就是虚拟变量的使用原则。变量,这就是虚拟变量的使用原则。19现在学习的是第19页,共101页 虚拟变量陷阱:如果虚
13、拟变量设定不虚拟变量陷阱:如果虚拟变量设定不当,会使最小二乘法无解,称这种情当,会使最小二乘法无解,称这种情况为虚拟变量陷阱。况为虚拟变量陷阱。20现在学习的是第20页,共101页 引入两个虚拟变量对有截距项和没有截距引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。项的情况分别讨论。(1)对有截距项的情况,我们如果设两个对有截距项的情况,我们如果设两个虚拟变量,则回归模型为虚拟变量,则回归模型为(5.2)21现在学习的是第21页,共101页式式(5.2)也可表示为也可表示为其中,其中,显然如下等式成立。,显然如下等式成立。(5.3)(5.4)22现在学习的是第22页,共101页 式式(5
14、.4)表明模型表明模型(5.3)即原模型即原模型(5.2)中中有完全的多重共线性,将导致最小二乘估计有完全的多重共线性,将导致最小二乘估计无解。我们称该情景为掉入虚拟变量陷阱。无解。我们称该情景为掉入虚拟变量陷阱。所以,在有截距项的情况下,如果一个质的所以,在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是因素有多少个特征就引入多少个虚拟变量是行不通的。行不通的。23现在学习的是第23页,共101页 (2)对没有截距的情况,我们如果设两个虚拟变对没有截距的情况,我们如果设两个虚拟变量,量,显然显然模型模型(5.5)中,解释变量中,解释变量D1,D2和和X之间无之间无完全的多
15、重共线性。可以使用普通最小二乘法完全的多重共线性。可以使用普通最小二乘法估计估计式(式(5.5)的参数。的参数。(5.5)24现在学习的是第24页,共101页一一、截距变动模型和斜率变动模型、截距变动模型和斜率变动模型 (一)包含一个虚拟变量的截距变动模型(一)包含一个虚拟变量的截距变动模型 假设只有一个定性因素影响被解释变量的变假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候只需化,而且这个因素仅有两种特征,这时候只需要引入一个虚拟变量。要引入一个虚拟变量。25现在学习的是第25页,共101页 例例5.1描述了一个包括正常年份和非正常描述了一个包括正常年份和非正常年
16、份(亚洲金融危机或年份(亚洲金融危机或SARS的影响)居的影响)居民消费的样本,并建立了虚拟变量计量模民消费的样本,并建立了虚拟变量计量模型。型。26现在学习的是第26页,共101页 对对 1 1 作作t t 检验,若检验,若 1 显著地不为显著地不为0,我们,我们就认为正常年份和非正常年份居民在消费行为上就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若的差异是明显的。若 1 0,则正常年份的居民,则正常年份的居民消费水平高于非正常年份的居民消费水平。消费水平高于非正常年份的居民消费水平。利用最小二乘法对利用最小二乘法对式(式(5.1)进行估计,可得到进行估计,可得到(5.6)27
17、现在学习的是第27页,共101页 (二)斜率变动模型(二)斜率变动模型 在实际问题中,斜率单独变动出现的情在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速形一般比较少,它指的是改变了变动的速率也就是弹性。率也就是弹性。例如城镇居民家庭与农村例如城镇居民家庭与农村居民家庭的消费函数,居民家庭的消费函数,在边际消费倾向在边际消费倾向(斜率)上可能会有所不同,假设它们的(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。消费函数在截距项没有区别。28现在学习的是第28页,共101页那么回归模型可记为那么回归模型可记为(5.7)其中,其中,Yi=第个家庭的消费水平,第个
18、家庭的消费水平,Xi=第第个家庭的收入水平,个家庭的收入水平,29现在学习的是第29页,共101页式(式(5.7)可以表示为)可以表示为(5.8)(5.9)30现在学习的是第30页,共101页 (三)包含多个虚拟变量的截距变动模型(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,只需如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因素往往引入一个虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国家可以分不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家为发达国家、发展中国家、不发达国家。31现在学习的是第31页,共101
19、页 我国少数民族在很多问题上有差我国少数民族在很多问题上有差异,所以当把民族作为虚拟变量时,异,所以当把民族作为虚拟变量时,不能简单将其分为汉族和非汉族;季不能简单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我具有四个特征,按照前面的原则,我们要引入三个虚拟变量。们要引入三个虚拟变量。32现在学习的是第32页,共101页 例如,我们用季度资料研究各种商品消例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立费额在季节上有没有什么区别?可以建立模型如下:模型如下:(5.10)其中,其中,其中,其中,YYt
20、t=季度的消费,季度的消费,季度的消费,季度的消费,XXtt=季度的收入,对季度的收入,对季度的收入,对季度的收入,对于四个季度,我们引入了三个虚拟变量:于四个季度,我们引入了三个虚拟变量:于四个季度,我们引入了三个虚拟变量:于四个季度,我们引入了三个虚拟变量:33现在学习的是第33页,共101页这里,第四季度为基础类型,其截距项为这里,第四季度为基础类型,其截距项为0 。而其它三个季度的截距项分别为而其它三个季度的截距项分别为 0+1,0+2 ,0+3 。1,2,3 代表季节变动引代表季节变动引起的消费差异。起的消费差异。34现在学习的是第34页,共101页四个季度的回归模型分别为四个季度的
21、回归模型分别为(5.11)(5.12)(5.13)(5.14)35现在学习的是第35页,共101页 (四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变模型的斜率。模型的斜率。模型的斜率。模型的斜率。36现在学习的是第36页,共101页 例如城镇居民和农村居民的消费例如城镇居民和农村居民的
22、消费函数不但在斜率上有差异,在截距上函数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同也是有可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程时考虑进来,我们可以得到回归方程 37现在学习的是第37页,共101页(5.15)式中,式中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个家第个家庭的收入水平庭的收入水平,38现在学习的是第38页,共101页 1和和 3 分别表示城镇居民家庭和农村居民家庭分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。的消费函数在截距和斜率上的差异。式(式(5.15)可以表示为)可以表示为(5.16)(5.17)39现
23、在学习的是第39页,共101页 我们一般通过我们一般通过t t 检验来判定它们之间是否有差异。检验来判定它们之间是否有差异。1.1.若若10 0,300,则为截距和斜率同时变动,则为截距和斜率同时变动模型;模型;2.2.若若 10,0,3=0=0,则为截距变动模型;,则为截距变动模型;3.3.若若 1=0=0,3=0,=0,则表示城镇居民家庭和农村居则表示城镇居民家庭和农村居 民家庭有着完全相同的消费模式;民家庭有着完全相同的消费模式;4.4.若若 1=0=0,30,0,则为斜率变动模型,这种情况则为斜率变动模型,这种情况在现实中出现得不是很多。在现实中出现得不是很多。40现在学习的是第40页
24、,共101页 下面,以我国城镇居民家庭储蓄模型为下面,以我国城镇居民家庭储蓄模型为例,实际体会虚拟变量模型从建模到检验例,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。再到估计参数最后下结论的全过程。【例例5.2】已有数据资料为我国城镇居民家已有数据资料为我国城镇居民家庭庭1955年至年至1985年人均收入和人均储蓄。年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。关系而且收入的变化会引起储蓄的变化。41现在学习的是第41页
25、,共101页 假定它们之间为线性关系,我们可以建立储蓄假定它们之间为线性关系,我们可以建立储蓄模型如下模型如下 式中,式中,St=人均储蓄,人均储蓄,Xt=人均收入,人均收入,t=年份年份(t=1955=1955,19561956,19851985)。)。(5.18)42现在学习的是第42页,共101页 把把19551955年作为基期并把该期的价格水平定年作为基期并把该期的价格水平定为为100,再分别扣除包含在和中的物价上涨,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计因素。用最小二乘法估计式(式(5.18),),得到得到 R2=0.833=0.833,DW=0.398=0.398 (
26、5.19)43现在学习的是第43页,共101页 模型(模型(5.19)包含了这样一个假定,那包含了这样一个假定,那就是在就是在1955到到1985年期间我国城镇居民家年期间我国城镇居民家庭的储蓄行为大体保持不变。庭的储蓄行为大体保持不变。44现在学习的是第44页,共101页 这一假定实际上是行不通的,因为在这一假定实际上是行不通的,因为在十一届三中全会召开之后,居民的收入十一届三中全会召开之后,居民的收入大大增加,而且与居民储蓄有关的许多大大增加,而且与居民储蓄有关的许多重要因素在重要因素在1979年以后发生了明显变化。年以后发生了明显变化。在改革开放之前,在改革开放之前,我国居民的收入水平我
27、国居民的收入水平仅仅能够维持温饱水平,根本不可能有仅仅能够维持温饱水平,根本不可能有多少储蓄。多少储蓄。45现在学习的是第45页,共101页 1979年以后,我国居年以后,我国居民的收入水平大民的收入水平大幅度提高,同时,居民储蓄也在大幅幅度提高,同时,居民储蓄也在大幅度增长。从这些可以看出来,度增长。从这些可以看出来,1979年年前后两个时期,我国居民的边际储蓄前后两个时期,我国居民的边际储蓄倾向有显著性差异。倾向有显著性差异。46现在学习的是第46页,共101页 在改革开放前的大多数年份在改革开放前的大多数年份,我国我国的消费市场常常是供不应求的消费市场常常是供不应求,许多商品许多商品要国
28、家下达计划指标要国家下达计划指标,居民凭票证购买居民凭票证购买,经常出现的问题是顾客即使有钱也难经常出现的问题是顾客即使有钱也难买到需要的商品买到需要的商品,就不得不把钱存起来。就不得不把钱存起来。这时候的储蓄就带有非自愿的性质。这时候的储蓄就带有非自愿的性质。47现在学习的是第47页,共101页而在而在19791979年以后年以后,物资逐渐丰富物资逐渐丰富,商品的买商品的买卖也取消了票证的限制卖也取消了票证的限制,消费者储蓄的主要消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不目的之一是购买高档耐用消费品,储蓄不再具有再具有“被迫被迫”的性质。的性质。48现在学习的是第48页,共101页
29、 为了验证城镇居民的储蓄行为是否为了验证城镇居民的储蓄行为是否有显著变化有显著变化,可以建立下面的截距和斜可以建立下面的截距和斜率同时变动模型。率同时变动模型。(5.205.20)式中式中,St和和Xt仍代表人均储蓄和人均收入仍代表人均储蓄和人均收入,DD为虚拟变量,为虚拟变量,49现在学习的是第49页,共101页用最小二乘法估计用最小二乘法估计式式(5.20),可以得到可以得到(5.21)50现在学习的是第50页,共101页 其中其中,参数估计值下面括号中的数字参数估计值下面括号中的数字为统计值。显然为统计值。显然,在在1979年前后储蓄年前后储蓄模型的截距和斜率有明显差异。式模型的截距和斜
30、率有明显差异。式(5.21)可以写为两个方程可以写为两个方程(5.225.22)(5.23)51现在学习的是第51页,共101页 由以上模型可知,我国城镇居民的边由以上模型可知,我国城镇居民的边际储蓄倾向在际储蓄倾向在1979年以前仅为年以前仅为0.004,也也就是收入增加就是收入增加1元元,储蓄平均增加储蓄平均增加4厘厘;而从而从1979年到年到1985年这段时间年这段时间,城镇居城镇居民的边际储蓄倾向增至民的边际储蓄倾向增至0.256。52现在学习的是第52页,共101页 然而然而,在在式式(5.19)中得到的边际储蓄中得到的边际储蓄倾向却是倾向却是0.17。很明显。很明显,式式(5.19
31、)既既不代表改革开放之前城镇居民的消费不代表改革开放之前城镇居民的消费行为行为,也不能正确描述也不能正确描述1979年以后城年以后城镇居民储蓄与收入之间的关系。镇居民储蓄与收入之间的关系。53现在学习的是第53页,共101页我我们们单单从从模模型型的的拟拟合合也也可可以以看看出出引引进进虚虚拟拟变变量量可可以以改改善善估估计计效效果果。式式(5.19)中中的的随随机机误误差差项项存存在在正正自自相相关关(DW=0.398),拟拟合合优优度度效效果果也也不不太太好好(R2=0.833)。引引入入虚虚拟拟变变量量后后的的模模型型消消除除了了自自相相关关(DW=1.67),判判定定系系数数也也上上升
32、升到到0.967。所所以以,虚虚拟拟变变量量的的引引入入很很有必要。有必要。54现在学习的是第54页,共101页 二、多个质的因素的虚拟变量模型二、多个质的因素的虚拟变量模型 我们讨论的回归模型只包括一个质的因素,我们讨论的回归模型只包括一个质的因素,但是在很多情形下但是在很多情形下,往往有两个以上的质的因往往有两个以上的质的因素影响回归模型的被解释变量。例如素影响回归模型的被解释变量。例如,在考察在考察居民的食品消费行为时居民的食品消费行为时,可以考虑的质的因素可以考虑的质的因素有居民的性别、民族、受教育程度、地理区域有居民的性别、民族、受教育程度、地理区域等等。等等。55现在学习的是第55
33、页,共101页 再如再如,除收入水平外除收入水平外,冰琪凌消费量还冰琪凌消费量还会受到季节和地区等质的因素影响。这会受到季节和地区等质的因素影响。这些质的因素可能不仅仅改变模型的截距些质的因素可能不仅仅改变模型的截距和斜率和斜率,质的因素之间也往往有相互影质的因素之间也往往有相互影响。例如响。例如,高收入水平和低收入水平的高收入水平和低收入水平的居民在家电消费量上的差异会随着季节居民在家电消费量上的差异会随着季节不同而改变的。不同而改变的。为了方便为了方便,我们建立以下简单的食品消我们建立以下简单的食品消费模型费模型。56现在学习的是第56页,共101页(5.245.24)57现在学习的是第5
34、7页,共101页 式式(5.24)中中,Ct和和At分别表示居民的食分别表示居民的食品消费和居民的收入品消费和居民的收入,D1,D2,D3,D4,D5是虚拟变量,分别表示性别因是虚拟变量,分别表示性别因素、年龄因素和学历因素。素、年龄因素和学历因素。性别因素只性别因素只有两个特征男和女,设一个虚拟变量有两个特征男和女,设一个虚拟变量D1。58现在学习的是第58页,共101页 年龄分为三个层次,年龄分为三个层次,25岁以下、岁以下、25到到50岁和岁和50岁以上,设二个虚拟变量岁以上,设二个虚拟变量D2和和D3。受教育程度分为三个层次。受教育程度分为三个层次,初中初中以下、高中和高中以上以下、高
35、中和高中以上,设二个虚拟变设二个虚拟变量量D4 和和D5。模型中还有虚拟变量之间。模型中还有虚拟变量之间的乘积,考虑了截距项的各种变化可的乘积,考虑了截距项的各种变化可能。能。59现在学习的是第59页,共101页DDii取值不同,截距不同,如:取值不同,截距不同,如:取值不同,截距不同,如:取值不同,截距不同,如:其余的依次类推。其余的依次类推。6 和和 7 为性别和年龄层次为性别和年龄层次的相互影响系数。采用通常的统计检验方法对的相互影响系数。采用通常的统计检验方法对各种可能的情况进行检验。各种可能的情况进行检验。60现在学习的是第60页,共101页 例如,如果例如,如果 1 在统计上显著在
36、统计上显著说明性别这说明性别这个质的因素会明显影响食品的消费量。个质的因素会明显影响食品的消费量。同时,同时,2 在统计上显著,就表明在统计上显著,就表明25岁以岁以下居民在食品消费上和别的层次的居民是下居民在食品消费上和别的层次的居民是有显著差异的,那么年龄也会是个很重要有显著差异的,那么年龄也会是个很重要的影响因素。的影响因素。61现在学习的是第61页,共101页上上上上述述述述假假假假定定定定虚虚虚虚拟拟拟拟变变变变量量量量仅仅仅仅仅仅仅仅影影影影响响响响回回回回归归归归模模模模型型型型的的的的截截截截距距距距,由由由由此此此此可可可可以以以以推推推推广广广广到到到到更更更更一一一一般般
37、般般的的的的情情情情形形形形,也也也也就就就就是是是是虚虚虚虚拟拟拟拟变变变变量量量量同同同同时时时时改改改改变变变变回回回回归归归归模模模模型型型型的的的的截截截截距距距距和和和和斜斜斜斜率率率率,那那那那样样样样考考考考虑虑虑虑得得得得更更更更周周周周全全全全,但但但但是是是是也也也也会会会会更更更更复复复复杂杂杂杂,在这里我们不作讨论。在这里我们不作讨论。在这里我们不作讨论。在这里我们不作讨论。62现在学习的是第62页,共101页第三节第三节第三节第三节 变参数模型和分段回归变参数模型和分段回归变参数模型和分段回归变参数模型和分段回归一、变参数模型一、变参数模型 从上一节的讨论可知,由于
38、引入了虚拟变从上一节的讨论可知,由于引入了虚拟变量,回归模型的截距或斜率不再是固定不变量,回归模型的截距或斜率不再是固定不变的。但是模型中参数的变化是离散的,而不的。但是模型中参数的变化是离散的,而不是连续的。是连续的。63现在学习的是第63页,共101页 例如,在例如,在式(式(5.20)中,只是假定在中,只是假定在1979年以前和年以前和1979年以后两个时期城镇年以后两个时期城镇居民有不同的消费行为,也就是说,回居民有不同的消费行为,也就是说,回归模型的截距和斜率并不是每年都发生归模型的截距和斜率并不是每年都发生变化。变参数模型是虚拟变量模型的推变化。变参数模型是虚拟变量模型的推广,它认
39、为回归模型的截距或斜率会随广,它认为回归模型的截距或斜率会随着样本观察值的改变而系统地改变。着样本观察值的改变而系统地改变。64现在学习的是第64页,共101页 (一)截距变动模型(一)截距变动模型 系统变参数模型也可以分为截距变动模型系统变参数模型也可以分为截距变动模型和截距、斜率同时变动模型。设线性回归模型和截距、斜率同时变动模型。设线性回归模型为为(5.25)65现在学习的是第65页,共101页 式中,式中,X=解释变量,解释变量,Y=被解释变量。被解释变量。如果的变化为非随机的,而且这种如果的变化为非随机的,而且这种变化完全由外生变量决定,那么式变化完全由外生变量决定,那么式(5.25
40、)就是一个非随机变参数模)就是一个非随机变参数模型。型。66现在学习的是第66页,共101页 我们观察到截距项和我们前面的虚拟变我们观察到截距项和我们前面的虚拟变量模型的截距项有所不同,下面多了一量模型的截距项有所不同,下面多了一个下标个下标t。这就是说,虽然回归模型斜率。这就是说,虽然回归模型斜率在整个样本时期保持不变,但是截距项在整个样本时期保持不变,但是截距项是随着时间的变化而变化的。是随着时间的变化而变化的。67现在学习的是第67页,共101页1t定义如下定义如下(5.265.26)式中,式中,0 0和和1 为我们要求的参数,也可以称为我们要求的参数,也可以称为为“超参数超参数”,Z
41、Zt t 是用来解释是用来解释 1 1t t 变动情况变动情况的外生变量将的外生变量将式(式(5.26)代入代入式(式(5.25)中,中,整理得到整理得到68现在学习的是第68页,共101页(5.27)可用最小二乘法对可用最小二乘法对式(式(5.27)中的超参数和其)中的超参数和其它参数一并进行估计。如果它参数一并进行估计。如果Zt 为虚拟变量,那为虚拟变量,那么么式(式(5.27)就是一个虚拟变量模型,而且是就是一个虚拟变量模型,而且是一个截距项变动斜率不变的模型。因此,虚拟一个截距项变动斜率不变的模型。因此,虚拟变量模型是变参数模型的一种特殊形式。变量模型是变参数模型的一种特殊形式。69现
42、在学习的是第69页,共101页 (二)截距和斜率同时变动模型(二)截距和斜率同时变动模型 和虚拟变量模型的思路一样,再来和虚拟变量模型的思路一样,再来讨论斜率和截距同时存在系统变动的情讨论斜率和截距同时存在系统变动的情况。我们只需要在况。我们只需要在式(式(5.27)的基础上的基础上进行改进。将换为,且假定有如下关系进行改进。将换为,且假定有如下关系式:式:(5.285.28)70现在学习的是第70页,共101页将式(将式(5.28)代入式()代入式(5.27),则有),则有(5.29)71现在学习的是第71页,共101页 以上模型只假定以上模型只假定 1t 和和 2t 存在系统变化,存在系统
43、变化,实际上还有很多参数都可能存在这种变化,实际上还有很多参数都可能存在这种变化,甚至可能存在甚至可能存在1t 和和 2t 等系数有可能不是线等系数有可能不是线性变化的,也就是说超参数本身可能不为常性变化的,也就是说超参数本身可能不为常数。这种情况只是在理论上提出来,实际操数。这种情况只是在理论上提出来,实际操作会因为太复杂而没有太多的应用。作会因为太复杂而没有太多的应用。72现在学习的是第72页,共101页用最小二乘估计得到用最小二乘估计得到用最小二乘估计得到用最小二乘估计得到式(式(式(式(5.295.29)中的参数估计中的参数估计中的参数估计中的参数估计值后,就可以对参数是否存在系统变化
44、进行统值后,就可以对参数是否存在系统变化进行统值后,就可以对参数是否存在系统变化进行统值后,就可以对参数是否存在系统变化进行统计检验。如果计检验。如果计检验。如果计检验。如果 1 11 1和和和和b bb b1 11 1在统计上不显著,就可在统计上不显著,就可在统计上不显著,就可在统计上不显著,就可以把以把以把以把 1 11 1和和和和 11看作常数;否则,我们认为看作常数;否则,我们认为看作常数;否则,我们认为看作常数;否则,我们认为 11 和和和和 22 存在系统变化。存在系统变化。存在系统变化。存在系统变化。73现在学习的是第73页,共101页 显然,如果错误地把显然,如果错误地把 1
45、和和2 当作常数,当作常数,就等同于错误地解释了经济变量之间的就等同于错误地解释了经济变量之间的关系。此外,由于相当于省略了重要的关系。此外,由于相当于省略了重要的解释变量解释变量 Zt 和和 Wt ,还可能会产生自相,还可能会产生自相关等问题。关等问题。74现在学习的是第74页,共101页 (三)应用案例(三)应用案例 【例【例5.3】众所周知,我国居民的消费行众所周知,我国居民的消费行为在经济体制改革开放前后存在巨大差异。为在经济体制改革开放前后存在巨大差异。但是,在这期间居民的消费行为是否也在不但是,在这期间居民的消费行为是否也在不断变化?我国的经济体制改革走的是一条渐断变化?我国的经济
46、体制改革走的是一条渐进的道路,与居民消费有关的诸多因素必然进的道路,与居民消费有关的诸多因素必然会随着改革开放的不断推进而逐步改变。会随着改革开放的不断推进而逐步改变。75现在学习的是第75页,共101页 这些变化对居民消费的影响主要有三个这些变化对居民消费的影响主要有三个方面:方面:第一、第一、观念的变化。与改革开放观念的变化。与改革开放初期相比,初期相比,我国居民的观念已经发生了我国居民的观念已经发生了深刻的变化。人们的市场意识、风险意深刻的变化。人们的市场意识、风险意识、对通货膨胀的心理承受能力等均大识、对通货膨胀的心理承受能力等均大大增强;对大增强;对“铁铁”饭碗的依赖思想已明饭碗的依
47、赖思想已明显减弱。显减弱。76现在学习的是第76页,共101页 第二,消费者的经济决策权逐渐扩大,第二,消费者的经济决策权逐渐扩大,消费品市场供给日益丰富;劳动力市消费品市场供给日益丰富;劳动力市场的建立使人们有越来越多的择业机场的建立使人们有越来越多的择业机会;居民金融资产的迅速积累,使消会;居民金融资产的迅速积累,使消费者可以在一定时间范围内提前或延费者可以在一定时间范围内提前或延期消费。期消费。77现在学习的是第77页,共101页 第三,不确定因素增多。随着市场因素第三,不确定因素增多。随着市场因素的增多,经济生活的不确定因素也在增的增多,经济生活的不确定因素也在增加。例如,职工的实际收
48、入已不再是完加。例如,职工的实际收入已不再是完全全“刚性刚性”,个人的实际收入可能会因,个人的实际收入可能会因为通货膨胀、企业经济效益下降而减少。为通货膨胀、企业经济效益下降而减少。不确定因素的增加,迫使消费者在安排不确定因素的增加,迫使消费者在安排消费时更多顾及长远利益,消费行为渐消费时更多顾及长远利益,消费行为渐趋向理性。趋向理性。78现在学习的是第78页,共101页 综上所述,我们似乎没有理由认为居民消费综上所述,我们似乎没有理由认为居民消费行为在行为在19791979年以后是固定不变的。但是这种变年以后是固定不变的。但是这种变动是否显著?变动趋势是怎么样的?这一切还动是否显著?变动趋势
49、是怎么样的?这一切还需要用系统变参数模型加以验证。需要用系统变参数模型加以验证。79现在学习的是第79页,共101页利用利用利用利用1979197919791979年至年至年至年至1997199719971997年我国城镇居民家庭收年我国城镇居民家庭收年我国城镇居民家庭收年我国城镇居民家庭收支调查资料,可以建立一个简单的系统变支调查资料,可以建立一个简单的系统变支调查资料,可以建立一个简单的系统变支调查资料,可以建立一个简单的系统变参数模型:参数模型:参数模型:参数模型:(5.305.30)式中,式中,X Xt t和和Y Yt t分别代表城镇居民家庭某年人均分别代表城镇居民家庭某年人均实际收入
50、和人均实际支出(以实际收入和人均实际支出(以19801980年的价格年的价格水平为水平为100100,从收入和支出中分别扣除价格上,从收入和支出中分别扣除价格上涨因素的影响)。涨因素的影响)。t=年份,年份,ut=随机误差项。随机误差项。80现在学习的是第80页,共101页 注意到模型的截距注意到模型的截距1t 和边际消费和边际消费倾向倾向 2t 是随着时间的推移而不断变是随着时间的推移而不断变化的,也就是说,消费与收入的关系化的,也就是说,消费与收入的关系是逐年变化的。引起是逐年变化的。引起 1t 和和 2t 变化的变化的因素中有许多是不可观测或难以度量因素中有许多是不可观测或难以度量的,所