《虚拟变量模型》PPT课件.ppt

上传人:wuy****n92 文档编号:54016160 上传时间:2022-10-27 格式:PPT 页数:30 大小:309.50KB
返回 下载 相关 举报
《虚拟变量模型》PPT课件.ppt_第1页
第1页 / 共30页
《虚拟变量模型》PPT课件.ppt_第2页
第2页 / 共30页
点击查看更多>>
资源描述

《《虚拟变量模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《虚拟变量模型》PPT课件.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第五章第五章 经典单方程计量经济学模型专门问题经典单方程计量经济学模型专门问题5.1 5.1 虚拟变量模型虚拟变量模型5.2 5.2 滞后变量模型滞后变量模型5.1 5.1 虚拟变量模型虚拟变量模型一、虚拟变量的含义一、虚拟变量的含义二、虚拟变量的设置二、虚拟变量的设置三、虚拟变量的引入三、虚拟变量的引入一、虚拟变量的含义一、虚拟变量的含义一种人为构造的、取值仅为一种人为构造的、取值仅为“1”1”或或“0”0”的变量的变量1.1.定量变量和定性变量定量变量和定性变量定量变量定量变量:测度等级为间距(:测度等级为间距(intervalinterval)或比率()或比率(ratioratio)尺度

2、的变量,)尺度的变量,如需求量、价格、收入、产量等如需求量、价格、收入、产量等其取值为具有实际含义的数据其取值为具有实际含义的数据可以在建模过程中直接使用这些变量及其数据可以在建模过程中直接使用这些变量及其数据定性变量定性变量:测度等级名义(:测度等级名义(nominalnominal)或顺序()或顺序(ordinalordinal)尺度的变量,)尺度的变量,如性别、教育程度等如性别、教育程度等其取值为类别或顺序,可用数值表示,但数值不具有实际含义,仅是表示其取值为类别或顺序,可用数值表示,但数值不具有实际含义,仅是表示类别或序次的代码类别或序次的代码性别(性别(1 1男;男;0 0女)、教育

3、程度(女)、教育程度(1 1小学、小学、2 2初中、初中、3 3高中、高中、4 4大学)大学)实际建模中,考虑定性变量的影响是必要的,但实际建模中,考虑定性变量的影响是必要的,但直接使用定性变量的取值直接使用定性变量的取值则具有不合理性则具有不合理性2.2.直接使用定性变量的不合理性直接使用定性变量的不合理性【例】:【例】:考虑教育程度(考虑教育程度(E E)、工龄()、工龄(X X)和收入()和收入(Y Y)的关系。)的关系。模型中系数模型中系数 2 2 的经济意义是什么?的经济意义是什么?注意到注意到 2 2 是一个是一个常数,常数,这意味着什么?这意味着什么?教育程度的变化对收入的影响是

4、固定不变的,教育程度的变化对收入的影响是固定不变的,即:教育程度每提升一个即:教育程度每提升一个 等级,所带来的收入的变动均为等级,所带来的收入的变动均为 2 2显然,对于大多数实际情况而言,这种假定存在明显的不合理性显然,对于大多数实际情况而言,这种假定存在明显的不合理性问题:建模过程中如何使用定性变量?问题:建模过程中如何使用定性变量?其中:其中:E E:1 1本科;本科;2 2硕士;硕士;3 3博士博士【例】:【例】:对于上例,设置如下两个变量:对于上例,设置如下两个变量:3.3.正确应用定性变量的方式正确应用定性变量的方式 硕士硕士 其它其它 博士博士 其它其它这意味着:对于某个硕士生

5、:这意味着:对于某个硕士生:E1=1 E2=0E1=1 E2=0 对于某个博士生:对于某个博士生:E1=0 E2=1E1=0 E2=1 对于某个本科生:对于某个本科生:E1=0 E2=0E1=0 E2=0建立如下模型:建立如下模型:于是:对于本科生,其收入为:于是:对于本科生,其收入为:对于硕士生,其收入为:对于硕士生,其收入为:对于博士生,其收入为:对于博士生,其收入为:教育程度的变动带来的影响分别是教育程度的变动带来的影响分别是22(本硕)和(本硕)和(3322)(硕)(硕博),模型合理性得到改进!博),模型合理性得到改进!虚拟变量(虚拟变量(dummy variabledummy var

6、iable):一种人为构造的、取值:一种人为构造的、取值仅为仅为“1”1”或或“0”0”的变量,又称示性变量(的变量,又称示性变量(indicator variableindicator variable)。)。“1”1”表示属于某个类别或具备某种属性表示属于某个类别或具备某种属性“0”0”表示不属于该类别或不具备该属性表示不属于该类别或不具备该属性 实质上,虚拟变量是定性变量的一种实质上,虚拟变量是定性变量的一种“量化量化”工具,用以反映观测在定工具,用以反映观测在定性变量上所属的类别或所具有的属性。性变量上所属的类别或所具有的属性。虚拟变量可以类似于定量变量一样直接引入模型,而不丧失模型的

7、合理虚拟变量可以类似于定量变量一样直接引入模型,而不丧失模型的合理性,因此:性,因此:正确应用定性变量的一种方式是通过设置正确应用定性变量的一种方式是通过设置“虚拟变量虚拟变量”引入定引入定性变量。性变量。由此,包含虚拟变量的模型称之为由此,包含虚拟变量的模型称之为虚拟变量模型虚拟变量模型4.4.虚拟变量的含义虚拟变量的含义 问题:如何正确地设置虚拟变量?问题:如何正确地设置虚拟变量?二、虚拟变量的设置二、虚拟变量的设置 虚拟变量的个数为定性变量类别数虚拟变量的个数为定性变量类别数1 1 注意参照类的设置注意参照类的设置 注意虚拟变量陷阱注意虚拟变量陷阱【思考】:上例中,为什么不用【思考】:上

8、例中,为什么不用三个三个虚拟变量表示三种教育程度?虚拟变量表示三种教育程度?对例题的思考对例题的思考 硕士硕士 其它其它 博士博士 其它其它 本科本科 其它其它这意味着:这意味着:对于某个硕士生:对于某个硕士生:E1=1 E2=0 E3=0E1=1 E2=0 E3=0对于某个博士生:对于某个博士生:E1=0 E2=1 E3=0E1=0 E2=1 E3=0对于某个本科生:对于某个本科生:E1=0 E2=0 E3=1E1=0 E2=0 E3=1相应的模型:相应的模型:【分析】:【分析】:假定我们有假定我们有6个观测值,其中个观测值,其中2个硕士、个硕士、1个博士、个博士、3个本科生个本科生考虑模型

9、的考虑模型的设计矩阵设计矩阵X:显然,矩阵显然,矩阵X是不满秩的,产生了是不满秩的,产生了“完全的多重共线性完全的多重共线性”!此即所谓的此即所谓的“虚拟变量陷阱虚拟变量陷阱”!对每个定性变量而言,所引入的虚拟变量的个数应该比该变量的类别数对每个定性变量而言,所引入的虚拟变量的个数应该比该变量的类别数少少1 1,即:如果某个定性变量具有,即:如果某个定性变量具有mm个类别,则只需在模型中引入个类别,则只需在模型中引入(m-m-1 1)个虚拟变量。个虚拟变量。1.1.虚拟变量的设置原则虚拟变量的设置原则定性变量定性变量:性别性别男男女女虚拟变量虚拟变量:男男女女例例1 1:定性变量定性变量:教育

10、程度:教育程度E E:1 1本科;本科;2 2硕士;硕士;3 3博士博士 硕士硕士 其它其它 博士博士 其它其它E1=1 E2=0 E1=1 E2=0:硕士:硕士E2=0 E2=1 E2=0 E2=1:博士:博士E1=0 E2=0 E1=0 E2=0:本科:本科虚拟变量虚拟变量:例例2 2:(1 1)这一规则适用于模型中包含一个或多个定性变量的情形。即如果模)这一规则适用于模型中包含一个或多个定性变量的情形。即如果模型存在型存在多个定性变量多个定性变量,则需要设置,则需要设置多组虚拟变量多组虚拟变量,每组虚拟变量的,每组虚拟变量的个数取决于对应的定性变量所具有的类别数。个数取决于对应的定性变量

11、所具有的类别数。(2 2)定性变量的分类中,不指定其虚拟变量的类别(组)称为)定性变量的分类中,不指定其虚拟变量的类别(组)称为基准组基准组(basebase)或参照组()或参照组(referencereference)。)。如上例:本科教育程度组即为基准组或参照组如上例:本科教育程度组即为基准组或参照组 在基准组上,所有对应的虚拟变量的取值均为在基准组上,所有对应的虚拟变量的取值均为0 0 实际问题中,基准组或参照组的选择完全取决于研究者。实际问题中,基准组或参照组的选择完全取决于研究者。一旦选定基准组,分析中,所有其它组都将与基准组进行比较。一旦选定基准组,分析中,所有其它组都将与基准组进

12、行比较。2.2.虚拟变量的设置说明虚拟变量的设置说明(3 3)这一设置原则仅指对于)这一设置原则仅指对于包含截距项包含截距项的回归模型而言,此时如果违的回归模型而言,此时如果违背这一原则则将陷入所谓的背这一原则则将陷入所谓的“虚拟变量陷阱虚拟变量陷阱”。如果模型不包含截距项,那么即使引入与类别数相同数量的虚如果模型不包含截距项,那么即使引入与类别数相同数量的虚拟变量也不会造成多重共线性。拟变量也不会造成多重共线性。硕士硕士 其它其它 博士博士 其它其它 本科本科 其它其它大多数研究者认为大多数研究者认为 ,在一个含有截距的方程中,他们能更容易地处,在一个含有截距的方程中,他们能更容易地处理他们

13、通常感兴趣的问题,是否有某个组与基准组有所不同以及有理他们通常感兴趣的问题,是否有某个组与基准组有所不同以及有多大不同,所以在方程中包括截距更方便。多大不同,所以在方程中包括截距更方便。肯尼迪(肯尼迪(KennedyKennedy)三、虚拟变量的引入三、虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式:虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。加法方式和乘法方式。注意不同方式下应用的目的注意不同方式下应用的目的(一)加法方式(一)加法方式【例【例1 1】考虑性别(男、女)、工龄(考虑性别(男、女)、工龄(X X)和薪金)和薪金(Y)(Y)的关系。的关系。模型中将虚

14、拟变量以相加的方式引入模型模型中将虚拟变量以相加的方式引入模型 可以直接考察定性变量不同类别的变化对模型因变量的影响可以直接考察定性变量不同类别的变化对模型因变量的影响 本质上,可以考察本质上,可以考察不同回归模型的截距项是否存在差异不同回归模型的截距项是否存在差异设置虚拟变量:设置虚拟变量:建立如下模型:建立如下模型:注意:参照组是什么?注意:参照组是什么?假定假定E(E(i)i)=0=0,则:,则:对于对于女职工(女职工(D=0D=0),其平均薪金),其平均薪金为:为:对于对于男职工(男职工(D=1D=1),其平均薪金),其平均薪金为:为:可以看出,可以看出,虚拟变量对应的回归系数虚拟变量

15、对应的回归系数 2 2表示:虚拟变量取值为表示:虚拟变量取值为1 1所代表所代表的类别(男)相对于参照类别(取值为的类别(男)相对于参照类别(取值为0 0,女)在因变量上的平均差异,女)在因变量上的平均差异,反映出定性变量取值的变化对因变量的影响反映出定性变量取值的变化对因变量的影响 从回归模型上看,两个组上的回归模型的差异主要在于截距的不同从回归模型上看,两个组上的回归模型的差异主要在于截距的不同 其其差异差异为:为:回归模型为:回归模型为:教育程度需要引入两个虚拟变量:教育程度需要引入两个虚拟变量:注意:参照组是哪一类?注意:参照组是哪一类?【例【例2 2】:在横截面数据基础上,考虑个人收

16、入和教育水平对个人保健:在横截面数据基础上,考虑个人收入和教育水平对个人保健支出的影响,其中教育水平考虑三个层次:高中以下、高中、支出的影响,其中教育水平考虑三个层次:高中以下、高中、大学及其以上大学及其以上 在在E(E(i i)=0=0 的初始假定下,不同教育层次的个人保健支出的函数:的初始假定下,不同教育层次的个人保健支出的函数:高中以下:高中以下:高中:高中:大学及其以上:大学及其以上:2 2表示表示:高中组与高中以下组在平均支出上的差异;:高中组与高中以下组在平均支出上的差异;3 3表示表示:大学组与高中以下组在平均支出上的差异;:大学组与高中以下组在平均支出上的差异;【例【例3 3】

17、:】:在上述职工薪金的例中,再引入代表学历的虚拟变量在上述职工薪金的例中,再引入代表学历的虚拟变量DD2 2 职工薪金的回归模型可设计为:职工薪金的回归模型可设计为:多个定性变量的例子多个定性变量的例子 模型中的虚拟变量模型中的虚拟变量本科及以上学历本科及以上学历本科以下学历本科以下学历注意:参照组是哪一类?注意:参照组是哪一类?女职工、本科以下学历(女职工、本科以下学历(D1=0,D2=0)的平均薪金:)的平均薪金:女职工、本科以上学历(女职工、本科以上学历(D1=0D1=0,D2=1D2=1)的平均薪金:)的平均薪金:不同性别、不同学历不同性别、不同学历职工的平均薪金分别为:职工的平均薪金

18、分别为:男职工、本科以下学历(男职工、本科以下学历(D1=1,D2=0)的平均薪金:)的平均薪金:男职工、本科以上学历(男职工、本科以上学历(D1=1D1=1,D2=1D2=1)的平均薪金:)的平均薪金:2表示:在教育水平相同的情况下,性别差异的影响表示:在教育水平相同的情况下,性别差异的影响 3表示:在性别属性相同的情况下,教育水平差异的影响表示:在性别属性相同的情况下,教育水平差异的影响 2、3、(、(23)表示了其他组与基准组的差异)表示了其他组与基准组的差异工龄工龄薪薪金金D1=0,D2=0D1=1,D2=0D1=0D1=0,D2=1D2=1D1=1D1=1,D2=1D2=1例:例:根

19、据消费理论,消费水平根据消费理论,消费水平C C主要取决于收入水平主要取决于收入水平Y Y,但在一个较长的,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。中引入虚拟变量来考察。(二)乘法方式(二)乘法方式 模型中将虚拟变量以与其它解释变量相乘构成一个新的变量的方模型中将虚拟变量以与其它解释变量相乘构成一个新的变量的方式引入模型式引入模型加法方式引入虚拟变量,可

20、以考察截距的不同,而在许多情况下往加法方式引入虚拟变量,可以考察截距的不同,而在许多情况下往往是斜率就有变化,或斜率、截距同时发生变化。往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可通过以乘法方式引入虚拟变量来测度。斜率的变化可通过以乘法方式引入虚拟变量来测度。这里,虚拟变量这里,虚拟变量DD以与以与X X相乘的方式引入了模型中,从而可用来考察相乘的方式引入了模型中,从而可用来考察消费倾向的变化。消费倾向的变化。假定假定E(E(i i)=0=0,上述模型所表示的函数可化为:上述模型所表示的函数可化为:正常年份:正常年份:反常年份:反常年份:设设消费模型可建立如下:消费模型可建立如下:

21、特别地,当截距与斜率发生变化时,则需要同时引入加法特别地,当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。与乘法形式的虚拟变量。【例【例5.1.15.1.1】考察考察19901990年前后的中国居民的总储蓄年前后的中国居民的总储蓄-收入关系是否已发收入关系是否已发 生变化。生变化。表表中中给给出出了了中中国国1979197920012001年年以以城城乡乡储储蓄蓄存存款款余余额额代代表表的的居居民民储储蓄以及以蓄以及以GNPGNP代表的居民收入的数据。代表的居民收入的数据。以以Y Y为储蓄,为储蓄,X X为收入,可令:为收入,可令:19901990年前:年前:Y Yi i=1

22、1+2 2X Xi i+1i1i i=1,2,n i=1,2,n1 1 19901990年后:年后:Y Yi i=1 1+2 2X Xi i+2i2i i=1,2,n i=1,2,n2 2 则有可能出现下述四种情况中的一种:则有可能出现下述四种情况中的一种:(1)(1)1 1=1 1 ,且且 2 2=2 2 ,即即两两个个回回归归相相同同,称称为为重重合合回回归归(Coincident Coincident RegressionsRegressions);(2)(2)1 11 1 ,但但 2 2=2 2 ,即即两两个个回回归归的的差差异异仅仅在在其其截截距距,称称为为平平行行回回归归(Para

23、llel RegressionsParallel Regressions);(3)(3)1 1=1 1 ,但但 2 22 2 ,即即两两个个回回归归的的差差异异仅仅在在其其斜斜率率,称称为为汇汇合合回回归归(Concurrent Regressions)(Concurrent Regressions);(4)(4)1 11 1,且且 2 22 2 ,即即 两两 个个 回回 归归 完完 全全 不不 同同,称称 为为 相相 异异 回回 归归(Dissimilar RegressionsDissimilar Regressions)。)。这一问题通过同时以加法和乘法方式引入虚拟变量来解决。这一问题通

24、过同时以加法和乘法方式引入虚拟变量来解决。将将n n1 1与与n n2 2次观察值合并,并用以估计以下回归:次观察值合并,并用以估计以下回归:DD为引入的虚拟变量:为引入的虚拟变量:于是有:于是有:可分别表示可分别表示19901990年年前期前期与与后期后期的储蓄函数。的储蓄函数。在统计检验中,如果在统计检验中,如果 4 4=0=0的假设被拒绝,则说明两个时期中储蓄函数的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。的斜率不同。具体的回归结果为:具体的回归结果为:(-6.11)(22.89)(4.33)(-2.55)由由 3 3与与 4 4的的t t检验可知:参数显著地不等于检验可知:参数显

25、著地不等于0 0,强烈显示出两个时期的,强烈显示出两个时期的回归是相异的,回归是相异的,19901990年前:年前:19901990年后:年后:储蓄函数分别为:储蓄函数分别为:(三)临界指标的虚拟变量的引入(三)临界指标的虚拟变量的引入在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。则进口消费品的回归模型可建立如下:则进口消费品的回归模型可建立如下:例例:进进口口消消费费品品数数量量Y Y主主要要取取决决于于国国民民收收入入X X的的多多少少,中中国国在在改改革革开放前后,开放前后,Y Y对对X X的回归关系明显不同。的回归关系明显不同。这这时时,可可以以t t*=1979=1979年年为为转转折折期期,以以19791979年年的的国国民民收收入入X Xt t*为为临界值,设如下虚拟变量:临界值,设如下虚拟变量:OLSOLS法得到该模型的回归方程为法得到该模型的回归方程为则两时期进口消费品函数分别为:则两时期进口消费品函数分别为:当当tt*=1979tt*=1979年,年,当当t t t*=1979t*=1979年,年,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 初中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁