《计量经济学之虚拟变量.ppt》由会员分享,可在线阅读,更多相关《计量经济学之虚拟变量.ppt(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十一章:虚拟变量第十一章:虚拟变量一、虚拟变量一、虚拟变量为什么要引入为什么要引入“虚拟变量虚拟变量”?许多经济变量是可以定量度量的或者说是可以直接观测的许多经济变量是可以定量度量的或者说是可以直接观测的如商品需求量、价格、收入、产量等如商品需求量、价格、收入、产量等但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测 如职业、性别对收入的影响,战争、自然灾害对如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节的影响,季节对某些产品对某些产品(如冷饮如冷饮)销售的影响等。销售的影响等。为了能够在模型中反映这些因素的
2、影响,并提高模型的精度,需要将为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们人为地它们人为地“量化量化”,这种,这种“量化量化”通常是通过引入通常是通过引入“虚拟变量虚拟变量”来完成的。来完成的。这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量,称为类变量,称为虚拟变量。虚拟变量。虚拟变量的特点是:虚拟变量的特点是:1虚拟变量是对经济变化有重要影响的不可测变量。虚拟变量是对经济变化有重要影响的不可测变量。2虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取虚拟变量是赋值变量
3、,一般根据这些因素的属性类型,构造只取“0”或或“1”的人工变量,通常称为虚拟变量,记为的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而把定性因素这样。这是为了便于计算而把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。数量化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。一般的,基础类型和肯定类型取值为一般的,基础类型和肯定类型取值为1;比较类型和否定类型;比较类型和否定类型取值为取值为0。例如:例如:1)表示性别的虚拟变量可取为)表示性别的虚拟变量可取为D1=1 男性男性 0 女性女性2)表示文化程度的虚拟变量可取为)表示文化程度的虚拟变量可取
4、为D2=1 本科及以上学历本科及以上学历 0 本科以下学历本科以下学历3)表示地区的虚拟变量可取为)表示地区的虚拟变量可取为D3=1 城市城市 0 农村农村 二、虚拟变量模型二、虚拟变量模型同时含有一般解释变量与虚拟变量的模型称为同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型虚拟变量模型。在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要是用作是用作解释变量解释变量。例如例如:一个以性别为虚拟变量来考察职工薪金的模型如下:一个以性别为虚拟变量来考察职工薪金的模型如下:为职为职工的薪金;工的薪金;为职为职工工工工龄龄;=
5、1代表男性代表男性=0 代表女性代表女性 三、虚拟变量的引入三、虚拟变量的引入虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。1.加法方式加法方式上述职工薪金模型(上述职工薪金模型(8-1)中性别虚拟变量的引入就采取了加法方式,)中性别虚拟变量的引入就采取了加法方式,在在该该模型中,如果仍假定模型中,如果仍假定=0,则,则女女职职工的平均薪金工的平均薪金为为:男职工的平均薪金为:男职工的平均薪金为:2.乘法方式乘法方式斜率的变化斜率的变化 根据消费理论,消费水平根据消费理论,消费水平C主要取决于收入水平主要取决于收入
6、水平X。但在一个较长的时期,人。但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。设设 Dt=1 正常年份正常年份 0 反常年份反常年份则消费模型可建立如下:则消费模型可建立如下:这里,虚拟变量这里,虚拟变量 Dt 以与以与 Xt 相乘的方式引入了模型中,从而可用来相乘的方式引入了模型中,从而可用来考察消费倾向的变化。考察消费倾向的变化。正常年份:正
7、常年份:反常年份:反常年份:不同年份消费倾向示意图不同年份消费倾向示意图 如果在模型中如果在模型中同时使用加法和乘法两种方式引入虚拟变量同时使用加法和乘法两种方式引入虚拟变量,则回归线的截距和斜率都会改变。,则回归线的截距和斜率都会改变。例如:例如:对于改革开放前后储蓄对于改革开放前后储蓄-收入模型,可设定为收入模型,可设定为其中,其中,Y为储蓄,为储蓄,X为收入,为收入,Dt为虚拟变量为虚拟变量 改革开放以前改革开放以前改革开放以后改革开放以后X XY 改革开放前后储蓄函数示意图改革开放前后储蓄函数示意图3 3临界指标的虚拟变量的引入临界指标的虚拟变量的引入在经济发生转折时,可通过建立临界指
8、标的虚拟变量模型来反映。在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。进口消费品数量进口消费品数量Y主要取决于国民收入主要取决于国民收入X的多少,中国在改革开放前后,的多少,中国在改革开放前后,Y对对X的回归关系明显不同。的回归关系明显不同。这时,可以这时,可以t*=1979为转折期,以为转折期,以1979年的国民收入年的国民收入Xt*为临界值,设如下虚拟变量:为临界值,设如下虚拟变量:1 0Dt=tt*tt*则进口消费品的回归模型可建立如下则进口消费品的回归模型可建立如下:转折期回归示意图转折期回归示意图4.4.虚拟变量交互效应分析虚拟变量交互效应分析 当分析解释变量对变量的影响
9、时,大多数情形只是分析了解释变量自身变动对被解当分析解释变量对变量的影响时,大多数情形只是分析了解释变量自身变动对被解释变量的影响作用,而没有深入分析解释变量间的相互作用对被解释变量影响。释变量的影响作用,而没有深入分析解释变量间的相互作用对被解释变量影响。前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:两个定性变量是分别独立地影响被解释变量的两个定性变量是分别独立地影响被解释变量的 但是在实际经济活动中,两个定性变量对被解释变量的影响可能存在一定的交互作用,但是在实际经济活动中,两个定性变
10、量对被解释变量的影响可能存在一定的交互作用,即一个解释变量的边际效应有时可能要依赖于另一个解释变量。即一个解释变量的边际效应有时可能要依赖于另一个解释变量。为描述这种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。为描述这种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。Yi=0+1D1i+2D2i+3(D1iD2i)+Xi+i 1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数;为是否发展油菜籽生产对农副产品生产总收益的截距差异系数;2为是否发展养蜂生产对农副产品生产总收益的截距差异系数;为是否发展养蜂生产对农副产品生产总收益的截距差异系数;3为同时发展油菜籽生产和养蜂生产
11、时对农副产品生产总收益的交互效应系数。为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数。0 3组成截距水平。组成截距水平。四、虚拟变量的设置原则四、虚拟变量的设置原则 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果定性变量有即如果定性变量有m个类别,则只在模型中引入个类别,则只在模型中引入m-1个虚拟变量。个虚拟变量。冷饮的销售额与季节因素的关系冷饮的销售额与季节因素的关系 如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则其中如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一
12、次观测值,则其中第二节第二节 虚拟被解释变量虚拟被解释变量 当虚拟变量作为被解释变量时,其作用是对某一经济现象或活动进行当虚拟变量作为被解释变量时,其作用是对某一经济现象或活动进行“是是”与与“否否”的判断或决策。的判断或决策。研究是否购买商品住房、是否参加人寿或财产保险、是否能按期偿还贷款、研究是否购买商品住房、是否参加人寿或财产保险、是否能按期偿还贷款、新产品在市场上是否畅销、对某一改革措施所持的态度等。新产品在市场上是否畅销、对某一改革措施所持的态度等。某些人有汽车,而其他人没有。假定这种所有权函数的决定因素是收入和职业,某些人有汽车,而其他人没有。假定这种所有权函数的决定因素是收入和职
13、业,则可设定模型为:则可设定模型为:D1i=1 第第i个人是有车者个人是有车者 0 第第i个人是无车者个人是无车者 D2i=1 第第i个是白领职业个是白领职业 0 其它其它两大模型:线性概率模型和两大模型:线性概率模型和Logit模型模型一、线性概率模型一、线性概率模型(LPM)1 1什么是线性概率模型(前面所述的是否购买小汽车的模型就属于一个什么是线性概率模型(前面所述的是否购买小汽车的模型就属于一个LPMLPM)2 2线性概率模型的估计:线性概率模型的估计:由于由于直接采用直接采用OLS法对模型进行估计,将会遇到一法对模型进行估计,将会遇到一些特殊的问题,使得估计结果失去了合理的经济解释,
14、因而需要寻求相应的处理方法。些特殊的问题,使得估计结果失去了合理的经济解释,因而需要寻求相应的处理方法。(1)随机扰动项随机扰动项i的非正态性的非正态性 i=Yi-0 0-1 1 Xi=1-0-1 Xi 当当Yi=1时时-0-1 Xi 当当Yi=0时时显显然,关于然,关于i的正的正态态性假性假设设不再成立。不再成立。(2)随机扰动项随机扰动项i的异方差性的异方差性根据根据Yi的概率分布,有:的概率分布,有:Yi=1时,时,P(i=1-0-1Xi)=pi;Yi=0时,时,P(i=-0-1 Xi)=1-pi,Var(i )=Ei -E(i)2=E(i 2)=(1-0-1 Xi)2pi+(-0-1
15、Xi)2(1-pi)=(1-0-1 Xi)2(0+1 Xi)+(-0-1 Xi)2(1-0-1 Xi )=(0+1 Xi )(1-0-1 Xi )=pi(1-pi)可利用前面报告中有关修正异方差的方法,可用加权最小二乘法修正异方差。可利用前面报告中有关修正异方差的方法,可用加权最小二乘法修正异方差。(3)(3)不满足不满足00E E(Y Yi i|X Xi i)1)1的约束的约束 从理从理论论上,上,E(Yi|Xi)的取的取值值范范围围必必须为须为01,然而在,然而在实证实证分析中,分析中,E(Yi|Xi)的估的估计计量量并不一定在并不一定在0和和1之之间间,这这是用是用LPM的的OLS法估法
16、估计计存在的存在的实际问题实际问题。解决这一问题的二类方法是:解决这一问题的二类方法是:当当1时时,就,就认认定定=1;当;当0时时,就,就认认定定=0。1)2)选择对数单位模型或选择对数单位模型或Probit模型等能够保证满足模型等能够保证满足0E(Yi|Xi)1约束的非线性模型。约束的非线性模型。二、二、LogitLogit模型模型1Logit模型(对数单位模型)的基本概念模型(对数单位模型)的基本概念 当选择用逻辑斯蒂分布函数当选择用逻辑斯蒂分布函数(logistic distribution)去设定二元型响应计量经济模型时,有去设定二元型响应计量经济模型时,有P(Yi=1)=pi=其中
17、,其中,-1P+0考虑到在估计中便利,我们采用以下变换:考虑到在估计中便利,我们采用以下变换:式中,比率式中,比率pi/(1 pi)通常称为通常称为机会比率机会比率,即所研究的事件,即所研究的事件(或属性或属性)“发生发生”的概率与的概率与“没发生没发生”的概率之比。的概率之比。机会比率的对数机会比率的对数Li=lnpi/(1 pi)称为称为对数单位对数单位,这里的对数单位,这里的对数单位Li不仅是不仅是Xi的线性函的线性函数,而且也是数,而且也是的线性函数,所以,的线性函数,所以,上式也称为上式也称为Logit模型模型。2Logit模型的估计模型的估计 由于由于pi不仅对不仅对Xi是非线性关
18、系,而且对是非线性关系,而且对0和和1也是非线性关系,不能直接运用也是非线性关系,不能直接运用OLS法估计参数。必须设法把非线性关系转换为可以运用法估计参数。必须设法把非线性关系转换为可以运用OLS法估计的线性形式。法估计的线性形式。1-pi=上式表明,上式表明,Xi变动一个单位,机会比率的对数平均变化变动一个单位,机会比率的对数平均变化1个单位。个单位。对上式直接估计会遇到以下困难:对上式直接估计会遇到以下困难:(1)当事件发生时,)当事件发生时,pi=1,L i=ln(1/0);当事件没有发生时,;当事件没有发生时,pi=0,Li=ln(0/1),机会比率机会比率pi/(1 pi)的对数都
19、无意义,不能直接用的对数都无意义,不能直接用OLS法估计模型,而只能采法估计模型,而只能采 用极大似然法用极大似然法(ML)估计参数。当样本容量估计参数。当样本容量n较大,可选用加权最小二乘法进较大,可选用加权最小二乘法进 行估计。行估计。(2)估计参数需要的机会比率的对数)估计参数需要的机会比率的对数Li的数据无法观测。解决办法是对应于每的数据无法观测。解决办法是对应于每 个个 Xi,样本观测值个数,样本观测值个数n较大时,可利用整理汇总的数据,用相对频率作较大时,可利用整理汇总的数据,用相对频率作 为对为对pi的估计,并估计机会比率对数的估计,并估计机会比率对数Li。(3)模型的随机项)模型的随机项i为异方差,可以证明,为异方差,可以证明,n足够大时足够大时