虚拟变量回归优秀PPT.ppt

上传人:ylj18****70940 文档编号:57942916 上传时间:2022-11-06 格式:PPT 页数:54 大小:450KB
返回 下载 相关 举报
虚拟变量回归优秀PPT.ppt_第1页
第1页 / 共54页
虚拟变量回归优秀PPT.ppt_第2页
第2页 / 共54页
点击查看更多>>
资源描述

《虚拟变量回归优秀PPT.ppt》由会员分享,可在线阅读,更多相关《虚拟变量回归优秀PPT.ppt(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第七章 虚拟变量回来在对在校学生的消费行为进行的调查中在对在校学生的消费行为进行的调查中,发觉在校发觉在校生的消费行为呈现多元化的结构。人际交往消费、生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。学习用品类消费不突显。明显明显,男女生在消费上存在差异。为了了解男、女男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?生的消费支出结构差异,应当如何建立模型?面临的问题:如何

2、把男女生这样的非数量变量引面临的问题:如何把男女生这样的非数量变量引入方程?入方程?引子:男女高校生消费真有差异吗?问题的一般性描述问题的一般性描述在实际建模中,一些定性变量具有不行忽视的重要在实际建模中,一些定性变量具有不行忽视的重要影响。例如,探讨某个企业的销售水平,产业属性影响。例如,探讨某个企业的销售水平,产业属性(制造业、零售业)、全部制(私营、非私营)、(制造业、零售业)、全部制(私营、非私营)、地理位置(东、中、西部)、管理者的素养、不同地理位置(东、中、西部)、管理者的素养、不同的收入水同等是值得考虑的重要影响因素,但这些的收入水同等是值得考虑的重要影响因素,但这些因素共同的特

3、征是定性描述的。因素共同的特征是定性描述的。如何对非定量因素进行回来分析?如何对非定量因素进行回来分析?接受接受“虚拟变量虚拟变量”对定性变量进行量化一种思路。对定性变量进行量化一种思路。第七章第七章 虚拟变量回来虚拟变量回来 本章主要探讨本章主要探讨:虚拟变量虚拟变量 虚拟说明变量的回来虚拟说明变量的回来 第一节第一节 虚拟变量虚拟变量 本节基本内容本节基本内容:基本概念基本概念 虚拟变量设置规则虚拟变量设置规则 一、基本概念一、基本概念定量因素:可干脆测度、数值性的因素。定量因素:可干脆测度、数值性的因素。定性因素:属性因素,表征某种属性存在与否的定性因素:属性因素,表征某种属性存在与否的

4、 非数值性的因素。非数值性的因素。基本思想:基本思想:干脆在回来模型中加入定性因素存在诸多的困难干脆在回来模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用化,以达到定性因素能与定量因素有着相同作用之目的。之目的。计量经济学中,将取值为计量经济学中,将取值为0 0和和1 1的人工变量称为虚的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母等。通常用字母D D或或DUMDUM加以表示(英文中虚拟或加以表示(英文中虚拟或者哑元者

5、哑元DummyDummy的缩写)。的缩写)。对定性变量的量化可接受虚拟变量的方式实现。对定性变量的量化可接受虚拟变量的方式实现。虚拟变量的定义虚拟变量的定义虚拟变量的设置规则涉及三个方面虚拟变量的设置规则涉及三个方面:1.“0”1.“0”和和“1”“1”选取原则选取原则 2.2.属性(状态、水平)因素与设置虚拟变量属性(状态、水平)因素与设置虚拟变量数量的关系数量的关系 3.3.虚拟变量在回来分析中的角色以及作用等虚拟变量在回来分析中的角色以及作用等方面的问题方面的问题二、二、虚拟变量虚拟变量设置规则设置规则 “0”“0”和和“1”“1”选取原则选取原则l虚拟变量取虚拟变量取“1”“1”或或“

6、0”“0”的原则,应从分析问题的原则,应从分析问题的目的动身予以界定。的目的动身予以界定。l从理论上讲,虚拟变量取从理论上讲,虚拟变量取“0”“0”值通常代表比较值通常代表比较的基础类型;而虚拟变量取的基础类型;而虚拟变量取“1”“1”值通常代表被值通常代表被比较的类型。比较的类型。l“0”“0”代表基期(比较的基础,参照物);代表基期(比较的基础,参照物);l“1”“1”代表报告期(被比较的效应)。代表报告期(被比较的效应)。例如,比较收入时考察性别的作用。当研究男性收入是否例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有高于女性时,是将女

7、性作为比较的基础(参照物),故有男性为男性为“1”“1”,女性为,女性为“0”“0”。例例1 1问题问题:为何只选为何只选0 0、1 1,选,选2 2、3 3、4 4行吗?为什么?行吗?为什么?定性因素的属性既可能为两种状态,也可能为多种定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(状态。例如,性别(男、女两种)、季节(4 4种状态种状态),地理位置(东、中、西部),行业归属,所有),地理位置(东、中、西部),行业归属,所有制,收入的分组等。制,收入的分组等。属性的状态(水平)数与虚拟变量属性的状态(水平)数与虚拟变量数量的关系数量的关系1.1.若定性因素具

8、有若定性因素具有 个个 相互排斥属性相互排斥属性(或几个水平或几个水平),当回来模型有截距项时,只能,当回来模型有截距项时,只能引入引入 个虚拟变量;个虚拟变量;2.2.当回来模型无截距项时,则可引入当回来模型无截距项时,则可引入 个虚个虚拟变量;否则,就会陷入拟变量;否则,就会陷入“虚拟变量陷阱虚拟变量陷阱”。为什么?为什么?虚拟变量数量的设置规则虚拟变量数量的设置规则探讨居民住房消费支出探讨居民住房消费支出 和居民可支配收入和居民可支配收入 之间的之间的数量关系。回来模型的设定:数量关系。回来模型的设定:现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异

9、,如何办?为了对为了对“城镇居民城镇居民”、“农村居民农村居民”进行区分,分析进行区分,分析各自由住房消费支出各自由住房消费支出 上的差异,设上的差异,设 为城镇为城镇;为农村为农村,则模型为则模型为(模型有截距,模型有截距,“居民属性居民属性”定性变量只有两个相互排斥定性变量只有两个相互排斥的属性状态(的属性状态(),故只设定一个虚拟变量。),故只设定一个虚拟变量。)虚拟变量陷阱的一个例子虚拟变量陷阱的一个例子若对两个相互排斥的属性若对两个相互排斥的属性“居民属性居民属性”,仍然,仍然引入引入 个虚拟变量,则有个虚拟变量,则有则模型(则模型(1 1)为)为则对任一家庭都有:则对任一家庭都有:

10、,即产生完全共线,陷入了即产生完全共线,陷入了“虚拟变量陷阱虚拟变量陷阱”。“虚拟变量陷阱虚拟变量陷阱”的实质是:的实质是:完全多重共线性完全多重共线性。虚拟变量既可作为被说明变量,也可作为说明虚拟变量既可作为被说明变量,也可作为说明变量,分别称其为虚拟被说明变量和虚拟说明变量。变量,分别称其为虚拟被说明变量和虚拟说明变量。虚拟被说明变量的探讨是当前计量经济学探讨的虚拟被说明变量的探讨是当前计量经济学探讨的前沿领域,如前沿领域,如MacFaddenMacFadden、HeckmenHeckmen等人的微观计等人的微观计量经济学探讨,大量涉及到虚拟被说明变量的分析。量经济学探讨,大量涉及到虚拟被

11、说明变量的分析。本课程只是探讨虚拟说明变量的问题本课程只是探讨虚拟说明变量的问题 虚拟变量在回来模型中的角色虚拟变量在回来模型中的角色其次节其次节 虚拟说明变量的回来虚拟说明变量的回来 本节基本内容本节基本内容:加法类型加法类型 乘法类型乘法类型 虚拟说明变量综合应用虚拟说明变量综合应用在计量经济学中,通常引入虚拟变量的方式分为在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即加法方式和乘法方式两种:即实质实质:加法方式引入虚拟变量改变的是截距;加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。乘法方式引入虚拟变量改变的是斜率。以加法方式引入虚以加法方式引入

12、虚拟变拟变量量时时,主要考,主要考虑虑的的问问 题题是定性因素的属性和引入虚是定性因素的属性和引入虚拟变拟变量的个数。量的个数。分分为为四种情形探四种情形探讨讨:(1 1)说说明明变变量只有一个定性量只有一个定性变变量而无定量量而无定量变变量,量,而且定性而且定性变变量量为为两种相互排斥的属性;两种相互排斥的属性;(2 2)说说明明变变量分量分别为别为一个定性一个定性变变量(两种属性)量(两种属性)和一个定量和一个定量说说明明变变量;量;一、加法模型的类型一、加法模型的类型(3 3)说说明明变变量分量分别为别为一个定性一个定性变变量(两种以上属量(两种以上属性)和一个定量性)和一个定量说说明明

13、变变量;量;(4 4)说说明明变变量分量分别为别为两个定性两个定性变变量(各自分量(各自分别别是是两种属性)和一个定量两种属性)和一个定量说说明明变变量;量;思索:思索:四种加法方式引入虚四种加法方式引入虚拟变拟变量会量会产产生什么效生什么效应应?(1 1)一个两种属性定性说明变量而)一个两种属性定性说明变量而无定量变量的情形无定量变量的情形农村(2)一个定性说明变量(两种属性)和一个定量说明变量的情形城市农村共同的特征:截距发生变更(?)共同的特征:截距发生变更(?)(3 3)一个定性说明变量(两种以上)一个定性说明变量(两种以上属性)和一个定量说明变量的情形属性)和一个定量说明变量的情形(

14、4 4)两个定性说明变量(均为两种)两个定性说明变量(均为两种属性)和一个定量说明变量的情形属性)和一个定量说明变量的情形夏季、农村居民冬季、农村居民上述图形的前提条件是什么?上述图形的前提条件是什么?运用运用OLSOLS得到回来结果,再用得到回来结果,再用t t检验探讨因素检验探讨因素 是否对模型有影响。是否对模型有影响。加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式:基本分析方法基本分析方法:条件期望。条件期望。加法方式引入虚拟变量的主要作用为:加法方式引入虚拟变量的主要作用为:1.1.在有定量说明变量的情形下,主要变更方程在有定量说明变量的情形下,主要变更方程 截距;截

15、距;2.2.在没有定量说明变量的情形下,主要用于方在没有定量说明变量的情形下,主要用于方 差分析。差分析。基本思想基本思想以以乘乘法法方方式式引引入入虚虚拟拟变变量量时时,是是在在所所设设立立的的模型中,将虚模型中,将虚拟拟说说明明变变量量与与其其它它说说明明变变量量的的乘乘积积,作作为为新新的的说说明明变变量出量出现现在在模模型型中中,以以达达到到其其调调整整设设定定模模型型斜斜率率系系数数的的目的。或者将模目的。或者将模型型斜斜率率系系数数表表示示为为虚虚拟拟变变量量的的函函数数,以以达达到到相同的目的。相同的目的。乘法引入方式乘法引入方式:(1 1)截距不)截距不变变;(2 2)截距和斜

16、率均)截距和斜率均发发生生变变更;更;分析手段:仍旧是条件期望。分析手段:仍旧是条件期望。二、乘法类型二、乘法类型模型形式:模型形式:例:探讨消费支出例:探讨消费支出 受收入受收入 、年份状况、年份状况 的影响的影响(1 1)截距不变的情形)截距不变的情形(2 2)截距和斜率均发生变更)截距和斜率均发生变更 例,同样研究消费支出例,同样研究消费支出 、收入收入 、年份状况、年份状况 间的影间的影 响关系。响关系。模型形式:模型形式:不同截距、斜率的组合图形不同截距、斜率的组合图形重合回归:截距斜率均相同重合回归:截距斜率均相同平行回归:截距不同斜率相同平行回归:截距不同斜率相同共点回归:截距相

17、同斜率不同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同交叉(不同)回归:截距斜率均不同三、虚拟说明变量综合应用三、虚拟说明变量综合应用所谓综合应用是指将引入虚拟说明变量的加法方所谓综合应用是指将引入虚拟说明变量的加法方式、乘法方式进行综合运用。式、乘法方式进行综合运用。基本分析方式仍旧是条件期望分析。基本分析方式仍旧是条件期望分析。本课主要探讨本课主要探讨(1 1)结构变更分析;)结构变更分析;(2 2)交互效应分析;)交互效应分析;(3 3)分段回来分析)分段回来分析(1 1)结构变更分析)结构变更分析 结构变更的实质是检验所设定的模型在样本期内结构变更的实质是检验所设定的模型

18、在样本期内是否为同一模型。明显,平行回来、共点回来、是否为同一模型。明显,平行回来、共点回来、不同的回来三个模型均不是同一模型。不同的回来三个模型均不是同一模型。平行回来模型的假定是斜率保持不变(加法类型,平行回来模型的假定是斜率保持不变(加法类型,包括方差分析);包括方差分析);共点回来模型的假定是截距保持不变(乘法类型,共点回来模型的假定是截距保持不变(乘法类型,又被称为协方差分析);又被称为协方差分析);不同的回来的模型的假定是截距、斜率均为变动不同的回来的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。的(加法、乘法类型的组合)。例:比较改革开放前、后我国居民(平均)例:比较

19、改革开放前、后我国居民(平均)“储储 蓄蓄收入收入”总量关系是否发生了变更?总量关系是否发生了变更?模型的设定形式为模型的设定形式为 :明显,只要明显,只要 、不同时为零,上述模型就能刻画不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生改革开放前后我国居民储蓄收入模型结构是否发生变更。变更。回来方程:回来方程:问题:问题:1.本例中,平行、共点回来、不同的回来三本例中,平行、共点回来、不同的回来三模型的经济学背景说明是什么?模型的经济学背景说明是什么?2.如何进行结构变更推断?如何进行结构变更推断?3.是否可对是否可对(2)、(3)分别进行分别进行 OLS 估计?估计?

20、为什么?为什么?4.若分别对若分别对(2)、(3)进行进行 OLS 估计应留意估计应留意什么?什么?(2 2)交互效应分析)交互效应分析交互作用交互作用:一个说明变量的边际效应有时可能要依靠于另一一个说明变量的边际效应有时可能要依靠于另一个说明变量。为此,个说明变量。为此,KleinKlein和和Morgen(1951)Morgen(1951)提出了提出了有关收入和财产在确定消费模式上相互作用的假有关收入和财产在确定消费模式上相互作用的假设。他们认为消费的边际倾向不仅依靠于收入,设。他们认为消费的边际倾向不仅依靠于收入,而且也依靠于财产的多少而且也依靠于财产的多少 较富有的人可能会较富有的人可

21、能会有不同的消费倾向。有不同的消费倾向。为了捕获该影响,设为了捕获该影响,设 。假设边际。假设边际消费倾向消费倾向 依靠于财产依靠于财产 。一个简洁的表示方法。一个简洁的表示方法就是就是 。代入消费函数,有:。代入消费函数,有:由于由于 捕获了收入和财产之间的相互作用而被称捕获了收入和财产之间的相互作用而被称为交互作用项。为交互作用项。明显,刻画交互作用的方法,在变量为数量明显,刻画交互作用的方法,在变量为数量(定量定量)变量时,变量时,是以乘法方式引入虚拟变量的。是以乘法方式引入虚拟变量的。例例:是否发展油菜籽生产与是否发展养蜂生产的是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益

22、的影响探讨。差异对农副产品总收益的影响探讨。模型设定为模型设定为:(1 1)式中)式中,以加法形式引入虚拟变量暗含何假设以加法形式引入虚拟变量暗含何假设?(1 1)式以加法形式引入,暗含的假设为:)式以加法形式引入,暗含的假设为:菜籽生产和养蜂生产是分别独立地影响农副品生产菜籽生产和养蜂生产是分别独立地影响农副品生产总收益。但是,在发展油菜籽生产时,同时也发展总收益。但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益,可能会养蜂生产,所取得的农副产品生产总收益,可能会高于不发展养蜂生产的状况。即在是否发展油菜籽高于不发展养蜂生产的状况。即在是否发展油菜籽生产与养蜂生产的虚

23、拟变量生产与养蜂生产的虚拟变量 和和 间,很可能间,很可能存在着确定的交互作用,且这种交互影响对被说明存在着确定的交互作用,且这种交互影响对被说明变量农副产品生产收益会有影响。变量农副产品生产收益会有影响。问题:如何刻画同时发展油菜籽生产和养蜂生产的问题:如何刻画同时发展油菜籽生产和养蜂生产的交互作用?交互作用?基本思想基本思想:在模型中引入相关的两个变量的乘积。在模型中引入相关的两个变量的乘积。区分之处在于,上页定义中的交互效应是针对数量区分之处在于,上页定义中的交互效应是针对数量变量,而现在是定性变量变量,而现在是定性变量,又应当如何处理又应当如何处理?为了反映交互效应,将(为了反映交互效

24、应,将(1 1)变为:)变为:同时发展油菜籽和同时发展油菜籽和养蜂生产:养蜂生产:发展油菜籽生产:发展油菜籽生产:发展养蜂生产:发展养蜂生产:基础类型:基础类型:如何检验交互效应是否存在?如何检验交互效应是否存在?若若拒拒绝绝原原假假设设,即即交交互互效效应应对对 产产生生了了影影响响(应应当引入模型)。当引入模型)。作用作用:提高模型的描述精度。提高模型的描述精度。虚拟变量也可以用来代表数量因素的不同阶段。虚拟变量也可以用来代表数量因素的不同阶段。分段线性回来就是类似情形中常见的一种。分段线性回来就是类似情形中常见的一种。一个例子一个例子:探讨不同时段我国居民的消费行为。探讨不同时段我国居民

25、的消费行为。实际数据表明,实际数据表明,19791979年以前,我国居民的消费支年以前,我国居民的消费支出出 呈缓慢上升的趋势;从呈缓慢上升的趋势;从19791979年起先,居民消年起先,居民消费支出为快速上升趋势。费支出为快速上升趋势。如何刻画我国居民在不同时段的消费行为?如何刻画我国居民在不同时段的消费行为?(3 3)分段回来分析)分段回来分析基本思路:接受乘法方式引入虚拟变量的手基本思路:接受乘法方式引入虚拟变量的手段。明显,段。明显,19791979年是一个转折点,可考虑在年是一个转折点,可考虑在这个转折点作为虚拟变量设定的依据。若设这个转折点作为虚拟变量设定的依据。若设 197919

26、79,当,当 时可引入虚拟时可引入虚拟变量。(为什么选择变量。(为什么选择19791979作为转折点?)作为转折点?)(t1955,1956,2004)依据上述思路,有如下描述我国居民在不同时段依据上述思路,有如下描述我国居民在不同时段消费行为模型:消费行为模型:居民消费趋势方程:居民消费趋势方程:1979年之前,回来模型的斜率为年之前,回来模型的斜率为 ;1979年之前,回来模型的斜率为年之前,回来模型的斜率为 ;若统计检验表明,若统计检验表明,显著不为零,则我国居民的消显著不为零,则我国居民的消费行为在费行为在1979年前后发生了明显变更。年前后发生了明显变更。分析分析1.1.虚拟变量是人

27、工构造的取值为虚拟变量是人工构造的取值为0 0和和1 1的作为属性的作为属性变量代表的变量。变量代表的变量。2.2.虚拟变量个数的设置有确定规则:在有截距项虚拟变量个数的设置有确定规则:在有截距项的模型中,若定性因素有的模型中,若定性因素有 个相互排斥的类型,个相互排斥的类型,只能引入只能引入 个虚拟变量,否则会陷入所谓个虚拟变量,否则会陷入所谓“虚拟变量陷阱虚拟变量陷阱”,产生完全的多重共线性。,产生完全的多重共线性。第七章第七章 小小 结结3.3.在计量经济模型中,加入虚拟说明变量的途径在计量经济模型中,加入虚拟说明变量的途径有两种基本类型:一是加法类型;二是乘法类有两种基本类型:一是加法

28、类型;二是乘法类型。以加法方式引入虚拟变量变更的是模型的型。以加法方式引入虚拟变量变更的是模型的截距;以乘法方式引入虚拟变量变更的是模型截距;以乘法方式引入虚拟变量变更的是模型的斜率。的斜率。4.4.说明变量只有一个分为两种相互排斥类型的定说明变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回来,称为方差分析模性变量而无定量变量的回来,称为方差分析模型。型。5.5.说明变量包含一个分为两种类型定性变量的回说明变量包含一个分为两种类型定性变量的回来时,只运用了一个虚拟变量;说明变量包含一来时,只运用了一个虚拟变量;说明变量包含一个两种以上类型的定性变量的回来时,定性变量个两种以上类型的定

29、性变量的回来时,定性变量有有 种类型,依据虚拟变量设置规则引入了种类型,依据虚拟变量设置规则引入了 个虚拟变量。个虚拟变量。6.6.说明变量包含两个(或说明变量包含两个(或 个)定性变量的回来个)定性变量的回来中,可选用了两个(或中,可选用了两个(或 个)虚拟变量去表示,个)虚拟变量去表示,这并不会出现这并不会出现“虚拟变量陷阱虚拟变量陷阱”。7.7.以乘法形式引入虚拟说明变量的主要作用在于:以乘法形式引入虚拟说明变量的主要作用在于:对回来模型结构变更的检验;定性因素间交互对回来模型结构变更的检验;定性因素间交互作用的影响分析;分段线性回来等。作用的影响分析;分段线性回来等。第七章第七章 结结 束束 了!了!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 商业计划书

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁