数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx

上传人:一*** 文档编号:71949065 上传时间:2023-02-07 格式:PPTX 页数:22 大小:324.49KB
返回 下载 相关 举报
数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx_第1页
第1页 / 共22页
数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx_第2页
第2页 / 共22页
点击查看更多>>
资源描述

《数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx》由会员分享,可在线阅读,更多相关《数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据数据(shj)统计与分析教程章含虚拟变量统计与分析教程章含虚拟变量的回归模型的回归模型第一页,共22页。一、虚拟变量的定义1.定性(dng xng)变量与定量变量定量变量:回归模型定量变量:回归模型(mxng)中有些变量是可以被度量的,如居民消费、国内生产总值、出口总额等,这些变量被称为中有些变量是可以被度量的,如居民消费、国内生产总值、出口总额等,这些变量被称为“定量变量定量变量”。定性变量:在经济现象的分析中还存在一些不能被度量的变量,如性别、种族、婚姻状况、文化程度等,这些变量被称为定性变量:在经济现象的分析中还存在一些不能被度量的变量,如性别、种族、婚姻状况、文化程度等,这些变量被

2、称为“定性变量定性变量”。第1页/共22页第二页,共22页。一、虚拟(xn)变量的定义2.虚拟(xn)变量定义:定义:定性变量描述的是变量具有的性质,要将这样的变量纳入回归模型中,需构造定性变量描述的是变量具有的性质,要将这样的变量纳入回归模型中,需构造(guzo)人工变量,从而将定性变量进行量化处理。人工变量,从而将定性变量进行量化处理。在计量经济学中,将取值为在计量经济学中,将取值为“0”和和“1”的人工变量称作虚拟变量(的人工变量称作虚拟变量(Dummy Variable),用字母),用字母D表示。当表示。当D取值为取值为0时,表示该变量不具备某种属性;当时,表示该变量不具备某种属性;当

3、D取值为取值为1时,表示该变量具有某种属性。时,表示该变量具有某种属性。第2页/共22页第三页,共22页。一、虚拟(xn)变量的定义2.虚拟(xn)变量虚拟变量陷阱:虚拟变量陷阱:所谓的所谓的“虚拟变量陷阱虚拟变量陷阱”是指自变量(解释变量)中包含了过多的虚拟变量,从而导致了模型出现多重共线性。当模型中既有整体截距又对每一组都设有一个是指自变量(解释变量)中包含了过多的虚拟变量,从而导致了模型出现多重共线性。当模型中既有整体截距又对每一组都设有一个(y)虚拟变量时,就产生了虚拟变量陷阱。虚拟变量时,就产生了虚拟变量陷阱。第3页/共22页第四页,共22页。一、虚拟变量(binling)的定义2.

4、虚拟变量(binling)引入虚拟变量的原则:引入虚拟变量的原则:一般情况一般情况(qngkung)下,如果定性变量有下,如果定性变量有m类,并且模型不含有截距项时,应引入类,并且模型不含有截距项时,应引入m个虚拟变量;如果模型含有截距项,应引入个虚拟变量;如果模型含有截距项,应引入m-1个虚拟变量。个虚拟变量。第4页/共22页第五页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binling)在回归模型中,解释变量可以仅是一个虚拟变量,这样在回归模型中,解释变量可以仅是一个虚拟变量,这样(zhyng)的回归模型被称为方差分析模型。的回归模型被称为方差分析模型。例如:

5、例如:yt=0+1Dt+t 假设被解释变量假设被解释变量yt为员工工资收入,为员工工资收入,Dt为虚拟解释变量,取值为为虚拟解释变量,取值为0或或1:1,雇员为女性,雇员为女性Dt=0,雇员为男性,雇员为男性第5页/共22页第六页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binling)如果该回归模型的随机误差项满足线性回归模型的五个基本如果该回归模型的随机误差项满足线性回归模型的五个基本(jbn)假定条件,则假定条件,则E(yt|Dt=1)=E(雇员工资收入(雇员工资收入|雇员为女性)雇员为女性)=0+1E(yt|Dt=0)=E(雇员工资收入(雇员工资收入|雇员

6、为男性)雇员为男性)=00+1表示女性雇员的平均工资收入,表示女性雇员的平均工资收入,0表示男性雇员的平均工资收入。表示男性雇员的平均工资收入。第6页/共22页第七页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binling)实验:实验:根据表根据表7-1中的数据显示,建立解释变量为虚拟变量的回归模型。表中列出了中的数据显示,建立解释变量为虚拟变量的回归模型。表中列出了24个不同性别个不同性别(xngbi)的企业员工的月工资收入情况,性别的企业员工的月工资收入情况,性别(xngbi)一列中一列中“1”表示女性员工,表示女性员工,“0”表示男性员工。通过建立含有虚拟变

7、量的回归模型,试图分析男女平均工资是否存有差距,如果有差距,那么差距是多少。表示男性员工。通过建立含有虚拟变量的回归模型,试图分析男女平均工资是否存有差距,如果有差距,那么差距是多少。第7页/共22页第八页,共22页。二、含虚拟变量的模型(mxng)1.仅含一个虚拟变量实验:实验:回归模型为回归模型为yt=0+1Dt+t (t=1,2,n)其中,其中,yt表示企业表示企业(qy)员工的工资收入情况,员工的工资收入情况,Dt=0表示男性员工,表示男性员工,Dt=1表示女性员工。表示女性员工。第8页/共22页第九页,共22页。二、含虚拟变量的模型(mxng)1.仅含一个虚拟变量实验:实验:第一步,

8、建立类型为第一步,建立类型为“Unstructured/Undated”(未限定结构(未限定结构/未限定日期)的工作文件,在未限定日期)的工作文件,在“Data range”(数据范围)中输入观测数据的样本范围,本例中所分析的数据为(数据范围)中输入观测数据的样本范围,本例中所分析的数据为24个样本,在个样本,在“Names”中为该工资文件命名中为该工资文件命名(mng mng),如,如“工资与性别关系工资与性别关系”。然后单击。然后单击“OK”按钮即可生成工作文件。按钮即可生成工作文件。第9页/共22页第十页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binlin

9、g)实验:实验:第二步,在该工作文件中建立两个序列对象,一个为第二步,在该工作文件中建立两个序列对象,一个为“wage”,一个为,一个为“sex”。第三步,在第三步,在“wage”序列对象中输入序列对象中输入 “工资工资(gngz)”的数据,在的数据,在“sex”序列对象中输入序列对象中输入 “性别性别”的数据。的数据。第10页/共22页第十一页,共22页。二、含虚拟(xn)变量的模型1.仅含一个虚拟(xn)变量实验:实验:第四步,在工作文件中选择主菜单栏中的第四步,在工作文件中选择主菜单栏中的“Object”|“New Object”|“Equation”选项,或者选项,或者(huzh)选择

10、选择“Quick”|“Estimate Equation”选项,打开如下所示的方程对话框。选项,打开如下所示的方程对话框。第11页/共22页第十二页,共22页。二、含虚拟变量的模型(mxng)1.仅含一个虚拟变量实验:实验:在在“Equation specification”(方程说明)中列出模型中的被解释变量、常数项和解释变量。在(方程说明)中列出模型中的被解释变量、常数项和解释变量。在“Estimation settings”(估计方法设定)中选择(估计方法设定)中选择“LS”,用普通最小二乘法对回归,用普通最小二乘法对回归(hugu)模型进行估计。然后单击模型进行估计。然后单击“确定确定

11、”按钮即可得到如下估计结果。按钮即可得到如下估计结果。第12页/共22页第十三页,共22页。二、含虚拟(xn)变量的模型1.仅含一个虚拟(xn)变量实验实验(shyn):虚拟变量的回归方程结果可以表示为:虚拟变量的回归方程结果可以表示为:Wage=3478.869 595.0965 sext=(30.06899)(-3.482241)R2=0.35533 Adjusted-R2=0.326027 F=12.126 D.W.=2.232989结果表明,该企业的女性员工的平均工资水平为结果表明,该企业的女性员工的平均工资水平为2883.7725(3478.869 595.0965)元人民币,该企业

12、的男性员工的平均工资水平为)元人民币,该企业的男性员工的平均工资水平为3478.869 元人民币。由此可见,女性的平均工资比男性少了元人民币。由此可见,女性的平均工资比男性少了595.0965 元。元。第13页/共22页第十四页,共22页。二、含虚拟变量的模型2.同时含虚拟和定量(dngling)解释变量当方程当方程(fngchng)的解释变量中既有虚拟变量又有定量变量时,同样可以用的解释变量中既有虚拟变量又有定量变量时,同样可以用OLS对模型进行估计。例如:对模型进行估计。例如:yt=0+1 xt+2Dt+t 第14页/共22页第十五页,共22页。二、含虚拟变量的模型(mxng)2.同时含虚

13、拟和定量解释变量实验:实验:随着科技的进步和人民生活水平的不断提高,电脑越来越普及,许多家庭纷纷把个人电脑(随着科技的进步和人民生活水平的不断提高,电脑越来越普及,许多家庭纷纷把个人电脑(PC机)搬进家中。我们机)搬进家中。我们(w men)可以研究人们的收入水平、受教育程度与城乡居民之间的关系。模型如下,可以研究人们的收入水平、受教育程度与城乡居民之间的关系。模型如下,yt=0+1 xt+2D2t+3D3t+t (t=1,2,n)其中,其中,yt表示根据调查资料所得到的家庭所购买个人电脑情况,表示根据调查资料所得到的家庭所购买个人电脑情况,xt表示家庭收入,表示家庭收入,D2 和和D3为虚拟

14、解释变量。为虚拟解释变量。第15页/共22页第十六页,共22页。二、含虚拟(xn)变量的模型2.同时含虚拟(xn)和定量解释变量实验:实验:1,大专及以上学历,大专及以上学历D2 =0,其他,其他 1,城镇居民,城镇居民D3 =0,非城镇居民,非城镇居民根据表根据表7-2中的数据用普通最小二乘法(中的数据用普通最小二乘法(OLS)对模型进行估计,并分析)对模型进行估计,并分析(fnx)回归结果。回归结果。第16页/共22页第十七页,共22页。二、含虚拟变量的模型(mxng)2.同时含虚拟和定量解释变量操作步骤:操作步骤:第一步,建立第一步,建立(jinl)类型为类型为“Unstructured

15、/Undated”(未限定结构(未限定结构/未限定日期)的工作文件。未限定日期)的工作文件。第二步,在该工作文件中建立第二步,在该工作文件中建立(jinl)四个序列对象。四个序列对象。“pc”代表家庭拥有的电脑数量;代表家庭拥有的电脑数量;“rev”代表家庭每月收入;代表家庭每月收入;“edu”代表教育程度;代表教育程度;“city”表示城乡居民情况。并把相应的数据输入到每个序列对象中。表示城乡居民情况。并把相应的数据输入到每个序列对象中。第17页/共22页第十八页,共22页。二、含虚拟变量的模型2.同时(tngsh)含虚拟和定量解释变量操作步骤:操作步骤:第三步,在工作文件中选择主菜单栏中的

16、第三步,在工作文件中选择主菜单栏中的“Object”|“New Object”|“Equation”选项,打开方程对话框。在选项,打开方程对话框。在“Equation specification”(方程说明(方程说明(shumng))中输入)中输入“pc c rev edu city”或或“pc=c(1)+c(2)*rev+c(3)*edu+c(4)*city”,在,在“Estimation settings”(估计方法设定)中选择(估计方法设定)中选择“LS”。第18页/共22页第十九页,共22页。二、含虚拟(xn)变量的模型2.同时含虚拟(xn)和定量解释变量操作步骤:操作步骤:第四步,结

17、果分析。第四步,结果分析。右图中,变量右图中,变量 edu和变量和变量city没有没有通过显著性(通过显著性(t)检验,说明这两)检验,说明这两个变量对因变量个变量对因变量 pc的影响不显著。的影响不显著。因而,在所调查的样本因而,在所调查的样本(yngbn)中,被调中,被调查者的受教育程度以及是否是城查者的受教育程度以及是否是城镇居民对拥有个人电脑的数量没镇居民对拥有个人电脑的数量没有显著的影响。有显著的影响。第19页/共22页第二十页,共22页。三、用虚拟变量法进行季节(jji)调整在使用虚拟变量法对时间序列进行季节性调整时,可以计算出每个季节对经济变量的影响。在使用虚拟变量法对时间序列进

18、行季节性调整时,可以计算出每个季节对经济变量的影响。假设模型含有截距项,则四个季节包含了假设模型含有截距项,则四个季节包含了4种分类种分类(fn li),因而需要引入,因而需要引入3个虚拟变量(个虚拟变量(41)。用)。用Qi表示第表示第i个季度取值为个季度取值为1,其他季节取值为,其他季节取值为0这样一个虚拟变量,则这样一个虚拟变量,则Q1+Q2+Q3+Q41。当时间序列的数据样本为月度数据时,建立虚拟变量的方法与季度数据相同,只是如果模型含有截距项,则月度数据要建立。当时间序列的数据样本为月度数据时,建立虚拟变量的方法与季度数据相同,只是如果模型含有截距项,则月度数据要建立11个虚拟变量。个虚拟变量。第20页/共22页第二十一页,共22页。本章小结:理解虚拟变量(binling)的定义 掌握引入虚拟变量(binling)的方法 掌握含虚拟变量(binling)模型的建立方法第21页/共22页第二十二页,共22页。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁