《统计分析与方法-第七章回归分析4-虚拟变量的回归分析.ppt》由会员分享,可在线阅读,更多相关《统计分析与方法-第七章回归分析4-虚拟变量的回归分析.ppt(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章 回归分析5虚拟变量的回归回归分析的类型回归分析的类型w因变量与自变量都是定量变量的回归分析因变量与自变量都是定量变量的回归分析即我们常做的回归分析即我们常做的回归分析w因变量是定量变量,自变量中有定性变量因变量是定量变量,自变量中有定性变量的回归分析的回归分析即含有虚拟变量的回归分析即含有虚拟变量的回归分析w因变量是定性变量的回归分析因变量是定性变量的回归分析Logistic回归分析回归分析自变量中有定性变量自变量中有定性变量的回归分析的回归分析自变量中有定性变量的回归自变量中有定性变量的回归w在社会经济研究中,由许多定性变量,比在社会经济研究中,由许多定性变量,比如地区、民族、性别、
2、文化程度、职业和如地区、民族、性别、文化程度、职业和居住地等。居住地等。w可以应用它们的信息进行线性回归。可以应用它们的信息进行线性回归。w但是,必须现将定性变量转换为哑变量但是,必须现将定性变量转换为哑变量(也称虚拟变量),然后再将它们引入方(也称虚拟变量),然后再将它们引入方程,所得的回归结果才有明确的解释意义。程,所得的回归结果才有明确的解释意义。哑变量的建立哑变量的建立w对于具有对于具有k类的定性变量来说,设哑变量类的定性变量来说,设哑变量时,我们只设时,我们只设k-1个哑变量。个哑变量。w例例7.4 分析某地区妇女的年龄、文化程度、分析某地区妇女的年龄、文化程度、及居住地状况对其曾生
3、子女数的影响。及居住地状况对其曾生子女数的影响。w定量变量定量变量:年龄年龄w定性变量定性变量:文化程度、地区文化程度、地区wSpss数据:妇女生育子女数数据:妇女生育子女数.SAV哑变量的建立哑变量的建立w原变量编码值原变量编码值 哑变量赋值的操作哑变量赋值的操作w文化程度文化程度=1(文盲)(文盲)所有所有EDU=0w文化程度文化程度=2(小学)(小学)EDU2=1,其他其他EDU=0w文化程度文化程度=3(初中)(初中)EDU3=1,其他其他EDU=0w文化程度文化程度=4(高中)(高中)EDU4=1,其他其他EDU=0w文化程度文化程度=5(大学)(大学)EDU5=1,其他其他EDU=
4、0 w地区地区=1(城市)(城市)AREA=1w 地区地区=2(农村)(农村)AREA=0应用应用SPSS建立回归方程建立回归方程w回归结果:SPSSSPSS输出结果输出结果SPSSSPSS输出结果输出结果回归方程的解释回归方程的解释w当案例在两个分类变量都等于当案例在两个分类变量都等于0时,即文时,即文化程度为文盲,居住地在农村时,此种情化程度为文盲,居住地在农村时,此种情况称为参照类(其他情况将于此进行比较)况称为参照类(其他情况将于此进行比较),其回归方程为:,其回归方程为:w表明所有参照类妇女年龄每上升表明所有参照类妇女年龄每上升1岁,其岁,其曾生子女数的平均变化量为曾生子女数的平均变
5、化量为0.068个。个。回归方程的解释回归方程的解释w当文化程度为小学,居住地为农村时:当文化程度为小学,居住地为农村时:w表明,对于相同年龄和居住地而言,小学表明,对于相同年龄和居住地而言,小学文化程度妇女比文盲妇女曾生子女数多出文化程度妇女比文盲妇女曾生子女数多出b2个部分,即少生个部分,即少生1.13个子女。个子女。回归方程的解释回归方程的解释w当教育程度为文盲、居住地为城市时,当教育程度为文盲、居住地为城市时,表明,对于相同年龄和文化程度而言,城表明,对于相同年龄和文化程度而言,城市妇女比农村妇女曾生子女数多出市妇女比农村妇女曾生子女数多出b6个部个部分,即少生分,即少生0.49个子女
6、。个子女。回归方程的解释回归方程的解释w总之,该回归方程表示总之,该回归方程表示:w参照类参照类妇女曾生子女数对年龄的回归直线妇女曾生子女数对年龄的回归直线的的截据为截据为1.41,年龄每上升,年龄每上升1岁,参照类妇岁,参照类妇女的女的平均曾生子女数上升平均曾生子女数上升0.068个。个。w城市妇女城市妇女比农村妇女的平均曾生子女数比农村妇女的平均曾生子女数少少0.49个。个。w小学、初中、高中和大学小学、初中、高中和大学文化程度妇女的文化程度妇女的平均曾生子女数分别比文盲妇女平均曾生子女数分别比文盲妇女少少1.13、1.31、1.58、1.57个个(在年龄和居住地相同(在年龄和居住地相同时
7、)。时)。回归方程的解释回归方程的解释w文化程度在实际中是一个序次变量。可以文化程度在实际中是一个序次变量。可以用用 表示序次变量个相邻分类的表示序次变量个相邻分类的实际效应,如初中的边际效应为:实际效应,如初中的边际效应为:w类似,可以计算下面的边际效应:类似,可以计算下面的边际效应:w小学小学=-1.13 初中初中=-0.18w高中高中=-0.27 大学大学=0.01回归分析回归分析w利用同样的方法我们可以对例利用同样的方法我们可以对例7.27.2进行回进行回归分析。归分析。w例例7.2的数据中的数据中,还有一个自变量是定性变还有一个自变量是定性变量量“收入收入”,以虚拟变量或哑元以虚拟变量或哑元(dummy variable)的方式出现。的方式出现。SPSSSPSS输出结果输出结果SPSSSPSS输出结果输出结果回归分析回归分析w回归方程为:回归方程为:总统任期对工业指数变化的影响案例总统任期对工业指数变化的影响案例w现有道琼斯工业平均指数(DJIA)在8任总统的每一个四年任期之内的变化,利用回归分析来确定政党和总统任期对道琼斯工业平均指数变化的影响。w所有的数据在数据文件:回归分析-总统对指数的影响案例.SAV。