《虚拟变量模型》课件.ppt-淘文阁

资源描述

《《虚拟变量模型》课件.ppt》由会员分享，可在线阅读，更多相关《《虚拟变量模型》课件.ppt（35页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第第8章章虚拟变量模型虚拟变量模型本章教学要求：本章教学要求：（1）掌握虚拟变量的概念）掌握虚拟变量的概念（2）掌握虚拟变量作为自变量情况时的设置和）掌握虚拟变量作为自变量情况时的设置和应用应用（3）虚拟变量作为因变量的情况）虚拟变量作为因变量的情况（4）非线性概率模型的概念及应用）非线性概率模型的概念及应用（5）利用）利用Eviews软件估计虚拟变量模型的参数软件估计虚拟变量模型的参数8.1 虚拟变量与线性模型虚拟变量与线性模型8.1.1 虚拟变量的概念及作用虚拟变量的概念及作用定量变量：可以直接获取观测资料数值的变量定性变量：表示某种特征的存在与否基本思想：基本思想：直接在回归模型中加入

2、定性因素存在诸多的直接在回归模型中加入定性因素存在诸多的困难，是否可将这些定性因素进行量化，以达到困难，是否可将这些定性因素进行量化，以达到定性因素能与定量因素有着相同作用之目的。定性因素能与定量因素有着相同作用之目的。取值0或1量化方法量化方法0：表示属性不不存在1：表示属性存在在计量经济学中，我们把反映定性因素变化，取值为0和1的人工变量称为虚拟变量（虚拟变量（dummy variable)。8.1.2 虚拟变量作为自变量的情况虚拟变量作为自变量的情况规则一：对于一个有规则一：对于一个有m种可能的定性变量，只能引入种可能的定性变量，只能引入m-1个虚拟变量个虚拟变量。1、虚拟变量的设置规

3、则、虚拟变量的设置规则（1）一个因素多种属性多种属性的问题如，学历、工龄对薪金都有影响，则薪金模型可写为：其中，D1D2代表高中以下、高中和大学及以上三种学历水平。否则会导致多重共线性，称作虚拟变量陷阱（dummy variable trap）。（2）理论上讲，关于定性变量中的哪个类别取0，哪个类别取1，是任意的，不影响检验结果。一般将定性变量中取值为0所对应的类别称作基础类别（base category），而将比较类别（肯定类别）取值为1。2、虚拟变量的引入方式、虚拟变量的引入方式加法对模型截距项的影响乘法对模型斜率系数的影响 b0+b1xt+ut,(D=0)yt=(b0+b2)+b1xt+

4、ut,(D=1)t0女男Y b0+b1xt+ut,(D=0)yt=b0+(b1+b2）xt+ut,(D=1)Y t女男0仍以薪金模型为例：yt=b0+b1 xt+b2 xt Dt+ut其中xt为定量变量；Dt为定性变量。当D=0 或1时，上述模型可表达为：b0+b1 xt+ut (D=0)(b0+b2)+(b1+b3)xt+ut,(D=1)yt=t女男03、一般方式在经济发生转折时期，可通过建立虚拟变量实现模型的分段回归。例例如如，进口消费品数量Y主要取决于国民收入X的多少，中国在改革开放前后，Y对X的回归关系明显不同。3、折线回归、折线回归假设以t*=1979年为转折期，以1979年的国

5、民收入Xt*为临界值，可设如下虚拟变量：则进口消费品的回归模型可建立如下：则进口消费品的回归模型可建立如下：若经检验Dt显著，则两时期进口消费品函数分别为：当tt*=1979年，当tt*=1979年，在我国上市公司中，个人做第一大股东的现象还非常少，主要是国家或法人作为公司的第一大股东。而国家作为第一大股东与法人相比，除了公司业绩，还有其它考虑，例如就业、形象工程、负责人升迁、上缴利税等，这些目标都或多或少有悖于公司利润最大化的目标。另外，国家控股的公司由国家选择代理人，而这些代理人往往是行政人员或官僚出身，没有经营管理的特长，进一步制约上市公司绩效的发挥。因此，总体而言，国家作为第一大股东的

6、上市公司的绩效要低于法人做第一大股东的上市公司的绩效。为验证上述结论，我们建立如下的模型：虚拟变量在金融数据处理中的作用虚拟变量在金融数据处理中的作用案例案例1其中为每股收益，用以代表公司绩效。的定义方式如下：1，国家是公司i的第一大股东 =0，法人是公司i的第一大股东由模型可以得到：国家为第一大股东平均每股收益：=法人为第一大股东平均每股收益：=0)=根据有效市场理论，在有效市场中，由于股票价格能够及时地反映所有的信息，因此股价将会呈现出随机波动的特征。并且，在有效市场中，由于投资者能够随时获取所需要的信息，因此将不存在套利的机会，股票的价格将反映价值。按照有效市场理论，一周内每天的收益

7、率将是随机波动、没有规律的。因为如果假设某天的收益率比其他各天的收益率高或者低，由于投资者可随时掌握所需要的信息，并且做出理性的选择，因此他们将充分利用这个套利机会来获取超额收益率。而随着套利过程的进行，超额收益率也会逐渐减少直至消失，从而每天的收益率又将会呈现出无规律的波动。虚拟变量在金融数据处理中的作用虚拟变量在金融数据处理中的作用案例案例2下面我们将利用虚拟变量模型对这一现象进行实证检验：数据描述：我们利用的是上海股票市场上证指数1997年1月1日到2004年12月31日的日收盘价数据，共1926个观测值。收益率的计算我们采用的是连续收益率法，计算公式如下我们建立如下的虚拟变量模型：使用

8、Eviews3.1软件对上述模型进行OLS回归，得到如下结果（括号内为相应的t值）：对模型各系数估计值进行联合F检验，看各系数值是否同时为零，结果的到F值为1.03，其概率值为0.39，因此不能拒绝各系数值同时为零的假设，则可以得出结论，上海股票市场不存在周内效应。8.1.3 虚拟变量作为因变量的情况虚拟变量作为因变量的情况1、因变量为虚拟变量的回归模型、因变量为虚拟变量的回归模型虚拟变量作为因变量的模型也称定性响应模型，既可以包括二值变量模型（也称二分选择模型），也包括多分选择模型。我们重点讨论二值变量模型。模型举例：一个大学毕业生是否会被一个不错的MBA项目录取，取决于其学习成绩、GMAT

9、分数和其它因素。一位成年男子是否就业取决于总体失业率、平均工资率、受教育程度和家庭收入等因素。在因变量为定量变量的模型中，总体回归函数描述的是解释变量和相应条件下因变量期望值之间的函数关系。在因变量为定性变量的模型中，这一总体回归函数有何特殊含义？以居民家庭购买汽车的状况为例，假定该家庭是否购买汽车只同家庭收入x有关，且呈线性关系，则回归模型为：相应地，这种因变量为虚拟变量的线性回归模型又称为线性概率模型。现在分析现在分析线性概率模型误差的分布：线性概率模型误差的分布：ui=yi-a a-b b xi=-=-0 ,1 ,1iiiiyxyxbaba E(ui)=(1-a a-b b xi)pi+

10、(-a a-b b xi)(1-pi)=pi-a a-b b xi 由（由（4）式）式pi=a a+b b xi，有，有 E(ui)=pi-a a-b b xi=0 因为因为yi只能取只能取0,1两个值，所以，两个值，所以，Var(ui)=E(ui2)=(1-a a-b b xi)2 pi+(-a a-b b xi)2(1-pi)=(1-a a-b b xi)2(a a+b b xi)+(a a+b b xi)2(1-a a-b b xi),=(1-a a-b b xi)(a a+b b xi)=(1-pi)pi=pi-pi2,上式说明，误差项的期望为零，方差具有异方差。上式说明，误差项的期望

11、为零，方差具有异方差。所以所以线性概率概率模型回归系数的线性概率概率模型回归系数的OLS估计量具有估计量具有无偏性和一致性，但不具有有效性无偏性和一致性，但不具有有效性。2、线性概率模型估计中存在的问题、线性概率模型估计中存在的问题Var(Var(u ui i2 2)=)=p pi i-p pi i2 2当当当当p pi i =0.5=0.5时最大时最大时最大时最大x xi i取值在一定范围之内时对被解释变取值在一定范围之内时对被解释变取值在一定范围之内时对被解释变取值在一定范围之内时对被解释变量可能取值的概率估计才是合理的。量可能取值的概率估计才是合理的。量可能取值的概率估计才是合理的。量可

12、能取值的概率估计才是合理的。随机误差项不服从正态分布，而是服从二点分布随机误差项具有异方差性0E(yi/xi)1不被满足可疑的拟合优度如何解决？异方差性加权最小二乘随机误差项不服从正态分布大样本下，参数估计量近似服从正态分布0E(yi/xi)1不被满足 +=0,010,1,1iiiiixxxxpbabababa 此模型由此模型由James Tobin 1958年提出，因此称作年提出，因此称作Tobit模型（模型（James Tobin 1981年获诺贝尔经济学奖）。年获诺贝尔经济学奖）。然而这样做是有问题的。假设预测某个事件发生的概率等于然而这样做是有问题的。假设预测某个事件发生的概率等于1，

13、但是实际中，但是实际中该事件可能根本不会发生。反之，预测某个事件发生的概率等于该事件可能根本不会发生。反之，预测某个事件发生的概率等于0，但是实，但是实际中该事件却可能发生了。际中该事件却可能发生了。虽然估计过程是无偏的，但是由估计过程得出的虽然估计过程是无偏的，但是由估计过程得出的预测结果却是有偏的。预测结果却是有偏的。由于线性概率模型的上述缺点，希望能找到一种变换方法，（由于线性概率模型的上述缺点，希望能找到一种变换方法，（1）使解释）使解释变量变量xi所对应的所有预测值（概率值）都落在（所对应的所有预测值（概率值）都落在（0，1）之间。（）之间。（2）同时对于）同时对于所有的所有的xi，

14、当，当xi增加时，希望增加时，希望yi也单调增加或单调减少。显然累积概率分布也单调增加或单调减少。显然累积概率分布函数函数F(zi)能满足这样的要求。能满足这样的要求。采用累积正态概率分布函数的模型称作采用累积正态概率分布函数的模型称作Probit模型模型。另外另外logistic函函数也能数也能满足这样的要求满足这样的要求。采用。采用logistic函数的模型称作函数的模型称作 logit 模型。模型。8.2 非线性概率模型非线性概率模型逻辑模型逻辑模型逻辑模型的估计问题逻辑模型的估计问题1、因变量观测值可以分组的情况、因变量观测值可以分组的情况如果样本容量足够大，以至每一个自变量观测值都

15、有若干因变量观察值与之对应，则可求出给定条件下每组因变量的取值为一的概率值，从而在此基础上运用OLS法估计。2、因变量观测值不能重复观测的情况、因变量观测值不能重复观测的情况采取极大似然估计方法估计。三、考虑下面的模型：其中，Y表示大学教师的年薪收入，X表示工龄。为了研究大学教师的年薪是否受到性别、学历的影响。按照下面的方式引入虚拟变量：（1）基准类是什么？（2）解释各系数所代表的含义。（3）若，你得出什么结论？在对美国1980-1995年间人均消费支出（PCE）和人均可支配收入（PDPI）年度数据取对数后，在对数序列的基础上进行回归分析，得到了如下Eviews回归分析结果：Dependen

16、t Variable:LOG(PCE)Method:Least SquaresSample:1980 1995Included observations:16VariableCoefficientStd.Errort-StatisticProb.LOG(PDPI)1.2052810.02889141.7182160.0000C-2.0926640.2812860.0000R-squared Mean dependent var9.641839Adjusted R-squared0.99145 S.D.dependent var0.096436S.E.of regression0.008917 Akaike info criterion-6.485274Sum squared resid0.001113 Schwarz criterion-6.388701Log likelihood53.88219 F-statistic1740.450Durbin-Watson stat2.322736 Prob(F-statistic)0.000000（1）求出空白处的数值（填在空格内）。（2）根据以上回归结果，写出回归分析报告。（3）在0.05的显著性水平下进行各统计准则的检验，并解释其经济含义。（4）检验模型是否存在一阶序列相关问题。

展开阅读全文