《第07章离散因变量和受限因变量模型精选文档.ppt》由会员分享,可在线阅读,更多相关《第07章离散因变量和受限因变量模型精选文档.ppt(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第07章离散因变量和受限因变量模型1本讲稿第一页,共六十九页在在实实际际中中,还还会会经经常常遇遇到到因因变变量量受受到到某某种种限限制制的的情情况况,这这种种情情况况下下,取取得得的的样样本本数数据据来来自自总总体体的的一一个个子子集集,可可能能不不能能完完全全反反映映总总体体。这这时时需需要要建建立立的的经经济济计计量量模模型型称称为为受受限限因因变变量量模模型型(limiteddependentvariablemodel)。这这两两类类模模型型经常用于调查数据的分析中。经常用于调查数据的分析中。2本讲稿第二页,共六十九页7.17.1二元选择模型二元选择模型二元选择模型二元选择模型 在离散
2、选择模型中,最简单的情形是在两个可供选择的方在离散选择模型中,最简单的情形是在两个可供选择的方案中选择其一,此时被解释变量只取两个值,称为二元选择模案中选择其一,此时被解释变量只取两个值,称为二元选择模型(型(binarychoicemodel)。在实际生活中,我们经常遇到二)。在实际生活中,我们经常遇到二元选择问题。例如,在买车与不买车的选择中,买车记为元选择问题。例如,在买车与不买车的选择中,买车记为1,不买记为不买记为0。是否买车与两类因素有关系:一类是车本身所具有的属。是否买车与两类因素有关系:一类是车本身所具有的属性,如价格、型号等;另一类是决策者所具有的属性如收入水平、性,如价格、
3、型号等;另一类是决策者所具有的属性如收入水平、对车的偏好程度等。如果我们要研究是否买车与收入之间的关系,对车的偏好程度等。如果我们要研究是否买车与收入之间的关系,即研究具有某一收入水平的个体买车的可能性。因此,二元选择模即研究具有某一收入水平的个体买车的可能性。因此,二元选择模型的目的是研究具有给定特征的个体作某种而不作另一种选择的概型的目的是研究具有给定特征的个体作某种而不作另一种选择的概率。率。3本讲稿第三页,共六十九页为为了了深深刻刻地地理理解解二二元元选选择择模模型型,首首先先从从最最简简单单的的线线性性概概率率模模型开始讨论。线性概率模型的回归形式为:型开始讨论。线性概率模型的回归形
4、式为:(7.1.1)其其中中:N是是样样本本容容量量;k是是解解释释变变量量个个数数;xj为为第第j个个个个体体特特征征的的取取值值。例例如如,x1表表示示收收入入;x2表表示示汽汽车车的的价价格格;x3表表示示消消费费者者的的偏偏好好等等。设设 yi 表表示取值示取值为为0和和1的离散型随机变量:的离散型随机变量:式(式(7.1.1)中)中ui为相互独立且均值为为相互独立且均值为0的随机扰动项。的随机扰动项。7.1.17.1.1 线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式 4本讲稿第四页,共六十九页令令pi
5、=P(yi=1),那么那么1-pi=P(yi=0),于是于是(7.1.2)又又因因为为E(ui)=0,所所以以E(yi)=xi,xi=(x1i,x2i,xki),=(1,2,k),从而有下面的等式:从而有下面的等式:(7.1.3)5本讲稿第五页,共六十九页式式(7.1.3)只只有有当当xi 的的取取值值在在(0,1)之之间间时时才才成成立立,否否则则就就会会产产生生矛矛盾盾,而而在在实实际际应应用用时时很很可可能能超超出出这这个个范范围围。因因此此,线线性性概概率率模模型型常常常常写成下面的形式:写成下面的形式:(7.1.4)此时就可以把因变量看成是一个概率。此时就可以把因变量看成是一个概率。
6、那么扰动项的方差为:那么扰动项的方差为:(7.1.5)或或(7.1.6)6本讲稿第六页,共六十九页由由此此可可以以看看出出,误误差差项项具具有有异异方方差差性性。异异方方差差性性使使得得参参数数估估计计不不再再是是有有效效的的,修修正正异异方方差差的的一一个个方方法法就就是是使使用用加加权权最最小小二二乘乘估估计计。但但是是加加权权最最小小二二乘乘法法无无法法保保证证预预测测值值在在(0,1)之之内内,这这是是线线性性概概率率模模型型一一个个严严重重的的弱弱点点。由由于于上上述述问问题题,我我们们考考虑虑对对线线性性概概率率模模型型进进行行一一些变换,由此得到下面要讨论的模型。些变换,由此得到
7、下面要讨论的模型。假假设设有有一一个个未未被被观观察察到到的的潜潜在在变变量量yi*,它它与与xi之之间间具具有有线线性性关关系系,即即(7.1.7)其中:其中:ui*是扰动项。是扰动项。yi和和yi*的关系如下:的关系如下:(7.1.8)7本讲稿第七页,共六十九页 yi*大大于于临临界界值值0时时,yi=1;小小于于等等于于0时时,yi=0。这这里里把把临临界界值值选选为为0,但但事事实实上上只只要要xi包包含含有有常常数数项项,临临界界值值的的选选择择就就是是无无关关的的,所所以不妨设为以不妨设为0。这样。这样(7.1.9)其其中中:F是是ui*的的分分布布函函数数,要要求求它它是是一一个
8、个连连续续函函数数,并并且且是是单单调调递增的。因此,原始的回归模型可以看成如下的一个回归模型:递增的。因此,原始的回归模型可以看成如下的一个回归模型:(7.1.10)即即yi关于它的条件均值的一个回归。关于它的条件均值的一个回归。8本讲稿第八页,共六十九页 分分布布函函数数的的类类型型决决定定了了二二元元选选择择模模型型的的类类型型,根根据据分分布布函函数数F的的不不同同,二二元元选选择择模模型型可可以以有有不不同同的的类类型型,常常用用的的二二元元选选择择模模型型如如表表7.1所示:所示:表表表表7.1 7.1 常用的二元选择模型常用的二元选择模型常用的二元选择模型常用的二元选择模型 ui
9、*对应的分布对应的分布分布函数分布函数F 相应的二元选择模型相应的二元选择模型标准正态分布标准正态分布Probit 模型模型逻辑分布逻辑分布Logit 模型模型极值分布极值分布Extreme模型模型9本讲稿第九页,共六十九页二元选择模型一般采用极大似然估计。似然函数为二元选择模型一般采用极大似然估计。似然函数为(7.1.11)即即(7.1.12)对数似然函数为对数似然函数为(7.1.13)7.1.27.1.2二元选择模型的估计问题二元选择模型的估计问题二元选择模型的估计问题二元选择模型的估计问题 10本讲稿第十页,共六十九页对数似然函数的一阶条件为对数似然函数的一阶条件为(7.1.14)其其中
10、中:fi 表表示示概概率率密密度度函函数数。那那么么如如果果已已知知分分布布函函数数和和密密度度函函数数的的表表达达式式及及样样本本值值,求求解解该该方方程程组组,就就可可以以得得到到参参数数的的极极大大似似然然估估计计量量。例例如如,将将上上述述3种种分分布布函函数数和和密密度度函函数数代代入入式式(7.1.14)就就可可以以得得到到3种种模模型型的的参参数数极极大大似似然然估估计计。但但是是式式(7.1.14)通常是非线性的,需用迭代法进行求解。通常是非线性的,需用迭代法进行求解。二二元元选选择择模模型型中中估估计计的的系系数数不不能能被被解解释释成成对对因因变变量量的的边边际际影影响响,
11、只只能能从从符符号号上上判判断断。如如果果为为正正,表表明明解解释释变变量量越越大大,因因变变量量取取1的的概概率率越越大大;反反之之,如如果果系系数数为为负负,表表明明相相应应的的概概率率将越小。将越小。11本讲稿第十一页,共六十九页 例例例例7.17.1二元选择模型实例二元选择模型实例二元选择模型实例二元选择模型实例 考考虑虑Greene给给出出的的斯斯佩佩克克特特和和马马泽泽欧欧(1980)的的例例子子,在在例例子子中中分分析析了了某某种种教教学学方方法法对对成成绩绩的的有有效效性性。因因变变量量(GRADE)代代表表在在接接受受新新教教学学方方法法后后成成绩绩是是否否改改善善,如如果果
12、改改善善为为1,未未改改善善为为0。解解释释变变量量(PSI)代代表表是是否否接接受受新新教教学学方方法法,如如果果接接受受为为1,不不接接受受为为0。还还有有对对新新教教学学方方法法量量度度的的其其他他解解释释变变量量:平平均均分分数数(GPA)和和测测验验得得分分(TUCE),来分析新的教学方法的效果。来分析新的教学方法的效果。12本讲稿第十二页,共六十九页 (1 1)模型的估计)模型的估计)模型的估计)模型的估计 估计二元选择模型,从估计二元选择模型,从EquationSpecification对话框中,选择对话框中,选择Binary估计方法。在二元模型的设定中分为两部分。首先,在估计方
13、法。在二元模型的设定中分为两部分。首先,在EquationSpecification区域中,键入二元因变量的名字,随后键入一列回归项。区域中,键入二元因变量的名字,随后键入一列回归项。由于二元变量估计只支持列表形式的设定,所以不能输入公式。然后,由于二元变量估计只支持列表形式的设定,所以不能输入公式。然后,在在Binaryestimationmethod中选择中选择Probit,Logit,Extremevalue选择三选择三种估计方法的一种。以例种估计方法的一种。以例7.1为例,对话框如图为例,对话框如图7.2所示。所示。13本讲稿第十三页,共六十九页图图图图7.2 7.2 二元选择模型估计
14、对话框二元选择模型估计对话框二元选择模型估计对话框二元选择模型估计对话框14本讲稿第十四页,共六十九页 例例7.1的估计输出结果如下:的估计输出结果如下:15本讲稿第十五页,共六十九页参参数数估估计计结结果果的的上上半半部部分分包包含含与与一一般般的的回回归归结结果果类类似似的的基基本本信信息息,标标题题包包含含关关于于估估计计方方法法(ML表表示示极极大大似似然然估估计计)和和估估计计中中所所使使用用的的样样本本的的基基本本信信息息,也也包包括括达达到到收收敛敛要要求求的的迭迭代代次次数数。和和计计算算系系数数协协方方差差矩矩阵阵所所使使用用方方法法的的信信息息。在在其其下下面面显显示示的的
15、是是系系数数的的估估计计、渐渐近近的的标标准准误误差差、z-统统计计量量和和相相应应的的概概率率值值及及各各种种有有关关统统计量。计量。16本讲稿第十六页,共六十九页在回归结果中还提供几种似然函数:在回归结果中还提供几种似然函数:loglikelihood是是对对数数似似然然函函数数的的最最大大值值L(b),b是是未未知知参数参数 的估计值。的估计值。Avg.loglikelihood是是用用观观察察值值的的个个数数N去去除除以以对对数数似似然然函数函数L(b),即对数似然函数的平均值。,即对数似然函数的平均值。Restr.Loglikelihood是是除除了了常常数数以以外外所所有有系系数数
16、被被限限制制为为0时的极大似然函数时的极大似然函数L(b)。LR统统计计量量检检验验除除了了常常数数以以外外所所有有系系数数都都是是0的的假假设设,这这类类似似于于线线性性回回归归模模型型中中的的统统计计量量,测测试试模模型型整整体体的的显显著著性性。圆圆括号中的数字表示自由度,它是该测试下约束变量的个数。括号中的数字表示自由度,它是该测试下约束变量的个数。17本讲稿第十七页,共六十九页 Probability(LRstat)是是LR检检验验统统计计量量的的P值值。在在零零假假设设下下,LR检检验验统统计计量量近近似似服服从从于于自自由由度度等等于于检检验验下下约约束束变变量的个数的量的个数的
17、 2分布。分布。McFaddenR-squared是是计计算算似似然然比比率率指指标标,正正像像它它的的名名字字所所表表示示的的,它它同同线线性性回回归归模模型型中中的的R2是是类类似似的的。它它具具有有总总是是介介于于0和和1之间的性质。之间的性质。18本讲稿第十八页,共六十九页 利利用用式式(7.1.10),分分布布函函数数采采用用标标准准正正态态分分布布,即即Probit模模型型,例例7.1计算结果为计算结果为(7.1.15)z=(-2.93)(2.34)(0.62)(2.39)利利用用式式(7.1.15)的的Probit模模型型的的系系数数,本本例例按按如如下下公公式式给给出出新新教学
18、法对学习成绩影响的概率,教学法对学习成绩影响的概率,当当PSI=0时:时:(7.1.19)当当PSI=1时:时:(7.1.20)式式中中测测验验得得分分TUCE取取均均值值(21.938),平平均均分分数数GPA是是按按从从小小到到大大重重新新排序后的序列。排序后的序列。19本讲稿第十九页,共六十九页图图图图7.1 7.1 新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率20本讲稿第二十页,共六十九页(2 2)估计选项估计选项估计选项估计选项 因因为为我我们们是是用用迭迭代代法法求求极极大大似似然然函函数数的的最最大大值值,所所以
19、以Option选选项项可可以以从从估估计计选选项项中中设设定定估估计计算算法法与与迭迭代代限限制制。单单击击Options按钮,打开对话框如图按钮,打开对话框如图7.3所示。所示。图图图图7.3Options7.3Options对话框对话框对话框对话框21本讲稿第二十一页,共六十九页Option对话框有以下几项设置:对话框有以下几项设置:稳稳稳稳健健健健标标标标准准准准差差差差(RobustStandardErrors)对对二二元元因因变变量量模模 型型 而而 言言,EViews允允 许许 使使 用用 准准-极极 大大 似似 然然 函函 数数(Huber/White)或或广广义义的的线线性性模
20、模型型(GLM)方方法法估估计计标标准准误误差差。察察看看RobustCovariance对对话话框框,并并从从两两种种方方法法中中选选择择一一种。种。初初初初始始始始值值值值EViews的的默默认认值值是是使使用用经经验验运运算算法法则则而而选选择择出出来来的的,适用于二元选择模型的每一种类型。适用于二元选择模型的每一种类型。估估估估计计计计法法法法则则则则在在Optimizationalgorithm一一栏栏中中选选择择估估计计的的运运算算法法则则。默默认认地地,EViews使使用用quadratichill-climbing方方法法得得到到参参数数估估计计。这这种种运运算算法法则则使使用
21、用对对数数似似然然分分析析二二次次导导数数的的矩矩阵阵来来形形成成迭迭代代和和计计算算估估计计的的系系数数协协方方差差矩矩阵阵。还还有有另另外外两两种种不不同同的的估估计计法法则则,Newton-Raphson也也使使用用二二次次导导数数,BHHH使使用用一一次次导导数数,既确定迭代更新,又确定协方差矩阵估计。既确定迭代更新,又确定协方差矩阵估计。22本讲稿第二十二页,共六十九页 (3 3)预测)预测)预测)预测从从 方方 程程 工工 具具 栏栏 选选 择择 Procs/Forecast(Fitted Probability/Index),然然 后后 单单 击击 想想 要要 预预 测测 的的
22、对对 象象。既既 可可 以以 计计 算算 拟拟 合合 概概 率率,也可以计算指标,也可以计算指标的拟合值。的拟合值。像像其其他他方方法法一一样样,可可以以选选择择预预测测样样本本,显显示示预预测测图图。如如果果解解释释变变量量向向量量xt包包括括二二元元因因变变量量yt的的滞滞后后值值,选选择择Dynamic选选项项预预测测,EViews使使用用拟拟合合值值得得到到预预测测值值;而而选选择择Static选选项项,将将使使用用实实际际的的(滞后的)(滞后的)yt-1得到预测值。得到预测值。对对于于这这种种估估计计方方法法,无无论论预预测测评评价价还还是是预预测测标标准准误误差差通通常常都都无无法
23、法自自动动计计算算。后后者者能能够够通通过过使使用用View/CovarianceMatrix显显示示的的系系数数方方差矩阵,或者使用差矩阵,或者使用covariance函数来计算。函数来计算。23本讲稿第二十三页,共六十九页可可以以在在各各种种方方式式上上使使用用拟拟合合指指标标,举举个个例例子子,计计算算解解释释变变量量的的边边际际影影响响。计计算算预预测测拟拟合合的的指指标标,并并用用序序列列xb中中保保存存 这这 个个 结结 果果。然然 后后 生生 成成 序序 列列 dnorm(-xb)、dlogistic(-xb)、dextreme(-xb),可可以以与与估估计计的的系系数数 j相相
24、乘乘,提提供供一一个个yi的的期期望望值值对对xi的的第第j个分量的导数的估计。个分量的导数的估计。(7.5.1)24本讲稿第二十四页,共六十九页(4 4)产生残差序列)产生残差序列)产生残差序列)产生残差序列通通过过Procs/MakeReidualSeries选选项项产产生生下下面面三三种种残残差差类类型型中中的的一一种类型。种类型。表表表表7.6 7.6 残差类型残差类型残差类型残差类型普通残差普通残差(Ordinary)标准化残差标准化残差(Standardized)广义残差广义残差(Generalized)25本讲稿第二十五页,共六十九页7.27.2排序选择模型排序选择模型排序选择模
25、型排序选择模型当当因因变变量量不不止止是是两两种种选选择择时时,就就要要用用到到多多元元选选择择模模型型(multiplechoicemodel)。多多元元离离散散选选择择问问题题普普遍遍存存在在于于经经济济生活中。例如:生活中。例如:(1)一一个个人人面面临临多多种种职职业业选选择择,将将可可供供选选择择的的职职业业排排队队,用用0,1,2,3表表示示。影影响响选选择择的的因因素素有有不不同同职职业业的的收收入入、发发展前景和个人偏好等;展前景和个人偏好等;(2)同同一一种种商商品品,不不同同的的消消费费者者对对其其偏偏好好不不同同。例例如如,十十分分喜喜欢欢、一一般般喜喜欢欢、无无所所谓谓
26、、一一般般厌厌恶恶和和十十分分厌厌恶恶,分分别别用用0,1,2,3,4表表示示。而而影影响响消消费费者者偏偏好好的的因因素素有有商商品品的的价价格格、性性能能、收收入入及及对对商商品品的需求程度等;的需求程度等;(3)一一个个人人选选择择上上班班时时所所采采用用的的方方式式自自己己开开车车,乘乘出租车,乘公共汽车,还是骑自行车。出租车,乘公共汽车,还是骑自行车。26本讲稿第二十六页,共六十九页 上上述述3个个例例子子代代表表了了多多元元选选择择问问题题的的不不同同类类型型。前前两两个个例例子子属属于于排排序序选选择择问问题题,所所谓谓“排排序序”是是指指在在各各个个选选择择项项之之间间有有一一
27、定定的的顺顺序序或或级级别别种种类类。而而第第3个个例例子子只只是是同同一一个个决决策策者者面面临临多多种种选选择择,多多种种选选择择之之间间没没有有排排序序,不不属属于于排排序序选选择择问问题题。与与一一般般的的多多元元选选择择模模型型不不同同,排排序序选选择择问问题题需需要要建建立立排排序序选选择择模模型型(orderedchoicemodel)。下下面我们主要介绍排序选择模型。面我们主要介绍排序选择模型。27本讲稿第二十七页,共六十九页与与二二元元选选择择模模型型类类似似,设设有有一一个个潜潜在在变变量量yi*,是是不不可可观观测测的的,可可观测的是观测的是yi,设,设yi 有有0,1,
28、2,M等等M+1个取值。个取值。(7.2.1)其中:其中:ui*是独立同分布的随机变量,是独立同分布的随机变量,yi 可以通过可以通过yi*按下式得到按下式得到(7.2.2)28本讲稿第二十八页,共六十九页设设ui*的分布函数为的分布函数为F(x),可以得到如下的概率,可以得到如下的概率(7.2.3)和和二二元元选选择择模模型型一一样样,根根据据分分布布函函数数F(x)的的不不同同可可以以有有3种种常常见见的的模模型型:Probit模模型型、Logit模模型型和和Extremevalue模模型型。仍仍然然采采用用极极大大似似然然方方法法估估计计参参数数,需需要要指指出出的的是是,M个个临临界界
29、值值c1,c2,cM 事事先先也也是是不确定的,所以也作为参数和回归系数一起估计。不确定的,所以也作为参数和回归系数一起估计。29本讲稿第二十九页,共六十九页 例例例例7.27.2排序模型的实例排序模型的实例排序模型的实例排序模型的实例 在在调调查查执执政政者者的的支支持持率率的的民民意意测测验验中中,由由于于执执政政者者执执行行了了对对某某一一收收入入阶阶层层有有利利的的政政策策而而使使得得不不同同收收入入的的人人对对其其支支持持不不同同,所所以以收收入入成成为为决决定定人人们们是是否否支支持持的的因因素素。通通过过调调查查取取得得了了市市民民收收入入(INC)与与支支持持与与否否(Y)的的
30、数数据据,其其中中如如果果选选民民支支持持则则Yi取取0,中中立立取取1,不不支支持持取取2。我们选取。我们选取24个样本进行排序选择模型分析。个样本进行排序选择模型分析。30本讲稿第三十页,共六十九页 1 1 模型的估计模型的估计模型的估计模型的估计 与二元选择模型类似,从主菜单中选择与二元选择模型类似,从主菜单中选择Objects/NewObject,并从该菜单中选择,并从该菜单中选择Equation选项。从选项。从EquationSpecification对话框,选择估计方法对话框,选择估计方法ORDERED,标准估计对话标准估计对话框将会改变以匹配这种设定。在框将会改变以匹配这种设定。
31、在EquationSpecification区域,区域,键入排序因变量的名字,其后列出回归项。排序估计也只支持键入排序因变量的名字,其后列出回归项。排序估计也只支持列表形式的设定,不用输入一个明确的方程。然后选择列表形式的设定,不用输入一个明确的方程。然后选择Normal,Logist,ExtremeValue三种误差分布中的一种,单三种误差分布中的一种,单击击OK按钮即可。对话框如图按钮即可。对话框如图7.4所示。所示。31本讲稿第三十一页,共六十九页图图图图7.4 7.4 排序模型的输入对话框排序模型的输入对话框排序模型的输入对话框排序模型的输入对话框32本讲稿第三十二页,共六十九页 例例
32、7.2估计结果如下:估计结果如下:33本讲稿第三十三页,共六十九页有有两两点点需需要要指指出出:首首先先,EViews不不能能把把常常数数项项和和临临界界值值区区分分开开,因因此此在在变变量量列列表表中中设设定定的的常常数数项项会会被被忽忽略略,即即有有无无常常数数项项都都是是等等价价的的。其其次次,EViews要要求求因因变变量量是是整整数数,否否则则将将会会出出现现错错误误信信息息,并并且且估估计计将将会会停停止止。然然而而,由由于于我我们们能能够够在在表表达达式式中中使使用用round、floor或或ceil函函数数自自动动将将一一个个非非整整数数序序列列转转化化成成整整数数序序列,因此
33、这并不是一个很严格的限制。列,因此这并不是一个很严格的限制。估估计计收收敛敛后后,EViews将将会会在在方方程程窗窗口口显显示示估估计计结结果果。表表头头包包含含通通常常的的标标题题信信息息,包包括括假假定定的的误误差差分分布布、估估计计样样本本、迭迭代代和和收收敛敛信信息息、y的的排排序序选选择择值值的的个个数数和和计计算算系系数数协协方方差差矩矩阵阵的的方方法法。在在标标题题信信息息之之下下是是系系数数估估计计和和渐渐近近的的标标准准误误差差、相相 应应 的的 z-统统 计计 量量 及及 概概 率率 值值。然然 后后,还还 给给 出出 了了 临临 界界 值值LIMIT_1:C(2),LI
34、MIT_2:C(3)的估计及相应的统计量。的估计及相应的统计量。34本讲稿第三十四页,共六十九页 2.2.常用的两个过程常用的两个过程常用的两个过程常用的两个过程MakeOrderedLimitVector产产生生一一个个临临界界值值向向量量c,此此向向 量量 被被 命命 名名 为为 LIMITS01,如如 果果 该该 名名 称称 已已 被被 使使 用用,则则 命命 名名 为为LIMITS02,以此类推。,以此类推。MakeOrderedLimitCovarianceMatrix产产生生临临界界值值向向量量c的的估估计计值值的的协协方方差差矩矩阵阵。命命名名为为VLIMITS01,如如果果该该
35、名名称称已已被被使使用,则命名为用,则命名为VLIMITS02,以此类推。,以此类推。35本讲稿第三十五页,共六十九页 3.3.预测预测预测预测 因因为为排排序序选选择择模模型型的的因因变变量量代代表表种种类类或或等等级级数数据据,所所以以不不能能从从估估计计排排序序模模型型中中直直接接预预测测。选选择择Procs/MakeModel,打打开开一一个个包包含含方方程程系系统统的的没没有有标标题题的的模模型型窗窗口口,单单击击模模型型窗窗口口方方程程栏栏的的Solve按按钮钮。例例7.2因因变变量量 y的的拟拟合合线线性性指指标标 序序列列被被命命名名为为i_Y_0,拟拟和和值值落落在在第第一一
36、类类中中的的拟拟合合概概率率被被命命名名为为Y_0_0的的序序列列,落落在在第第二二类类中中的的拟拟合合概概率率命命名名为为Y_1_0的的序序列列中中,落落在在第第三三类类中中的的拟拟合合概概率率命命名名为为Y_2_0的的序序列列中中,等等等等。注注意意对每一个观察值,落在每个种类中的拟合概率相加值为对每一个观察值,落在每个种类中的拟合概率相加值为1。表表7.7中中Y_0_0,Y_1_0,Y_2_0分分别别是是支支持持、中中立立、不不支支持的概率,持的概率,Y,INC是实际样本。是实际样本。36本讲稿第三十六页,共六十九页 4 4产生残差序列产生残差序列产生残差序列产生残差序列选选择择Proc
37、/MakeResidualSeries产产生生广广义义残残差差序序列列,输输入入一一个个名名字字或或用用默默认认的的名名字字,然然后后单单击击OK按按钮钮。一一个个排排序序模模型型的的广广义义残残差差由由下下式式给出:给出:(7.5.2)其中:其中:c0=-,cM+1=。37本讲稿第三十七页,共六十九页7.37.3受限因变量模型受限因变量模型受限因变量模型受限因变量模型 现现实实的的经经济济生生活活中中,有有时时会会遇遇到到这这样样的的问问题题,因因变变量量是是连连续续的的,但但是是受受到到某某种种限限制制,也也就就是是说说所所得得到到的的因因变变量量的的观观测测值值来来源源于于总总体体的的一
38、一个个受受限限制制的的子子集集,并并不不能能完完全全反反映映总总体体的的实实际际特特征征,那那么么通通过过这这样样的的样样本本观观测测值值来来推推断断总总体体的的特特征征就就需需要要建建立立受受限限因因变变量量模模型型(limiteddependentvariablemodels)。本本节节研研究究两两类类受受限限因因变变量量模模型型,即即审审查查回回归归模模型型(censoredregressionmodels)和和截截断断回回归归模模型型(truncatedregressionmodels)。38本讲稿第三十八页,共六十九页 7.3.1 7.3.1 审查回归模型审查回归模型审查回归模型审查
39、回归模型 1 1模型的形式模型的形式模型的形式模型的形式考虑下面的潜在因变量回归模型考虑下面的潜在因变量回归模型(7.3.1)其其中中:是是比比例例系系数数;y*是是潜潜在在变变量量。被被观观察察的的数数据据y 与与潜潜在在变变量量y*的关系如下:的关系如下:(7.3.2)39本讲稿第三十九页,共六十九页换换句句话话说说,yi*的的所所有有负负值值被被定定义义为为0值值。我我们们称称这这些些数数据据在在0处处进进行行了了左左截截取取(审审查查)(leftcensored)。而而不不是是把把观观测测不不到到的的yi*的的所所有有负负值值简简单单地地从从样样本本中中除除掉掉。此此模模型型称称为为规
40、规范范的的审审查查回回归归模模型型,也称为也称为Tobit模型。模型。更一般地,可以在任意有限点的左边和右边截取(审查),即更一般地,可以在任意有限点的左边和右边截取(审查),即(7.3.3)其中:其中:,代表截取(审查)点,是常数值。如果没有左截取代表截取(审查)点,是常数值。如果没有左截取(审查审查)点,可以设为点,可以设为 。如果没有右截取。如果没有右截取(审查审查)点,可以设为点,可以设为 。规范的。规范的Tobit模型是具有模型是具有 和和 的一个特例。的一个特例。40本讲稿第四十页,共六十九页2 2审查回归模型的极大似然估计审查回归模型的极大似然估计审查回归模型的极大似然估计审查回
41、归模型的极大似然估计 与与前前边边介介绍绍的的几几个个模模型型类类似似,可可以以采采用用极极大大似似然然法法估估计计审审查查回回归归模模型的参数,对数似然函数为型的参数,对数似然函数为(7.3.4)求式求式(7.3.4)的最大值即可得参数的最大值即可得参数,的估计。这里的估计。这里f,F分别是分别是u的密的密度函数和分布函数。度函数和分布函数。41本讲稿第四十一页,共六十九页特别地,对于特别地,对于Tobit模型,设模型,设uN(0,1),这时对数似然函数为,这时对数似然函数为(7.3.5)式式(7.3.5)是是由由两两部部分分组组成成的的。第第一一部部分分对对应应没没有有限限制制的的观观测测
42、值值,与与经经典典回回归归的的表表达达式式是是相相同同的的;第第二二部部分分对对应应于于受受限限制制的的观观测测值值。因因此此,此此似似然然函函数数是是离离散散分分布布与与连连续续分分布布的的混混合合。将将似似然然函数最大化就可以得到参数的极大似然估计。函数最大化就可以得到参数的极大似然估计。42本讲稿第四十二页,共六十九页 例例例例7.37.3审查模型的实例审查模型的实例审查模型的实例审查模型的实例 本本例例研研究究已已婚婚妇妇女女工工作作时时间间问问题题,共共有有50个个调调查查数数据据,来来自自于于美美国国国国势势调调查查局局U.S.BureauoftheCensus(CurrentPo
43、pulationSurvey,1993),其其中中y 表表示示已已婚婚妇妇女女工工作作时时间间,x1 x4分分别别表表示示已已婚婚妇妇女女的的未未成成年年子子女女个个数数、年年龄龄、受受教教育育的的年年限限和和丈丈夫夫的的收收入入。只只要要已已婚婚妇妇女女没没有有提提供供工工作作时时间间,就就将将工工作作时时间间作作零零对对待待,符符合合审查回归模型的特点。审查回归模型的特点。43本讲稿第四十三页,共六十九页 7.3.27.3.2截断回归模型截断回归模型截断回归模型截断回归模型 截截断断问问题题,形形象象地地说说就就是是掐掐头头或或者者去去尾尾。即即在在很很多多实实际际问问题题中中,不不能能从
44、从全全部部个个体体中中抽抽取取因因变变量量的的样样本本观观测测值值,而而只只能能从从大大于于或或小小于于某某个个数数的的范范围围内内抽抽取取样样本本的的观观测测值值,此此时时需需要要建建立立截截断断因因变变量量模模型型。例例如如,在在研研究究与与收收入入有有关关的的问问题题时时,收收入入作作为为被被解解释释变变量量。从从理理论论上上讲讲,收收入入应应该该是是从从零零到到正正无无穷穷,但但实实际际中中由由于于各各种种客客观观条条件件的的限限制制,只只能能获获得得处处在在某某个个范范围围内内的的样样本本观观测测值值。这这就就是是一一个个截截断断问问题题。截断回归模型的形式如下:截断回归模型的形式如
45、下:(7.3.7)其其中中:yi 只只有有在在时时才才能能取取得得样样本本观观测测值值,,为为两两个个常数。常数。对对于于截截断断回回归归模模型型,仍仍然然可可以以采采用用极极大大似似然然法法估估计计模模型型的的参参数,只不过此时极大似然估计的密度函数是条件密度。数,只不过此时极大似然估计的密度函数是条件密度。44本讲稿第四十四页,共六十九页 7.5.37.5.3估计估计估计估计审查回归审查回归审查回归审查回归模型模型模型模型 1.1.1.1.模型的估计模型的估计模型的估计模型的估计 为估计审查模型,打开为估计审查模型,打开Equation对话框,从对话框,从EquationSpecifica
46、tion对话框所列估计方法中选择对话框所列估计方法中选择CENSORED估计方法。估计方法。在在EquationSpecification区域,输入被审查的因变量的名字及一系列区域,输入被审查的因变量的名字及一系列回归项。审查回归模型的估计只支持列表形式的设定回归项。审查回归模型的估计只支持列表形式的设定(图图7.5)。45本讲稿第四十五页,共六十九页 图图图图7.5 7.5 审查模型的估计对话框审查模型的估计对话框审查模型的估计对话框审查模型的估计对话框46本讲稿第四十六页,共六十九页 在三种分布中选择一种作为误差项的分布,在三种分布中选择一种作为误差项的分布,EViews提供三种可供选提供
47、三种可供选择的分布择的分布(表表7.8)。表表表表7.87.8误差项的分布误差项的分布误差项的分布误差项的分布 StandardnormalLogisticExtremevalue (欧拉常数欧拉常数)还还需需要要在在DependentVariableCensoringPoints一一栏栏提提供供关关于于被被检检查查因因变变量量的的临临界界点点的的信信息息。临临界界点点可可以以是是数数值值、表表达达式式、序序列列,还还可可以是空的。有两种情况需要考虑:以是空的。有两种情况需要考虑:临界点对于所有个体都是已知的;临界点对于所有个体都是已知的;临界点只对具有审查观察值的个体是已知的。临界点只对具有
48、审查观察值的个体是已知的。47本讲稿第四十七页,共六十九页 (1 1)临界点对所有个体都已知)临界点对所有个体都已知)临界点对所有个体都已知)临界点对所有个体都已知按按照照要要求求在在编编辑辑栏栏的的左左编编辑辑区区(Left)和和右右编编辑辑区区(Right)输输入入临临界界点点表表达达式式。注注意意如如果果在在编编辑辑区区域域留留下下空空白白,EViews将将假假定定该种类型的观测值没有被审查。该种类型的观测值没有被审查。例例如如,在在规规范范的的Tobit模模型型中中,数数据据在在0值值左左边边审审查查,在在0值值右右边边不不被被审审查。这种情况可以被指定为:查。这种情况可以被指定为:左
49、编辑区:左编辑区:0右编辑区:右编辑区:blank而一般的左边和右边审查由下式给出:而一般的左边和右边审查由下式给出:左编辑区:左编辑区:右编辑区:右编辑区:EViews也也允允许许更更一一般般的的设设定定,这这时时审审查查点点已已知知,但但在在观观察察值值之之间间有有所所不同。简单地在适当的编辑区域输入包含审查点的序列名字。不同。简单地在适当的编辑区域输入包含审查点的序列名字。48本讲稿第四十八页,共六十九页(2 2)临临临临界界界界点点点点通通通通过过过过潜潜潜潜在在在在变变变变量量量量产产产产生生生生并并并并且且且且只只只只对对对对被被被被审审审审查查查查的的的的观观观观测测测测值值值值
50、个个个个体体体体已知已知已知已知在在一一些些情情况况下下,假假设设临临界界点点对对于于一一些些个个体体(和和不不是是对对所所有有的的观观察察值值都都是是可可观观察察到到的的)是是未未知知的的,此此时时可可以以通通过过设设置置0-1虚虚拟拟变变量量(审审查查指指示示变变量量)来来审审查查数数据据。EViews提提供供了了另另外外一一种种数数据据审审查查的的方方法法来来适适应应这这种种形形式式。简简单单地地,在在估估计计对对话话框框中中选选择择Fieldiszero/oneindicatorofcensoring选选项项,然然后后在在合合适适的的编编辑辑区区域域输输入入审审查查指指示示变变量量的的