第十章定性选择模型与受限因变量模型.ppt-淘文阁

资源描述

《第十章定性选择模型与受限因变量模型.ppt》由会员分享，可在线阅读，更多相关《第十章定性选择模型与受限因变量模型.ppt（58页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第十章定性选择模型与受限因变量模型现在学习的是第1页，共58页对于被解释变量而言，很多情况也会对其取值有所限制。有时，因变量描述的是微观个体的某种选择、特征或所属等，即因变量为定性变量，相应的模型称为定性选择模型定性选择模型或定性响定性响应模型应模型；另一些情况是，因变量的取值被限定在某个特殊范围，一般我们称这类取值范围受到限制的因变量为受限因变量，相应的模型称为受限因变量模型受限因变量模型。两类模型样本数据一般是横截面数据。两类模型被广泛应用于消费者行为、劳动经济学、农业经济学等领域，大多属于微观计量经济学的研究范畴。本章介绍几种常见的定性选择模型与受限因变量模型。现在学习的是第2页，共58

2、页第一节线性概率模型因变量为虚拟变量的模型被称为定性选择模型或定性响应模型。如果只有两个选择，我们可用0和1分别表示它们，如乘公交为0，自驾车为1，这样的模型称为二元选择模型（binary choice Models），多于两个选择（如上班方式加上一种骑自行车）的定性选择模型称为多项选择模型（Multinomial choice models）。我们先从基础的二元选择模型入手，介绍定性选择模型的设定和估计。最简单的二元选择模型是线性概率模型（Linear Probability Models,LPM）。现在学习的是第3页，共58页一、线性概率模型的概念一、线性概率模型的概念下面用一个关于

3、是否读研究生的例子来说明如何解释线性概率模型的结果。模型为：其中：现在学习的是第4页，共58页设回归结果如下（所有系数值均在10%水平统计上显著）：对每个观测值，我们可根据（10.3）式计算因变量的拟合值或预测值。在常规OLS回归中，因变量的拟合值或预测值的含义是，平均而言，我们可以预期的因变量的值。但在本例的情况下，这种解释就不适用了。假设学生甲的平均分为3.5，家庭年收入为5万美元，Y的拟合值为现在学习的是第5页，共58页尽管因变量在这个二元选择模型中只能取两个值：0或1，可是该学生的的拟合值或预测值为0.8。我们将该拟合值解释为该生决定读研的概率的估计值。因此，该生决定读研的可能性或

4、概率的估计值为0.8。需要注意的是，这种概率不是我们能观测到的数字，能观测的是读研还是不读研的决定。对斜率系数的解释也不同了。在常规回归中，斜率系数代表的是其他解释变量不变的情况下，该解释变量的单位变动引起的因变量的变动。而在线性概率模型中，斜率系数表示其他解释变量不变的情况下，该解释变量的单位变动引起的因变量等于1的概率的变动。现在学习的是第6页，共58页 CPA的系数估计值0.4意味着家庭收入不变的情况下，一个学生的增加一个点（如从3.0到4.0），该生决定去读研的概率的估计值增加0.4。INCOME的系数估计值0.002表明，一个学生的成绩不变，而家庭收入增加1000美元（单位为千美元）

5、，该生决定去读研的概率的估计值增加0.002。LPM模型中，解释变量的变动与虚拟因变量值为1的概率线性相关，因而称为线性概率模型。现在学习的是第7页，共58页二、线性概率模型的估计和问题二、线性概率模型的估计和问题第一个问题是线性概率模型存在异方差性。扰动项的方差是，这里 p 是因变量等于1的概率，此概率对于每个观测值不同，因而扰动项方差将不是常数，导致异方差性。可以使用WLS法，但不是很有效，并且将改变结果的含义。第二个问题是扰动项不是正态分布的。事实上，线性概率模型的扰动项服从二项分布。第三个问题，它假定自变量与Y=1的概率之间存在线性关系，而此关系往往不是线性的。现在学习的是第8页，共

6、58页第四个问题是，拟合值可能小于0或大于1，而概率值必须位于0和1的闭区间内。回到有关读研的例子。假设学生乙的为4.0，家庭收入为20万美元，则代入（10.3）式，Y的拟合值为从而得到一个不可能的结果（概率值大于1）。假设另有一个学生丙的为1.0，家庭收入为5万元，则其Y的拟合值为-0.2，表明读研的概率为负数，这也是一个不可能的结果。现在学习的是第9页，共58页解决此问题的一种方法是，令所有负拟合值都等于0，所有大于1的拟合值都等于1。但也无法令人十分满意，因为在现实中很少会有决策前某人读研的概率就等于1的情况，同样，尽管某些人成绩不是很好，但他去读研的机会仍会大于0。线性概率模型倾

7、向于给出过多的极端结果：估计的概率等于0或1。现在学习的是第10页，共58页第五个问题是在线性概率模型中，以及不再是合适的拟合优度测度。事实上，此问题不仅是线性概率模型的问题，而是所有定性选择模型的问题。较好一点的测度是模型正确预测的观测值的百分比。首先，我们将每一预测归类为1或0。如果拟合值大于等于0.5，则认为因变量的预测值为1。若小于0.5，则认为因变量的预测值为0。然后，将这些预测值与实际发生的情况相比较，计算出正确预测的百分比：现在学习的是第11页，共58页需要指出的是，这个测度也不是很理想，但预测结果的好坏，并非定性选择模型唯一关心的事，这类模型常被用于研究影响人们进行某个决

8、策的因素。让我们来看一个竞选的例子。假设候选人甲和乙二人竞选某市市长，我们可以用一个二元选择模型来研究影响选民决策的因素，模型为：其中：现在学习的是第12页，共58页VariableCoefficientStandard errort-Statisticp-ValueConstant-0.510.19-2.650.01 INCOME0.00980.0033.250.00 AGE0.0160.00533.080.00 MALE0.00310.130.020.98 表10.2 两候选人选举线性概率模型回归结果Dependent variable：CAND1Observations：30 =0.58

9、Adjusted =0.53Residual Sum of Squares=3.15F-statistic=11.87现在学习的是第13页，共58页如表所示，INCOME的斜率估计值为正，且在1%的水平上显著。年龄和性别不变的情况下，收入增加1000元，选择候选人甲的概率增加0.0098。AGE的斜率估计值也在1%的水平上显著。在收入和性别不变的情况下，年龄增加1岁，选择候选人甲的概率增加0.016。的斜率系数统计上不显著，因而没有证据表明样本中男人和女人的选票不同。我们可以得出如下结论：年老一些、富裕一些的选民更喜欢投票给候选人甲。表中给出CAND1的拟合值，每个大于等于0.5的拟合值计入

10、CAND1为1的预测，而小于0.5的拟合值则计入CAND1为0的预测。现在学习的是第14页，共58页从表可看出，30个观测值中，27个（或90%）预测正确。选甲的14人中，12人（或85.7%）预测正确。选乙的16人中，15人（或93.8%）预测正确。是0.58，表明模型解释了因变量的58%的变动，这与90%的正确预测比例相比，低了不少。注意表103中有一些拟合值大于1或小于0。这是我们前面指出的这类模型的缺点之一，这些拟合值是概率的估计值，而概率永远不可能大于1或小于0。现在学习的是第15页，共58页第二节 Probit模型和Logit模型虽然估计和使用线性概率模型很简单，但存在上面讨论的

11、几个问题，其中最严重的两个问题是拟合值小于0或大于1的问题和假定自变量和的概率之间存在线性关系的假设不现实的问题。使用更为复杂的二元响应模型可以克服这些缺陷现在学习的是第16页，共58页一Probit和Logit模型的设定估计二元选择模型的另一类方法假定回归模型为这里不可观测，通常称为潜变量（latent variable）。我们能观测到的是虚拟变量：现在学习的是第17页，共58页这就是Probit和Logit方法的思路。Probit模型和Logit模型的区别在于对中扰动项u的分布的设定，前者设定为正态分布，后者设定为logistic分布。与线性概率模型的区别是，这里假设潜变量的存在

12、。例如，若被观测的虚拟变量是某人买车还是不买车，将被定义为“买车的欲望或能力”，注意这里的提法是“欲望”和“能力”，因此解释变量是解释这些元素的。可以看出，乘上任何正数都不会改变，因此这里习惯上假设 Var(ui)=1，从而固定的规模。我们有现在学习的是第18页，共58页其中F是u的累积分布函数。如果u的分布是对称的，则，我们可以将上式写成我们可写出似然函数：现在学习的是第19页，共58页上式中F的函数形式取决于有关扰动项u的假设，如果的累积分布是logistic分布，则我们得到的是logit模型。在这种情况下，累积分布函数为：因此现在学习的是第20页，共58页请注意，对于logit模

13、型：上式的左端是机会（odds）的对数，称为对数机会比率（log-odds ratio），因而上式表明对数机会比率是各解释变量的线性函数，而对于线性概率模型，为各解释变量的线性函数。如果服从正态分布，我们得到的是probit模型（或normit模型），在这种情况下，累积分布函数为：现在学习的是第21页，共58页无论是probit模型还是logit模型，极大似然函数都伴随着非线性估计方法，目前很多计量经济分析软件已可用于probit和logit分析，用起来很方便。由于累积正态分布和累积logistic分布很接近，只是尾部有点区别，因此，我们无论logit法还是probit法，得到的结果都不会

14、有很大不同。可是，两种方法得到的参数估计值不是直接可比的。由于logistic分布的方差为，因此，logit模型得到的的估计值必须乘以，才能与probit模型得到的估计值相比较（正态分布标准差为1）。现在学习的是第22页，共58页概率=F(Z)10ZProbit模型线性概率模型图10-1 线性概率模型和Probit模型现在学习的是第23页，共58页二、二、Probit模型和模型和Logit模型的极大似模型的极大似然估计和假设检验然估计和假设检验估计LPM，我们可以采用OLS或WLS。在Probit模型和Logit模型中，由于的非线性性质，OLS或WLS都不再适用。估计Probit模型和Lo

15、git模型，通常采用极大似然法。现在学习的是第24页，共58页极大似然估计量（MLE）即由极大化此对数似然函数得到。对于logit模型，G是标准logistic cdf，是logit估计量；对于probit模型，G是标准正态cdf，是probit估计量。由于此最大化问题的非线性性质，我们很难写出Probit模型和Logit模型的参数的极大似然估计量的具体表达式。可以证明，在很一般的条件下，MLE是一致的、渐近正态和渐近有效的(一般性讨论参见Woodridge（2002）。现在学习的是第25页，共58页伴随每一个极大似然估计值，有一个与之对应的标准误差。支持Probit和Logit的软件包在给出

16、系数估计值的同时会给出与之对应的标准误差。一旦我们从软件包的报告中得到了标准误差，就可以构造（渐近的）t检验和置信区间，与应用OLS、2SLS估计量做检验时一样。例如要检验，我们做法是，构造t统计量，然后按通常的检验程序进行检验。我们也可以对Probit模型和Logit模型的参数的多重约束(即关于的多个线性或非线性约束)进行检验，可以采用沃尔德检验、拉格朗日乘数检验和似然比检验，详细讨论见第4、5章有关内容。现在学习的是第26页，共58页三、偏效应三、偏效应在二元响应模型的大多数应用中，首要的目标是解释对响应概率的影响。在潜变量模型中，对潜变量的偏效应是，我们下面将看到对响应概率的偏效应

17、是，对正态分布和logistic分布而言，总有，因而上述两个效应的符号相同，影响的方向总是一致的。潜变量极少有一个确定的度量单位，因而本身的大小，往往不是很有用的（相对于线性概率模型而言）。对于大多数应用而言，我们要估计的是解释变量对响应概率的影响。由于的非线性本质，使得这个工作相当复杂，通常需要区分为连续变量和离散变量两种情况。现在学习的是第27页，共58页（1）如果是一个大致连续的变量，则无论Probit模型还是Logit模型，对响应概率的偏效应都在处取最大值：在Probit模型中，；在Logit模型中，（2）对于离散解释变量，微分没有实际意义。若离散解释变量从变化到，则其对响应概率

18、的离散偏效应可由下式表示现在学习的是第28页，共58页与LPM模型相比，偏效应的值多出一个乘积项，称为比例因子（scale factor）或调整因子（adjustment factor），它与全部解释变量有关，因而会随的值而变。在计算偏效应时，为方便起见，通常希望有一个适用于模型中所有斜率的比例因子。有两种方法解决这个问题：第一种方法是用解释变量观测值的均值计算偏效应的表达式，比例因子为第二种方法是对每个观测值计算偏效应，然后计算它们的样本均值，这样得到的是平均偏效应（average partial effect,APE）。现在学习的是第29页，共58页四、拟合优度的测度四、拟合优度的测度从实

19、际角度看，在现代计算机解决了复杂的计算问题之后，Probit和Logit模型最困难之处就落在模型结果的提供和解释方面。支持Probit和Logit的软件包都会报告系数估计值、它们的标准误差和对数似然函数值。如同在线性概率模型中讨论的一样，Probit模型和Logit模型也可以计算正确预测的百分比这一指标作为拟合优度的测度。首先，我们将每一预测归类为1或0。如果拟合值大于等于0.5，则认为因变量的预测值为1。若小于0.5，则认为因变量的预测值为0。然后，将这些预测值与实际发生的情况相比较，计算出正确预测的百分比。现在学习的是第30页，共58页尽管正确预测的百分比作为拟合优度的测度是有用的，但它也

20、可能造成误导，特别是在对小可能结果的预测非常糟糕的情况下仍能得到相当高的正确预测的百分比。例如，假设n200，160个观测值为，这160个观测值中，有140个预测值也是0，即使对于的那40个观测值的预测都错，正确预测全部结果的百分比仍高达70！度量Probit和Logit模型的拟合优度的测度还可以采用各种pseudo-R2。pseudo-原意是伪(假)，这里采用它，意思是与常规R2类似但不相同，而不是说它是假的。对于Probit模型和Logit模型，已经开发了几种有用的pseudo-R2测度，其中最常用的是McFadden(1974)提出的pseudo-R2测度现在学习的是第31页，共58页

21、表104 两候选人选举模型的Probit回归结果Dependent variable：CAND1VariableCoefficientStandard errort-Statisticp-ValueConstant-5.191.70-3.060.00 INCOME0.0710.0342.10 0.04 AGE0.0730.0342.180.03 MALE-0.70 0.90-0.780.44 Observations：30McFadden pseudo-R2=0.61Residual Sum of Squares=2.62现在学习的是第32页，共58页采用Probit模型估计的结果与前面用线

22、性概率模型估计的结果有所不同。采用Probit模型的情况下，INCOME和AGE的系数估计值在5%的误差水平上显著，而在线性概率模型的情况下，在1%的水平上显著。由于我们知道线性概率模型存在严重的问题，因此Probit结果可能更准确一些。可是，如果是实际研究的话，要有一个大得多的样本。Probit模型的系数估计值不能像线性概率模型那样，解释成概率的变动（有些计量经济分析软件程序可以将系数估计值转换为与线性概率模型相当的概率变动）。使用Probit模型的一种有意思的方式是求出拟合值进行预测，如我们用线性概率模型所做的一样。现在学习的是第33页，共58页 Probit模型中用McFadden的ps

23、eudo-R2作为拟合优度的测度。pseudo-R2是用于虚拟因变量模型的拟合优度的测度的名字。pseudo-原意是伪（假），这里采用它，意思是与常规R2类似但不相同，而不是说它是假的。对于定性选择模型，已经开发了几种有用的pseudo-R2测度，这里所用的是McFadden开发的。很多估计Probit或Logit模型的计量经济程序计算pseudo-R2。本例中给出的0.61的含义是，Probit模型解释了因变量61%的变动。现在学习的是第34页，共58页与probit模型一样，logit模型也不能用OLS法估计，而要用极大似然法估计。采用表10-1中的同样数据估计logit模型，回归结果如

24、表10-5所示。表10-5 两候选人选举模型的Logit回归结果Dependent variable：CAND1VariableCoefficientStandard errort-Statisticp-ValueConstant-8.963.23-2.770.01INCOME0.120.061.980.05AGE0.130.062.030.04MALE-1.031.54-0.670.51Observations：30McFadden pseudo-R2=0.60Residual Sum of Squares=2.59现在学习的是第35页，共58页 McFadden pseudo-R2和统计显

25、著性与probit模型的结果类似。INCOME和AGE的系数估计值亦在5%误差水平上显著。而MALE则在两种模型回归中均不显著。而斜率系数估计值则不同，这是因为它们的意义不一样。例如，AGE的系数估计值0.13意味着收入和性别不变的情况下，年龄增大一岁，选举候选人甲的机会的对数增加0.13。实际上，除了斜率系数的解释不同，使用probit模型和logit模型并没有多大区别。现在学习的是第36页，共58页六、多项选择模型六、多项选择模型多项选择模型是研究在多于两个的选项中进行决策的模型。一般可以依照选择集分为有序和无序两种宽泛的类型。比如，城市交通工具的选择显然是无序的，而投资者选择公司债券(债

26、券经过评级)是有序的。有关二元选择的Logit模型可以推广到因变量有两个以上离散取值的情况，构成多项Logit模型(multinomial logit model)，此模型的主要优点是容易计算，选择给定方案的概率易于被表示，并且极大似然函数可以用简单明了的方式产生和最大化。现在学习的是第37页，共58页该模型的缺点是它以所谓的不相干选择的独立性（independence of irrelevant alternatives，IIA）性质为特征。假设一个几乎与一个已有选项相同的新选项被加进选择集中，我们期望的是，从此模型得到的选择这两个几乎相同的选项（如乘公共汽车时选老车型还是新车型）的概率将被

27、分成两半，而选择其它选项的概率不受影响。不幸的是，情况不是这样。因此当两个或多个选项是相近替代方案时，采用多项Logit模型不适合。在这种情况下，可考虑多项Probit模型(multinomial Probit model)。多项Probit模型允许扰动项跨选项相关，从而绕过IIA困境。它的缺点是计算困难，计算四个以上选项的问题几乎不可行。随着计算机能力和计算方法的改进，多项Probit模型的应用前景会越来越好。现在学习的是第38页，共58页如果因变量本质上是有序的，多项Logit模型和多项Probit模型均无法解释解释因变量的序数性质。因为决策者选择不同的方案所得到的效用也是排序的，一般多元

28、离散选择模型中的效用关系不再适用。处理有序离散因变量的常用方法是有序Probit模型与有序Logit模型。现在学习的是第39页，共58页*第三节第三节 Censored模型模型 Censored模型研究一类重要的受限因变量：在取正值时大致连续，但总体中有一个不可忽略的部分取值为零。考察决定居民家庭用于耐用消费品(如汽车等)支出的因素，或者研究居民每年用于慈善捐助支出的决定因素，或者研究居民每月用于特殊消费品(如酒类等)支出的决定因素等等。这些研究都需要对总体进行抽样调查取得相关的数据，而抽样调查的结果有一个共同的特点，那就是有相当一部分个体用于这些方面支出的金额为零，同时不为零的支出数据会呈现

29、出基本连续的形态。现在学习的是第40页，共58页一、一、Censored模型的概念模型的概念当因变量在特定范围内的值都转换成（或报告为）某个值时，称因变量被归并(censoring)，称此变量为归并变量(censored variable)。censored回归模型的一般形式是现在学习的是第41页，共58页二、二、Tobit模型的估计模型的估计为了计估模型参数，我们推导Y的均值设，称为逆米尔斯比率(inverse Mills ratio)，它是标准正态pdf与标准正态cdf在c处的比值。则现在学习的是第42页，共58页有了上面的结果，我们可以计算从总体中随机抽取的观测值的均值因此，一旦有了

30、的估计值，我们就可以确保Y的预测值为正。当然，保证Y的预测值为正的代价是使用了更为复杂的非线性模型。现在学习的是第43页，共58页 Censored模型通常采用极大似然估计。由Y的分布，可得模型的对数似然函数为该对数似然函数由两部分组成：一部分对应于没有限制的观测值，是经典回归部分；一部分对应于受到限制的观测值。因而上式是一个非标准的对数似然函数，实际上是离散分布与连续分布的混合。最大化对数似然函数，可得极大似然估计量。这一估计量的性质与普通MLE的性质相同。一般情况下，需采用数值方法来求极大似然估计值。现在学习的是第44页，共58页求标准误差的矩阵表达式很复杂，详细的讨论见Wooldridg

31、e（2002）。利用Eviews软件，很方便得到模型的参数估计值及标准误差，因而可以进行参数的假设检验。我们还可以采用沃尔德统计量或似然比统计量同时检验多个约束，其方法与一般的MLE相同。Censored模型的MLE需要两个基本假定：潜变量模型中随机干扰项的同方差性和正态性。如果存在异方差性或非正态性，那么MLE估计量便是不一致的。现在学习的是第45页，共58页在实践中，研究人员估计Censored模型时往往采用OLS法，尽管OLS估计值不一致。人们发现OLS估计值通常小于ML估计值，几乎没有例外。一个值得注意的经验规律是，极大似然估计值通常约等于OLS估计值除以样本中非受限观测值的比例。这恐

32、怕是人们估计Censored模型时采用OLS法的原因。现在学习的是第46页，共58页三、三、Tobit模型的偏效应模型的偏效应在潜变量模型中，参数的含义与线性模型相同，事实上但潜变量不可观测，因而这个结果通常没有什么意义。我们更关心的是解释变量如何影响可观测变量。可以证明，在Tobit模型扰动项正态分布的假设下，对的偏效应为现在学习的是第47页，共58页四、实例四、实例Wooldridge报告了一个美国已婚妇女工作时数的例子。样本数据包括753个已婚妇女的年工作小时数，其中有428个妇女小时数大于0，另外325个妇女的工作小时数为0。对工作时间为正的妇女而言，其工作时间范围相当宽，从12小

33、时到4950小时，可以看作连续变化。因此，年工作小时数很适合用Tobit模型，Wooldridge同时还用OLS估计了线性模型(使用全部753个数据)，结果由下表给出。现在学习的是第48页，共58页因变量：hours自变量线性模型(OLS)Tobit模型(MLE)Nwifeinc-3.45(2.54)-8.81(4.46)Educ28.76(12.95)80.65(21.58)Exper65.67(9.96)131.56(17.28)Exper2-0.70(.325)-1.86(0.54)Age-30.51(4.36)-54.41(7.42)Kidslt6-442.09(58.85)-894.

34、02(111.88)Kidsge6-32.78(23.18)-16.22(38.64)Constant1330.48(270.78)965.31(446.44)Constant Log-likelihood value-3819.09R-squared0.2660.275750.181122.02现在学习的是第49页，共58页我们对比OLS估计与Tobit估计，可以看出：(1)Tobit系数估计值与OLS估计值具有相同的符号，而且统计显著性也类似。可能的例外的是nwifeinc与kidsge6的系数，nwifeinc在OLS估计中的统计量为-1.41,在Tobit估计中的统计量为-1.98。k

35、idsge6在OLS估计中的统计量为-1.41,在Tobit估计中的统计量为-0.42。(2)本例的结果可以验证我们前面介绍的经验法则。样本中非受限观测值的比例为428/753=0.568，除个别例外（kidsge6），OLS估计值除以0.568得到的值与Tobit估计值大致相当。如将Exper的OLS系数估计值65.67除以0.568，得到115.62。除了kidsge6外，换算后的OLS估计值的绝对值都小于对应的Tobit估计值的绝对值。现在学习的是第50页，共58页(3)线性模型和Tobit模型都报告了R-squared值，但其计算方法是不同的。线性模型的R-squared值是基于残差平

36、方和得到的，而Tobit模型的R-squared值却是与其估计值之间相关系数的平方。(4)从R-squared看，Tobit模型拟合要好一点，但并不明显。不过，我们要看到，Tobit估计值是最大化对数似然函数得到的，其目的并不是为了最大化R-squared，而OLS估计值却是为得到最大化的R-squared值。(5)根据两个模型预测，hours的所有Tobit拟合值均是正的。相比之下，OLS拟合值则有39个为负。现在学习的是第51页，共58页*第四节第四节 Truncated 模型模型 Truncated 模型从样本中排除或截断一些观测值，例如，Hausman和Wise（1977）利用负收入税

37、实验的数据来研究收入的各种决定因素的例子中，一个家庭的收入必须低于1967年贫困线（贫困线取决于家庭规模）的1.5倍才会被包含在研究数据中。又如，在研究贫困问题时，我们排除富人，如从样本中排除收入高于某个上限的观测值。因此样本不再是随机的，OLS应用于这种被截断的样本会导致有偏和不一致的结果，如下图所示。截断（Truncation）与上一节介绍的归并（censoring）不同，在归并的情况下，没有数据被排除。事实上，我们观测到所有家庭的特性，包括那些没有购车的家庭。现在学习的是第52页，共58页截断回归模型现在学习的是第53页，共58页一、截断分布一、截断分布截断分为下截断和上截断，处理方法

38、类似，本节的讨论基于下截断。在下截断的情况下，一组样本只有在时才有观测值，其中，a是截断点。这意味着，对所有观测到的样本，一定有；对于的情况，我们既不能观测到被解释变量，也不能观测到解释变量。这与Censored 模型不同，在Censored模型中，对所有随机样本都能观测到解释变量的全部样本值。现在学习的是第54页，共58页截断分布截断分布截断分布截断分布(truncation distribution)是一个未截断分布的一部分，该部分在某一规定值之上或之下。例如在研究贫困问题时，截断分布是人均年收入低于5000元的分布，这个子集是收入范围从0到无限大的全分布的一部分。简单说，截断分布就是一个在某个规定值之上或之下的分布。不失一般性，本节假设截断随机变量是大于某值的连续随机变量。可以证明,对一个连续随机变量现在学习的是第55页，共58页基于连续随机变量的大多数近期应用研究使用截断正态分布截断正态分布为了下面讨论的方便，我们称服从截断分布的随机变量为截断截断随机变量随机变量（truncated random variable）。现在学习的是第56页，共58页截断正态分布的矩的一些重要结果（证明略）设，a是一个常数，则现在学习的是第57页，共58页二、二、Truncated回归模型回归模型设则现在学习的是第58页，共58页

展开阅读全文