《第九章 二元选择模型优秀课件.ppt》由会员分享,可在线阅读,更多相关《第九章 二元选择模型优秀课件.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第九章 二元选择模型第1页,本讲稿共47页说明说明在经典计量经济学模型中,被解释变量通常被假定为连续在经典计量经济学模型中,被解释变量通常被假定为连续变量。变量。离散被解释变量数据计量经济学模型(离散被解释变量数据计量经济学模型(Models with Models with Discrete Dependent VariablesDiscrete Dependent Variables)和离散选择模型)和离散选择模型(DCM,(DCM,Discrete Choice Model)Discrete Choice Model)。二元选择模型二元选择模型(Binary Choice Model)(
2、Binary Choice Model)和多元选择模型和多元选择模型(Multiple Choice Model)(Multiple Choice Model)。本节只介绍二元选择模型。本节只介绍二元选择模型。第2页,本讲稿共47页离散选择模型起源于离散选择模型起源于FechnerFechner于于18601860年进行的动物条件年进行的动物条件二元反射研究。二元反射研究。19621962年,年,WarnerWarner首次将它应用于经济研究领域,用首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。以研究公共交通工具和私人交通工具的选择问题。7070、8080年代,离散
3、选择模型被普遍应用于经济布局、年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。策领域的研究。模型的估计方法主要发展于模型的估计方法主要发展于8080年代初期。年代初期。第3页,本讲稿共47页一、二元离散选择模型的经济背景一、二元离散选择模型的经济背景第4页,本讲稿共47页实际经济生活中的二元选择问题实际经济生活中的二元选择问题研究选择结果与影响因素之间的关系。研究选择结果与影响因素之间的关系。影响因素包括两部分:影响因素包括两部分:决策者的属性决策者的属性和和备选方案的备选方案的属性属性。对于单个
4、方案的取舍。例如,购买者对某种商品的对于单个方案的取舍。例如,购买者对某种商品的购买决策问题购买决策问题 ,求职者对某种职业的选择问题,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷投票人对某候选人的投票决策,银行对某客户的贷款决策。由款决策。由决策者的属性决定。决策者的属性决定。对于两个方案的选择。例如,两种出行方式的选择,两对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由种商品的选择。由决策者的属性决策者的属性和和备选方案的属性共备选方案的属性共同决定。同决定。第5页,本讲稿共47页二、二元离散选择模型二、二元离散选择模型第6页,本讲稿共47页1.
5、1.线性概率线性概率(LPM)(LPM)模型模型假设有以下二元选择模型:(9.1)其中,Xi是包含常数项的k元解释变量,假设在给定Xi的时候,Yi=1 的概率为p,即 ,则在给定Xi的时候,Yi=0 的概率为1-p,即 。第7页,本讲稿共47页当(9.1)式满足 时 ,(9.2)另外,因为Yi只取1和0两个值,其条件期望为 (9.3)综合(9.2)式和(9.3)式得:(9.4)第8页,本讲稿共47页因此,(9.1)式拟合的是当给定解释变量Xi的值时,某事件发生(即Yi取值为1)的平均概率。在(9.4)式中,这一概率体现为线性的形式 ,因此(9.1)式称为线性概率模型(Linear Probab
6、ility Model,LPM)。对于线性概率模型,可以采用普通最小二乘法进行估计,但是会存在一些问题。常见的问题和相应的解决方法如下:第9页,本讲稿共47页(1)对(9.1)式的拟合的结果是对某一事件发生的平均概率的预测,即但是,的值并不能保证在0和1之间,完全有可能出现大于1和小于0的情形。实际应用中,当出现的预测值大于1或小于0的情况不是太多时,如果预测值大于1,就把它看作是等于1,如果预测值小于0,就把它看作是等于0.第10页,本讲稿共47页(2)由于Y是二元变量,因此扰动项也应该是二元变量,它应该服从二项分布,而不是我们通常假定的正态分布。但是,当样本足够多时,二项分布收敛于正态分布
7、。第11页,本讲稿共47页(3)在LPM中,扰动项的方差为:因此,扰动项是异方差的。为了克服异方差,可以采用处理异方差的方法去估计模型。第12页,本讲稿共47页(4)由于因变量是二元选择的结果,因此按传统线性回归模型所计算的判定系数R2不再有实际的意义。可以定义 当Y的实际预测的值大于0.5时,我们视其预测值为1;当小于0.5时,视其预测值为0。然后比较预测值与实际值是否存在差异,如果不存在差异,则认为是正确的预测。然后将正确的预测的个数与总预测个数比较,得到一个新的拟合优度的指标。第13页,本讲稿共47页(5)边际效应的分析对LPM进行边际效应分析得:因此,当解释变量是非虚拟变量时,表示的是
8、解释变量变动一个单位时对Y取值为1的平均概率的影响。如果解释变量是虚拟变量,则 表示的是虚拟解释变量取值为1和取值为0时,Y的取值为1的概率的差异。因此,LPM的边际效应是一个常数,的边际效应是一个常数,它与解释变量取值的大小无关。第14页,本讲稿共47页在LPM中,假设Yi=1 的概率是线性的,也就是假设中的函数F为恒等函数,即但是,不能保证概率的取值在0和1之间。第15页,本讲稿共47页标准正态分布的概率分布函数标准正态分布的概率分布函数 第16页,本讲稿共47页逻辑分布的概率分布函数逻辑分布的概率分布函数 第17页,本讲稿共47页如果将函数F定义为标准正态分布函数 ,即 会把概率的取值限
9、定在0和1之间,这时的概率模型称为这时的概率模型称为Probit模型。模型。第18页,本讲稿共47页如果将函数F定义为Logistic分布函数 ,则产生的概率模型为则产生的概率模型为Logit模型模型:同样,也将概率的取值限定在0和1之间。第19页,本讲稿共47页2.Probit2.Probit模型模型考察以下模型 (9.6)其中,Yi*是潜变量或隐变量(Latent Variable),它无法获得实际观测值,但是却可以观测到它的性状,如Yi*0或Yi*0。因此,我们实际上观测到的变量是Yi而不是Yi*。(9.6)式称为潜变量反应函数(Latent Response Function)或指示函
10、数(Index Function)。第20页,本讲稿共47页一般假设:A1:;A2:是i.i.d.的正态或Logistic分布;A3:。在A1A3的假定之下,考察(9.6)式中Yi的概率特征:(9.7)第21页,本讲稿共47页当 为标准正态分布的概率密度函数时,(9.7)式可以写成:(9.8)这样,(9.8)式正是Probit模型。第22页,本讲稿共47页3.Logit3.Logit模型模型当(9.7)式中的 是Logistic的概率密度函数时,(9.7)式可以进一步表达为 (9.9)(9.9)式正是Logit模型。第23页,本讲稿共47页边际效应分析对于Probit模型来说,其边际效应为:(
11、9.10)对于Logit模型,其边际效应为:(9.11)其中,。第24页,本讲稿共47页从(9.10)式和(9.11)式中可以看到,Probit和Logit模型中解释变量对Yi取值为1的概率的边际影响不是常数,它会随着解释变量取值的变化而变化。对于非虚拟的解释变量,一般是用其样本均值代入到(9.10)式和(9.11)式中,估计出平均的边际影响。但是,对于虚拟解释变量而言,则需要先分别计算其取值为1和0时的值,二者的差即为虚拟解释变量的边际影响。第25页,本讲稿共47页最大似然估计(MLE)Probit和Logit模型都是非线性模型,不能用OLS法估计。对于非线性模型的估计方法之一是最大似然法。
12、对于Probit或Logit模型来说,第26页,本讲稿共47页所以似然函数为对数似然函数为 (9.12)第27页,本讲稿共47页最大化logL的一阶条件为 (9.13)由于(9.13)式不存在封闭解,所以要用非线性求解的迭代法求解。常用的迭代方法之一是建立在泰勒级数展开基础上的Newton-Raphson迭代法或二次攀峰算法(Quadratic Hill Climbing)。第28页,本讲稿共47页似然比检验和拟合优度似然比检验类似于检验模型整体显著性的F检验,原假设为全部解释变量的系数都为0,检验的统计量LR为:(9.14)其中,lnL为对概率模型进行MLE估计的对数似然函数值,lnL0为估
13、计只有截距项的模型的对数似然函数值。当原假设成立时,LR的渐近分布是自由度为k-1(即除截距项外的解释变量的个数)的 分布。第29页,本讲稿共47页对于Probit和Logit模型,同样可以计算(9.5)式中 的以反映模型的拟合优度。此外,还可以计算类似于传统R2的McFadden似然比指数(McFaddens Likelihood Ratio Index)来度量拟合优度。似然比指数的定义为(9.15)McFadden R2总是介于0和1之间。当所有的斜率系数都为0时,McFadden R2=0,但是,McFadden R2不会恰好等于1。McFadden R2越大,表明拟合得越好。第30页,
14、本讲稿共47页例例 贷款决策模型贷款决策模型分析与建模:分析与建模:某商业银行从历史贷款客户中随机抽取某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的个样本,根据设计的指标体系分别计算它们的“商业信用支持度商业信用支持度”(CC)和)和“市场竞争地位等级市场竞争地位等级”(CM),对它们贷款的结果(),对它们贷款的结果(JG)采用二元离散变)采用二元离散变量,量,1表示贷款成功,表示贷款成功,0表示贷款失败。目的是研究表示贷款失败。目的是研究JG与与CC、CM之间的关系,并为正确贷款决策提供支持。之间的关系,并为正确贷款决策提供支持。第31页,本讲稿共47页样样本
15、本观观测测值值CC=XYCM=SC第32页,本讲稿共47页第33页,本讲稿共47页第34页,本讲稿共47页该方程表示该方程表示,当,当CC和和CM已知时,代入方程,可以计算贷款成功的已知时,代入方程,可以计算贷款成功的概率概率JGF。例如,将表中第。例如,将表中第19个样本观测值个样本观测值CC=15、CM=1代入方代入方程右边,计算括号内的值为程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于;查标准正态分布表,对应于0.1326552的累积正态分布为的累积正态分布为0.5517;于是,;于是,JG的预测值的预测值JGF=10.5517=0.4483,即对应于该客户,贷款成
16、功的概率为,即对应于该客户,贷款成功的概率为0.4483。输出的估计结果第35页,本讲稿共47页模拟预测第36页,本讲稿共47页预测:预测:如果有一个新客户,根据客户资料,计算的如果有一个新客户,根据客户资料,计算的“商业信用支持度商业信用支持度”(XY)和)和“市场竞争地位等级市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。以此决定是否给予贷款。第37页,本讲稿共47页3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元ProbitProbit离散离散选择模型的参数估计选择模型的参数估计 对每个决策者
17、有多个重复(例如对每个决策者有多个重复(例如10次左右)次左右)观测值。观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次的次数比例为数比例为pi,那么可以将,那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“概率单位模型概率单位模型”,采用广义最小二,采用广义最小二乘法估计乘法估计。实际中并不常用。实际中并不常用。第38页,本讲稿共47页Brsch-SupanBrsch-Supan于于19871987年指出年指出:如果选择是按照效用最大化而进行的,具有极限值的逻如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这
18、种情况下的二元选择模型应该辑分布是较好的选择,这种情况下的二元选择模型应该采用采用Logit模型。模型。第39页,本讲稿共47页第40页,本讲稿共47页第41页,本讲稿共47页第42页,本讲稿共47页Probit0.9999991.0000000.4472330.000000第43页,本讲稿共47页3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元logitlogit离散选离散选择模型的参数估计择模型的参数估计对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比
19、例为的次数比例为pi,那么可以将,那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“对数成败比例模型对数成败比例模型”,采用广义最小二乘法,采用广义最小二乘法估计估计。实际中并不常用。实际中并不常用。详见教科书。详见教科书。第44页,本讲稿共47页三、二元离散选择模型的变量显著性检三、二元离散选择模型的变量显著性检验验第45页,本讲稿共47页1 1、检验假设、检验假设经典模型中采用的变量显著性经典模型中采用的变量显著性t检验仍然是有效的。检验仍然是有效的。如果省略的变量与保留的变量不是正交的,那么对参数如果省略的变量与保留的变量不是正交的,那么对参数估计量将产生影响,需要进一步检验这种省略是否恰当。估计量将产生影响,需要进一步检验这种省略是否恰当。第46页,本讲稿共47页2 2、统计量、统计量如果X2中的变量省略后对参数估计量没有影响,那么H1和H0情况下的对数最大似然函数值应该相差不大,此时LR统计量的值很小,自然会小于临界值,不拒绝 H0。第47页,本讲稿共47页