《二元选择模型课件.ppt》由会员分享,可在线阅读,更多相关《二元选择模型课件.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于二元选择模型现在学习的是第1页,共33页二元选择模型二元选择模型 Binary Choice Model一、二元离散选择模型的经济背景一、二元离散选择模型的经济背景 二、二元离散选择模型二、二元离散选择模型 三、二元三、二元ProbitProbit离散选择模型及其参数估计离散选择模型及其参数估计 四、二元四、二元LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 五、二元离散选择模型的检验五、二元离散选择模型的检验 现在学习的是第2页,共33页说明说明 在经典计量经济学模型中,被解释变量通常被假定为连连续变量续变量。 离散被解释变量数据计量经济学模型(Models wit
2、h Discrete Dependent Variables)和离散选择模型(DCM, Discrete Choice Model)。 二元选择模型(Binary Choice Model)和多元选择模型(Multiple Choice Model)。 本节只介绍二元选择模型。现在学习的是第3页,共33页 离散选择模型起源于离散选择模型起源于FechnerFechner于于18601860年进行的动物条件年进行的动物条件二元反射研究。二元反射研究。 19621962年,年,WarnerWarner首次将它应用于经济研究领域,用以研究首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具
3、的选择问题。公共交通工具和私人交通工具的选择问题。 7070、8080年代,离散选择模型被普遍应用于经济布局、企年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领业定点、交通问题、就业问题、购买决策等经济决策领域的研究。域的研究。 模型的估计方法主要发展于模型的估计方法主要发展于8080年代初期。年代初期。现在学习的是第4页,共33页1 1、逻辑分布的概率分布函数、逻辑分布的概率分布函数 F tet( ) 11f teett( )()12F teettt( )( )1f teetttt( )()( )( )112现在学习的是第5页,共33页1 1、原始模
4、型、原始模型 对于二元选择问题,可以建立如下计量经济学模型。其对于二元选择问题,可以建立如下计量经济学模型。其中中Y为观测值为为观测值为1和和0的决策被解释变量;的决策被解释变量;X为解释变量,为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。包括选择对象所具有的属性和选择主体所具有的属性。 YXyiXii0)(iEiX)(iyEiiiipyPyPyE) 0(0) 1(1)(E yP yii()()1Xi) 0(1) 1(iiiiyPpyPp左右端矛盾左右端矛盾现在学习的是第6页,共33页 由于存在这两方面的问题,所以原始模型不能作为由于存在这两方面的问题,所以原始模型不能作为实际研
5、究二元选择问题的模型。实际研究二元选择问题的模型。需要将原始模型变换为效用模型。需要将原始模型变换为效用模型。 这是离散选择模型的关键。这是离散选择模型的关键。 iiiyy1101XXXXiiii当,其概率为当,其概率为具有异方具有异方差性差性 现在学习的是第7页,共33页2 2、效用模型、效用模型 作为研究对象的二元选择模型作为研究对象的二元选择模型Uiii11X1Uiii000X UUiiiii1010X10()()yii*Xi第第i个个体个个体 选择选择1的效用的效用第第i个个体个个体 选择选择0的效用的效用P yP yPiii()()()*10Xi现在学习的是第8页,共33页注意,在模
6、型中,效用是不可观测的,人们能够得到的观注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即测值仍然是选择结果,即1和和0。 很显然,如果不可观测的很显然,如果不可观测的U1U0,即对应于观测值为,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具;工具的效用,他当然要选择公共交通工具;相反,如果不可观测的相反,如果不可观测的U1U0,即对应于观测值为,即对应于观测值为0,因为,因为该个体选择公共交通工具的效用小于选择私人交通该个体选择公共交通工具的效用小于选择私人交通工具
7、的效用,他当然要选择私人交通工具。工具的效用,他当然要选择私人交通工具。现在学习的是第9页,共33页最大似然估计最大似然估计 欲使得效用模型可以估计,就必须为随机欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。误差项选择一种特定的概率分布。 两种最常用的分布是标准正态分布和逻辑两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用)分布,于是形成了两种最常用的二元选择模型的二元选择模型Probit模型模型和和Logit模型模型。 最大似然函数及其估计过程如下:最大似然函数及其估计过程如下:现在学习的是第10页,共33页FtF t()( ) 1P y
8、P yPPFFiiii()()()()()()* 1011XXXXiiiiP yyyFFnyyii(,)()()12011XXiiLFFin()()XXiyi1yii11逻辑分布的对称性逻辑分布的对称性似然函数现在学习的是第11页,共33页ln(ln()() ln()LyFyFiiinXXii111ln()()Ly fFyfFiiiiiiin111X0i 在样本数据的支持下,如果知道概率分布函数和概在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估率密度函数,求解该方程组,可以得到模型参数估计量。计量。 1阶极值条件现在学习的是第12页,共33页四、二元四
9、、二元LogitLogit离散选择模型及其参数估离散选择模型及其参数估计计现在学习的是第13页,共33页1 1、逻辑分布的概率分布函数、逻辑分布的概率分布函数 F tet( ) 11f teett( )()12F teettt( )( )1f teetttt( )()( )( )112现在学习的是第14页,共33页B Brsch-Supanrsch-Supan于于19871987年指出年指出: : 如果选择是按照效用最大化而进行的,具有极限值的逻辑如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用分布是较好的选择,这种情况下的二元选择模型应该采
10、用Logit模型。模型。 现在学习的是第15页,共33页例例 贷款决策模型贷款决策模型 分析与建模:分析与建模:某商业银行从历史贷款客户中随机抽取某商业银行从历史贷款客户中随机抽取78个个样本,根据设计的指标体系分别计算它们的样本,根据设计的指标体系分别计算它们的“商业信用商业信用支持度支持度”(CC,XY)和)和“市场竞争地位等级市场竞争地位等级”(CM,SC),对它们贷款的结果(),对它们贷款的结果(JG)采用二元离散变量,)采用二元离散变量,1表示贷款成功,表示贷款成功,0表示贷款失败。目的是研究表示贷款失败。目的是研究JG与与CC、CM之间的关系,并为正确贷款决策提供支持。之间的关系,
11、并为正确贷款决策提供支持。现在学习的是第16页,共33页 样样本本观观测测值值CC=XYCM=SC现在学习的是第17页,共33页 数据的录入现在学习的是第18页,共33页 QUICKEstimate Equation现在学习的是第19页,共33页现在学习的是第20页,共33页现在学习的是第21页,共33页McFadden R-squared0.966793 S.D. dependent var 0.495064 Akaike info criterion 0.121882 Schwarz criterion 0.212525 Hannan-Quinn criter. 0.158168 LR s
12、tatistic 102.0977Prob(LR statistic) 0.000000现在学习的是第22页,共33页 Akaike info criterion 0.121882 Schwarz criterion 0.212525 Hannan-Quinn criter. 0.158168现在学习的是第23页,共33页 信息准则越小越好: 被估计的参数个数k越小,SC越小;L越大,SC越小。 具体可参见: 数据分析与EViewS应用,易丹辉主编,2008年第一版,中国人民大学出版社。第35页及第12章及相关章节。现在学习的是第24页,共33页 Mean dependent var0.410
13、256 S.E. of regression 0.089416 Sum squared resid0.599643 Log likelihood -1.753403 Restr. log likelihood-52.80224 Avg. log likelihood -0.022480现在学习的是第25页,共33页:log;llikelihoodl对数似然函数的最大值;:零模型(除常数项外的所有系数都为零,意即仅含常数项,又称截距概率模型)的对数似然函数的最大值。现在学习的是第26页,共33页 LR statistic 102.0977 Prob(LR statistic) 0.000000现
14、在学习的是第27页,共33页2()LRll 现在学习的是第28页,共33页现在学习的是第29页,共33页 该方程表示该方程表示,当,当CC和和CM已知时,代入方已知时,代入方程,可以计算贷款成功的概率程,可以计算贷款成功的概率JGF。例如,。例如,将表中第将表中第19个样本观测值个样本观测值CC=15、CM=1 代 入 方 程 右 边 , 计 算 括 号 内 的 值 为代 入 方 程 右 边 , 计 算 括 号 内 的 值 为0.1326552;查标准正态分布表,对应于;查标准正态分布表,对应于0.1326552的累积正态分布为的累积正态分布为0.5517;于是,;于是,JG的预测值的预测值J
15、GF=10.5517=0.4483,即,即对应于该客户,贷款成功的概率为对应于该客户,贷款成功的概率为0.4483。现在学习的是第30页,共33页0.9999991.0000000.4472330.000000现在学习的是第31页,共33页 预测:预测:如果有一个新客户,根据客户资料,计算的如果有一个新客户,根据客户资料,计算的“商业信用支持度商业信用支持度”(XY)和)和“市场竞争地位等级市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。定是否给予贷款。现在学习的是第32页,共33页感谢大家观看感谢大家观看现在学习的是第33页,共33页