《数据包络分析(DEA)方法(共22页).docx》由会员分享,可在线阅读,更多相关《数据包络分析(DEA)方法(共22页).docx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上二、 数据包络分析(DEA)方法数据包络分析(data envelopment analysis, DEA)是由著名运筹学家Charnes, Cooper和Rhodes于1978年提出的,它以相对效率概念为基础,以凸分析和线性规划为工具,计算比较具有相同类型的决策单元(Decision making unit,DMU)之间的相对效率,依此对评价对象做出评价1 Charnes A, Cooper W W, Rhodes E. Measuring the efficiency of decision making units J. European Journal of
2、Operational Research, 1978, 2: 429-444.1。DEA方法一出现,就以其独特的优势而受到众多学者的青睐,现已被应用于各个领域的绩效评价中2 Cook W D, Seiford L M. Data envelopment analysis (DEA)-Thirty years on J. European Journal of Operation Research, 2009, 192(1): 1-17.,3 Liu J S, Lu L Y Y, Lu W M, Lin B J Y. Data envelopment analysis 19782010: A c
3、itation-based literature survey J. Omega, 2012, doi:10.1016/j.omega.2010.12.006. (In press)。在介绍DEA方法的原理之前,先介绍几个基本概念:1. 决策单元一个经济系统或一个生产过程都可以看成是一个单位(或一个部门)在一定可能范围内,通过投入一定数量的生产要素并产出一定数量的“产品”的活动。虽然这种活动的具体内容各不相同,但其目的都是尽可能地使这一活动取得最大的“效益”。由于从“投入”到“产出”需要经过一系列决策才能实现,或者说,由于“产出”是决策的结果,所以这样的单位(或部门)被称为决策单元(DMU)。
4、因此,可以认为,每个DMU(第i个DMU常记作DMUi)都表现出一定的经济意义,它的基本特点是具有一定的投入和产出,并且将投入转化成产出的过程中,努力实现自身的决策目标。在许多情况下,我们对多个同类型的DMU更感兴趣。所谓同类型的DMU,是指具有以下三个特征的DMU集合:具有相同的目标和任务;具有相同的外部环境;具有相同的投入和产出指标。 2. 生产可能集设某个DMU在一项经济(生产)活动中有m项投入,写成向量形式为;产出有s项,写成向量形式为。于是我们可以用来表示这个DMU的整个生产活动。定义1. 称集合为所有可能的生产活动构成的生产可能集。在使用DEA方法时,一般假设生产可能集T满足下面四
5、条公理:公理1(平凡公理): 。 公理2(凸性公理): 集合T为凸集。 如果 , 且存在 满足 则 。公理3(无效性公理):若,则。 , 公理4 (锥性公理): 集合T为锥。如果那么 对任意的。若生产可能集是所有满足公理1 , 2 , 3和4的最小者,则T有如下的唯一表示形式。3. 技术有效与规模收益(1) 技术有效:对于任意的,若不存在,且,则称为技术有效的生产活动。(2) 规模收益:将产出和投入的同期相对变化比值称为规模效益。若,说明规模收益递增,这时可以考虑增大投入;若,说明规模收益递减,这时可以考虑减小投入;若,说明规模收益不变,且称为规模有效。(一) DEA方法原理与CCR模型DEA
6、方法的基本原理是:设有n个决策单元,它们的投入,产出向量分别为:,。由于在生产过程中各种投入和产出的地位与作用各不相同,因此,要对DMU进行评价,必须对它的投入和产出进行“综合”,即把它们看作只有一个投入总体和一个产出总体的生产过程,这样就需要赋予每个投入和产出恰当的权重。假设投入、产出的权向量分别为和,从而就可以获得如下的定义。定义2. 称为第个决策单元的效率评价指数。根据定义可知,我们总可以选取适当的权向量使得。如果想了解某个决策单元,假设为在这n个决策单元中相对是不是“最优”的,可以考察当和尽可能地变化时,的最大值究竟为多少? 为了测得的值,Charnes等人于1978年提出了如下的CC
7、R(三位作者名字首字母缩写)模型: (1)利用Charnes和Cooper (1962)4 Charnes A, Cooper W W. Programming with linear fractional functional J. Naval Research Logistics Quarterly, 1962, 9: 181-185.提出的分式规划的Charnes-Cooper变换: , ,变换后我们可以得到如下的线性规划模型: (2)根据线性规划的相关基本理论,可知模型(2)的对偶问题表达形式: (3)上述的模型是基于所有决策单元中“最优”的决策单元作为参照对象,从而求得的相对效率都是
8、小于等于1的。模型(2)或者(3)将被求解n次,每次即得一个决策单元的相对效率。模型(3)的经济含义是:为了评价的绩效,可以用一组假想的组合决策单元与其进行比较。模型(3)的第一和第二个约束条件的右端项分别是这个组合决策单元的投入和产出。从而,模型(3)意味着,如果所求出的效率最优值小于1,则表明可以找到这样一个假想的决策单元,它可以用少于被评价决策单元的投入来获取不少于该单元的产出,即表明被评价的决策单元为非DEA有效。而当效率值为1时,决策单元为DEA有效。有关DEA有效根据松弛变量是否都为零还可以进一步分为弱DEA有效与DEA有效两类。即通过考察如下模型中的与的值来判别。 (4)其中为非
9、阿基米德无穷小量。根据上述模型给出被评价决策单元有效性的定义:定义3. 若模型(4)的最优解满足,则称为弱DEA有效。定义4. 若模型(4)的最优解满足,且有,成立,则称为DEA有效。定义5. 若模型(4)的最优解满足,则称为非DEA有效。对于非DEA有效的决策单元,有三种方式可以将决策单元改进为有效决策单元:保持产出不变,减少投入;保持投入不变增大产出;减小投入的同时也增大产出。CCR模型容许DMU在减小投入的同时也增加产出。对于CCR模型,可以通过如下投影的方式将其投向效率前沿面,从而投影所得的点投入产出组合即为DEA有效。上述投影所得值与原始投入产出值之间的差异即为被评价决策单元欲达到有
10、效应改善的数值,设投入的变化量为,产出的变化量为:(二) BCC模型CCR 模型是假设生产过程属于属于固定规模收益,即当投入量以等比例增加时,产出量应以等比增加。然而实际的生产过程亦可能属于规模报酬递增或者规模报酬递减的状态。为了分析决策单元的规模报酬变化情况,Banker, Charnes与Cooper以生产可能集的四个公理以及Shepard距离函数为基础在1984年提出了一个可变规模收益的模型,后来被称为BCC的模型5 Banker R D, Charnes A, Cooper WW. Some models for estimating technical and scale effic
11、iencies in data envelopment analysis J. Management Science, 1984, 30: 1078-1092.。线性形式的BCC模型可表示为: (5)含松弛变量形式的BCC对偶模型 (6)其中为非阿基米德无穷小量。根据BCC模型中的的取值大小,Banker和Thrall(1992) 6 Banker R D, Thrall R M. Estimation of returns to scale using data envelopment analysis J. European Journal of Operational Research,
12、 1992, 62: 74-84.提出如下判别方法来判断模型(5)的规模收益。定理16. 假设含有投入产出组合的是有效的,那么下面的条件可以判别模型(1)之下的规模收益:(i) 对于投入产出组合规模收益不变当且仅当在某个最优解情况下有;(ii) 对于投入产出组合规模收益递增当且仅当在所有最优解情况下都有;(iii) 对于投入产出组合规模收益递减当且仅当在所有最优解情况下都有。其中代表模型(5)中的最优解。该定理的证明参见文献6。CCR模型或者BCC模型计算出来的效率可能存在多个效率值为1的情形,为了进一步区分这些有效决策单元,常用的方法有超效率模型,交叉效率模型以及双前沿数据包络分析模型。下面
13、依次做个简单介绍。(三) 超效率模型CCR 模型在计算效率值时,经常会出现多个有效的决策单元(效率值为1)的情形,从而使得有效决策单元之间无法进行比较分析。Andersen 和 Petersen (1993) 7 Andersen P, Petersen N C. A procedure for ranking efficient units in data envelopment analysis J. Management Science, 1993, 39: 1261-1264.为了实现决策单元的完全排序,将被评价的决策单元从效率边界中剔除,以剩余的决策单元为基础,形成新的效率边界,计算
14、剔除的决策单元到新的效率边界的距离。由于剔除的决策单元不被效率边界所包围,对于有效的决策单元而言,其计算出来的新效率值就会大于1,而对于无效的决策单元而言,其所得的效率值不变,仍小于1,从而使得全体决策单元可以实现完全排序。由于有效的决策单元效率大于1,从而就有了超效率(Super-efficiency) 的概念。基于CCR模型的超效率DEA模型为: (7)Banker和Chang(2006)8 Banker R D, Chang H. The super-efficiency procedure for outlier identification, not for ranking effi
15、cient units J. European Journal of Operational Research, 2006, 175: 1311-1320.证实了超效率极易受离群值的影响,因此该方法可以用来检测数据集中是否存在离群值。(四)交叉效率模型为了解决DEA有效决策单元的排序和比较问题,Sexton等人(1986)9 Sexton T R, Silkman R H, Hogan A J. Data envelopment analysis: Critique and extensions J. In: R.H. Silkman, Editor, Measuring Efficiency
16、: An Assessment of Data Envelopment Analysis, Jossey-Bass, San Francisco, C A, 1986, 73105.提出了交叉效率评价的概念。所谓交叉效率评价就是每个DMU分别确定一组输入输出权重,供所有的DMUs评价使用,其中:用DMU自身确定的权重评价自己的效率,称为自我评价效率;用其它DMU确定的权重评价自己的效率,称为交叉效率或同行评价效率。以表51为例,交叉效率评价的实质是对每个DMU同时进行自评和同行评价,这样不仅考虑DMU自评的最好相对效率,而且还考虑了DMU同行评价给出的交叉效率,利用自我评价和交叉效率的平均值作
17、为衡量DMU绩效的综合指标,该指标不仅较好地解决了DMUs间排序和比较问题,而且解决了CCR模型由于输入输出权重不一致性导致的不可比较问题。Sexton等人(1986)通过引入二级目标来确定输入输出权重、消除权重的不唯一性。随后Doyle和Green(1994,1995) 10 Doyle J R, Green R H. Efficiency and cross-efficiency in DEA: derivations, meanings and uses J. Journal of Operational Research Society, 1994, 45: 567-578.,11 D
18、oyle J R, Green R H. Cross-evaluation in DEA: Improving discrimination among DMUs J. INFOR, 1995, 33: 205-222.从同行评价的角度解释了交叉效率的含义,并给出了后来的到广泛引用的二级目标函数-攻击型计算方式和仁慈型计算方式,下面两个模型依次为攻击型交叉效率模型和仁慈型交叉效率模型:表51 交叉效率示意表决策单元交叉效率算术平均值12n12n攻击型交叉效率模型: (8)仁慈型交叉效率模型: (9)然而,至今仍无一个准则来判别什么情况下使用攻击型或者是仁慈型。为了避免目标函数选择上的两难, W
19、ang和 Chin (2010a)12 Wang Y M, Chin K S. A neutral DEA model for cross-efficiency evaluation and its extension J. Expert Systems with Applications, 2010a, 37 (5): 3666-3675. 提出了一种中性交叉效率模型。其模型形式如下所示: (10)利用Charnes-Cooper的变换公式,可得中性交叉效率模型的线性模型 (11)交叉效率模型还有其他一些改进方式,例如:Liang等人(2008a)13 Liang L, Wu J, Cook
20、 W D, Zhu J. The DEA game cross-efficiency model and its Nash equilibrium J. Operations Research, 2008a, 56, 1278-1288.13年提出了3个可供选择的二级目标计算方式;Liang等人(2008b)14 Liang L, Wu J, Cook W D, Zhu J. Alternative secondary goals in DEA cross-efficiency evaluation J. International Journal of Production Economic
21、s, 2008b, 113: 1025-1030.将非合作博弈理论与交叉效率评价方法结合起来,提出了博弈交叉效率的概念,并设计了算法求解博弈交叉效率值,同时证明了该博弈交叉效率值即为纳什均衡点;Wang和Chin (2010b)15 Wang Y M, Chin K S. Some alternative models for DEA cross-efficiency evaluation J. International Journal of Production Economics, 2010b, 128 (1): 332-338.5提出了一些可选择性交叉效率评价模型;Wang和Chin(
22、2011)16 Wang Y M, Chin K S. The use of OWA operator weights for cross-efficiency aggregation J. Omega, 2011, 39 (5): 493-503.6在交叉效率的研究中率先引入有序加权平均算子(Ordered weighted averaging operator , OWA),很好的体现了决策者的各种偏好,尤其是对不合理的交叉效率评价值赋予较小的权重,从而使得最终的评价结果更为科学合理。有兴趣的读者可以进一步参阅其他有关交叉效率的相关论文。(五)几何平均效率模型为了区分有效决策单元的排序难问
23、题,Wang等人(2007)17 Wang Y M, Chin K S, Yang J B. Measuring the performances of decision making units using geometric average efficiency J. Journal of the Operational Research Society, 2007, 58: 929-937.7于2007提出了悲观效率模型,并将其与乐观效率模型相结合,提出了基于几何平均值的双前面数据包络分析方法。基于悲观前沿面的数据包络分析模型为: (12)其中和是非负权重。模型(12)与模型(2)的区别
24、在于:模型(12)计算所得效率均大于等于1,而模型(2)所得的效率值均小于等于1。基于几何平均值的双前沿数据包络分析方法就是将模型(12)所得的效率与模型(2)所得的效率通过几何平均的方式加以综合,即:其中为综合后的的效率值,而和分别对应该决策单元在模型(2)与模型(12)下的最优效率值。下图为有效前沿面和无效前沿面的一个演示图。图5-1 决策单元的有效和无效前沿面(六)最优决策单元的选择 在实际应用中,决策者有时候关心的是哪个方案或者哪个决策单元是最优的,而对于其他单元的排序并不在意。因此,如何利用DEA模型直接寻求最优决策单元成为学者们所感兴趣的问题。Amin和Toloo (2007)18
25、 Amin G R, Toloo M. Finding the most efficient DMUs in DEA: An improved integrated model J. Computers & Industrial Engineering, 2007, 52(2): 71-77.8提出了一个混合整数线性规划模型,采用两步法以期实现寻求最优决策单元。然而随后Amin (2009)19 Amin G R. Comments on finding the most efficient DMUs in DEA: An improved integrated model J. Comput
26、ers & Industrial Engineering, 2009, 56 (4): 1701-1702.9发现这种两步法有时会产生两个或者两个以上的最优决策单元,因此他提出一个非线性混合整数模型。Foroughi (2011)20 A A. A new mixed integer linear model for selecting the best decision making units in data envelopment analysis J. Computers & Industrial Engineering, 2011, 60(4): 550-554.0发现Amin的非线
27、性规划模型在有些情况下是不可行的。不过Foroughi (2011)的模型存在着一些冗余的约束且对输入输出权重给定了保证域,并且该模型易受离群值(outliers)的影响,从而导致所选择的最优决策单元不正确。因此,Wang 和 Jiang (2012)21 Wang Y M, Jiang P. Alternative mixed integer linear programming models for identifying the most efficient decision making unit in data envelopment analysis J. Computers &
28、Industrial Engineering, 2012, 62: 546-553.1提出了三种混合整数线性规划模型来改进Foroughi (2011)的模型中所存在的问题。这三种最优决策单元选择的模型分别为:1. 基于不变规模收益的混合整数线性规划模型的最优决策单元选择方法Minimize Subject to , , , (13), , , ,其中 ()是二元变量,且只有一个变量可以取非零值1。如果,那么约束条件 对应的 的约束为 , 即允许的效率值大于1,而其余的DMU的约束与原始的CCR模型的约束相同, 也就是 对于任意的除了。 因此, 只有最有效的决策单元的效率值会大于1,而其余决策
29、单元的效率均小于等于1。权重约束沿用 (Sueyoshi, 199922 Sueyoshi T. J. Omega, 1999, 27(3): 315-326.2)提出的松弛变量模型中的形式,该约束形式在实际应用中被广泛采用,即 ();对于任意的 ().2. 基于投入导向的BCC模型的混合整数线性规划最优决策单元选择方法模型(13)是基于不变规模收益下的最优决策单元的选择方法。该方法可以拓展到可变规模收益的情形如下所示,该模型的形式是基于投入导向的BCC模型下的形式 :Minimize Subject to , , , (14), , , , 无符号限制.3. 基于产出导向的BCC模型的混合整
30、数线性规划最优决策单元选择方法同理可得,基于产出导向的可变规模收益的BCC形式下的混合整数线性规划模型如下:Minimize Subject to , , , , (15), , , , is free in sign,其中约束条件 ()是为了保证全体产出是非负的,因为负的产出没有意义。(七)举例说明下面用3个例子来说明DEA方法的应用。例1:假设现有七个被评价的决策单元,投入、产出项各有一项,投入项为X,产出项为Y,输入如下表所示。此时七个决策单元的相对位置如图52所示。在CCR模型下,连接原点与点B的射线构成前沿面,如图中所示,其余的点均位于该前沿面的下方。表52 七个决策单元的投入、产出
31、数据DMUXYEfficiencyA210.5000B331.0000C860.7500D620.3333E540.8000F1060.6000G74.50.6429图52 七个决策单元的分布及其在生产前沿面上的投影从图2中可以看出,只有决策单元B位于生产前沿面上,而其他所有决策单元均位于该生产前沿面的下方,即A, C, D, E, F, G均为非DEA有效,从表52最后一列的效率值大小也很容易得到确认。为了使非DEA有效决策单元为DEA有效,可依图中箭头所示的方向将非DEA有效的决策单元往前沿面上投影。A, C, D, F, G均为减小投入而保持产出不变;而E给出了三种投影方式(减小投入产出
32、不变;保持投入不变增大产出;或者同时减小投入和增大产出)。例2: 五个先进制造技术的甄别, 数据来源于Wang和Chin(2009)23 Wang Y M, Chin K S. A new approach for selection of advanced manufacturing technologies: DEA with double frontiers J. International Journal of Production Research, 2009, 47 (23): 6663-6679.。表53 五个先进制造技术的数据及其乐观、悲观以及几何平均值决策单元投入产出Y乐观效
33、率值悲观效率值几何平均值X1X2A4072101.00001.60001.2469B32121050.56391.00000.7509C52203041.00001.73711.3180D35132000.98381.74151.3089E3281500.85801.42861.1071对于每一个决策单元而言,可通过求解模型(2)和(12)获得全体DMUs的乐观和悲观效率,结果如上表所示。下面简单介绍一下求解过程和技术实现。以第一个决策单元的CCR效率(即乐观效率)为例,将数据代入模型(2)即得模型(16),显然这是个较为复杂的线性规划模型,需要借助软件计算才会更为简便。因此本书分别给出了Li
34、ngo以及Matlab下的CCR模型的编程。Lingo的编程一次也只能计算一个(见下面程序后的计算说明),而Maltab程序相对而言更为简便,其可以很快地计算出所有决策单元的效率。此例中通过软件计算所得,在乐观效率下,所得效率为表53的第五列所示,全体单元的优序关系为: C=ADEB。,决策单元A与C均为DEA有效,而B, D, E为非DEA有效。在悲观模型下,所得的效率值为表53的第六列所示,决策单元B为DEA无效,而其他单元均为非DEA无效,其优序顺序为:DCAEB。由此可见,在乐观前沿面和在悲观前沿面下的排序存在着一定的差异。表53的最后一列的值为乐观和悲观效率的几何平均值,显然Wang
35、等人(2007)提出的该几何平均值较好的综合了乐观和悲观前面的两部分信息,从而五个单元合理的排序为:CDAEB。 (16)下面给出LINGO与Matlab的程序:例2的LINGO程序实现:(以计算第一个决策单元的乐观效率为例)MODEL:sets:DMU/1.5/:S,T,P; !Decision making units;II/1.2/:w; !input index;OI/1/:u; !output index;IV(II,DMU):X; !input variable;OV(OI,DMU):Y; !output variable;endsetsdata:P=1 0 0 0 0;X=40
36、32 52 35 32 7 12 20 13 8;Y=210 105 304 200 150;enddatamax=sum(DMU: P*T);for(DMU(j):S(j)=sum(II(i): w(i)*X(i,j);T(j)=sum(OI(i): u(i)*Y(i,j);S(j)=T(j);sum(DMU:P*S)=1;END在上述程序中,P的值(1 0 0 0 0)分别替换为 (0 1 0 0 0), (0 0 1 0 0), (0 0 0 1 0), (0 0 0 0 1), 可得5个决策单元的最优效率值依次为1.0000, 0.5639, 1.0000, 0.9838, 0.858
37、0。例2的Matlab程序实现:clear all;X= 40 32 52 35 32 7 12 20 13 8;Y= 210 105 304 200 150;n=size(X,1);m=size(X,1);s=size(Y,1);A=-X Y;b=zeros(n,1); LB=zeros(m+s,1);UB=;for i=1:n;F=zeros(1,m) -Y(:,i);Aeq=X(:,i) zeros(1,s); beq=1;w(:,i)=linprog(F,A,b,Aeq,beq,LB,UB); E(i,i)=Y(:,i)*w(m+1:m+s,i); endwEomega=w(1:m,:
38、)mu=w(m+1:m+s,:)EE=diag(E)运行上述Matlab程序,即可得全体DMUs的CCR效率值。例3. 现有14家国际航空公司,数据来源于Tofallis(1997) 24 Tofallis C. Input efficiency profiling: An application to airlines J. Computer & Operations Research, 1997, 24: 253-258.。已知投入有三项,产出有两项,分别为: :飞机容量吨公里:营业费用:其他资产(预定系统,便利性以及流动资产): 每公里乘客数: 非客运收益表54 14家航空公司的数据DM
39、U投入产出1572332392003266776972589542254557308153932409995606267126641356574993213647341563551831880783236045136190808032327295011572746033457236022112969812097677964745236320019658733413581265041297105654187819161927797211125598098331041925339812572824812254277549821347151792248531332543142279398744145
40、1404表55 CCR效率及其非有效决策单元的改进DMUj CCR 效率. 投入 产出 x1j x2j x3jy1j y2j 10.8684-753-916-2640020.3379-3903-2940-40323569030.9475-1265-502-329073140.9581-569-1235-13500510000060.9766-447-402-770810710000080.8588-1709-957-20080090.9477-344-175-1392001010000011100000121000001310000014100000利用CCR模型以及将非有效DMU改进为有效D
41、MU的投影公式,可得表55的结果。从表中可知,决策单元 5, 7, 10, 11,12, 13, 14为DEA有效,而其它单元为非DEA有效。对于非有效决策单元,例如对第一家航空公司而言,它的第一项投入应减少753,第二项投入应减少916,第三项投入应减少264,同时保持产出不变,这时该航空公司可达DEA有效。DMU4,DMU8和DMU9与DMU1类似也均需减少该三项投入。而对DMU2而言,其前三项投入应分别减少3903,2940和4032,第一项产出需增加3569,第二项产出保持不变可达有效。而DMU3和DMU6在减少三项投入的同时,还需要增加第二项产出才会有效。利用攻击型交叉效率模型,我们可得如下表(表56)所示的14家航空公司的交叉效率表以及其排序。从表中可以看出第5家航空公司的相对效率为0.7983,为所有航空公司中最优,其次是第11家航空公司,其交叉效率值为0.7742。而第2家航空公司的交叉效率值为0.1652,为14家航空公司中最差。利用仁慈型交叉效率模型,我们可得如下表(表57)所示的14家航空公司的交叉效率表以及其排序。从表中可以看出第11家航空公司的相对效率为0.9193,为所有航空公司中最优,其次是第13家航空公司,其交叉效率值为0.9190。而第2家航空公司的交叉效率值为0.1894