《5决策分析dfr.pptx》由会员分享,可在线阅读,更多相关《5决策分析dfr.pptx(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第9章 决策分析n9.1.决策分析的基本概念n9.2.风险型决策分析n9.3.不确定型决策分析 1.不确定型决策的条件和例子 2.不确定型决策分析方法n9.4.效用函数和信息的价值 1.效用函数 2.信息的价值9.1.决策分析的基本概念n决策:为达到某一目标从几种不同的行动方案中选出最优方案所做出的抉择。n决策分析研究从多种可供选择的行动方案中选择最优方案的方法。nH.A.Simon:管理就是决策。n决策过程的步骤:确定目标、收集信息、制定方案、选择方案、执行决策并利用反馈信息进行控制决策过程的步骤决策过程的步骤:n确定目标n收集信息n制定方案n选择方案n执行决策并利用反馈信息进行控制决策的
2、分类决策的分类决策的分类n:决策的分类确定型决策风险型决策不确定型决策确定型决策确定型决策n在完全掌握未来的外界状态情况下傲出决策。n决策者掌握决策所需的各种信息;n决策者面临多种可供选择的方案,但每种方案只可能有一种后果。风险型决策n是在不完全掌握未来的外界情况,但知道未来外界状态的概率分布的情况下做出决策。n在这种情况下决策者不仅面临多种方案可供选择,而且每种方案还面临多种后果,每种后果出现的可能性是可以预测。不确定型决策不确定型决策n在未来状态的概率分布也末知的情况下做出决策.n决策者只能掌握各种方案可能出现的后果,但不知道各种后果发生的概率.建立决策模型所用到的一些基本概念n状态集n决
3、策集n报酬函数n决策准则状态集u状态:决策对象(系统)所处的不同的状况称为状态。它是由不可控制的自然因素所引起的结果,故称为自然状态。u状态变量:自然状态数量化u状态集:所有可能的自然状态所构成的集合u状态集的表示方法:S=x,其中x是状态变量,它可以是离散型的,也可以是连续型的。u系统中状态x发生的概率记为P(x).决策集u决策方案(简称方案):为达到预想的目标提出的每一个行动方案u决策变量:决策方案数量化.记为a.u决策集:决策变量的全体构成的集合,记为A=a.它可以是离散型的,也可以是连续型的.u本章研究状态集和决策集都是有限集的情况.报酬函数u报酬函数:定义在AS上的一个二元实值 函数
4、R(a,x).u根据决策问题的实际意义,报酬值R(a,x)可以表示在状态x出现时,决策者采取方案a所得到的收益值或损失值.决策准则决策准则u决策准则:决策者为了寻找最佳决策方案而采取的准则.记为.u最优方案:最优值对应的方案u一般选取决策准则使收益尽可能大而损失尽可能小。u由于决策者对收益、损失价值的偏好程度不同,对同一决策问题,不同的决策者会采取不同的决策准则。决策的数学模型和例子n假定决策问题的状态集和决策集都是有限集n数学模型的构成:状态集S、决策集A、报酬函数R(a,x)和决策准则。n表示方法:解析法、决策表、决策树决策表实例 n例 某农场欲修一水坝,必须考虑年降雨量大小对水坝的破坏作
5、用.根据过去的经验知道雨量大、中、小的概率分别为0.2,0.5,0.3.有三种设计方案可供选择,即按常规设计、采取加固措施设计和特殊加固措施设计.对每个设计方案需要考虑建筑费用和因雨量大小造成破坏后的维修费用.经调查计算总费用如表8.1.3所示(单位:万元).试建立该问题的决策数学模型nCircular Distance Labelling nCircular Distance Labelling9.2.风险型决策分析n1.进行风险型决策分析的基本条件和方法n风险型决策:决策者对未来的情况无法做出肯定的判断,但可借助于统计资料推算出各种情况发生的概率.n决策条件:(1)存在决策者希望达到的一个
6、明确目标;(2)存在着两种或两种以上的自然状态;(3)存在着可供决策者选择的不同方案;(4)可计算出各方案在各种自然状态下的报酬值;(5)可以确定各种自然状态产生的概率。(1)最大可能法n最大可能法:是将风险型决策化为确定型决策而进行决策分析的一种方法.该方法选择一个概率最大的自然状态进行决策,把这种自然状态发生的概率看作1,用确定型决策分析方法来进行决策。n例 9.2.1 某农场要在一块地里种一种农作物,有三种可供选择的方案,即种蔬菜、小麦或棉花.根据过去的经验和大量调查研究发现天气干旱、正常和多雨的概率分别为0.2,0.7,0.1.每种农作物在三种天气下获利情况如表9.2.1所示.为获得最
7、大利润应如何决策?例9.2.1 (2)期望值准则期望值准则(1)矩阵法矩阵法例例1 S1 S2 S3 0.3 0.5 0.2 A1 20 1 -6 5.3 A2 9 8 0 6.7 A3 6 5 4 5.1S Sj jP Pj jA Ai i PjVij选选 A A2 2例例 2 2 S1 S2 P(S1)=0.7 0.3A1 500 -200 290*A2 -150 1000 195 PjVij分析当分析当P(SP(S1 1)为何值时,方案会从为何值时,方案会从A A1 1 A A2 2 转折概率转折概率n nE(A1)=500+(1-)(-200)E(A1)=500+(1-)(-200)=
8、700-200 =700-200n nE(A2)=(-150)+(1-)(1000)E(A2)=(-150)+(1-)(1000)=-1150+1000 =-1150+1000n n令令E1=E2 E1=E2 得得=0.65=0.65n n称称=0.65=0.65为转折概率为转折概率n n 0.65 0.65 选选A1 A1 n n 0.65 0.5,选 a4;否则选a1 Vi1+(1-)Vi2245Vi2=Min R(ai,x)1+24-1+6(4)后悔值法(Savage决策法)n后悔值法:使后悔值尽量小的决策分析方法n状态 x下方案a的后悔值为 n决策准则:在所有方案的最大后悔值中选取最小
9、值所对应的方案为最优方案,即决策准则为 R(a,x)S A2X1(1000)X2(1500)X3(2000)X4(2500)a1(1000)2222a2(1500)1333a3(2000)0244a4(2500)-1135 R(a,x)S AX1X2X3X4X1X2X3X4a1(1000)22220123a2(1500)13331012a3(2000)02442101a4(2500)-11353210选 a2 或a33245Max R(ai,x)xS1+24-1+63232 后悔值表222(5)等可能法(Laplace决策法)n等可能法假定各种自然状态发生的概率都相同.这样就把一个不确定型决策
10、化为一个风险型决策来进行分析.n决策准则:选择期望报酬值最大的方案为最优方案.R(a,x)S A2X1(1000)X2(1500)X3(2000)X4(2500)a1(1000)2222a2(1500)1333a3(2000)0244a4(2500)-1135 R(a,x)S AX1X2X3X4a1(1000)2222a2(1500)1333a3(2000)0244a4(2500)-1135选 a2 或a33245Max R(ai,x)xS1+24-1+622.522.5 后悔值表222.52.51.效用函数及其应用n(1)期望值法决策的特点n最优方案是期望报酬值最大意义下的方案.n期望报酬值
11、不一定是实际报酬值,单纯追求期望报酬值最大是有风险的.l用望值法进行决策,应取方案a1为最优方案l实施方案a1,有70%的可能获得10万元,但也有30%的可能亏损3万元.10-35X1,0.7X2,0.36.1a1a26.1(2)效用值n对同一问题,不同的决策者会采取不同的态度.n对于不愿冒险的决策者来说,他宁愿采取方案a2,而舍弃方案a1.这样他肯定能得到5万元的收入.n对另外的决策者来说,他宁愿选择a1,因为有很大的可能收入10万元,即他认为a1比a2好.。n对同一结果,不同的人会有不同的价值观,不同的人会有不同的价值观.因而会做出不同的决策.n例如某个方案能收入1000元,对于一个拥有1
12、00万元的人来说,他可能会放弃.但对于一个只有500元的人来说,他很可能会采取.n同一结果(同样货币同样货币)在不同的风险场合,其价值在同一在不同的风险场合,其价值在同一个人感觉不一样。个人感觉不一样。n为了对决策者对报酬值的偏好程度给出一个数量标志,就引进了效用函数的概念,它表示决策者对风险的态度.(3)报酬集、偏好关系(4)效用函数(5)效用值计算及效用曲线效用值计算及效用曲线n n例例1 1 在某次交易中,决策者认为:在某次交易中,决策者认为:n n可承担的最大损失是可承担的最大损失是 -1000-1000万元万元n n可获得的最大收益是可获得的最大收益是20002000万元万元 则则
13、u(2000)=1,u(-1000)=0u(2000)=1,u(-1000)=0n n提问提问(1):(1):你觉得你觉得r r=?=?时,时,A A1 1,A A2 2等效?等效?n nA A1 1:无风险得无风险得r rn nA A2 2:以以0.50.5可能得可能得20002000万,万,0.50.5可能损失可能损失10001000万。万。n n答:答:r=1200r=1200万万n n确定确定u(r):u(r):n0.5u(2000)+0.5u(-1000)=u(1200)n则u(1200)=0.5n nu(2000)=1,u(-1000)=0u(2000)=1,u(-1000)=0n
14、 n提问提问(1)(1)确定确定u(1200)=0.5n n提问提问(2):(2):你觉得你觉得r r=?=?时,时,A A1 1,A A2 2等效?等效?n nA A1 1:无风险得无风险得r rn nA A2 2:以以0.50.5可能得可能得12001200万,万,0.50.5可能损失可能损失10001000万。万。n n答:答:r=800r=800万万n n确定确定u(r):u(r):n0.5u(1200)+0.5u(-1000)=u(800)n则U(800)=0.50.5=0.25n nu(2000)=1,u(-1000)=0u(2000)=1,u(-1000)=0n n提问提问(1)
15、(1)确定确定u(1200)=0.5n n提问提问(2)(2)确定确定u(800)=0.25n n提问提问(3):(3):你觉得你觉得r r=?=?时,时,A A1 1,A A2 2等效?等效?n nA A1 1:无风险得无风险得r rn nA A2 2:以以0.50.5可能得可能得800800万,万,0.50.5可能损失可能损失10001000万。万。n n答:答:r=200r=200万万n n确定确定u(r):u(r):n0.5u(800)+0.5u(-1000)=u(800)n则U(800)=0.50.25=0.1251 101000100020002000120012002002008
16、008000.50.50.250.250.1250.125冒险型冒险型L1L1:保守型保守型L2L2:中间型中间型L3L3:冒险型冒险型效用曲线的三种基本类型(6)效用值准则决策n例9.4.1.某工厂欲生产一种新产品.有两种生产方案可供选择,即年产2万吨和年产5万吨.根据市场预测知道产品销路有好、中、差、滞销四种情况.这几种情况发生的概率和两个方案在各种情况中的经济效益如下表所示(单位:万元).设工厂的效用函数在各报酬的值为 u(500)=1,u(200)=0.5,u(-100)=0.1,u(500)=1,u(200)=0.5,u(-100)=0.1,u(-200)=0.05,u(-500)=
17、0 u(-200)=0.05,u(-500)=0 试利用效用函数选择最优方案试利用效用函数选择最优方案.S Ax1(好)x2(中)x2(差)x2(滞销)0.30.40.20.1a1(年产2万吨)200200200200200-100a2(年产5万吨)500200200-200-200-500又据该表中的收益值和概率,可算得全信息的期望收益为 0.3100 0.7 10=37(万元)则全信息价值为 37一13=24(万元).易知采取a2(出租)方案较好,可期望获利13万元。例9.4.1.效用值决策n解:该问题的效用值决策表如下:u(au(a1 1)=0.30.5+0.40.5+0.20.5+0.
18、10.1=0.46)=0.30.5+0.40.5+0.20.5+0.10.1=0.46 u(au(a2 2)=0.31+0.40.5+0.20.05+0.10=0.51)=0.31+0.40.5+0.20.05+0.10=0.51 工厂应选工厂应选a a2 2为最优方案为最优方案.S Ax1(好)x2(中)x2(差)x2(滞销)0.30.40.20.1a1(年产2万吨)0.50.50.50.50.50.1a2(年产5万吨)10.50.50.050.050又据该表中的收益值和概率,可算得全信息的期望收益为 0.3100 0.7 10=37(万元)则全信息价值为 37一13=24(万元).易知采取
19、a2(出租)方案较好,可期望获利13万元。例9.4.1.期望值决策n解:该问题的期望值决策表如下:E(a E(a1 1)=0.3200+0.4200+0.2200+0.1(-100)=170)=0.3200+0.4200+0.2200+0.1(-100)=170 E(aE(a2 2)=0.3500+0.4200+0.2(-200)+0.1(-500)=0.3500+0.4200+0.2(-200)+0.1(-500)=140 =140 工厂应选工厂应选a a1 1为最优方案为最优方案.由上面的例子易见把利润作为决策目标和把效用值作为决策目由上面的例子易见把利润作为决策目标和把效用值作为决策目标
20、,其结果可能是不同的标,其结果可能是不同的.一般利用效用函数进行决策分析更能一般利用效用函数进行决策分析更能反映决策者的主观愿望反映决策者的主观愿望.效用函数还可以用来简化决策树,进行效用函数还可以用来简化决策树,进行多目标决策分析等多目标决策分析等 S Ax1(好)x2(中)x2(差)x2(滞销)0.30.40.20.1a1(年产2万吨)200200200200200-100a2(年产5万吨)500200200-200-200-500又据该表中的收益值和概率,可算得全信息的期望收益为 0.3100 0.7 10=37(万元)则全信息价值为 37一13=24(万元).易知采取a2(出租)方案较
21、好,可期望获利13万元。2.信息的价值n要想对各种自然状态发生的概率做正确的预测,必须掌握更多的信息.n在现实生活中,人们往往使用实验的方法去获取信息.这里实验一词的含义很广,诸如气象观测,市场调查,地质勘测,产品抽样检验(对质量控制问题)等等,都可视之为实验.n要获得信息一般都要付出代价(咨询费用)。要知道花多少代价去获得信息才合算,就得估算信息的价值。如果信息价值大于咨询费用,则进行咨询.否则,将不值得进行咨询.n确定未来状态发生的概率是进行决策分析的重要依据.凭个人的主观意志,判断给出的状态发生的概率通常称为先验概率.在先验概率的基础上,通过咨询得到新的概率分布,称为后验概率.n用后验概
22、率计算的最优期望报酬值与用先验概率计算出的最优期望报酬值之差称为咨询的信息价值.计算信息价值的步骤n设状态集S=x1,x2,xn,发生的先验概率为p(xi),实验结果S=z1,z2,zn.n第1步 利用各状态的先验概率分布p(x),求出各个方案的期望报酬值,最大者记为E(R).n第2步 根据所得信息,计算各种自然状态的后验分布,即依赖于信息的条件概率分布 p(xz)P(z)j p(xj)p(z|xj)P(z|x)p(x)=n第3步 利用后验概率分布,计算各个方案的后验期望报酬值;n第4步 对于的每一个值,选出后验期望报酬值最大的方案.这时的报酬值是x和z的函数,记为R*(x,z).n第5步 计
23、算出后验期望报酬值与先验期望报酬值的差,即计算出E(R*(x,z)-E(R).完全信息完全信息 例1nA国某地区地下可能储藏有石油,其概率为0.3.A国可以自行钻探,需化费30万元,然而一但探明有油,开采可获净利100万元;也可将该地石油开采权租让给B国石油开发公司,从而稳得租金10万元,且若能出油还可额外再得10万元.A国应如何决策?n解:先列出该问题的期望值法决策表。S Ax1(有油)x2(无油)0.30.7a1(自钻)100-30a2(出租)2010又据该表中的收益值和概率,可算得全信息的期望收益为 0.3100 0.7 10=37(万元)则全信息价值为 37一13=24(万元).易知采
24、取a2(出租)方案较好,可期望获利13万元。例2n全信息价值为 37一13=24(万元).n但是,要获得全信息必须实际钻探,要钻探就得花费30万元,这又超过了全信息的价值,显然不合算.n全信息固然有效,但实际上往往很少用到它.n例2 在例1中,假定有一个地质勘探队能对该地区进行一次地震试验,从而判明该地区的地质结构是封闭的或开放的.从地质学知通:有油地区多半是封闭结构,无油地区多半是开放结构.又根据以往的统汁资料知道,该地质勘探队把有油地区勘测为封闭结构的概率是 0.8,勘测为开放结构的概率是0.2;把无油地区勘测为封闭结构的概率是0.4,勘测为开放结构的概率是0.6.假定此项地震试验的花费为
25、5万元,问A国应如何决策?n上述利用公式计算后验概率的过程,可用下面的计算表格清楚地表示出来.表中右端栏给出了后验概率p(xj|zi),即在附加信息zi下状态xj的概率.xj(1)p(xj)(2)p(z1|xj)p(z2|xj)(3)=(1)(2)p(xjz1)p(xjz2)(4)=(3)/p(z)p(xj|z1)p(xj|z2)X1x20.30.70.8 0.20.4 0.60.24 0.060.28 0.420.52 0.48=p(z1)=p(z2)23948710165钻探A1出租A2-5试验A3X1,0.3X1,0.3X1,0.125X1,0.125X2,0.875X2,0.875X2
26、,0.7X2,0.7X1,6/13X1,6/13X2,7/13X2,7/13A1A1A2A2A2Z2,0.48Z1,0.523014.6-13.753011.253011.25913211001020-301001020-3010010 20-30|16 最优总决策:先进行地震试验,若试验结果为封闭结构,则自行钻探;若试验结果为开放结构,则出租该地区石油开采权.这样,收益期望值最大,为ER*=16万元.决策树法具体过程n画树建模:依法从左至右画出决策树.n逐级决策:这是一个多级决策问题,需要从右至左逐级决策.先算出节点、处的期望值;然后在节点5、6处作出决策并剪枝;再算出节点以及、处的期望值;最后在节点1处进行决策:因节点处期望值为21万元,除去试验费5万元(即符号右旁的数宇-5),还剩16万元,这就是试验方案a3.的纯收益期望值,它大于不试验而直接自行钻探或出租的a1、a2方案的收益期望值,所以剪去a1、a2 分枝,确定a3 为最优方案.n作出结论:从节点1出发,沿未剪的分枝从左至右巡视,就可得出最优决策序列,即最优总决策:先进行地震试验,若试验结果为封闭结构,则自行钻探;若试验结果为开放结构,则出租该地区石油开采权.这样,收益期望值最大,为ER*=16万元.演讲完毕,谢谢观看!