《数学建模决策分析.pptx》由会员分享,可在线阅读,更多相关《数学建模决策分析.pptx(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1决策分析模型决策分析模型 一、一、概述概述 在决策问题中,每个可供选择的方案称之为行在决策问题中,每个可供选择的方案称之为行动,记为动,记为a a,而所有可能行动,而所有可能行动a a的集合称为行动空的集合称为行动空间,记为间,记为A A。行动是决策系统的自变量,它可以是。行动是决策系统的自变量,它可以是连续的,也可以是离散的。连续的,也可以是离散的。例如,某地要创建出租车公司,制定了三种购例如,某地要创建出租车公司,制定了三种购车方案:车方案:100100辆、辆、150150辆、辆、200200辆,这里的行动就辆,这里的行动就是一个离散变量。是一个离散变量。又如,某食又如,某食 品销售公司
2、考虑购进一批食用油,品销售公司考虑购进一批食用油,要制定一个利润大、库存积压少的购入量方案,这要制定一个利润大、库存积压少的购入量方案,这时的行动就是一个连续变量。时的行动就是一个连续变量。第1页/共68页2 方案确定以后,所产生的后果是否唯一确定,有方案确定以后,所产生的后果是否唯一确定,有时还取决于一些决策者无法控制的因素。时还取决于一些决策者无法控制的因素。在决策中,把行动确定以后,目标值所含的参数在决策中,把行动确定以后,目标值所含的参数s s称为状态,称为状态,s s的集合称的集合称 作状态空间,记为作状态空间,记为。状态取值可以是连续的,也可以是离散的。例状态取值可以是连续的,也可
3、以是离散的。例如,某企业经营是否盈利可以分为盈利、盈亏平衡、如,某企业经营是否盈利可以分为盈利、盈亏平衡、亏损三种离散状态。企业经营状况也可以使用量化亏损三种离散状态。企业经营状况也可以使用量化指标表示成连续值。指标表示成连续值。行动在状态下产生的后果,可以用收益或损失表行动在状态下产生的后果,可以用收益或损失表示,在决策中,收益函数、损失函数均称为决策函数,示,在决策中,收益函数、损失函数均称为决策函数,记为记为F F(s s,a a)。)。决策函数是决策的依据,它与行动空间、状态空间一决策函数是决策的依据,它与行动空间、状态空间一直构成了决策系统,记为(直构成了决策系统,记为(,A A,F
4、 F)。)。第2页/共68页3决策分类决策分类确定性决策非确定性决策不确定性决策风险决策决策环境(状态空间)确定(唯一的)大致概率完全不确定第3页/共68页4例1、某石油公司计划开发海底石油,有四种勘探方案 A1,A2,A3,A4可供选择。勘探尚未进行,只知可能有以下三种结果:S1:干井,S2:油量中等,S3:油量丰富,对应于各种结果各方案的损益情况已知,应如何决策?例2、某洗衣机厂,根据市场信息,认为全自动洗衣机应发展滚筒式,有两种方案。A1:改造原生产线,A2:新建生产线。市场调查知,滚筒式销路好的概率为0.7,销路不好为0.3。两种方案下各种情况的损益情况已知,应如何决策?第4页/共68
5、页5确定性决策方法 根据行动的性质,确定性决策问题可以划分为离散型和连续型两种,由于同一问题往往有多种处理方法,因此,这里只能简单介绍几种常用方法。1、加权评分法 在行动方案有限且离散的情况下,加权评分法是确定性问题的一种简便决策方法,该方法把方案涉及到的因素用指标表示,同时考虑不同指标在不同方案下的不同作用(指标值)及各指标重要性(指标权重)的差异,指标权重和指标值经算术和,综合成一个可比量值,来实现方案选 优。这种方法能从主观和客观两方面反映问题,所产生的结果一般比较符合实际。第5页/共68页62、微分法 当行动是连续变量,或者行动虽是离散变量,但其取值个数很多,甚至是无穷多,行动的取什多
6、一个或少一个数量间接对行动结局基本没有影响,可用微分法求最 佳行动。微分法的理论依据是极值理论,其决策准则是;使收益函数达到最大或使损失函数达到最小的行动就是最佳行动,因此,求最佳行动就是求函数的最大值(或最小值)。第6页/共68页73、数学规划法 上面介绍的加权评分法和微分法是确定性决策方法中的两种古典方法,其出发点在于求收益函数的最大值和损失函数的最小值。这两种方法通常适用于变量不多的决策问题,随着变量增加其适用性越来越差。近几十年来,随着运筹学等数学理论的发展,以数学规划理论为基础的一整套最优化方法在决策方面起着越来越重要的作用。例如,处理多变量决策问题的线性规划法,处理离散变量决策问题
7、的整数规划法等。第7页/共68页8第一节:不确定性决策例1、电视机厂,99年产品更新方案:A1:彻底改型 A2:只改机芯,不改外壳A3:只改外壳,不改机芯问:如何决策?第8页/共68页9收益矩阵:高 中 低 S1 S2 S3(万元)A1 20 1 -6A2 9 8 0 A3 6 5 4事件方案第9页/共68页10(一)、乐观准则(最大最大法则)maxmaxVij i ij j选A1 S1 S2 S3 Vi=maxVij A1 20 1 -6 20 A2 9 8 0 9A3 6 5 4 6maxVi=20i i 乐观原则是一种冒险的决策模式,它反映了决策者乐观原则是一种冒险的决策模式,它反映了决
8、策者的乐观情绪和风险意识。这种模式适用于最好状态发的乐观情绪和风险意识。这种模式适用于最好状态发生的可能性很大,或研究对象承受风险能力强的情况生的可能性很大,或研究对象承受风险能力强的情况。第10页/共68页11 悲观原则反映了决策者的悲观情绪,是一种保守的决策方法。例如,企业承受风险的能力较差,或最坏的状态很可能发生时,常采用这种决策原则。(二)、悲观准则(最大最小法则)maxminVij i ij j第11页/共68页12选A3 S1 S2 S3 Vi=minVij A1 20 1 -6 -6 A2 9 8 0 0A3 6 5 4 4maxVi=4i ij j第12页/共68页13 悲观原
9、则显得过于悲观保守,而乐观原则又显得太冒险,这种情况下可采用乐观系数法。这种方法要求决策者首先提出一个系数 (用 表示,0 1)来表示其乐观程度。决策者越乐观,值越接近于1;越悲观,值越接近于0。因此,这种方法叫乐观系数法。这种方法尽管避免了两种极端情况,但也没有利用全部可用信息,而且,乐观系数 的恰当确定也是一个难点。(三)、折衷准则(乐观系数准则)加权系数(0 1 1)max(maxVij)+(1-)(minVij)=0.6ijj第13页/共68页14选A1 S S1 1 S S2 2 S S3 3 V Vi1 i1=max V=max Vi2 i2=min =min 加权平均加权平均 A
10、1 20 1 -6 20 -6 9.6A2 9 8 0 9 0 5.4A3 6 5 4 6 4 5.2max=9.6max=9.6i i第14页/共68页15max Vij 1 1n nn nj=1j=1i i(四)、等可能准则 在缺乏准确信息的情况下,各行动状态是未知的。因此,有理由认为每一状态出现的概率是相同的。第15页/共68页16选 A2 S1 S2 S3 Vi=Vij A1 20 1 -6 5 A2 9 8 0 5A3 6 5 4 5max=52 23 32 23 31 13 3第16页/共68页17(五)、后悔值准则(最小机会损失)minmax maxVij -Vij 该原则与悲观
11、原则相似,也带有保守性质,反映了决策者的悲观情绪。但后悔值原则与悲观原则又有所不同,其一是它从损失的角度考虑问题,其二它又不是过分保守。i ij jj j第17页/共68页18选 A1 S S1 1 S S2 2 S S3 3 S S1 1 S S2 2 S S3 3 maxmaxA1 20 1 -6 0 7 10 10A2 9 8 0 11 0 4 11A3 6 5 4 14 3 0 14min=10min=10第18页/共68页19第19页/共68页21第二节:风险决策(一)、期望值准则(1)、矩阵法例1 S1 S2 S3 0.3 0.5 0.2 A1 20 1 -6 5.3 A2 9 8
12、 0 6.7 A3 6 5 4 5.1S Si iP Pj jA Aj j PjVij选 A2第21页/共68页22例2 S1 S2 P(S1)=0.7 0.3A1 500 -200 290A2 -150 1000 195 PjVij分析当P(S1)为何值时,方案会从A1 A2 第22页/共68页23当P(S1)=0.8 P(S2)=0.2时,E(A1)=0.8500+(-200)0.2=360E(A2)=0.8(-150)+0.2(1000)=80,仍A1P(S1)=0.6 P(S2)=0.4时 E(A1)=220E(A2)=310,选A2第23页/共68页24一般:E(A1)=500+(1
13、-)(-200)=700-200E(A2)=(-150)+(1-)(1000)=-1150+1000令E1=E2 得=0.65称=0.65为转折概率 0.65 选A1 100=E(A1)E(B2)=(1/2)2+(1/22)22+(1/23)23+=1+1+=10000=E(A2)因此根据期望收益最大的原则,应该选择方案B1和B2。这会令实际的决策者难以接受。例1 说明,完全根据期望收益作为评价方案的准则有时是不合理的。例2、有甲、乙二人,甲提出请乙掷硬币,并约定:若出正面,乙获利40元;若出反面,乙向甲支付10元。现在,乙有两个选择,接受甲的建议(方案A)或者不接受甲的建议(记为B),计算可
14、得乙的期望收益为:E(B)=0;E(A)=0.540-0.510=15第49页/共68页50 根据期望最大化原则,乙应该接受甲的建议。如果设乙是个穷人,手中仅有的10元钱是他一家三天的口粮钱。这时,乙对甲的建议的态度会发生变化,很可能宁愿用这10元钱来买全家三天的口粮,不致挨饿,而不去冒投机的风险。这个例子说明即使对同一个决策者来说,当其所处的地位、环境不同时,对风险的态度一般也是不同的。上述例子说明:现实中,决策方案的确定不仅仅依据期望收益最大原则,常要考虑到问题发生的环境、时期及决策者对问题的认知等方面因素。为此经济学家提出了效用的概念,并在此基础上建立了效用理论。第50页/共68页51
15、一般来说,效用是一个属于主观范畴的概念,是衡量决策方案的总体指标,反映决策者对决策问题各因素的总体看法.(1)同一货币量,在不同风险情况下,对同一决策者来说具有不同的效用值;(2)在同等风险程度下,不同决策者对风险的态度不同,即相同的货币量在不同人看来具有不同的效用。效用值是一个相对的指标,它的大小表示决策者对于风险的态度,对某事物的倾向和偏差等主观因素的强弱程度。第51页/共68页52 为此,在对某个问题提供决策的咨询意见时,我们可以通过与决策者进行对话,来建立相应的效用函数。此效用函数应能在一定的程度上反映决策者在决策问题上的决策偏向和评价标准。于是,利用这种效用函数作决策,依据的原则就称
16、为效用值准则。在一个决策问题中,通常情况下,我们将可能得到的最大收益值b的效用值取为1;而把可能得到的最小收益值a的效用值取为0。用效用值进行决策:首先把要考虑的因素折合成效用值,然后在决策准则下选出效用值最大的方案,作为最优方案。第52页/共68页53 如何通过与决策者对话建立相应的效用函数呢如何通过与决策者对话建立相应的效用函数呢?对于一个决策问题,如果最小收益值为?对于一个决策问题,如果最小收益值为a a,最大,最大收益值为收益值为b b,我们以收益,我们以收益x x 为自变量,为自变量,a a,b b 上的效上的效用函数设为用函数设为U U(x x),并有),并有U U(a a)=0,
17、)=0,U U(b b)=1)=1。对于。对于x x a a,b b,U U (x x)称为)称为x x 的效用值,的效用值,U U(x x)0,1 0,1。效用函数曲线 用效用量化决策者对风险的态度对每个决策者,用效用量化决策者对风险的态度对每个决策者,都可以确定反映他对风险态度的效用曲线,主要用都可以确定反映他对风险态度的效用曲线,主要用对比提问法确定效用曲线。对比提问法确定效用曲线。第53页/共68页54对比提问法:设计两种方案 A1,A2A1:无风险可得一笔金额 X2A2:以概率P得一笔金额 X3,以概率(1-P)损失一笔金额 X1X1X2X3,u(xi)表示金额xi 的效用值。第54
18、页/共68页55在某种条件下,决策者认为A1,A2两方案等效。P U(x1)+(1-P)U(x3)=U(x2)()P,x1,x2,x3 为4个未知数。已知其中3个可定第4个。第55页/共68页56提问的方式大体有3种:1)每次固定x1,x2,x3x1,x2,x3的值,改变P,并向决策者提问:“P取何值时,您认为A1和A2等价?”2)每次固定P,x2,x3x2,x3的值,改变x1x1,并向决策者提问:“x1x1取何值时,您认为A1和A2等价?”3)每次固定P,x1,x2x1,x2的值,改变x3x3,并向决策者提问:“x3x3取何值时,您认为A1和A2等价?第56页/共68页57一般用改进的VM法
19、,即固定P=0.5,每次给出x1,x3,通过提问定x2,用(*)求出U(x2)5点法,定5个点作图第57页/共68页58例1、在某次交易中,决策者认为:可承担的最大损失是-1000万元 可获得的最大收益是2000万元 U(2000)=1 U(-1000)=0提问(1)A1:无风险得?你觉得A1,A2等效?A2:以0.5可能得2000万,0.5可能损失1000万。回答 1200万,0.5U(2000)+0.5U(-1000)=U(1200)则U(1200)=0.5第58页/共68页59提问(2)A1:无风险得?你觉得A1,A2等效?A2:以0.5可能得1200万,0.5可能损失-1000万。回答
20、 800万,0.5U(1200)+0.5U(-1000)=U(800)0.50.5=U(800)=0.25提问(3)A1:无风险得?你觉得A1,A2等效?A2:以0.5可能得800万,0.5可能损失-1000万。回答 200万,U(200)=0.50.25=0.125 第59页/共68页601 101000100020002000120012002002008008000.50.50.250.250.1250.125冒险型第60页/共68页61L1L1:保守型L2L2:中间型L3L3:冒险型第61页/共68页62(3)效用值准则决策例 A1:建大厂 需要投资300万元 使用期10年 A2:建小
21、厂 需要投资160万元 使用期10年 销路 S1(好)S2(差)0.7 0.3 A1 100万元/年 -20万元/年 A2 40万元/年 10万元/年第62页/共68页63(1)期望值准则(决策树法)134023建小厂建小厂A A2 2建大厂建大厂A A1 11503400.70.30.70.34010-1604010-1602402401010-1601010-160-60-6010010-30010010-300700700-2010-300-2010-300-500-500第63页/共68页64结论:应建立大厂134023建小厂建小厂A A2 2建大厂建大厂A A1 13106400.7
22、0.30.70.340401010100100-20-2010年-160-160-300-300第64页/共68页65(2)效用值准则(决策树法)1)求决策者最大可能损益值 建大厂销路好:700 u(700)=1 建大厂销路差:-500 u(-500)=0第65页/共68页662)效用曲线0-5007001u(240)0.82u(-60)0.58第66页/共68页67结论:应建立小厂10.7523建小厂建小厂A A2 2建大厂建大厂A A1 10.750.70.70.30.70.3u(240)=0.82u(240)=0.82u(-60)=0.58u(-60)=0.58u(700)=1u(700)=1u(-500)=0u(-500)=0第67页/共68页68感谢您的观看。第68页/共68页