《2022年随机决策模型简介 .pdf》由会员分享,可在线阅读,更多相关《2022年随机决策模型简介 .pdf(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、华南农业大学数学建模培训资料随机决策模型简介 陈 羽 决策(Decision)是人们为了达到某一目标而从多个实现目标的可行方案中选出最优方案做出的抉择. 决策分析(Decision Analysis) 是帮助人们进行科学决策的理论和方法. 在现代管理中, 管理的核心就是决策, 正如诺贝尔奖金获得者H.A.Simon 说过的“管理就是决策”,决策在管理中起着十分重要的作用. 本专题主要介绍随机决策的基本概念和基本方法 , 重点介绍风险型决策、不确定型决策和效用理论. 第一节决策的概念 一、实例 例 1 某医院决策者对“ CT”室配置“ CT”机进行决策. 目的是在满足诊断需要的同时取得最好的经济
2、效益. 他们设想的可行方案有三个, 分别为配置一台、两台和三台. 根据资料, 预计在今年内需用“CT”诊断的患者人数有三种可能: 人多、一般、人少. 并且, 出现这三种情况的概率分别为0.3、0.5 和 0.2. 又计算得知, 当配置一、二、三台“CT”机时, 如果病人多, 则效益分别为10、22、36(万元);一般时,效益分别为 10、20、18(万元) ;而病人少时, 效益分别为10、16、10(万元). 问应选择何种方案, 才能达到目标要求? 建立实际问题的数学模型, 是运筹学解决问题的前提, 在这里我们先引入决策分析问题的精确数学描述, 暂不考虑问题的解法. 第二节将对该题给出解法.
3、很显然, 本题中有三个方案可供选择, 每种方案都有三个可能结果, 即存在三个自然状态: 病人多、一般、病人少;因为状态是不可控制的 , 是随机事件, 而每个状态发生的概率已经分别给出;不同方案和不同的状态的效益值也不同 . 为了能够给出问题的数学描述, 我们先给出决策问题的一些基本概念. 二、决策的基本概念 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料1. 策略集为实现预期目的而提出的每一个可行
4、方案称为策略 , 全体策略构 成 的 集 合 , 称 为 策 略 集 (Strategies Set), 也 称 方 案 集 , 记 作iaA =,)3 ,2, 1(niai=表示每一个方案.2. 状态集系统处于不同的状况称为状态, 它是由人们不可控制的自然因素所引起的结果, 故称为自然状态. 全体状态构成的集合称为状态集(States Set),记作jsS =,)3 , 2, 1(mjsj= 表示每一状态.3. 状态概率状态js 的概率称状态概率 (State Probability),记为)(jsp.4. 益损函数 益损函数 (Opportunity Loss Function) 是指对应
5、于选取方案和可能出现的状态, 所得到的收益值或损失值, 记为R.显然,R 是 A与S的函数, 益损函数值可正可负也可为零, 如果认定正值表示收益, 那么负值就表示损失, 益损函数的取值就称为益损值. 策略集, 状态集, 益损函数是构成一个决策问题的三项最基本要素 . 5. 决策准则和最优值 决策者为了寻找最佳方案而采取的准则称为决策准则(Decision Criterion) , 记为 . 最优值 (Optimal Number) 是最优方案对应的益损值,记为*R一般选取的决策准则往往是保证收益尽可能大而损失尽可能小,由于决策者对收益、损失价值的偏好程度不同, 对同一决策问题, 不同的决策者会
6、有不同的决策准则三、决策的数学模型 一个决策问题的数学模型是由策略集A、状态集 S 、益损函数R和决策准则构成的. 因此我们可以用解析法写出上述集合、函数、准则来表示一个决策问题 的 数 学 模 型.即ijrSARR=),(,其 中 ,iaA =ni.2, 1=, jsS =mj.2 , 1=,ijr 是方案ia 在状态js 情况下的益损值.例 2给出例 9-1 问题的数学模型.解 数学模型为 : 策略集机台配制CTiaAi=321 ,=i状态集321病人多,一般,病人少,=ssssSj名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - -
7、 - 名师精心整理 - - - - - - - 第 2 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料状态概率3.0)(1=sp5.0)(2=sp2.0)(3=sp益损值ijrR=3 ,2, 1=i3, 2, 1=j1110r=1012=r1013=r2221=r2022=r 1623=r 3631=r 1832=r 1033=r另外,决策的数学模型也可用表格法表示,风险型决策也常用决策树方法表示. 例 1 可由表 1 表示,决策树将于第二节详细介绍.表 1 不同方案在不同状态下的益损值(万元) 自 然 状 态 方 案 1s( 病人多 ) 2s( 一般 )
8、3s( 病人少 ) 3.0)(1=sp5.0)(2=sp2 .0)(3=sp1a( 配置一台 ) 10 10 10 2a( 配置两台 ) 22 20 16 3a( 配置三台 ) 36 18 10 四、决策的步骤与分类 一个完整的决策过程通常包括以下几个步骤:确定目标、 拟定方案、 评价方案、选择方案、 实施决策并利用反馈信息进行控制决策按问题所处的条件和环境可分为确定型决策、风险型决策和不确定型决策 确定型决策(Certain Decision)是在决策环境完全确定的情况下作出决策即每种方案都是在事先已经确定的状态下展开,而且每个方案只有一个结果, 这时只要把各种方案及预期收益列出来,根据目标
9、要求进行选择即可尽管如此, 当决策可行方案很多时, 确定型决策也非常复杂, 有时可借助线性规划的方法,去找出最佳方案 风险型决策 (Venture Decision)是在决策环境不完全确定的情况下做出的决策即每种方案都有几个可能的结果,而且对每个结果发生的概率可以计算或估计,用概率分布来描述 正因为各结果的发生或不发生具有某种概率,所以这种决策带有一定的风险 不确定型决策 (Uncertain Decision)是在对将发生结果的概率一无所知的情况名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - -
10、- - 第 3 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料下做出的决策 . 即决策者只掌握了每种方案可能出现的各个结果, 但不知道各个结果发生的概率 . 由于缺乏必要的情报资料 , 决策者只能根据自己对事物的态度去进行抉择 , 不同的决策者可以有不同的决策准则, 所以同一问题就可能有不同的抉择和结果这里我们只介绍风险型和不确定型两种决策 第二节 风险型决策(有概率的决策) 风险型决策也称随机决策, 是在状态概率已知的条件下进行的决策本节主要介绍风险型决策的条件和一些常用的基本决策准则及决策方法 一、风险型决策的基本条件 在进行风险型决策分析时,被决策的问
11、题应具备下列条件:(1)存在决策者希望实现的明确目标;(2)存在两个或两个以上的自然状态,但未来究竟出现哪种自然状态,决策者不能确定;(3) 存在着两个或两个以上的可行方案(即策略)可供决策者选择 , 最后只选一个方案;(4) 各种方案在各种自然状态下的益损值可以计算出来;(5) 各种自然状态发生的概率可以计算或估计出来. 对于一个风险型决策问题 , 首先要掌握决策所需的有关资料和信息, 从而确定状态集S, 以及状态概率)(jsP, 明确可供选择的策略集A, 进而计算出益损函数),(SAR. 建立决策数学模型 , 根据决策目标选择决策准则, 从而找出最优方案 . 二、最大可能准则 由概率论知识
12、可知 , 一个事件的概率越大 , 它发生的可能性越大 . 基于这种考虑, 在风险型决策问题中选择一个概率最大的自然状态进行决策, 而其他状态可以不管 , 这种决策准则称为最大可能准则(The Maximum Criterion) . 利用这种决策准则进行决策时 , 把确定的自然状态看作必然事件,其发生的概率看作1, 而其他自然状态看作不可能事件,其发生的概率看作0, 这样, 认为系统中只有一种确名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 29 页 - - - - -
13、- - - - 华南农业大学数学建模培训资料定的自然状态 , 从而将风险型决策转化为确定型决策. 例 3 某药厂要确定下一计划期内某药品的生产批量, 根据以往经验并通过市场调查和预测 . 现要通过决策分析 , 确定合理批量 , 使药厂获得效益最大 , 表2为不同方案在不同状态下的益损值. 表 2 不同方案在不同状态下的益损值(万元)药 品 销 路 方 案 1s( 好) 2s( 一般 ) 3s( 差) 2 .0)(1=sp5.0)(2=sp3.0)(3=sp1a( 大批量生产 ) 30 18 8 2a( 中批量生产 ) 25 20 12 3a( 小批量生产 ) 16 16 16 解 这是一个风险
14、型决策问题 , 采用最大可能准则来进行决策. 在药品销路中, 自然状态2S出现的概率最大, 即销路一般的可能性最大. 现对这一种自然状态进行决策 , 通过比较 , 可知药厂采用策略2a( 中批量生产 ) 获利最大 , 所以选取中批量生产为最优方案 . 值得注意 : 在若干种自然状态发生的概率相差很大, 而相应的益损值又差别不大时, 使用这种决策准则效果较好. 如果在若干种自然状态发生的概率都很小,而且相互很接近时 , 使用这种决策准则 , 其效果是不好的,甚至会引起严重错误. 三、期望值准则 期望值是指概率论中随机变量的数学期望. 这里使用的是离散型随机变量的数学期望 , 是将每个策略 (方案
15、)都看作离散型随机变量 , 其取值就是采用该策略时各自然状态下对应的益损值. 期望值准则 (The Expected Value Criterion) 就是选择期望益损值最大 (或最小)的方案为最优方案 . 用公式表达为 : )(max)(maxjjijiiispraER=? (1) 或 )(min)(min=?jjijiiispraER (2) 其中ijr 是方案ia 在状态js 情况下的益损值,)(jsp是状态js 发生的概率 . 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第
16、5 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料例 4 用期望值准则解例3. 解 根据表 2 所列各种状态概率和益损值, 可以算出每个策略的期望益损值: 163.0165. 0162.016)(6.183 .0125.0202.025)(4.173.085. 0182 .030)(321=+=+=+=aEaEaE通过比较可知)(2aE=6 .18最大 , 所以采用2a也就是采取中批量生产, 可能获得的效益最大 . 例5 已知在过去的 200天里, 某药品在各种销售量下销售天数的记录如表3所示. 设该种药品一旦生产出来需要及时推销出去, 如当天不能推销出去
17、, 即全部报废. 该药品每件生产成本8元, 销售价 10元, 假设今后的销售情况与过去的销售情况相同 , 试确定最优的生产数量 . 表 3 销售量与销售时间 每天销售量 ( 件) 80 90 100 110 相应的销售天数 20 70 80 30 解 在本例中 , 自然状态是销售情况 , 设状态1s、2s、3s 、4s分别表示销售量为 80 件、90 件、100 件、110 件. 策略也为 4 种, 设方案4321,aaaa分别表示日生产 80 件、90 件、100 件、110 件. 由表 3 可计算状态概率 : 1 .0200/20)(1=sp35.0200/70)(2=sp4 .0200/
18、80)(3=sp15. 0200/30)(4=sp 现在计算每个策略在各种自然状态下的益损值. 当1a,1s时, 生产 80件销售 80 件, 每件收益 10-8=2 元, 共收益 160元, 即 16011=r元 , 同理160141312=rrr; 当2a,1s时,生产90件,但只销售80件,报废10件共收益8010880221=-=r元依此类推,可算出所有的益损值,详列于表4,利用( 1)式计算出每种策略下的期望益损值进行比较,可以看出:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - -
19、- 第 6 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料170)()(),(),(),(max24321=aEaEaEaEaE故选择方案2a为最优策略,即日产90 件,此时期望益损值为170元.表 4 不同方案在不同状态下的益损值(元) 市 场 可 销 售 量 方 案 1s2s3s4s1.0)(1=sp35.0)(2=sp4. 0)(3=sp15.0)(4=sp期望益损值 1a 160 160 160 160 160 2a 80 180 180 180 170 3a 0 100 200 200 145 4a -80 20 120 220 80 一般地,用期
20、望值准则进行风险型决策的计算步骤是:(1)根据统计资料计算各个自然状态的概率;(2)计算每个方案在各个自然状态下的益损值;(3)计算每个方案的期望益损值;(4)根据期望益损值评价方案的优劣若决策目标是收益,应选择期望益损值最大的相应方案为最优方案;若决策目标是支出或损失, 应选择期望益损值最小的相应方案为最优方案四、决策树法(decision trees method)应用期望值准则作决策,还可借助于一种名为“决策树”(decision tree)的图形来进行,它将方案、状态、益损值和状态概率等用一棵树来表示,将期望益损值也标在这棵树上, 然后直接通过比较进行决策 图 1 就是例 6 中决策问
21、题的决策树图 9-1 决策树图 1 决策树名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料决策树是由决策点、方案节点、树枝、结果节点四部分组成,下面就图中符号做一说明:表示决策点 , 从它引出的分枝称为方案分枝 表示方案节点 , 其上方数字为该方案的期望益损值, 从它引出的分枝称为状态分枝 , 每条分枝上数字为相应的状态概率, 分枝数就是状态数 . 表示结果节点 , 它后面的数字表示某个方案在某种状
22、态下的益损值. 采用决策树法进行决策的步骤是: (1)画决策树 . 一般是从左向右画 , 先画决策点 , 再画由决策点引出的方案分枝, 有几个备选方案 , 就要画几个分枝; 方案分枝的端点是方案节点; 由方案节点引出状态分枝 , 有几个自然状态 , 就要画几个分枝; 在每个状态分枝上标出状态概率;最后 , 在每个状态分枝末梢画上“”, 即结果节点 , 在它后面标上每个状态在其方案的益损值 . (2)计算方案的期望益损值 . 在决策树中从末梢开始按从右向左的顺序, 利用决策树上标出的益损值和它们相应的概率计算出每个方案的期望益损值. (3)根据期望益损值进行决策, 将期望益损值小的舍去 , 而期
23、望益损值大的方案则保留 , 这就是最优策略. 决策树法是决策分析中最常用的方法之一, 这种方法不仅直观方便 , 而且可以更有效地解决比较复杂的决策问题. 例中只包括一级决策 , 叫做单级决策问题(Simple-Level Decision Problem) . 有些决策问题包括两级或两级以上的决策叫做多级决策问题 (Multiple-Level Decision Problem). 这类问题采用决策树法进行决策显得尤为方便简洁 . 下面举例说明决策树法的应用。 例 6 单级决策。单级决策是指决策问题子整个决策期中指进行一次决策,就能选择满意方案的决策过程。 某企业准备市场某种产品, 预计该产品
24、的销售有两种可能:销路好,其概率为 0.7;销路差,其概率为 0.3;可采用的方案有两个:一个是新建一条流水线,需投资 220 万元;另一个是对原有的设备进行技术改造,需投资70 万元。两个方案的使用期均为10 年,损益资料如表5所示,试对方案进行决策。 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料表 5 损益资料 投资 年收益(万元) 方案 (万元) 销路好( 0.7) 销路差( 0.3)使用
25、期 1新建流水线 2技术改造 220 70 90 50 -30 10 10 年 10 年 绘制决策树 ,如图 2 所示。 图 2 单级决策树 然后计算期望值:结点的期望值为; 900.7+(-30) 0.3 10-220=320 结点的期望值为;500.7+100.310-70=310 从期望收益值来看,方案一较高。因此,应采用此方案。例 7 已知某企业有下表所示的情况,请选择所用策略。 表 6 不同方案在不同状态下的益损值(万元) 方 案 自 然 状 态 决策点方案 1 方案 20.3 30 0.3 0.7 10 50 1 320 2 310 3 0.7 90 名师资料总结 - - -精品资
26、料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料1s(畅销) 1( )0.3P s=2s(一般) 2()0.5P s=3s(滞销) 3()0.2P s=1d(方案甲) 40 26 15 2d(方案乙) 35 30 20 3d(方案丙) 30 24 20 决策树如下 路好P(S1 )=0.3 40 d1 =28 销路一般 P(S2 )=0.5 26 销路差P(S3)=0.2 15 29.5 d2 =29.5 销路好P(S1 )=0
27、.3 35 决选乙方案销路一般 P(S2 )=0.5 30 策销路差P(S3)=0.2 20 d3 =25 销路好P(S1 )=0.3 30 销路一般 P(S2 )=0.5 24 销路差P(S3)=0.2 20 图 3 例 8 多级决策。多级决策又称序列决策,是指面临的决策问题比较复杂,非一次决策所能解决问题,而需进行一系列的决策过程才能选出满意方案的决策。某厂为生产某种新产品设计了两个建厂方案,一是建大厂,二是建小厂。建大厂需投资 300 万元,建小厂需投资160 万元。两方案的经济寿命均为10 年。估计在 10年内,前 3 年销路好的概率为0.7;销路差的概率为 0.3。同时预测投产后,如
28、果前 3 年销路好,后 7 年销路好的概率是0.9;销路差的概率是0.1;如果前 3年销路不好, 后 7 年销路也一定不好。 在这种情况下, 有人又提出第三方案,即先建小厂,如果全年销路好,再扩建成大厂,这样更有把握。扩建需投资 140万元。各方案的年损益值如表7,试问应如何决策?销名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料表 7 各方案的损益值(万元) 销路好 销路差 自然状态 方案 0.
29、7 0.3 寿命 投资 1建大厂 2建小厂 3先建小厂后扩建 100 40 -20 10 10 年 10 年 300 160 140 根据题意,绘出决策树如图4 差0.1616 差 0.1 差 0.1 好 0.9 6 好 0.9 差 0.1 差 0.1 好 0.9 287.2281.2 476-140 476 70 259 3年年7年1 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料图 4 决策
30、树 根据决策树图计算各点期望收益值。先计算后7 年的,后计算前3 年的。 点EMV8= 0.9100+0.1(-20) 7-140 =476(万元) 点EMV9= 0.940+0.1107=259(万元) 这两点的期望收益值计算出来后,进行比较。由于EMV8 EMV9 ,故决定选择扩建方案,把不扩建的方案剪掉,并把点的期望收益值移至点。 点EMV4= 0.9100+0.1(-20) 7=616(万元) 点EMV5= 1.0(-20) 7=-140(万元) 点EMV7=1.0 107=70(万元) 点EMV2=0.7 1003+0.7616+0.3(-20)3+ 0.3(-140)-300=28
31、1.2 (万元) 点EMV3=0.7 403+0.7476+0.3103+0.3 70-160=287.2(万元) 因 EMV3 EMV2 ,故选择先建小厂后扩建的方案。 决策树法具有许多优点, 它用图形把决策过程形象地表示出来,使决策者有顺序、有步骤地周密思考各有关因素,从而进行决策, 对于较复杂的序贯决策问题,可以画一个决策树挂在墙上,以便更多人了解决策的全过程,利于进行集体讨论,集体决策 五、完全情报及其价值 正确的决策来源于可靠的情报或信息。情报、信息越全面、可靠,对自然状态发生的概率的估计就越准确,据此作出的决策也就越合理。 1、完全情报和不完全情报 能完全肯定某一状态发生的情报称为
32、完全情报。否则,称为不完全情报。 有了完全情报, 决策者在决策时即可准确预料将出现什么状态,从而把风险型决策转化为确定型决策。 实际上,获得完全情报是十分困难的,大多数情报属于不完全情报。 2、完全情报的价值 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料为了得到情报,或直接从别入手中购买, 或需要自己进行必要的调查、 试验、统计等。总之 . 要花费一定的代价。若决策者支付的费用过低,则难于得到
33、所要求的情报,若需支付的费用过高,则决策者可能难以承受且可能不合算。另外,在得到完全情报之前, 并不知道哪个状态将会出现, 因此也无法准确算出这一情报会给决策者带来多大利益。 但为了决定是否值得去采集这项情报,必须先估计出该情报的价值。 完全情报的价值等于因获得了这项情报而使决策者的期望收益增加的数值。如果完全情报的价值大于采集该情报所花费用,则采集这一情报是值得的,否则就不值得了。因此 , 完全情报的价值给出了支付情报费用的上限。 例 9如前例 7 中的事例,假定花费 0.7 万元可以买到关于产品销路好坏的完全情报,请问是否购买之? 假如完全情报指出产品销路好,就选取策略d1,可获得 40
34、万元效益。 假如完全情报指出产品销路一般,就选取策略d2 , 可获得 30 万元效益。 假如完全情报指出产品销路差, 就选取策略 d2,或 d3 ,可获得 20 万元效益。因为在决定是否购买这一完全情报时还不知道它的内容,故决策时无法计算出确切的效益,只能根据各自然状态出现的概率求出期望效益值: 0.340+0.530+0.220=31 该问题的决策树如图5 所示。图中效益值的单位为万元。 40 d140 好2 d235 路d330 31 销0.3 30 d126 1 销路一般3 d230 0.5 d324 销0.2 d1路20 d215 差4 d320 20 图 5 对照例 7 的图可知,由
35、于得到了完全情报,期望效益值增加了1.5 万元。这1.5 万元就是该完全情报的价值。 因此,花费 0.7 万元购买该完全情报是合算的。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料六、贝叶斯(Bayes )决策 1、先验概率和后验概率 在风险型决策中, 有时不可能得到完全情报, 有时为了得到完全情报花费的代价太大而无法承受。 在这种情况下, 如果要改进原来的决策结果,可以采用抽样检验、请专家估计
36、等方法, 采集不完全情报作为补充情报以此来修正原来的概率估计。 先验概率:根据补充情报进行修正之前的各自然状态的概率。 后验概率:根据补充情报进行修正之后的各自然状态的概率。 一般来说,后验概率要比先验概率更加准确可靠。与完全情报相类似,获取不完全情报也要付出一定的代价,也有一个是否值得的问题。 2、贝叶斯公式及贝叶斯决策 概率中的贝叶斯公式就是根据补充情报,由先验概率计算后验概率的公式。其公式为: () (|)(|)() (|)iiijjP B P A BP BAP BP A B=, 1,2,in=式中: 事件iB 表示自然状态,12,nB BB 是所有可能出现的自然状态。 (|)iP A
37、B P是自然状态iB 出现的情况下,事件A发生的条件概率。 (|)iP BA 是事件 A发生的情况下, 自然状态iB 出现的条件概率, 即后验概率。“发生了一次事件 A”作为补充情报,据此对先验概率加以修正,以得到后验概率。 在风险型决策中,利用贝叶斯公式进行概率修正的决策方法,称为贝叶斯决策。 例 10 公司有 50000 元多余资金,如用于某项投资,估计成功率为96% ,成功时可获利 12% ,若失败,将丧失全部资金。如果把资金存入银行,则可稳得利息 6% 。为获取更多情报,该公司可求助于咨询服务,咨询费用为500 元,但咨询意见只能提供参考。 该咨询公司过去类似的200例咨询意见实施结果
38、如下表8所示。 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料表 8 咨询意见实施结果实施结果咨询意见投资成功投资失败合计可以投资154 次2 次 156次不宜投资2 次6 次44 次合计192 次8 次200 次问:该公司是否值得求助于咨询服务?应如何安排多余资金? 根据已知条件,有: 资金用于投资可获利: 5000012% = 6000(元) 资金存入银行可获利: 500006% = 300
39、0 (元) 设:E1:实际投资成功 E2:实际投资失败 T1:咨询意见为可以投资 T2:咨询意见为不宜投资 由表中数据知,各先验概率为: 实际投资成功: P(E1)= 192/200 = 0.96 实际投资失败: P(E2)= 8/200 = 0.04 咨询意见为可以投资 P(T1)= 156/200 = 0.78 咨询意见为不宜投资 P(T2)= 44/200 = 0.22 如果不考虑补充情报, 仅根据投资成功与失败的先验概率进行决策,则决策树为下图的上半部分。 决策结果将是进行投资。 如考虑补充情报, 则要计算后验概率。为此,先计算条件概率: 实际投资成功,咨询意见为可以投资: P (T1
40、E1 )= 154/192 = 0.802 实际投资成功,咨询意见为不宜投资: P (T2E1 )= 38/192 = 0.198 实际投资失败,咨询意见为可以投资: P (T1E2 )= 2/8 = 0.25 实际投资失败,咨询意见为不宜投资: P (T2E2 )= 6/8 = 0.75 再根据 Bayes公式计算各后验概率,即: 咨询意见为可以投资,实际投资成功: 咨询意见为可以投资,实际投资失败: 咨询意见为不宜投资,实际投资成功: 咨询意见为不宜投资,实际投资失败: 根据以上分析,可以完成决策树的全部内容。见图6:P(E1)= 0.96 3760 6000 投资P(E2)= 0.04
41、名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料3760 -50000 不咨询存银行3000 4272 P(E1T1)= 0.987 5272 P(E2T1)= 0.013 6000 咨询5272 投资-50000 4772 T1存银行3000 -1616 P(E1T2)= 0.864 6000 3000 投资P(E2T2)= 0.136 -50000 -500 T2存银行3000 图 6 本题的
42、结论是, 该公司应求助于咨询服务。 如果咨询意见是可以投资, 则将资金用于投资;如果咨询意见是不宜投资,则将资金存入银行。 第三节 不确定型的决策( 无概率的决策) 不确定型决策是在只知道有几种自然状态可能发生,但这些状态发生的概率并不知道时所做出的决策,这类决策问题应具有下列条件: (1) 存在明确的决策目标; (2) 存在两个或两个以上的可行方案; (3) 存在两种或两种以上的自然状态,但各种自然状态的概率无法确定; (4) 可以计算出各种方案在各自然状态下的益损值 如果各种自然状态的概率可以知道,不确定型决策就变成了风险型决策在实际中,会常常遇到不确定型决策问题,如新产品的销路问题、 新
43、股票上市发行问题等 例 11 某药厂决定生产一种新药,有四种方案可供选择:甲药、乙药、丙药、丁药;可能发生的状态有三种:畅销、一般、滞销每种方案在各种自然状态下的年效益值如表9 所示,为获得最大销售利润,问药厂应如何决策? 表 9 不同方案在不同状态下的益损值(万元) 自 然 状 态 方 案 1s(畅销) 2s(一般) 3s(滞销) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料1a(生产甲药)
44、 650 320 -170 2a(生产乙药) 400 350 -100 3a(生产丙药) 250 100 50 4a(生产丁药) 200 150 90 这是一个不确定决策问题,由于不知状态概率,无法计算每种方案的期望益损值,这类问题在理论上没有一个最优决策准则让决策者决策,它存在着几种不同的决策分析方法, 这些方法都有其合理性, 具体选择哪一种, 主要靠决策人的自身因素等下面介绍几种不确定型决策准则 、乐观准则 乐观准则 (Max-Max Criterion) 是从最乐观的观点出发,对每个方案都按最有利状态来考虑,然后从中选取最优的作为最优方案这个准则可表示为: maxmax*ijjirR=(
45、3) 具体步骤是: 先找出各方案在不同自然状态下的最大效益值,再从中选取最大值所对应的方案为决策方案 即先求ijjirRmax=,再求iiRRmax*=, 则*R 所对应的方案为决策方案 下面按乐观准则解例11. 解 650400max250200iijjRr?=?650max=?iiRR最优方案应为1a, 即生产甲药 . 这种决策是风险最大的决策. 注: 若给出的益损值不是效益值, 而是损失值 , 公式(3) 应变为小中取小 . 二、悲观准则(保守法) 悲观准则 (Max-Min Criterion) 是从最悲观的观点出发 , 对每个方案按最不利的状态来考虑 , 然后从中选取最优的作为最优方
46、案. 这个准则可表示为 : 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 17 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料minmaxjijirR =? (4) 具体步骤是 , 先求jijirRmin=, 再求iiRRmax=?, 则?R所对应的方案为决策方案 . 下面按悲观准则解例11. 解 ?-=9050100170minijjirR90max=?iiRR最优方案应为4a, 即生产丁药 . 注: 若给出的益损值不是效益值, 而是损失值 ,
47、 公式(9-4) 应大中取小 . 三、折衷准则 折衷准则 (Compromise Criterion) 是从折衷观点出发 , 既不完全乐观也不完全悲观, 准则中引入一个表达乐观程度的乐观系数()10. 这个准则可表示为: min)1 (maxmaxijjijjirrR-+=? (5) 显然, 若1=, 折衷准则就变成乐观准则 . 若0=, 会变成悲观准则 . 下面取7 .0=,按折衷准则解例11. 解 max(1)miniijijjjRrr=+-6501704044001002500.70.32505019020090167max404iiRR?-?-?=+=?=最优方案应为1a, 即生产甲药
48、 . 注: 若给出的益损值是损失值 , 公式(5) 中取大改为取小 , 取小改为取大 . 四、等可能准则( 拉普拉斯准则)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 18 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料 等可能准则 (Laplace Criterion) 是在假定各种自然状态发生的概率总是相同的情况下,选择期望益损值最优的方案为最优的方案决策准则可表示为:1max*=jijirmR(6)下面按等可能准则解例11解?=7 .146
49、3.1337 .2167 .2661jijirmR7.266max*=iiRR所以,选取方案1a为最优方案,即生产甲药注:若益损值为损失值时,公式(6)改为取最小值五、后悔值准则(最小遗憾法)后悔值准则 (Regret Criterion)是从后悔值考虑, 希望能找到一个这样的策略,以使在实施这个策略时能产生较少的后悔所谓后悔值是指每种状态下最大益损值与此状态下其它益损值之差在所有方案的最大后悔值中选最小者,此时对应的方案为最优策略决策准则可表示为:maxmin*jijiRVR =(7)其中jijiijirrRV-= max这种策略的具体步骤主要是:(1)找出各种自然状态下的最大收益值;(2)
50、分别求出各自然状态下各个方案未达到理想的后悔值;后悔值 =最大收益值 -方案收益值(3)把后悔值排成矩阵,称为后悔矩阵;(4)把每个方案的最大后悔值求出来,选取其中最小者所对应的方案为最优策略下面按后悔值准则解例11解首先根据表9 计算在状态js 下方案ia 的后悔值,然后计算最大后悔名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 19 页,共 29 页 - - - - - - - - - 华南农业大学数学建模培训资料值计算结果如表10 所示250450400250260minmax