《运筹学课件第三节不确定型决策方法精.ppt》由会员分享,可在线阅读,更多相关《运筹学课件第三节不确定型决策方法精.ppt(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、运筹学课件第三节不确定型决策方法第1页,本讲稿共62页一、悲观准则(max-min 准则)悲观准则又称华尔德准则或保守准则,按悲观准则决策时,决策者是非常谨慎保守的,为了“保险”,从每个方案中选择最坏的结果,在从各个方案的最坏结果中选择一个最好的结果,该结果所在的方案就是最优决策方案。例5 设某决策问题的决策收益表为 状态方案 42533547556636579 58542333第2页,本讲稿共62页所以 为最优方案。因二、乐观准则(max-max 准则)当决策者对客观状态的估计持乐观态度时,可采用这种方法。此时决策者的指导思想是不放过任何一个可能获得的最好结果的机会,因此这是一个充满冒险精神
2、的决策者。一般的,悲观准则可用下式表示试按悲观准则确定其决策方案。第3页,本讲稿共62页一般的,乐观准则可用下式表示 状态方案 42533547556636579 58579785例5 设某决策问题的决策收益表为试按乐观准则确定其决策方案。第4页,本讲稿共62页所以 为最优方案。因三、折衷准则折衷准则又称乐观系数准则或赫威斯准则,是介于悲观准则与乐观准则之间的一个准则。若决策者对客观情况的评价既不乐观也不悲观,主张将乐观与悲观之间作个折衷,具体做法是取一个乐观系数(0 1)来反映决策者对状态估计的乐观程度,计算公式如下第5页,本讲稿共62页 状态方案 42533547556636579 585
3、例5 设某决策问题的决策收益表为试按折衷准则确定其决策方案。解:若取乐观系数第6页,本讲稿共62页 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为第7页,本讲稿共62页 状态方案 42533547556636579 5856.47.66.27.04.6例5 设某决策问题的决策收益表为第8页,本讲稿共62页四、等可能准则等可能准则又称机会均等法或称拉普拉斯(Laplace)准则,它是19世纪数学家 Laplace 提出的。他认为:当决策者面对着n种自然状态可能发生时,如果没有充分理由说明某一自然状态会比其他自然状态有更多的发生机会时,只能认为它们发生的概率是
4、相等的,都等于1/n。计算公式如下第9页,本讲稿共62页 状态方案 42533547556636579 585例5 设某决策问题的决策收益表为试按等可能准则确定其决策方案。解:按等可能准则此一问题的每种状态发生的概率为第10页,本讲稿共62页 状态方案 42533547556636579 5855.505.255.005.504.50第11页,本讲稿共62页因有两个最大期望益损值方案,哪一个更优?第12页,本讲稿共62页考虑它们的界差:界差越小,方案越优。状态方案 42533547556636579 5855.505.255.005.504.50第13页,本讲稿共62页因故方案1为最优方案。五
5、、遗憾准则遗憾准则又称最小最大沙万奇(Savage)遗憾准则或后悔准则。第14页,本讲稿共62页当决策者在决策之后,若实际情况出现时并不理想,决策者有后悔之意,而实际出现状态可能达到的最大值与决策者得到的收益值之差越大,决策者的后悔程度越大。因此可用每一状态所能达到的最大值(称作该状态的理想值)与其他方案(在同一状态下)的收益值之差定义该状态的后悔值向量。对每一状态作出后悔值向量,就构成后悔值矩阵。对后悔值矩阵的每一行及对应每个方案求初其最大值,再在这些最大值中求出最小值所对应的方案,即为最优方案。计算公式如下第15页,本讲稿共62页最优方案为先取每一列中最大值,用这一最大之减去此列的各个元素
6、。再取结果的最大值。第16页,本讲稿共62页 状态方案 42533547556636579 58579785例5 设某决策问题的决策收益表为试按遗憾准则确定其决策方案。解:先计算后悔值矩阵:第17页,本讲稿共62页 状态方案 42533547556636579 585 状态方案 13022230220030120 4142*342*4后悔值矩阵第18页,本讲稿共62页最优方案为1或4。方案准则 悲观准则乐观准则折衷准则等可能准则遗憾准则一般来讲,被选中多的方案应予以优先考虑。第19页,本讲稿共62页第四节 效用函数方法一、效用概念的引入前面介绍风险型决策方法时,提到可根据期望益损值(最大或最小
7、)作为选择最优方案的原则,但这样做并不一定合理。请看下面的例子:例6设有两个决策问题:问题1:方案A1:稳获100元;方案B1:用掷硬币的方法,掷出正面获得250元,掷出反面获得0元。第20页,本讲稿共62页问题2:方案A2:稳获10000元;方案B2:用掷硬币的方法,直到掷出正面为止,记所掷次数为N,则当正面出现时,可获2N元.当你遇到这两类问题时,如何决策?大部分会选择 A1 和 A2。但不妨计算一下其期望值:Y10250P(Y1=k)1/21/2方案B1的收益为随机变量Y1。则其期望收益为:第21页,本讲稿共62页设方案B2的收益为随机变量Y2。Ai=“第i次掷出正面”,则第n次掷出正面
8、的概率为:Y222223nP(Y2=k)1/21/221/231/2nX012n-1相互独立设掷出正面前掷出反面的次数为随机变量X,则有分布列:则方案2的平均收益为:第22页,本讲稿共62页Y222223nP(Y2=k)1/21/221/231/2nX012n-1于是,根据期望收益最大原则,应选择B1和B2,但这一结果很难令实际决策者接受。此乃研究效用函数的初衷。例7(赌一把)一个正常的人,遇到“赌一把”的机会。情况如下面的树,问此人如何决策?第23页,本讲稿共62页正常人B赌不赌45元掷出正面P=0.5-10元P=0.50100元掷出反面45元对绝大部分人来说,只要兜里有10元钱,又不急用的
9、话,就选择“赌”。因此时“赌”的平均收益为:类似的问题,让一个被判刑十年且手头仅有10元钱的罪犯做下面的决策:第24页,本讲稿共62页罪犯B赌释放45元掷出正面P=0.5-10元P=0.5-10元100元掷出反面45元此时罪犯可能要选择交出10元钱,获得释放。以上例子说明:同一货币量在不同场合下给决策者带来的主观上的满足程度不同,决策者在更多的场合下是根据不同结果对其需求欲望的满足程度来进行决策的,不仅仅依据期望收益最大进行决策。相同的期望益损值(以货币值为度量)的不同随机事件之间其风险可能存在着很大的差异。即说明货币量的期望益损值不能完全反映随机事件的风险程度。第25页,本讲稿共62页 同一
10、随机事件对不同的决策者的吸引力可能完全不同,因此可采用不同的决策。这与决策者个人的气质、冒险精神、经济状况、经验等等主观因素有很大的关系。即使同一个人在不同情况下对同一随机事件也会采用不同的态度。当我们以期望益损值(以货币值为度量)作决策准则时,实际已经假定期望益损值相等的各个随机事件是等价的,具有相同的风险程度,且对不同的人具有相同的吸引力。但对有些问题这个假定是不合适的。因此不能采用货币度量的期望益损值作决策准则,而用所谓“效用值”作决策准则。效用是一个属于主观范畴的概念,效用是因人、因事、因地而发生变化的。第26页,本讲稿共62页效用与效用函数v为定量地描述决策者对风险的偏好和厌恶程度。
11、用效用来衡量同一期望值在不同人主观上的价值(满意程度的衡量尺度)。习惯上,效用最大为1,最小为0v一个决策者对不同期望值的效用值,构成了一条效用曲线U(X)。它描述了特定的期望损益值水平和与之相对应的满足程度之间的关系。效用函数的确定v直接提问:v收入2万您是满意的,收入增加到多少,您会加倍满意?v心理试验法 首先确定甲、乙两个方案,询问决策者选择哪一个方案。甲:以概率P得到a元,或以(1P)的概率损失b元;乙:无风险稳得c元;(acb)如果决策者认为甲、乙两方案等价时有:p U(a)+(1-p)U(b)=U(c)第27页,本讲稿共62页a,b,c,p四个变量中,已知任意三个,向决策者提问第四
12、个变量应取何值?如此反复回答,便可绘制出该决策者的效用曲线。常用的提问:固定a,b,p(0.5)值,问决策者c取何值时甲、乙两方案等价。0.5U(a)+0.5U(b)=U(X)1U(X)X0a0b0b2b1a1第28页,本讲稿共62页例8:效用曲线的确定 0.5U(a)+0.5U(b)=U(C)最大收益 a0=200,最小收益 b0100 根据约定:U(200)=1,U(-100)=0第一次提问:C取多少时,稳拿c的方案与相同的可能性获得最大收益和最小收益的方案是等价的?若回答为C=0,则有U(0)=0.5 U(200)+U(-100)=1/2;第二次提问:C取多少时,稳拿C的方案与相同的可能
13、性获取200和0的方案是等价的。若回答为C=80,则有U(80)=0.5 U(200)+U(0)=3/4;第三次提问:C取多少时,稳拿C的方案与相同的可能性获取100和0的方案是等价的。若回答为C=-60,则有U(-60)=0.5 U(0)+U(100)=1/4 根据以上五点用光滑曲线连起来,就得到他的效用曲线第29页,本讲稿共62页效用曲线图1U(X)X200100060800.750.500.25第30页,本讲稿共62页v 效用曲线的基本类型1U(X)X0IIIIIII 型:对损失的敏感性高于 对收益的敏感性。属于保守型决策者保守型:对实际收入的增加的反应较为迟钝,认为实际收入的增加比例小
14、于效用值的增加比例。II型:对收益的敏感性高于对损失的敏感性。属于冒险型决策者冒险型:对实际收入的增加的反应较为敏感,认为实际收入的增加比例大于效用值的增加比例。III型:对收益的敏感性等同于对损失的敏感性。按期望准则决策中间型:认为其实际收入和效用值的增长成正比关系。某一决策者可能兼有三种基本类型,不同情景下表现不同,当收入变化时,决策者对风险的态度也在发生变化。第31页,本讲稿共62页v小结:v1、不确定性决策方法。v2、效用函数法。第32页,本讲稿共62页第33页,本讲稿共62页第34页,本讲稿共62页第35页,本讲稿共62页第36页,本讲稿共62页v效用值准则 方法与期望价值相同,只是
15、用效用值替代损益值。计算得到每一方案的期望效用价值,取最大值对应的方案为最后的决策方案。第37页,本讲稿共62页二、效用曲线的确定及分类老王B二次抽奖一次500元P=0.50元P=0.5500元1000元500元为了讲清“效用”与“效用值”的概念,看下例例 老王参加某电视台综艺节目而得奖。他有两种方式可选择:一次获得500元奖金。分别以概率 0.5 与 0.5的机会抽奖可获得1000元与0元。试问老王该选择何种方式领奖?第38页,本讲稿共62页事件 的期望益损值都是500元,但有人认为应选择他认为 的“价值”比 大,有的相反。都是“主观价值”。此时他认为事件 的效用比事件 来的大。如何来度量随
16、机事件的效用(或说“价值”)?我们用“效用值”u来度量效用值的大小。“效用值”是一个“主观价值”,且是一个相对大小的值。通常假定决策者最偏好、最倾向、最喜欢的事情(方案)的效用为1,而最不偏好、最不倾向、最不喜欢的事情(方案)的效用为0。一般来说,若用r来表示期望收益值(这里收益值作广义理解,不一定是货币量,也可以是某事件的结果),则r的效用第39页,本讲稿共62页值用 来表示。因此有那么,当 时如何计算呢?一般用心理测试的方法来确定 ,具体做法是:反复向决策者提出下面的问题:“如果事件 是以概率P得到收益为 ,以概率(1-P)得到收益为 ,事件 是以100%概率得到收益为 你认为 取多大值时
17、,事件 与事件 是相当的(即认为效用值相等)?如果决策者经过思考后,认为 时 两事件效果是相当的,即有第40页,本讲稿共62页当 ,已知时,则 的效用值可求出。如当 则 则可求出的效益值,再在已知效用值的三点中的任意两点,再作出同样的问题来问决策者,则可在两点中求出一点的效用值。如此继续,可得到在 及 中间的一系列 的效用值 。再以 作横坐标,作纵坐标可得该决策者的效用曲线。举例如下。例 设某决策者在股票交易所购买股票,现有两种选择:选择股票01号,预计每手(100股)可能分别以概率0.5获利200元,概率0.5 损失100元。第41页,本讲稿共62页选择股票02号,预计每手(100股)可能分
18、别以概率1.0获利25元。试问该决策者应选择何种方式购买股票?用心理测试法对该决策者提问:对上述事件 ,问决策者愿意选择何种方式?决策者B01号股票02号股票0.5P=0.5-100元P=0.525元200元若决策者选择 ,则降低 到20元,若还选择则在降低 ,若降至0元(即不赔不赚)时,决策者犹豫不定,说明第42页,本讲稿共62页此时随机事件 的效用值与 相等。决策者01号股票02号股票0.5P=0.5-100元P=0.50元200元求出 时的效益值:得到效用曲线的三点。B1B2P=1.00.5第43页,本讲稿共62页决策者01号股票02号股票0.75P=0.50元P=0.540元200元选
19、择股票02号,预计每手(100股)可能分别以概率1.0获利40元。试问该决策者应选择何种方式购买股票?再求 与 之间某一点 的效用值。提出如下的问题:选择股票01号,预计每手(100股)可能分别以概率0.5获利200元,概率0.5 损失0元。B1B2P=1.00.75第44页,本讲稿共62页决策者01号股票02号股票0.75P=0.50元P=0.560元200元若决策者选择 ,则提高02号股票到60元。决策者犹豫不定,说明此时随机事件 的效用值与 相等。求出 时的效益值:得到效用曲线的四个点。B1B2P=1.00.75第45页,本讲稿共62页提出如下的问题,可得-100元到0元之间的某点效用值
20、。决策者B101号股票02号股票P=0.5-100元P=0.5-30元0元选择股票01号,预计每手可能分别以概率0.5获利0元,以概率0.5获利-100元。B2P=1.0选择股票02号,预计每手可能分别以概率1.0获利-30元。第46页,本讲稿共62页试问该决策者应选择何种方式购买股票?决策者01号股票02号股票0.25P=0.5-100元P=0.5-60元0元B1B2P=1.00.25第47页,本讲稿共62页决策者01号股票02号股票0.875P=0.560元P=0.5120元200元B1B2P=1.00.875 同理在60元到200元之间求出某点的效用值。经过几次提问,决策者稳定在第48页
21、,本讲稿共62页对于此决策者,此时的心态,任给一个值,比如25元(横坐标),通过曲线,即可查出其效用值。三、效用曲线的类型:总体上讲,效用曲线可分为:保守性:中间性:冒险性第49页,本讲稿共62页保守性的人对收益增加反映比较迟钝,像反对损失放映比较敏感。冒险性的人对损失增加反映比较迟钝,相反对收益放映比较敏感。中间性介于两者之间。第50页,本讲稿共62页四、最大效用期望值决策准则及其应用最大效用期望值决策准则,就是依据效用理论,通过效用函数(或效用曲线)计算出各个策略结点的效用期望值,以效用期望值最大的策略作为最优策略的选优准则。即以效用期望值代替风险型决策中的期望益损值进行决策。例 某厂计划
22、生产一种新产品,经预测,该信产品销路好与差的概率各占50%,该生产工艺有三种。第、种为现有工艺,第种为新工艺,因此第种工艺的生产又顺利与不顺利两种情况,且已知顺利的概率为0.8,不顺利的概率为0.2。三种工艺在销路好、差状态下的收益值见收益值表。又利用第51页,本讲稿共62页心理测试法,对该厂厂长在生产工艺决策问题上的效用函数已测出,见厂长效用函数表。现求:作出此问题的决策树。以最大期望益损值为最优决策准则求此问题的最优决策 以最大效用期望值为最优决策准则求此问题的最优决策解:作出此问题的决策树。收益值r/万元200 100 50 20 -10 -20 -50 -100效用值u(r)1.0 0
23、.79 0.66 0.57 0.46 0.42 0.29 0厂长效用值函数第52页,本讲稿共62页顺利(0.8)不顺利(0.2)销路概率收益销路概率收益销路概率收益销路概率收益好差0.50.520-10好差0.50.5100-20好差0.50.5200-50好差0.50.550-100收益值表单位:万元第53页,本讲稿共62页决策者工艺工艺0.515新工艺销路差0.5销路好0.5销路差0.5销路好0.5顺利销路好0.5销路差0.5销路好0.5销路差0.55400.605550.582不顺利750.645收益值效用值200.57-100.461000.79-200.422001.0-500.29
24、-1000.0500.66第54页,本讲稿共62页 计算各结点的期望益损值:结点:万元结点:万元结点:万元结点:万元结点:万元从期望益损值可看出,第种工艺方案为最优方案。此时最优期望收益值为55万元。第55页,本讲稿共62页 计算各结点的效用期望值:结点:万元结点:万元结点:万元结点:万元结点:万元从效用期望值可看出,第种工艺方案为最优方案。此时最大效用期望值为0.605。而期望收益值为55万元。第56页,本讲稿共62页用效用期望值作标准还有一个优点是:对于不同量纲的目标,可以折算成效用值,然后相加,求各个方案的总效用值来进行比较。例 某公司欲购置一批汽车,须考查两项指标:功率和价格。该公司决
25、策者认为最合适的功率为70kw,若低于55kw,则不宜使用;而最满意的价格为4.0万元。若超过5.6 万元,则不能接受。目前市场上能满足该公司基本要求的汽车型号有,:,。它们的功率和价格分别为第57页,本讲稿共62页 指标牌号 功率/kw价格/万元6065704.14.55.2问该公司决策者应作何种决策?解:这是一个涉及功率和价格的多目标决策问题,且两个目标相互矛盾,量纲也不同,无法用绝对数字进行比较。对此可用如下的方法:应用效用理论,把每个方案的各个指标折合成效用值,然后加权相加,计算出每个方案的总的效用值,然后进行比较。第58页,本讲稿共62页首先,应用效用理论,给出该公司决策者的功率效用
26、曲线 与价格效用曲线 ,然后再求出下属各点的效用值,其结果为:又通过询问,了解到决策者对功率与价格这两个目标的权重分别为0.6,0.4。因此可作出决策树:第59页,本讲稿共62页决策者0.63价格0.4功率0.60.78600.450.75701.00.200.68功率0.6功率0.6价格0.4价格0.44.10.90650.804.55.2计算各结点的效用期望值:第60页,本讲稿共62页决策者0.63价格0.4功率0.60.78600.450.75701.00.200.68功率0.6功率0.6价格0.4价格0.44.10.90650.804.55.2因此,按效用期望值作标准,应选择第种牌号的车型为最优决策。第61页,本讲稿共62页v总结:v不确定决策问题v效用函数法第62页,本讲稿共62页