《4、风险型决策与贝叶斯决策cut.pptx》由会员分享,可在线阅读,更多相关《4、风险型决策与贝叶斯决策cut.pptx(103页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、框架单目标决策多属性决策个体决策 群组决策不确定型决策 风险型决策贝叶斯决策简单线性加权法理想解方法及改进层次分析法 等冲突分析 集体决策 社会选择理论专家咨询方法 博弈分析谈判决策风险性决策与贝叶斯决策u 不确定型决策u 风险型决策u 贝叶斯决策第一部分 不确定型决策不确定型决策 设决策问题的决策矩阵为 设决策问题的决策矩阵为 这里,每种自然状态 这里,每种自然状态 j j(j j=1,2,3,=1,2,3,n n)出现的概率 出现的概率P P(j j)是未知 是未知的。的。如何根据不同方案在各状态下的条件结果值 如何根据不同方案在各状态下的条件结果值o oij ij,确定决策,确定决策者最
2、满意行动方案?下面介绍几种常用决策准则。者最满意行动方案?下面介绍几种常用决策准则。乐观准则(max-max准则)基本思路是:假设每个行动方案总是出现最好的条件结果,即条件收益值最大或条件损失值最小,那么最满意的行动方案就是所有oij中最好的条件结果对应的方案。具体步骤:根据决策矩阵选出每个方案的最优结果值根据决策矩阵选出每个方案的最优结果值 在这些最优结果值中选择一个最优者,所对应在这些最优结果值中选择一个最优者,所对应的方案就是最优方案。的方案就是最优方案。乐观准则 上述最优结果值是指最大收益值或最大效用值。在某些情况下,条件结果值是损失值,最优结果则是指最小损失值。设方案ai的最大收益值
3、为 则乐观准则的最满意方案a*应满足 乐观准则实质 持乐观准则的决策者在各方案可能出现的结果情况不明时,采取好中取好 的乐观态度,选择最满意的决策方案。由于决策者过于乐观,一切从最好的情况考虑,难免冒较大的风险。乐观准则举例某企业拟定了三个生产方案,方案一(某企业拟定了三个生产方案,方案一(aa11)为新)为新建两条生产线,方案二建两条生产线,方案二(aa22)为新建一条生产线,方为新建一条生产线,方案三(案三(aa33)为扩建原有生产线,改进老产品。在)为扩建原有生产线,改进老产品。在市场预测的基础上,估算了各个方案在市场需求市场预测的基础上,估算了各个方案在市场需求的不同情况下的条件收益值
4、如表(净现值,单位:的不同情况下的条件收益值如表(净现值,单位:万元),但市场不同需求状态的概率未能测定,万元),但市场不同需求状态的概率未能测定,试用乐观准则对此问题进行决策分析。试用乐观准则对此问题进行决策分析。例题收益值表及决策矩阵状态 状态方案 方案市场需求情况 市场需求情况 1 1(高需求 高需求)2 2(中需求 中需求)3 3(低需求 低需求)a a1 1a a2 2a a3 31000 1000750 750300 300600 600450 450300 300-200-20050 5080 80解题步骤 各方案的最优结果值为 最满意方案a*满足 a*=a1为最满意方案 悲观准
5、则(max-min准则)悲观准则也称保守准则,其基本思路是假设各行动方案总是出现最坏的可能结果值,这些最坏结果中的最好者所对应的行动方案为最满意方案。具体步骤 根据决策矩阵选出每个方案的最小条件结果值 根据决策矩阵选出每个方案的最小条件结果值 从这些最小值中挑一个最大者,所对应的方案就是最 从这些最小值中挑一个最大者,所对应的方案就是最满意方案 满意方案 悲观准则 设方案的最小收益值为 悲观准则的最满意方案应满足 悲观准则实质 持悲观准则的决策者往往经济实力单薄,当各状态出现的概率不清楚时,态度谨慎保守,充分考虑最坏的可能性,采取坏中取好 的策略,以避免冒较大的风险。例题收益值表及决策矩阵状态
6、 状态方案 方案市场需求情况 市场需求情况 1 1(高需求 高需求)2 2(中需求 中需求)3 3(低需求 低需求)a a1 1a a2 2a a3 31000 1000750 750300 300600 600450 450300 300-200-20050 5080 80悲观准则举例 上例中的决策问题用悲观准则进行决策分析。最满意方案a*满足 即a*=a3为最满意方案 折衷准则 乐观准则和悲观准则对自然状态的假设都过于极乐观准则和悲观准则对自然状态的假设都过于极端。折衷准则既非完全乐观,也非完全悲观。端。折衷准则既非完全乐观,也非完全悲观。折衷准则基本思路是假设各行动方案既不会出现折衷准则
7、基本思路是假设各行动方案既不会出现最好的条件结果值,也不会出现最坏的条件结果最好的条件结果值,也不会出现最坏的条件结果值,而是出现最好结果值与最坏结果值之间的某值,而是出现最好结果值与最坏结果值之间的某个折衷值,再从各方案的折衷值中选出一个最大个折衷值,再从各方案的折衷值中选出一个最大者,对应的方案即为最满意方案。者,对应的方案即为最满意方案。折衷准则的决策步骤 取定乐观系数(01),计算各方案的折衷值,方案ai的折衷值记为h(ai),即 从各方案的折衷值中选出最大者,其对应的方案就是最满意方案,即折衷准则最满意方案满足 乐观系数 由决策者主观估计而确定。当=1时,就是乐观准则;当=0时,就是
8、悲观准则。折衷准则中的一般假定为01。例题收益值表及决策矩阵状态 状态方案 方案市场需求情况 市场需求情况 1 1(高需求 高需求)2 2(中需求 中需求)3 3(低需求 低需求)a a1 1a a2 2a a3 31000 1000750 750300 300600 600450 450300 300-200-20050 5080 80折衷准则举例上例中的决策问题用折衷准则进行决策分析。取上例中的决策问题用折衷准则进行决策分析。取乐观系数乐观系数=1/3=1/3,各方案的折衷值为,各方案的折衷值为 最满意方案最满意方案aa*满足满足 即即aa*=*=aa22为最满意方案为最满意方案 遗憾准则
9、(min-max准则)遗憾准则也称为最小遗憾值准则或最小机会损失准则。遗憾准则的基本思路是,假设各方案总是出现遗憾值最大的情况,从中选择遗憾值最小的方案作为最满意方案。通常,人们在选择方案的过程中,如果舍优取劣,就会感到遗憾。遗憾值 所谓遗憾值,就是在一定的自然状态下没有取到最好的方案而带来的机会损失。设在状态j下选择了方案ai,这时得到条件收益值qij,则方案ai在状态j下的遗憾值rij(或称收益值qij的遗憾值)为 遗憾准则决策步骤 计算在各方案在每种状态下的遗憾值rij(即机会损失值)找出各方案的最大遗憾值,即 在各方案的最大遗憾值中取最小值,对应的方案为最满意方案。即最满意方案a*满足
10、 例题收益值表及决策矩阵状态 状态方案 方案市场需求情况 市场需求情况 1 1(高需求 高需求)2 2(中需求 中需求)3 3(低需求 低需求)a a1 1a a2 2a a3 31000 1000750 750300 300600 600450 450300 300-200-20050 5080 80遗憾准则举例上例中的决策问题用遗憾准则进行决策分析。上例中的决策问题用遗憾准则进行决策分析。计算各方案在每种状态下的遗憾值,得遗憾值矩计算各方案在每种状态下的遗憾值,得遗憾值矩阵阵 各方案最大遗憾值如右上:各方案最大遗憾值如右上:最满意方案最满意方案aa*满足满足 即即aa*=*=aa22为最满
11、意方案为最满意方案 等可能性准则(Laplace准则)由19世纪数学家拉普拉斯(Laplace)提出来,因此又称为拉普拉斯准则。这个准则认为,在各自然状态发生的可能性不清楚的时候,只能认为各状态发生的概率相等,按相等的概率求出各方案条件收益的期望值(或期望效用值),最大期望值对应的方案即是最满意方案。等可能性准则决策步骤 假定各自然状态出现的概率相等,即 pp(11)=)=pp(22)=)=pp(nn)=1/)=1/nn 求各方案条件收益期望值或期望效用值 从各方案的条件收益期望值中找出最大者,或找出期望效用值最大者,所对应的a*为最满意方案,即a*满足 例题收益值表及决策矩阵状态 状态方案
12、方案市场需求情况 市场需求情况 1 1(高需求 高需求)2 2(中需求 中需求)3 3(低需求 低需求)a a1 1a a2 2a a3 31000 1000750 750300 300600 600450 450300 300-200-20050 5080 80等可能性准则举例上例中决策问题用等可能性准则进行决策。上例中决策问题用等可能性准则进行决策。按等可能性准则,各状态发生的概率设为按等可能性准则,各状态发生的概率设为1/3 1/3 各方案条件收益的期望值为:各方案条件收益的期望值为:最满意方案最满意方案aa*满足满足即即aa*=*=aa11为最满意方案为最满意方案 不同的决策准则解题比
13、较 在应用多种方法分析之后,一般会发现某些方案一直未曾入选或被选中的频数相对较小,可将这样的方案先淘汰掉,再作进一步分析。例题中方案a3被选中的频数最低,淘汰。决策准则 决策准则 乐观 乐观 悲观 悲观 折衷(折衷(=1/3=1/3)遗憾 遗憾 等可能 等可能最满意方案 最满意方案a a1 1a a3 3a a2 2a a2 2a a1 1第二部分 风险型决策u 期望值准则u 状态优势法则u 概论优势法则u 法则u 完全信息价值风险型决策 各自然状态的概率经过预测或估算被确定下来,在此基础之上的决策分析所得到的最满意方案就具有一定的稳定性。只要状态概率的测算切合实际,风险型决策方法相对于不确定
14、型决策方法就更为可靠。风险型决策采用的最主要的决策准则是期望值准则 风险型决策一般条件 存在着决策者希望达到的目标(如收益最大或损存在着决策者希望达到的目标(如收益最大或损失最小)失最小)存在着两个或两个以上的方案可供选择存在着两个或两个以上的方案可供选择 存在着两个或两个以上不以决策者主观意志为转存在着两个或两个以上不以决策者主观意志为转移的自然状态(如不同的市场条件)移的自然状态(如不同的市场条件)可以计算出不同的方案在不同自然状态下的损益可以计算出不同的方案在不同自然状态下的损益值值 在可能出现的不同自然状态中,决策者不能肯定在可能出现的不同自然状态中,决策者不能肯定未来将出现哪种状态,
15、但能确定每种状态出现的未来将出现哪种状态,但能确定每种状态出现的概率概率 单目标风险型决策问题的表示 设风险型决策问题的可行方案为 设风险型决策问题的可行方案为a a1 1,a a2 2,a am m,自然状态为,自然状态为 1 1,2 2,n n,且,且 j j 的概率分布是已知的,的概率分布是已知的,p p(j j)=)=p pj j(j j=1,2,=1,2,n n),各可行方案在不同自然状态下的条件结果值为 各可行方案在不同自然状态下的条件结果值为o oij ij(i i=1,2,=1,2,m m;j j=1,2,=1,2,n n)。当方案的个数和状态的个数皆为。当方案的个数和状态的个
16、数皆为有限数时,该问题可表示为决策表或决策矩阵 有限数时,该问题可表示为决策表或决策矩阵 期望值准则 期望值准则是指根据各方案的条件结果值的期望值的大小进行决策。当条件结果值表示费用,应选期望值最小的方案,当条件结果值表示收益或效用,则应选期望值最大的方案。在实际应用中,风险型决策问题的期望值准则评价模型有三种情况。(一)期望效用值评价模型 经过效用标准测定法测算,得到决策者的效用函数为u=u(x)由决策矩阵可以求出各条件结果值的效用值uij=u(oij)(i=1,2,m;j=1,2,n)全部效用值构成效用值矩阵 期望效用值评价模型 各方案的期望效用值记为 期望效用值hi表示了各方案的优劣程度
17、,hi越大,方案ai越令人满意,这种表示方案令人满意程度的指标,称为合意度。可行方案的优劣排序问题,就可以用各方案的合意度的大小来表示,求解决策问题,就是寻找合意度最大的方案。即(二)期望结果值评价模型 直接按条件结果期望值的排序来选择最满意方案,这就是期望结果值评价模型。当条件结果为条件收益时,条件结果期望值最大的方案就是最满意方案。当条件结果的条件损失时,则条件结果期望值最小的方案为最满意方案。重复性风险决策 期望结果值评价模型一般应用于重复型风险决策。在市场相对稳定的情况下,厂家对产品生产量的决策,既要保证销售渠道畅通,又要力求生产相对稳定,一旦作出决策,就要重复实施多次。效用曲线是直线
18、型的,合意度的排序与条件结果期望值的排序是一致的。(三)考虑时间因素期望值评价模型 在投资决策等问题中,由于方案涉及的时间周期较长,投资额较大,每一方案在寿命期的不同时期内的损益情况也在发生着变化,这就是需要考虑资金的时间价值,必然涉及到这个方案在各个不同时期的条件收益。这就是考虑时间因素的期望值准则评价模型。模型决策表 第第tt时时期(期(t t=1,2,=1,2,NN;NN为为方案寿命期)的决方案寿命期)的决策表策表 表示第表示第tt时时期方案期方案aai i 在自然状在自然状态态j j 下的条下的条件收益件收益;表示第表示第tt时时期自然状期自然状态态jj出出现现的的概率概率。评价模型步
19、骤计计算第算第tt时时期方案期方案aaii的期的期望收益望收益:用用净现值净现值作作为标为标准,方准,方案案aaii总总期望收益:期望收益:其中,其中,NPVNPV(aaii)为为方案方案aaii期望期望净现值净现值,kk为为折折现现率,率,FFoioi为为方案方案aaii全部投全部投资资支出的支出的现值总额现值总额。评价模型步骤 最满意方案应满足 其中a*表示最满意方案。例题 我 我国 国某 某公 公司 司与 与国 国外 外一 一家 家厂 厂商 商签 签订 订明 明年 年的 的经 经销 销协 协议 议。如 如果 果出 出口 口A A型 型机 机床 床,则 则明 明年 年可 可以 以稳 稳获
20、获利 利800 800万 万元 元;如 如果 果出 出口 口另 另一 一种 种B B型 型机 机床 床;根 根据 据国 国际 际市 市场 场需 需求 求情 情况 况有 有三 三种 种可 可能 能:当 当国 国际 际市 市场 场需 需求 求量 量高 高时 时,可 可以 以获 获利 利2500 2500万 万元 元;当 当国 国际 际市 市场 场需 需求 求量 量一 一般 般时 时,可 可获 获利 利900 900万 万元 元;当 当国 国际 际市 市场 场不 不景 景气 气而 而滞 滞销 销时 时,就 就会 会因 因积 积压 压而 而亏 亏损 损500 500万 万元 元。根 根据 据各 各方
21、方面 面获 获得 得的 的信 信息 息,预 预测 测明 明年 年国 国际 际市 市场 场需 需求 求量 量大 大的 的可 可能 能性 性为 为0.3 0.3,需 需求 求量 量一 一般 般的 的可 可能 能性 性为 为0.4 0.4。公 公司 司决 决策 策者 者认 认为 为,亏 亏损 损500 500万 万元 元风 风险 险太 太大 大,打 打算 算放 放弃 弃出 出口 口B B型 型机 机床 床。外 外商 商又 又提 提出 出另 另一 一种 种方 方案 案,出 出口 口C C型 型机 机床 床,在 在国 国际 际市 市场 场畅 畅销 销和 和一 一般 般情 情况 况时 时,可 可分 分别
22、别获 获利 利1500 1500万 万元 元和 和850 850万 万元 元,在 在滞 滞销 销的 的情 情况 况下 下,可 可以 以稍 稍加 加改 改制 制作 作为 为其 其他 他加 加工 工机 机械 械销 销售 售,仍 仍可 可获 获利 利120 120万 万元 元。上 上述 述情 情况 况,除 除第 第一 一方 方案 案外 外,其 其余 余两 两方 方案 案均 均有 有较 较大 大利 利润 润而 而又 又要 要承 承担 担一 一定 定的 的风 风险 险。试 试对 对此 此问 问题 题进 进行 行决 决策分析。策分析。期望值准则评价模型应用实例假设假设利用利用标标准效用准效用测测定法,得到
23、定法,得到该该公司决策者公司决策者效效用函数为:用函数为:(00 x x 1 1)该问题是风险型决策,解题步骤如下:该问题是风险型决策,解题步骤如下:可行方案有三个可行方案有三个 a a1 1:出口 出口A A 型机床 型机床 a a2 2:出口 出口B B 型机床 型机床 a a3 3:出口 出口C C 型机床 型机床 例题解答 自然状态及其概率为 11:国国际际市市场畅销场畅销,pp(11)=0.3)=0.3 22:国国际际市市场场一般一般,pp(22)=0.4)=0.4 33:国国际际市市场场滞滞销销,pp(33)=0.3)=0.3 决策矩阵 例题解答 对决策矩阵进行归一化处理+500/
24、3000例题解答 根据效用函数 由效用函数求得各效用值例题解答 由状态概率向量P=(0.3,0.4,0.3)T 得 各方案的合意度为hh11=0.63450.3+0.63450.3+0.63450.3=0.6345=0.63450.3+0.63450.3+0.63450.3=0.6345hh22=0.5654,=0.5654,hh33=0.6255=0.6255 最满意方案是a1,即出口A型机床。例题某某报报社社编编辑辑发发行行一一种种晚晚报报,长长期期以以来来发发行行量量为为1515万万份份。近近来来实实行行改改革革,推推行行经经济济承承包包责责任任制制,为为提提高高报报社社经经济济效效益益
25、,对对晚晚报报发发行行量量进进行行决决策策分分析析。经经过过销销售售调调查查,在在过过去去100100天天的的统统计计资资料料中中,售售完完1515万万份份仅仅1212天天,其其余余销销售售情情况况是是,有有2020天天销销售售约约1414万万份份,30,30天天销销售售约约1313万万份份,25,25天天销销售售约约1212万万份份,13,13天天销销售售约约1111万万份份.晚晚报报每每份份可可赚赚0.050.05元元利利润润,如如果果销销售售不不出出去去,则则有有0.250.25元元的的成成本本损损失失。试试分分析析该该报报社社晚晚报报发发行行量多少时量多少时,才能获得最佳经济效益。才能
26、获得最佳经济效益。例题解答根根据据已已知知条条件件,这这是是风风险险型型决决策策问问题题。由由于于发发行行量量一一经经确确定定,在在一一段段时时间间内内将将按按此此发发行行量量发发行行,故故又又是重复性决策。可行方案有五个是重复性决策。可行方案有五个,即即 aa11:发行发行1515万份万份 aa22:发行发行1414万份万份 aa33:发行发行1313万份万份 aa44:发行发行1212万份万份 aa55:发行发行1111万份万份 例题解答 该晚报发行销售状态有五种,其状态概率分别为 11:销售销售1515万份万份,pp(11)=0.12)=0.12 22:销售销售1414万份万份,pp(2
27、2)=0.20)=0.20 33:销售销售1313万份万份,pp(33)=0.30)=0.30 44:销售销售1212万份万份,pp(44)=0.25)=0.25 55:销售销售1111万份万份,pp(55)=0.13)=0.13 例题解答 方案ai在状态j下的条件收益(净利润)为 qij=ai在j下的销售份数0.05 ai在j下的未销售份数 0.25 如:如:qq1111=150000=150000 0.05-0 0.05-0 0.25=7500(0.25=7500(元元)同样,可以计算出其他的条件收益值。得到如下决策矩阵 例题解答 销售状态概率向量为 P=(0.12,0.20,0.30,0
28、.25,0.13)T例题解答根据期望值公式根据期望值公式得到:条件结果期望值向量得到:条件结果期望值向量 QQ=(1290,3430,4970,5610,5500)=(1290,3430,4970,5610,5500)TT 最满意方案为最满意方案为aa*=*=aa44,即发行量为,即发行量为1212万份。万份。此时该报社平均每天获利为此时该报社平均每天获利为56105610元,其经济效益元,其经济效益大大超过按固定发行量大大超过按固定发行量1515万份的平均获利万份的平均获利12901290元。元。状态优势 如果在所有状态下,方案ai的条件收益值不小于方案aj的条件收益值,即qikqjk(k=
29、1,2,n)则称方案ai按状态优于方案aj。在方案决策时可以将劣方案aj先淘汰掉。概率优势 按概率优势是与按状态优势相对而言的 如果方案ai的条件收益值不小于任一实数的概率,大于或等于方案aj的条件收益值不小于同一实数的概率,则称方案ai按概率优于方案aj。概率语言描述 设方案ai的收益为qi,x 是任意实数 称Ri(x)=P(qix),(i=1,2,n)为方案ai的风险分布函数。如果Ri(x)Rj(x),(ij)对一切的x 都成立,并且至少有一个x,使得Ri(x)Rj(x),则称方案ai按概率优于方案aj。概率优势法则 在决策中,方案ai与方案aj之间存在按概率优势关系,则应保留按概率处于优
30、势的方案,淘汰按概率处于劣势的方案。若任意两个方案之间都存在按概率优势关系,则最满意方案就是对其他所有方案都具有按概率优势的方案。举例 注意到方案a3按状态劣于方案a1,首先淘汰掉。自然状态 自然状态 j j 1 1 2 2 3 3 4 4条件收益 条件收益q qij ijp p(1 1)=0.3)=0.3 p p(2 2)=0.4)=0.4 p p(3 3)=0.2)=0.2 p p(4 4)=0.1)=0.1a a1 140 40 20 20 30 30-10-10a a2 220 20 30 30-10-10 20 20a a3 330 30 20 20 20 20-15-15举例 计算
31、方案a1和方案a2的风险分布函数 举例 比较R1(x)和R2(x),显然 R1(x)R2(x),对一切的x 都成立。并且存在x,使得R1(x)R2(x)。因此,根据概率优势法则,方案a1按概率优于方案a2。状态优势与概率优势 如果一个方案a按状态优于另一个方案a,则a必定按概率优于a;反之,一个方案a按概率优于另一个方案a,则a不一定按状态优于a。注意:并非任意两个方案之间都存在按概率优势关系,也就是说,概率优势法则在应用对象上存在一定的局限性。法则的引入 风险型决策分析的期望值评价准则的判据是方案条件结果的期望值或期望效用值,这一准则只考虑了方案的收益性,仅从收益这一个方面来对各方案进行排序
32、选优。然而实际情况是,任何方案都要冒收益不确定的风险。在评价方案的优劣时,只考虑收益的因素而忽略风险的因素是不合理的。法则的基本思路-法则的基本思路是:在评价一个行动方案时,不仅考虑方案可能带来的期望收益值,同时也明确考虑代表风险的 条 件 收 益的方差。举例 若用期望值准则进行决策,由于(万元)则两方案是等价的。需求状态 需求状态 j j需求高(需求高(1 1)需求中(需求中(2 2)需求低(需求低(3 3)条件收益(万元)条件收益(万元)0.2 0.2 0.6 0.6 0.2 0.2a a1 172 72-4-4-10-10a a2 212 12 10 10 8 8举例(续)但但是是,对对
33、于于厌厌恶恶风风险险的的决决策策者者来来讲讲,显显然然更更偏偏爱爱方方案案aa22,因因为为方方案案aa11获获得得大大额额收收益益的的可可能能性性只只有有20%20%,而而发发生生亏亏损损的的可可能能性性却却是是80%80%,而而方方案案aa22是稳赚不赔的。是稳赚不赔的。计算两方案条件收益的方差,得计算两方案条件收益的方差,得 说说明明方方案案aa22的的条条件件收收益益qq22更更加加集集中中于于它它的的均均值值附附近近,而而方方案案aa11的的条条件件收收益益qq11取取值值较较为为分分散散,或或具具有较大的波动性。有较大的波动性。完全信息的价值 在风险型决策问题中,信息不完全时,一旦
34、 确 定 了 最 满 意 方 案 为a*,则 不 论 出 现 何种 自 然 状 态,总 是 执 行 方 案a*。若信息是完全的,决策者在任何自然状态下都能根据他所掌握的信息采取最有利的行动。这时决策者所获得的收益要大于信息不完全时所获得的最大收益,两者的差额就是完全信息的价值。完全信息价值的数学描述 最满意方案的条件收益期望值 利用完全信息的条件收益期望值 风险型决策完全信息的价值 举例 某个体商贩夏季经销品种为雪糕和面包。卖雪糕晴天每天可获利50元,雨天只能获利5元;卖面包晴天每天可获利15元,雨天可获利30元。若已知该季节晴天的概率为0.7,雨天的概率为0.3。试计算完全信息的价值。此为重
35、复性风险型决策,利用期望结果值评价模型。举例解题 卖雪糕,其期望利润值 卖雪糕,其期望利润值 卖面包,其期望利润值 卖面包,其期望利润值 最满意方案为卖雪糕 最满意方案为卖雪糕 如果商贩掌握了完全信 如果商贩掌握了完全信息,晴天卖雪糕,雨天 息,晴天卖雪糕,雨天卖面包,期望利润值为 卖面包,期望利润值为 完全信息的价值是 完全信息的价值是 第三部分 贝叶斯决策风险型决策与贝叶斯决策 风险型决策的基本方法是将状态变量视为随机变量,用先验状态分布表示状态变量的概率分布,用期望值准则计算方案的满意程度。贝叶斯决策:先验状态分布与实际情况存在一定误差,为了提高决策质量,需要通过市场调查,收集有关状态变
36、量的补充信息,对先验分布进行修正,用后验状态分布进行决策。两种偏向 缺乏市场调查,对状态变量概率分布情况的掌握和分析还十分粗略,就匆忙进行决策分析,使得决策结果与市场现实的出入过大,造成决策失误;市场调查费用过高,收集的信息没有给企业带来应有的效益。贝叶斯决策的意义 既要充分重视信息对决策的价值,同时也要注意信息自身的价值,少花钱多办事。提高决策分析的科学性和效益性。贝叶斯决策的关键:利用补充信息调整先验状态概率分布。全概率公式和贝叶斯公式 离散情况离散情况 连续情况连续情况全概率公式贝叶斯公式举例 某公司经营一种高科技产品,若市场畅销可获利1.5万元,若市场滞销将亏损5千元。根据历年的市场销
37、售资料,产品畅销概率为0.8,滞销概率为0.2,为了准确掌握该产品的市场销售情况,准备聘请某咨询公司进行市场调查和分析,该咨询公司对该产品畅销预测准备率为0.95,滞销预测准确率为0.90。试根据市场咨询分析结果,该公司应如何决策?解题 两种方案,即经营方案(a1),不经营方案(a2)市场销售也有两种状态,即畅销(1),滞销(2)。收益矩阵 解题 用风险型决策的期望结果值准则解 按状态变量的先验分布进行决策,最满意的行动方案为a1,表示不论市场状态是畅销或滞销,应该经营该产品。解题补充市场调查分析的信息补充市场调查分析的信息 市场预测的准确率,即在实际状态值市场预测的准确率,即在实际状态值jj
38、的条件下,的条件下,预测值预测值HHii的条件概率的条件概率PP(HHii|jj)HH11预测市场畅销,预测市场畅销,HH22预测市场滞销预测市场滞销 则则故故解题将全概率公式将全概率公式计算结果代入计算结果代入贝叶斯公式贝叶斯公式得得后验分布后验分布 表示市场预测 表示市场预测值为 值为H H i i 时,时,j j 发生的概率 发生的概率解题当市场预测为畅销时,当市场预测为畅销时,即事件即事件HH11发生发生 用 用P P(1 1|H H1 1),P(P(2 2|H H1 1)代替 代替P P(1 1),P P(2 2)E E(a a1 1|H H1 1)=14487.2=14487.2
39、E E(a a2 2|H H1 1)=0=0最满意方案为经营该最满意方案为经营该产品产品 当市场预测为滞销时,当市场预测为滞销时,即事件即事件HH22发生发生 用 用P P(1 1|H H2 2),P(P(2 2|H H2 2)代替 代替P P(1 1),P P(2 2)E E(a a1 1|H H2 2)=-1364=-1364 E E(a a2 2|H H2 2)=0=0最满意方案为不经营最满意方案为不经营该产品该产品 贝叶斯决策的基本方法 利用市场调查获取的补充信息值H或,去修正状态变量的先验分布。(经过修正的状态变量的分布,称为后验分布)再利用后验分布对风险性决策问题作出决策分析,并测
40、算信息的价值和比较信息的成本,从而提高决策的科学性和效益性。贝叶斯决策的似然分布矩阵 完整的描述了在不同状态值j的条件下,信息值Hi 的可靠程度。贝叶斯决策的关键,在于依据似然分布用贝叶斯公式求出后验分布。贝叶斯决策的基本步骤 验前分析 预验分析 验后分析 序贯分析 验前分析 依据历年的统计数据和资料,决策分析人员按照自身的经验和判断,应用状态分析方法测算和估计状态变量的先验分布,并计算各可行方案在不同自然状态下的条件结果值。利用这些信息,根据某种决策准则,对各可行方案进行评价和选择,找出最满意方案,称之为验前分析。预验分析 若决策问题十分重要,而且各条件允许,应该考虑是否进行市场调查和补充收
41、集新信息,决策分析人员要对补充信息可能给企业带来的效益和所花费的成本进行权衡分析。如果信息的价值高于信息的成本,则应当补充信息,反之则补充信息大可不必。这种比较分析补充信息的价值和成本的过程,称为预验分析。验后分析 决策分析人员作出补充信息的决定,并通过市场调查和分析补充信息,为验后分析做准备,关键是利用补充信息修正先验分布,得到更加符合市场实际的后验分布。再利用后验分布进行决策分析,选出最满意的可行方案,并对信息的价值和成本做对比分析,对决策分析的经济效益情况做出合理的说明。序贯分析 社会经济实际中的决策问题,情况都比较复杂,可适当的将决策分析全过程划分为若干阶段,每一阶段都包括先验分析,预
42、验分析和验后分析等步骤。这样多阶段相互连接,前阶段决策结果是后阶段决策的条件,形成决策分析全过程,称之为序贯决策。举例三种方案可供选择,即引进大型设备(三种方案可供选择,即引进大型设备(aa11),引),引进中型设备(进中型设备(aa22),引进小型设备(),引进小型设备(aa33)新产品需求状态也有三种,即需求量大(新产品需求状态也有三种,即需求量大(11),),一般(一般(22),小(),小(33),先验概率为),先验概率为0.3,0.4,0.30.3,0.4,0.3。收益矩阵收益矩阵 举例 市场调查:调查结果值H1,H2,H3分别表示需求量大,需求量一般,需求量小。PP(HH11|jj)
43、112233HH110.60.60.20.20.20.2HH220.30.30.50.50.20.2HH330.10.10.30.30.60.6解题 验前分析:由收益矩阵、验前状态概率向量求得E(A)=QP=(17,16,10)T 最优方案为:投资引进大型设备最优方案为:投资引进大型设备 预验分析:由全概率公式,分别求出各需求状态调查结果值Hi 的概率解题再由贝叶斯公再由贝叶斯公式及似然分布式及似然分布矩阵数据,分矩阵数据,分别计算后验分别计算后验分布布用后验分布代用后验分布代替先验分布,替先验分布,计算各方案的计算各方案的期望收益值期望收益值 分三种情况:当市场调查值为H1时 当市场调查值为
44、H2时 当市场调查值为H3时解题当市场调查值当市场调查值HH=HH11最大期望收益值最大期望收益值 最满意方案为最满意方案为aa11。当市场调查值 当市场调查值H H=H H2 2 最满意方案为 最满意方案为a a1 1。最大期望收益 最大期望收益21 21。当市场调查值 当市场调查值H H=H H3 3 最满意方案为 最满意方案为a a3 3。最大期望收益 最大期望收益10 10。解题 该企业通过市场调查所得到的期望收益值 在验前分析中的最大期望收益值为E1=17。因此,通过市场调查,该企业的期望收益值增加了2.99万元,只要调查费用不超过2.99万元,则进行调查就有利可图。解题 验后分析:
45、验后分析是把调查信息和验前信息结合起来,验后分析是把调查信息和验前信息结合起来,修正状态变量的先验分布,得到后验分布,并修正状态变量的先验分布,得到后验分布,并以此计算在调查信息值发生的条件下,各可行以此计算在调查信息值发生的条件下,各可行方案的期望收益值,比较得到最满意的决策方方案的期望收益值,比较得到最满意的决策方法。法。这一计算过程在预验分析阶段已经完成。这一计算过程在预验分析阶段已经完成。解题综述 如果市场调查费用不超过2.99万,就应该进行市场调查;若超过,则不应做市场调查。若进行市场调查,如果调查结果为需求量大,则选择引进大型设备,可获得期望收益值29.2万,如果调查结果为需求量一
46、般,仍然选择引进大型设备,可获得期望收益值21万,如果调查结果为需求量小,则选择引进小型设备,可获得期望收益值10万。补充信息价值 在一般情况下,信息值在一般情况下,信息值HHii对状态值对状态值00来说,条件来说,条件概率小于概率小于11,信息值,信息值HHii并非完全信息。并非完全信息。决策者掌握了补充信息值决策者掌握了补充信息值HHi i(或(或)前后期望收益)前后期望收益值的增加量,或者掌握了补充信息值值的增加量,或者掌握了补充信息值HHi i(或(或)前)前后期望损失值的减少量,称为补充信息值后期望损失值的减少量,称为补充信息值HHi i(或(或)的价值。)的价值。全部补充信息值全部
47、补充信息值HHi i(或(或)价值的期望值,称为补)价值的期望值,称为补充信息价值的期望值,简称补充信息价值,记作充信息价值的期望值,简称补充信息价值,记作EV AIEV AI(Expected Value of Additional InformationExpected Value of Additional Information)。)。举例 例 例1 1中:(方法一)中:(方法一)对于补充信息值对于补充信息值HH11,即市场预测畅销,掌握了,即市场预测畅销,掌握了HH11前前后的最满意方案都是后的最满意方案都是aa11,于是掌握了补充信息前后,于是掌握了补充信息前后期望收益值的增加量为
48、期望收益值的增加量为00,即信息值,即信息值HH11的价值为的价值为00。对于补充信息值对于补充信息值HH22,即市场预测滞销,掌握了,即市场预测滞销,掌握了HH22前前的最满意方案为的最满意方案为aa11,其期望收益值为,其期望收益值为-1364-1364元,掌握元,掌握了了HH22后的最满意方案为后的最满意方案为aa22,其期望收益值为,其期望收益值为00,增加,增加值为值为13641364元。元。故,补充信息价值为故,补充信息价值为举例 方法二 方法二 因为:因为:E E(a aopt opt)=)=E E(a a1 1)=11000()=11000(元 元),a a(H H1 1)=a)=a1 1,a a(H H2 2)=a)=a2 2。故 故补充信息价值与完全信息价值 任何补充信息价值都是非负的,且不超过完全信息价值 信息价值对于管理决策具有普遍意义。任何补充信息不会降低决策方案经济效益。完全信息是一类特殊的补充信息,它是最有价值的信息。演讲完毕,谢谢观看!