《决策中的收益、损失与效用培训课程.pptx》由会员分享,可在线阅读,更多相关《决策中的收益、损失与效用培训课程.pptx(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第四章 决策中的收益、损失与效用4.1 决策问题的三要素4.2 决策准则4.3 先验期望准则4.4 损失函数4.5 常用损失函数4.6 效用函数24.1 决策问题的三要素 决策就是对一件事要作决定.它与推断的差别在于是否涉及后果.统计学家在作推断时是按统计理论进行的,很少考虑结论在使用后的损失.可决策者在使用推断结果时必需与得失联系在一起,能带来利润的就会用,使他遭受损失的就不会被采用,度量得失的尺度就是损失函数. 贝叶斯决策:把损失函数加入贝叶斯推断就形成贝叶斯决策论,损失函数被称为贝叶斯统计中的第四种信息.一、决策的基本概念一、决策的基本概念3例1 设甲乙二人进行一种游戏,甲手中有三张牌
2、,分别标以 .乙手中也有三张牌, 分别标以 .游戏的规则是双方各自独立地出牌,按下表计算甲的得分与乙的得分.321,321,aaa甲的得分矩阵甲的得分矩阵(乙的失分矩阵乙的失分矩阵)1a2a3a123 3-2014-3-4-12这是一个典型的双人博弈(赌博)问题.不少实际问题可归结为双人博弈问题.把上例中的乙方改为自然或社会,就形成人与自然(或社会)的博弈问题.4例2 某农作物有两个品种:产量高但抗旱能力弱的品种 和抗旱能力强但产量低的品种 .在明年雨量不知的情况下,农民应选播哪个品种可使每亩平均收益最大?这是人与自然界的博弈.以明年600mm雨量为界来区分雨量充足 和雨量不充足 写出收益矩阵
3、(单位:元)1a2a121a2a12 1000200-2004005例3 一位投资者有一笔资金要投资.有以下几个投资供他选择:购买股票,根据市场情况,可净赚5000元,但也可能亏损 10000元;:存入银行,不管市场情况如何总可净赚1000元.1a2a这位投资者在与金融市场博弈.未来的金融市场也有二种情况:看涨 与看跌 .可写出投资者的收益矩阵121a2a1250001000-100001000投资者将依据此收益矩阵决定他的资金投向何方.这种人与自然(或社会)的博弈问题称为决策问题. 6二、决策问题的三要素二、决策问题的三要素 1. 状态集 ,其中每个元素 表示自然界(或社会)可能出现的一种状
4、态,所有可能状态的全体组成状态集.(如例2中的两种状态:雨水充足和雨水不充足) 2. 行动集 ,其中a表示人对自然界可能采取的一个行动. 注意注意:一般行动集有两个以上的行动供选择.若有两个行动无论对自然界的哪一个状态出现, 总比 收益高,则 就没有存在的必要,可把它从行动集中去掉,使留在行动集中的行动总有可取之处.a1a2a2a73.收益函数 。函数值 表示当自然界处于状态 ,而人们选取行动 时所得到的收益大小。),(aQijjiQaQ),(ija 收益函数的值可正可负,其正表示赢利,负表示亏损,单位常用货币单位。收益函数的建立不是件容易的事,要对所研究的问题有全面的了解才能建立起来。收益矩
5、阵(例4.1.4)nmnnmmQQQQQQQQQQ21222211121184.2 决策准则一、行动的容许性二、决策准则 1.乐观准则 2.悲观准则 3.折中准则9一、行动的容许性 定义:在给定的决策问题中,A 中的行动a1称为是容许的。假如在A 中不存在满足如下两个条件的行动a2,1.对所有的,有Q(,a2)Q(,a1)2.至少有一个,可使上式不等式严格成立。 假如这样的a2存在的话,则称a1是非容许的;假如二个行动a1和a2的收益函数在上处处相等,则称行动a1与a2是相等的。10两点说明:1.一般情况下,行动集中只存在容许行动。2.上面的讨论是对收益函数而言的,但我们还可以对支付函数(或亏
6、损函数、成本函数)进行讨论,此时需要支付函数(或亏损函数、成本函数)越少越好。1112二、决策准则1.乐观准则 (1)定义:乐观准则也称“好中求好”决策准则,或称“最大最大”决策准则。这种决策准则就是充分考虑可能出现的最大利益,在各最大利益中选取最大者,将其对应的方案作为最优方案。这种决策准则的客观基础就是所谓的天时、地利和人和,决策者感到前途乐观,有信心取得每一决策方案的最佳结果。13(2)乐观准则决策方法的一般步骤:确定各种可行方案;确定决策问题将面临的各种自然状态;将各种方案在各种自然状态下的收益值列于决策矩阵表中(表4-1);求每一方案在各自状态下的最大收益值,将其填写在决策矩阵表的最
7、后一列;取 中的最大值 ,所对应的方案为最佳决策方案。maxijQjmaxmaxijaQji14 自然状态行动方案1 2 na1a2am决 策mnmmnnQQQQQQQQQ212222111211maxmaxijaQjimaxijQj“乐观准则”决策矩阵表表4-115(3)“(3)“乐观准则乐观准则”决策方法的应用决策方法的应用 假设某一决策问题的决策收益矩阵表如下,按乐观准则选取最优方案。8.728.078.258.727.39 8.07 7.198.25 6.96 6.086.13 8.72 7.241 2 3决 策a1a2a3 自然状态行动方案maxijQjmaxmaxijaQji16假
8、设某一决策问题的决策损失矩阵表如下,按乐观准则选取最优方案。minminijaQji5576611 8 8 5 9 10 7 11 6 12 10 9 7 6 12 101 2 3 4 决 策a1a2a3a4 自然状态行动方案minijQj172.悲观准则(1)定义:悲观准则又称“小中取大”决策准则或叫“坏中求好”决策准则。这种决策准则的客观依据是决策的系统功能欠佳,形势对决策者不利,所以,决策者没有理由希望获得最理想的结果。面对这种情况,决策者必须从每一方案的最坏处着想,从每个方案的最坏结果中选择一个最佳值,即在所有不利的收益中,选取一个收益最大的方案作为最优决策方案。18(2)悲观准则决策
9、方法的一般步骤: 若决策矩阵为收益矩阵,则先对每一行动选出最小的收益,再在所有选出的最小收益中选取最大值。此最大值对应的行动就是悲观准则下的最优行动; 若决策矩阵为损失矩阵,则先对每一行动选出最大的损失,再在所有选出的最大损失中选取最小值。此最小值对应的行动就是悲观准则下的最优行动;19(3)“(3)“悲观准则悲观准则”决策方法的应用决策方法的应用假设某一决策问题的决策收益矩阵表如下,按悲观准则选取最优方案。7.197.196.086.137.39 8.07 7.198.25 6.96 6.086.13 8.72 7.241 2 3决 策a1a2a3 自然状态行动方案minijQjminmax
10、ijaQji20假设某一决策问题的决策损失矩阵表如下,按悲观准则选取最优方案。101110121211 8 8 5 9 10 7 8 6 12 11 9 7 6 12 111 2 3 4 决 策a1a2a3a4 自然状态行动方案maxijQjmaxminijaQji213.折中准则(1)(1)定义定义:折中准则又称系数决策准则,是对悲观准则和乐观准则进行折中的一种决策准则. 是一个依决策者认定情况乐观还是悲观而定的系数,称为乐观系数.若认定情况完全乐观,则=1,若认定情况完全悲观,则=0;一般情况下,则01.22(2)(2)折中准则的基本步骤折中准则的基本步骤第一步:确定系数的值;第二步:对每
11、一行动a计算: ),(min)1 (),(max)(aQaQaH),(maxaQ其中 表示行动a的最大收益值, 表示行动a的最小收益值),(minaQ第三步:取行动a0,使H(a0)达到最大,即此种a0就是这种准则下的最优行动.)(max)(0aHaHa A23(3)(3)折中准则决策方法应用案例折中准则决策方法应用案例 某工厂预备生产一种新型童车,根据市场需求分析和估计,产品销路可分为三种状态:1-销路好;2-销路一般;3-销路差.可供选择的行动方案也有三种:a1,大批量生产;a2,中批量生产;a3,小批量生产.根据产量多少和销售情况,工厂的盈利情况也有所不同,可能获利也可能亏损,将此数值称
12、为损益值.获利时称为收益值,亏损时称为损失值,用负号表示.现调查得本月的损益值见下表.试用系数法作出决策.24新型童车损益值表新型童车损益值表 自然状态 行动方案销路好1销路一般2销路差3大批量生产a13023-15中批量生产a225200小批量生产a312121225解:第一步,确定系数的值=0.6 第二步,计算H(a) H(a1)=0.6max(30,23,-15) +0.4min(30,23,-15)=12(万元) H(a2)=0.6max(25,20,0) +0.4min(25,20,0)=15(万元) H(a3)=0.6max(12,12,12) +0.4min(12,12,12)=
13、12(万元)第三步,计算收益中的最大者 H(a0)=max(12,15,12)=15(万元) 所以最佳方案应为中批量生产,即为a2.264.3 先验期望准则一、先验期望准则(1)定义:对给定的决策问题,若在状态集上有一个正常的先验分布(),则收益函数Q(,)对()的期望与方差 分别称为先验期望收益和收益的先验方差。使先验平均收益达 到最大的行动a 称为先验期望准则下的最优行动。若此种最优行动不止一个,其中先验方差达到最小的行动称为二阶矩准则下的最优行动。22),(),(),(),()(aQEaQEaQVaraQEaQ)(max)(aQaQAa27几点说明:1.定义中的先验分布只能用正常先验分布
14、,而不能采用广义先验分布。2.如果在比较先验期望收益的大小时,有两个或两个以上的行动使先验期望收益达到最大,这时才需要比较先验方差的大小做出决策。3.使用合理的先验信息,按照先验期望准则和二阶矩准则进行决策,所得结果更加可信。28(2)案例分析例1 某厂准备开发一种新产品,有三种方案供选择:a1、a2和a3。预计一年后市场对该种产品的需求量可分为较高、一般和较低。且预计一年后市场需求量是高、中、低的主观概率为:(1)=0.6,(2)=0.3,(3)=0.1,同时算得收益矩阵如下。试用先验期望准则确定最佳行动方案。29 状态 方案较高1一般2较低3a1700250-200a2980-500-80
15、0a340090-3030先验期望准则和其他准则的关系市场需求量1高2中3低悲观准则下1001乐观准则下2100折中准则下30.800.2先验期望准则下0.60.30.131例3 一卖花姑娘每天从花市按每棵5元购进,而按每棵10元卖出,当天若卖不完则剩下的花只能当垃圾。问该姑娘每天购进多少花?出售量(棵/日)频数(日)频率1440.0815110.2216100.201770.141870.141960.122050.10累计501.0032二、两个性质 定理4.1:在先验分布不变的情况下,收益函数的线性变换不会改变先验期望准则下的最优行动。 定理4.2:设1为状态集的一个非空子集,假如在1上
16、的收益函数Q(,a)都加上一个常数c,而在上的先验分布不变,则在先验期望准则下的最优行动不变。 例4(P135例题4.3.4)334.4 损失函数1.损失函数的含义 这里的损失不是负的收益,也不是亏损。例如,某商店一个月的经营收益为-1000元,即亏1000元。这是对成本而言。我们不称为损失,而称其为亏损。我们讲的损失是指“该赚而没有赚到的钱”,例如该商店本可以赚2000元,但由于某种原因亏了1000元,那我们说该商店损失了3000元。用这种观点认识损失对提高决策意识是有好处的。 按上述观点从收益函数可以很容易获得损失函数。34 例5 某公司购进某种货物可分大批、中批和小批三种行动,记为 。未
17、来市场需求量可分为高、中、低三种状态,记为 。三个行动在不同市场的利润(千元)如下:321,321,aaa18 . 07 . 22432610Q这是一个收益矩阵,我们把它改写成损失矩阵如下:08 . 17 . 3201840L由此可见,决策者在做决策时,要尽量避免大损失,追求小损失甚至无损失.352.损失函数a),(aL构成决策问题的三要素:由收益函数容易获得损失函数 ),(),(max),(aQaQaLAa 例6 某公司购进一批货物投放市场,若购进数量 低于市场需求量 ,每吨可赚15万元, 若购进数量 超过市场需求量 ,超过部分每吨反而要亏35万元.由此可写出收益函数aaaaaaQ),(35
18、15,15),(36 则立即可得损失函数:aaaaaL),(35),(15),(显然,当购进数量 等于市场需求量 时,收益达到最大为15 .a373.损失函数下的悲观准则第一步,对每个行动 ,选出最大损失值,记为aAaaL),(max第二步,在所有选出的最大损失中再选出最小者 , 则 满足aa),(max),(maxminaLaLAa则称 为悲观准则下的最优行动.这是一种保守策略.不求零损失,但愿少损失.a38例7 某公司购进某种货物可分大批、中批和小批三种行动,记为 ,未来市场需求量可分为高、中、低三种状态,记为 ,三个行动在不同市场的收益矩阵和损失矩阵如下:1a2a3a12318 . 07
19、 . 22432610Q08 . 17 . 3201840L1a2a3a1a2a3a试比较在Q与L下的最优行动。思考思考:为什么所选行动不一样?39例8 某股票投资者对金融市场上的两种资产进行投资,其收益矩阵如Q,请帮助作出合适的决策(按悲观准则).212120100002019aaQ21219980001aaL 用Q做决策(按悲观准则),结果为a2是最佳行动,显然该决策不好。 用L做决策(按悲观准则),结果为a1。 说明这样一个道理:用损失函数做决策要比用收益函数做决策更合理(P140)。404.损失函数下的先验期望准则(1)定义:对给定的决策问题,若在状态集上有一个正常的先验分布(),则损
20、失函数L(,)对()的期望与方差分别称为先验期望损失和损失的先验方差。使先验期望损失达到最小的行动a称为先验期望准则下的最优行动。若此种最优行动不止一个,其中先验方差达到最小的行动称为二阶矩准则下的最优行动。22),(),(),(),()(aLEaLEaLVaraLEaL)(min)(aLaLAa41注意事项:1.定义中的先验分布只能用正常先验分布,而不能采用广义先验分布。2.损失的先验方差有着特别的意义: (1)可以作为挑选最优行动的标准(在平均先验损失相等或者相差不大时). (2)衡量风险的大小. 3.使用合理的先验信息,按照先验期望准则和二阶矩准则进行决策,所得结果更加可信。42(2)
21、例题 例9 若有一决策问题如下,试用损失函数下的先验期望准则选出最优行动. 1 . 07 . 02 . 008 . 17 . 3201840)(321321aaaL43 损失函数是要根据实际问题而定的,但不论在什么场合,今后总要求损失函数是非负的。 当 与 都为实数时,总认为行动 离状态 愈远而引起的损失愈大,所以损失函数 应是距离 的非降函数,常取 其中, 且有限, 是 的非降函数。4.5常用损失函数aa( , )La|a( , )( ) (|)Lag a ( )0 ( )g tt44(1)平方损失函数 2)(),( aaL2)(),(aaL这是在统计决策中用得最多的损失函数.(2)线性损失
22、函数 aakaakaL),(),(),(10(3)0-1损失函数 aaaL, 1, 0),(4)多元二次损失函数 piiiiaaL12)(),(45(5)二行动线性决策问题的损失函数 定义:若某一决策问题只有两个行动a1,a2,而在每个行动下的收益函数都是状态(连续或离散)的线性函数,即则称此决策问题为二行动线性决策问题. 下列函数称为该决策问题对应的损失函数222111,),(aambaambaQ00121210,)()(),(mmbbaL0212102,)()(,0),(mmbbaL46例题11 甲乙两厂生产同一种产品,其质量相同,零售价也相同,现两厂都在招聘推销员,但所付报酬不同,甲厂每公斤给报酬3.5元;乙厂每公斤给报酬3元,还另给每天10元的津贴,应聘人如何选择?收益函数:损失函数: Q Q(,a2) 0 0 Q(,a1)21,310,5 . 3),(aaaaaQ20,020,5 . 010),(1aL20,5 . 01020,0),(2aL47