第五章:效用函数.ppt

上传人:赵** 文档编号:67267645 上传时间:2022-12-24 格式:PPT 页数:77 大小:547KB
返回 下载 相关 举报
第五章:效用函数.ppt_第1页
第1页 / 共77页
第五章:效用函数.ppt_第2页
第2页 / 共77页
点击查看更多>>
资源描述

《第五章:效用函数.ppt》由会员分享,可在线阅读,更多相关《第五章:效用函数.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Session5效用函数效用函数SessionTopic期望货币损益值准则的局限期望货币损益值准则的局限效用函数的定义和公理效用函数的定义和公理效用函数的构成效用函数的构成风险和效用的关系风险和效用的关系损失函数、风险函数和贝叶斯风险损失函数、风险函数和贝叶斯风险期望货币损益值准则的局限期望货币损益值准则的局限期望货币损益值准则的局限期望货币损益值准则的局限以期望货币损益值为标准的决策方法一般只适用于下列几种情况:(1)概率的出现具有明显的客观性值,而且比较稳定;(2)决策不是解决一次性问题,而是解决多次重复的问题;(3)决策的结果不会对决策者带来严重的后果。如果不符合这些情况,期望货币损益值

2、准则就不适用,需要采用其他标准。用期望值作为决策准则的根本条件是,决策有不断反复的可能。所谓决策有不断重复的可能,包括下列三层涵义所谓决策有不断重复的可能,包括下列三层涵义:第一,决策本身即为重复性决策。第二,重复的次数要比较多,尤其是当存在对于决策后果有重大影响的小概率事件时,只有重复次数相当多时才能用期望值来作为决策标准,因为只有这样其平均后果才接近于后果的期望值。例如,要决定是否按月投保火险,而且需要决定的不是投保一个月(投保一次),而是决定10年内(即120个月)是否投保,这就重复120次了。但因为失火损失较大,而失火概率又非常小,比如说仅万分之一,即120个月也不一定会失一次火,所以

3、其实际平均后果就和期望值相差很大。假定投保者投保资产为12万元,而保险费规定为万分之二(保险费征收率一定比失火概率大,否则保险公司就无盈利可图了),那么每月应交保险费24元,这是在投保情况下每月的支出。如果不去投保,则损失的期望值为120000(1/10000)=12元,比投保的支出小得多。如按期望值标准,则谁也不会去投保了。可是实际上决策者还是会去投保的,这是因为实际平均损失与其期望值大不一样,如果这120个月中没有失火,则1元损失也没有,但万一失火一次,则等于每月平均损失120000/120=1000元,比计算的损失期望值大80多倍。所以计算出来的损失期望值对决定是否投保的决策者来说毫无意

4、义,决策者往往会按“不怕一万,只怕万一”的心里去投保。因为拥有12万元资产的决策者来说,每月支出24元同其资产额相比几乎等于零,而万一失火却会遭受惨重损失。第三,每次决策后果都不会给决策者造成致命的威胁,否则,如果有此威胁,一旦真的产生此种致命后果,决策者就不可能再作下一次决策,从而也失去了重复的可能性。这就像投机者把全部资本孤注一掷一样,一旦失败,资本赔光,下一次也就无法再投机了。对于有此致命危险的重复性决策,期望值标准的采用也就受到了限制。最后,采用期望值标准时,还得假定在不断重复作出相同决策时其客观条件不变,这一方面包括了个自然状态的概率不变,另一方面亦包括决策后果函数不变。Exampl

5、e1St.PetersburgparadoxAprimemotivatorforBernoullisworkontheevaluationorriskyventureswasthefamousSt.Petersburggame.Incurrentterms,afaircoinistosseduntilaheadappears.Ifthefirstheadoccursatthenthtoss,thepayoffis2n$.Supposeyouowntitletooneplayofthegame;thatis,youcanengageinitwithoutcost.Whatistheleastam

6、ountyouwouldsellyourtitlefor?AccordingtotheBernoullis,thisleastamountisyourequivalentmonetaryvalueofthegame.Heobservedthattheexpectedpayoff(1/2)2+(1/4)22+(1/8)23+=1+1+1+isinfinite,butmostpeoplewouldselltitleforarelativelysmallsum,andheaskedforanexplanationofsuchaflagrantviolationofmaximumexpectedret

7、urn.Danielshowedhowhistheoryresolvestheissuebyprovidingauniquesolutionstotheequationforanyfinitew0,wheresistheminimumsellingpriceorequivalentmonetaryvalue.Moreover,exceptfortheveryrich,apersonwouldgladlyselltitleforabout$25or$30.Theeffectofw0canbeseenindirectlybyestimatingyourminimumsellingpricewhen

8、thepayoffatnis2ncentsinsteadof2ndollarsandcomparing100timesthisestimatetoyouranswerfromtheprecedingparagraph.UnlikeBernoulli,Cramerpayslittleattentiontoinitialwealth,andforx0setsv(x)=.Inhisterms,theminimumsellingpriceisthevalueofsthatsatisfieswhichisalittleunder$6.Example2AGameillustratingtheSt.Pete

9、rsburgparadoxAcasinomakesrepeatedindependenttossesofafaircoinuntilatailoccurs.Agambler,startingwithastakeof$1,isofferedthefollowingwager.Aftereachtossthegamblerwillbegiventwochoices.Hemayeithertakeawayhiswinningsfromtheprevioustossesofthecoin.Inthiscasethegamewillend.Alternativelyhemayuseallhiswinni

10、ngsfromprevioustossesplushisoriginalstakemoneyasastakeforthenexttossofthecoin.Thisstakewillbetripledbythecasinoifaheadistossedonthenextthrow.Ontheotherhand,ifatailisthrownthegamblerwillloseallhiswinningsfromprevioustossesofthecointogetherwithhisoriginalstakemoney.Supposethatthegamblerisinstructedtof

11、ollowtheEMValgorithmwhenplayingthisgame.AssumerconsecutiveheadshavebeenthrownanddenotethegamblersoriginalstakeplustotalwinningsasSr.Hisexpectedpay-offforwithdrawingfromthegameisclearlySr.However,hisexpectedpay-offforcontinuingtoplayisatleast(1/2)3Sr+(1/2)0=(3/2)Sr(theexpectedpay-offforplayingoncemor

12、e).SoundertheEMValgorithmthegamblershouldcontinuetostakehiswinningsuntilatailisthrown.Butsinceatailwillbethrowneventuallywithprobabilityone,byfollowingtheEMValgorithmthegamblerensuresthathewilllosehisoriginalstakemoneywith certainty!Clearly,inthesimplegamegivenabove,veryrationalpeoplewillnotwanttofo

13、llowthedictatesoftheEMValgorithm.ItisthereforenecessarytomodifytheEMValgorithmsothatoptimaldecisionscanbedefinedsensiblyforsituationsliketheonegivenabove.Itwillbeshowninthenextsectionthatsuchamodificationispossibleprovidedthatyourclientispreparedtocommithimselftofollowingcertainrules(oraxioms).Itals

14、ogeneralizestheEMVapproachtoproblemswhenclientsobjectivesarenotonlythemaximizationofpay-off.Homework:AmedicallaboratoryhastotestN samplesofbloodtoseewhichhavetracesofararedisease.Theprobabilityanyonepatienthasthediseaseisp,andgivenp,theprobabilityofanygroupofpatientshavingthediseaseisuninfluencedbyt

15、heexistenceorotherwiseofthediseaseinanyotherdisjointgroupofpatients.Becausepisbelievedtobesmallitissuggestedthatthelaboratorycombinethebloodofdpatientsintoequalsizedpoolsofn=N/dsampleswheredisadivisorofN.Eachpoolofsampleswouldthenbetestedtoseeifitexhibitedatraceoftheinfection.If no trace were found

16、then the individual samplescomprisingthegroupwouldbeknowntobeuninfected.Ifontheotherhandatracewerefoundinthepooledsampleitisthenproposedthateachofthensamplescomprisingthatpoolbetestedindividually.Ifitcosts1totestanysampleofblood,whetherpooledorunpooled,findtheBayesdecisionfortheoptimalsizeofthegroup

17、sofpatientsforagivenvalueofp.AnswerYouaregiventhespaceofdecisionsyouaretoconsideristheset of divisions of N.All the uncertainty in the experiment existsbecauseyoudonotknow(d)thenumberoftestsyourclientwillneedtodoifhechoosestopoolthesamplesintogroupsifdsamples.HismonetarylossisjustL(d)=(d).The uncert

18、ain quantity(d)can be broken down into twocomponents,beingthesumofthenumbernoftestedpoolsplusthenumberofindividualpatientsthatsubsequentlyneedtobechecked.Ifd=1,andhechoosestotestsamplesindividually,thesecondcomponentofthissumisknowntobezero.SothecorrespondingexpectedlossL(1)=N,thenumberofpatients.Su

19、pposed1andyouchoosetopoolthesamplesinsomeway.Ifdenotestheprobabilitythatapoolhasnotraceofdiseasedblood,thenistheprobabilitythatnopatientinthepoolhastheinfection.Sincepatients have the disease independently it follows by the laws ofprobabilitythat=(1-p)dSo,sincehewilltestn=N/dsuchpooledsamples,theexp

20、ectednumberofpooledsamplesthatneedretestingisn(1-).Ifapoolisfoundtohavetracesofthediseasethenallmembersofthepoolwillberetested.Sotheexpectednumberofsamplesthatsubsequentlyneedretestingis dn(1-)=N1-(1-p)dAddingthisnumbertothechosennumberofpools(n=N/d)givestheexpectednumberoftests(orequivalentlytheexp

21、ectedlossin$)forchoosingtousesamplepoolsofsized1.CombiningtheseresultsgivesthatAlthoughisnotalinearfunctionofd(asitwasinourfirstexample),givenp,canbeeasilycalculatedforeachdivisordofNandthedecisionwhichminimizesfound.Sinceisincreasingwhende,youcanshowthatifp0.31youshouldchoosetotestsamplesindividual

22、ly.Ontheotherhand,ifNisdivisibleby3andp0.31thenitisalwaysoptimaltopoolsamplesinsomeway.Ifp0.31,lety=d-1+1-(1-p)d.Theny=-d-2(1-p)dln(1-p)=0.WecanobtainSincetherightoftheequationisconstant,thisanon-algebraequation.Wemayusenumericalcalculustoapproximativelyresolveit.Supposetheresolutionisd1,thentheopti

23、maldisthedivisorofNwhichisnearestd1.效用函数的定义和公理效用函数的定义和公理效用函数的定义和公理效用函数的定义和公理1.效用的概念效用的概念决策分析中有两个关键问题:一是对所研究现象的状态的不确定性进行量化;二是对各种可能出现的后果赋值。一般说来,状态的不确定性用各种状态出现的概率来描述,而研究出现后果的价值则要用到效用理论。所谓效用,就是金钱、物品、劳务或其它事务给人提供的满足。它是度量一定数量的金钱(或其它事务)在决策者心目中的价值或者说决策者对待它们的态度的概念。或者说,效用是在有风险的情况下,决策人对后果的爱好(称为偏好)的量化,可用一数值表示。在风

24、险决策中,多用来体现决策者对风险所持有的态度。2.效用函数的定义定义定义5.1展望:展望:设C1,C2,Cn表示决策人选择某一行动ai时,决策问题的全部n个可能的后果;p1,p2,pn分别时后果发生的概率。用P表示所有后果的概率分布,并记为P=(p1,C1;p2,C2;pn,Cn)称为展望。所有展望的集合记作。定义定义5.2在上的效用函数是定义在上的实值函数u:(1)它和在上的优先关系一致,如果对于所有P1,P2,有P1P2,当且仅当u(P1)u(P2).(2)它在上是线性的,即如果P1,P2,而且01,则u(P1+(1-)P2)=u(P1)+(1-)u(P2).将上述定义推广到一般情况,函数

25、u的线性性可表示为:如果Pi,而且i0,i=1,2,m,,则复合展望复合展望由于P=(p1,C1;p2,C2;pn,Cn)所以u(P)=u(p1,C1;p2,C2;pn,Cn)记P1=(1,C1;0,C2;0,Cn)P2=(0,C1;1,C2;0,Cn)Pn=(0,C1;0,C2;1,Cn),则P=P1+P2+Pn由效用函数在上的现行性质可知,u(P)可表示为u(P)=上式中的u(Ci)为u(1,Ci),即以概率1选择后果Ci的效用。根据定义,P的效用u(P)就是以概率p1选择后果C1,以概率p2选择后果C2,以概率pn选择后果Cn的期望效用。因此,如果效用u存在,而且它和决策人对中的偏好关系

26、一致,即当P1P2时,u(P1)u(P2),决策人必将选择一行动使后果的期望效用为极大。(举例:带伞问题)理性行为公理:理性行为公理:公公理理1连通性(或成对可比性):如果P1,P2,则或者P1P2,或者P1P2,或者P1P2。公公理理2传递性:如果P1,P2,P3,而且P1P2,P2P3,则必有P1P3。公理公理3替代性:如果P1,P2和Q,而且0p1,则P1P2当且仅当pP1+(1-p)QpP2+(1-p)Q.公理公理4连续性(连续性或称偏好有界性):如果P1,P2,P3,而且P1P2P3,则存在数p和q,0p1和0q0)isalsoautilityfunctionrepresenting

27、thesamepreferences.Conversely,ifu()andw()aretwoutilityfunctionsonXrepresentingthesamepreferences,thenthereexist0andsuchthatw()=u()+.Proof.Thefirstpartofthetheoremisonepartofthetheorem4.1.Toprovetheconverseimplicationsupposethatu()andw()aretwoutilityfunctionsonXrepresentingthesamepreferences.Supposea

28、lsothat w()u()+(5.1)Wewillobtainacontradiction.Foranypointxi X defineapoint(ui,wi)intheplane,whereui=u(xi)andwi=w(xi).If(5.1)holds,xi X(i=1,2,3)suchthatthepoints(u1,w1),(u2,w2)and(u3,w3)arenotcolinear.Withoutlossofgeneralitywemayassumethatu1u2u3.Letp=(u2-u1)/(u3-u1)andconsiderthelotteryx3px1,wherex3

29、px1=.Intermsofthefunctionu(),x3px1hasexpectedutility.=pu(x3)+(1-p)u(x1)=u2Sox2x3px1.Butsimplegeometryshowsthattheassumptionofnon-collinearityimpliesW2pw3+(1-p)w1.SeeFig.4.1 So intermsof theutilityfunctionw(),x2 x3px1.Hence the assumption that u()and w()represent the samepreferencesiscontradicted.The

30、refore(5.1)cannotholdandwehavew()=u()+.That0holdsclearly.uu1u2u3ww3w2w1pw3+(1-p)w1Fig.4.1确定当量确定当量是指以下两种情况等价:一种情况是决策人得到一确定的后果C1,另一种情况是决策人得到一抽奖的机会(记作C),他以概率p得到后果C2,以概率1-p得到后果C3,即(p,C2;(1-p),C3)。如果决策人认为这两种情况对他是等价的,则确定的后果C1称为抽奖(p,C2;(1-p),C3)的确定当量。u(C1)=Eu(C)公公理理5(抽抽奖奖的的 性性质质)一抽奖的所有奖金都增加一金额,将使此抽奖的确定当量增加

31、。定理定理5.3如果在抽奖集上的优先关系适合公理1至公理5,则在后果集X上的效用函数为线性函数或指数函数。证证明明:假设抽奖的奖金(后果)为一连续变量,记作x,奖金集为X,X上的概率密度为f(x).此时抽奖P的期望效用为根据公理5和确定当量的定义可知,(5.2)其中是抽奖的确定当量。假设为一连续变量,在后果集X上的效用函数u(x+)对有直到二阶的连续导数。将上式两边对位分两次,得和将以上两式左右两边分别相除,并令=0,得如果(5.3)式对于各种不同的密度函数都成立,则满足该式的效用函数应符合以下条件:(5.3)对所有的xX选择此比值为一常数-r,即上式积分,得lnu(x)=-rx+k0所以 u

32、(x)=k1e-rx如r=0,则有u(x)=k1x+k2如r 0,则 u(x)=k2e-rx+k3Example3The St Petersburg paradox revisitedInExample2assumenowthatthegamblerhasautilityfunctiononrewardroftheformu(r)=r(e+r)-1r0(5.4)Theparameterwillreflectthegamblerspropensitytotakerisks.Thelargerthevalueof,themoreheprefersspeculativegainsoflargeamo

33、untstothecertaintyofgainingsmallamounts.Regardlessof,u(r)isconcaveandtakesvaluesbetween0and1.Thedecision-makersexpectedutilityassociatedwithdecisiondnofterminatingthegameafterthenthtossis=(1/2)n-13n-1(e+3n-1)-1=(1.5)n-1(e+3n-1)-1Itiseasilycheckedthatafunctionexe+ex-1 ismaximizedwhen x=-1log-log()+if

34、 Itfollowsthat(1.5)y-1(e+3y-1)-1ismaximizedwheny=-1log-log()+1where=log1.5=log3isthereforemaximizedateitherthelargestnon-negativeintegervaluenlessthanyorthesmallestnon-negativeintegergreaterthany,whereyisdefinedabove.Noticeinparticularthatyincreases(linearly)with.Sothemorereadythegambleristorisklarg

35、especulativegains,thelongerheshouldplaythegame,aswewouldexpect.Butnotethatanygamblerwithautilityfunctiongiveninequation(5.4)willchoosetoterminatethegameatsomestageunliketheEMVdecision-maker.SothenthesupposedSt Petersburg paradoxhasdisappeared.基数效用:以上所定义的效用是决策人在有风险的情况下对后果的偏好的量化,其中含有决策人对一不确定事件可能冒的风险的态

36、度,它反映了决策人的偏好强度,这种效用称为基数效用。序数效用:定义一效用表示决策人对各种确定事件的后果的偏好次序。对于这类事件,决策人无需承担任何风险。这样定义的效用和基数效用不同,称为序数效用。定定义义5.3令X为所有确定事件的后果x的集,在X上的效用函数称为序数效用函数,它是定义在X上的实值函数u,有u(x1)u(x2),当且仅当x1 x2。如在X上的优先关系满足以下三条公理,则在X上的序数效用存在:公理1连通性、公理2传递性、公理3连续性,即对于任何确定的后果x,它的劣势集和它的优势集都是闭集。定理5.4如果在X上的优先关系 满足公理1至公理3,则在X上存在效用u,它和一致。此外,u经过

37、保序变换仍然和一致。效用函数的构成效用函数的构成1.离散型效用的测定离散型效用的测定效用的大小可以用概率的形式来表示,效用值介于0、1之间。效用的测定方法很多,最常用的是VonNeumann和Morgenstern于1944年共同提出的,称之为效用标准测定法效用标准测定法。例如,对决策者而言,他最大的愿望是收益100元,最小的收益为0元。将收益为100元的方案的效用指定为1,收益为0元的方案的效用值定为0,且分别记作u(100)=1,u(0)=0。如果决策者确定“u(100)=1,u(0)=0”,那么记“收益a元的行动方案”为a,0a100。下面确定u(a)。显然,对决策者愈有利的方案,效用值

38、愈大,因此u(a)应满足0u(a)0,风险厌恶(2)k=0,风险中性(3)k0,风险喜好可测价值函数可测价值函数后果的偏好强度后果的偏好强度0-1000与1000-1500等价,效用函数?对确定性后果的偏好强度需要测量序数价值函数序数价值函数设是定义在方案集A上的决策人的弱序,若A上的实值函数v满足v(a)v(b)ab可测价值函数可测价值函数为了量化决策人对确定性后果的偏好强度可测价值函数可测价值函数在后果X上的实值函数v,对w,x,y,z属于X,有(1)(wx)(yz)v(w)-v(x)v(y)-v(z)(2)v对正线性变换是唯一确定的(wx)表示决策人对w和x的偏好强度之差可测价值函数示意

39、图可测价值函数示意图相对风险态度相对风险态度决策人的真实的风险态度被称为“相对风险态度”假设效用函数u和可测价值函数v在X上单调递增且二次连续可微记表示决策在x处的风险侧度(1)r(x)0,风险厌恶(2)r(x)=0,风险中性(3)r(x)0,v在x处下凹,边际价值递减(2)m(x)=0,v在x处线形,边际价值不变(3)m(x)0,u(x)0。效用函数具有如下形式:u(x)=a-be-cx,c0,b02)递增风险厌恶效用函数递增风险厌恶效用函数递增风险厌恶是指当主体随着其财产水平x的增加,他对某一类特定范围的决策就愈加回避风险的态度。这时r(x)0,u(x)0,u(x)0,0 x0,u(x)0

40、,u(x)0,u(x)0,u(x)0,根据参数a的不同,可以导出以下三种形式的基本递减风险厌恶效用函数。0a1一般形式为u(x)=-bx+d损失函数、风险函数和损失函数、风险函数和贝叶斯风险贝叶斯风险损失函数、风险函数和贝叶斯风险损失函数、风险函数和贝叶斯风险损失函数记作l(,a),它表示一决策问题当状态为,决策人的行动为a时,所产生的后果使决策人遭受的损失。由于损失函数可能为负值,因此它也能反映决策人获得的收益。后果的效用越大,损失越小。故用效用函数去定义损失函数的一种简单办法,是令 l(,a)=-u(,a)为了使损失函数非负,可以定义为由于损失函数经过任何正线性变换仍然是同一优先关系的效用

41、函数,因此以上两种形式的损失函数都会得到同样的分析结果。对于给定的对于给定的,观察的结果,观察的结果X是一随机变量,用是一随机变量,用F(x)记记X的的条条件分布函数,用件分布函数,用f(x)记记X的条件密度函数,用的条件密度函数,用记随机变量记随机变量的的样本空间。样本空间。决策规则决策规则所谓决策法则,就是由所有可能信息值的集合到所有可能行动的所谓决策法则,就是由所有可能信息值的集合到所有可能行动的集合的一个映射。换句话说,决策规则是这样一个规则集合的一个映射。换句话说,决策规则是这样一个规则,按照这,按照这个个规规则则,对对于于每每一一个个信信息息值值X均均有有唯唯一一确确定定的的可可行

42、行行行动动a=(x)与与之之对应。对应。设给定一个决策规则设给定一个决策规则(x),在任一状态在任一状态 下,当信息值下,当信息值X确定后,确定后,它它所所对对应应的的行行动动(x)也也就就确确定定了了,从从而而(x)的的损损失失值值为为l(,(x),它它也也是是一一随随机机变变量量。当当给给定定,l(,(x)对对X的的期期望望值值称称为为风风险险函函数,并记为数,并记为R(,),R(,)=E x l(,(x)若X为离散随机变量,则由于决策认事先不知道真实状态,他只能对随机状态的先验密度()作出主观估计。所以进行决策分析时,还需要将损失函数R(,(x)对取期望值,即如为连续随机变量,则如为离散

43、随机变量,则 r(,)称为决策规则相对于的贝叶斯风险。对于固定的决策规则(x),其贝叶斯风险为一常数,它反映出利用这一决策规则决策的平均损失。三种标准“损失函数”:平方损失:更一般的平方损失是加权平方损失,其形式是线性损失线性损失“0-1”损失损失例.有两类盒子:甲类盒子只有一个,其中装有80个红球,20个白球;乙类盒子共有三个,每个盒子均装有20个红球,80个白球。四个盒子外表一样,内容不知。今从中任取一盒,请你猜它是哪类的。如果猜中,付你1元钱;如果未猜中,不付你钱。那么你怎样猜法?如果从这个盒子中任意抽取N个球(回置地),让你观察,你如何根据这N个球的性质来选择自己的行动?当容量为1或2

44、的抽样时,求各决策规则的风险函数和贝叶斯风险,并分别指出最佳决策规则。解:令表示所取出的这个盒子中红球所占的比例。显然,只能取两个值:若这个盒子是甲类的,=1=0.8;若这个盒子是乙类的,=1=0.2。用a1、a2分别表示猜这个盒子是甲类的和猜它是乙类的这两个行动方案。显然收益矩阵如表5.1所示。表5.1猜盒问题的收益矩阵 1 2 1/4 3/4 a110a201假设N=1,即从你猜的那个盒子中取出1个球来观察。规定:对于红球,x=1;对于白球,x=0,其抽样分布如表5.2所示:表5.2N=1时猜盒问题的抽样分布矩阵P()P(x=0/)P(x=1/)11/40.20.823/40.80.2P(

45、x=0/)表示从甲类盒子中抽取1球是白球的概率,显然它等于0.2。对另外三个概率可作类似理解。利用先验分布和抽样分布计算后验分布:P(x=0)=0.21/4+0.83/4=0.65P(1/x=0)=0.05/0.65=1/13P(2/x=0)=0.60/0.65=12/13P(x=1)=0.81/4+0.23/4=0.35P(1/x=1)=0.2/0.35=4/7P(2/x=1)=0.15/0.35=3/7表5.3N=1时猜盒问题的后验分布矩阵XP(x)P(1/x)P(2/x)00.651/1312/1310.354/73/7样本容量N=2时,表5.4N=2时猜盒问题的抽样分布矩阵P()P(x

46、=0/)P(x=1/)P(x=2/)11/40.040.320.6423/40.640.320.04表5.5N=2时猜盒问题的后验分布矩阵XP(x)P(1/x)P(2/x)00.491/4948/4910.321/43/420.1916/193/19本例中,如果样本容量为1,由于所有可能的抽样结果有2个,可行行动也有2个,故决策规则共有22=4个:1(x)=a12(x)=3(x)=4(x)=a2如果样本容量为2,那么抽样结果有3种可能,可行行动海时2个,因此决策规则共有23=8个。一般地,对于有S个可行行动的决策问题,若补充信息值有n个,则决策规则共有Sn个。对于决策法则1(x),无论是x=0

47、或x=1,都有l(1,1(x)=l(1,a1)=0l(2,1(x)=l(2,a1)=1于是 R(1,1(x)=l(1,1(x)=0R(2,1(x)=l(1,1(x)=1即1(x)的风险函数为其贝叶斯风险:r(,1)=R(1,1)P(1)+R(2,1)P(2)=0.75对于决策规则2(x),l(1,2(0)=l(1,a1)=0l(1,1(1)=l(1,a2)=1于是R(1,2(x)=R(1,2(0)P(x=0/1)+R(1,2(1)P(x=1/1)=10.8+00.2=0.8同样地,l(2,2(0)=l(2,a1)=1l(2,2(1)=l(2,a2)=0R(2,2(x)=R(2,2(0)P(x=

48、0/2)+R(2,2(1)P(x=1/2)=10.8+00.2=0.8因此,2(x)的风险函数为R(,2)=0.8其贝叶斯风险为r(,2)=0.8类似地,可以求出3和4的贝叶斯风险分别为r(,3)=0.2,r(,4)=0.25最佳决策规则为3贝叶斯准则贝叶斯准则:贝叶斯风险最小的决策规则为最佳决策规则。最小最大风险函数值准则:对于每个决策规则(x),找出它的风险函数在所有可能状态下的最大值,这些最大风险函数值中最小者所对应的决策规则,就是最小最大值准则下的最佳决策规则。注意:这里所将的决策规则与前面的决策准则不同。决策准则,是判别诸行动间优劣关系的标准,他所指明的是什么叫一个行动方案优于另一个行动方案,据此可以选出最优行动方案来;而决策法则是信息值与所采取的行动的对应关系,它所指明的是如何根据信息值选择行动方案。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁