《3效用函数oja.pptx》由会员分享,可在线阅读,更多相关《3效用函数oja.pptx(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、3.效用函数n3.1 引言n3.2 效用的定义和公理系统n3.3 效用函数的构造n3.4 风险与效用n3.5 货币的效用3.1 引言n在定量评价可能的行动的各种后果时,会遇到两个主要问题:n(1)后果本身是用语言表述,可能没有任何合适的直接测量标度。n(2)即使有一个明确的标度可以测量后果,按这个标度测得的量也可能并不反映后果对决策人的真正价值。3.1 引言例例3.1 考虑钱对同一个人的价值。假设一个学生手头紧张,正好有机会挣100元钱,但是所要做的是他相当讨厌的工作。1)如他经济情况差,他会认为100元钱的实际价值足够大,所要做的工作即使是相当讨厌的,他仍会去干;2)如他先有了10000元,
2、要为100元钱去干这份让他讨厌的工作,他就很可能不干了。问题一:1)、2)中后果的数值分别是多少?问题二:1)、2)中后果的实际价值哪个大?例子说明:即使是数值量数值量表示的后果,它对决策人的实际价值实际价值仍有待确定。3.1 引言 例例3.2 决策人面临图3.1中决策树所示的选择:收入礼品1000元,或是参与一次抽奖:有50%的机会得0元,50%的机会得2500元。有人选确定性的1000元的收入。抽奖的期望值虽大,风险也大,实际价值还不如保险的1000元。而有人认为礼品不如抽奖,因为抽奖提供了获得2500元的机会。3.1 引言n由上面两个例子可知:在进行决策分析时,存在如何描述或表达后果对决
3、策人的实际价值,以便反映决策的人心目中各种后果的偏好次序偏好次序(preference order)的问题。n偏好次序是决策人的个性与价值观的反映,它与决策人所处的社会地位、经济地位、文化素养、心理和生理(身体)状态有关。3.2 效用的定义和公理系统n3.2.1 效用的定义n3.2.2 效用存在性公理n3.2.3 效用的公理化定义和效用的存在性n3.2.4 基数效用与序数效用3.2.1 效用的定义n效用效用:商品满足人的欲望的能力和消费者在消费商品时所感受到的满足程度.n在决策理论中,后果对决策人的实际价值,即决策人对后果的后果的偏好次序偏好次序是用效用效用(utility)来描述的。n效用就
4、是偏好的量化,是数效用就是偏好的量化,是数(实值函数实值函数)。n1738年,Daniel Bernoulli就指出:若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好偏好的期望值最高期望值最高的行动。一、效用的基本概念与符号(1)严格序严格序“”a b(或者记作aPb)的含义是“a优于b”(a is preferred to b);也就是说,若非外界因素的强迫,决策人只会选择a而不会选择b。一、效用的基本概念与符号(2)无差异无差异“”ab(或记作aIb)的含义是“a无差异于
5、b”(a is indifference to b);也就是说,决策人对选择或同样满意。一、效用的基本概念与符号(3)弱序弱序“”记作aRb,含义是“a不劣于b”,亦即a优于或者无差异于b。一、效用的基本概念与符号 (4)展望展望(prospect)展望指决策的可能的前景,即各种后果及后果出现的概率的组合,记作P=.在例3.2的决策问题中,后果集 C=1000,2500,0,采取行动a1和a2时的展望分别是:P1=P2=(4)展望展望(prospect)展望既考虑各种后果Ci,又考虑了各种后果出现的概率(客观概率pi或主观概率i),全面地描述了在决策问题中采取某种行动的可能前景。复合展望 一、
6、效用的基本概念与符号(5)抽奖与确定当量 由机会点和该机会点发出的 n 个机会枝的概率及相应后果构成的图形称为抽奖抽奖(lottery),抽奖又称彩票。若C1 (p,C2;(1-P),C3),则称 确定性后果C1为抽奖抽奖(p,C2;(1-P),C3)的确定当量确定当量(certainty equivalent)。二、效用的定义 根据上述讨论和记号,可以初步给出效用函数的定义如下。定义定义3.1 在集合P上的实值函数u,若它和P上的优先关系一致,即:若 P1,P2属于 P,P1 P2当且仅当u(P1)u(P2),则称u为效用函数。把效用函数定义在展望集P上而不是定义在后果集C上,是为了使效用函
7、数能够反映决策人对风险的态度。3.2.2 效用存在性公理n定义3.1给出了效用函数的最基本性质,这就是可以根据它的大小来判断展望P的优劣。n但是这样的效用函数是否一定存在呢?回答是不一定。n至于决策人的价值判断在满足什么条件时存在与之一致的效用函数,von Neumann-Morgenstern(1944)给出了效用的存在性公理,又称理性行为公理。3.2.2 效用存在性公理式(3.3)推导:P1 P2P1+(1-)P1 P2+(1-)P2P1+(1-)P3 P2+(1-)P3 公理3.3表明两个有序的展望各有相同的比例 被相等的量 替代后,优先关系不变.例3.3 横过马路问题:效用有界性证明例
8、3.5 Allais悖论:对预期效用的独立性公理的挑战Allais悖论:P(a1)=500*1+2500*0+0*0=500P(b1)=500*0.11+2500*0+0*0.89=55P(b2)=500*0+2500*0.1+0*0.9=250P(a2)=500*0.89+2500*0.1+0*0.01=695Allais悖论:a1和a2的优先关系与b1和b2优先关系相对应(替代性)P(a1)=500*1+2500*0+0*0=500P(b1)=500*0.11+2500*0+0*0.89=55P(a1)=500*0.11+2500*0+0*0+500*0.89=500P(a2)=500*0
9、.89+2500*0.1+0*0.01=695P(a2)=500*0+2500*0.1+0*0.01+500*0.89=695P(b2)=500*0+2500*0.1+0*0.01+0*0.89=2503.2.3 效用的公理化定义和效用的存在性3.2.3 效用函数的存在性3.2.4 基数效用与序数效用n基数:为实数,如1,2,3,n序数:如第一,二,4,3,2,1n基数性效用函数与序数效用函数区别:1.基数效用定义在展望集P上(考虑后果及其概率分布),是实数;序数效用定义在后果集C上,不涉及概率,可以是整正数.2.基数效用反映偏好强度:(正线性变换下唯一)原数列可变换为:b+c,2b+c,3b
10、+c,100b+c;其中 b,c R1,b0.而序数效用不反映偏好强度,(保序变换下唯一),原序数列可变换为16,9,4,1;或 8,6,4,2,或10,7,6,1等.3.2.4 基数效用与序数效用n 基数(cardinal number)效用:边际效用分析方法 -总效用(TOTAL UTILITY,TU):消费者在一定时间内从一定数量商品的消费中所得到的效用量的总和;-边际效用(MARGINAL UTILITY,MU):消费者在一定时间内增加一单位商品的消费所得到的效用量的增量.n序数(ordinal number)效用:无差异曲线分析方法 希克斯认为,效用的数值表现只是为了表达偏好的顺序,
11、并非效用的绝对数值。现在比较通用的是序数效用。无差异曲线(Indifference curve)n含义:无差异曲线表示对消费者没有区别的商品组合的点的轨迹。即无差异曲线是用来表示两种商品或两组商品的不同数量的组合对消费者所提供的效用是相同的。n特征:(1)无差异曲线是是一条凸向原点,并向右下方倾斜的曲线,其斜率为负值,它表明在收入与价格既定的条件下,为了获得同样的满足程度,增加一种商品消费时就必须放弃或减少另一种商品的消费。(2)两种商品在消费者偏好不变的条件下,不能同时减少或增多。在同一平面图上有无数条无差异曲线,同一条无差异曲线代表同样的满足程度,不同的无差异曲线代表不同的满足程度,离原点
12、越远,满足程度越大,反之则越小。(3)在同一平面图上,任意两条无差异曲线不能相交,否则与第二点矛盾。3.3 效用函数的构造n1估计效用函数值的方法估计效用函数值的方法n2离散型后果的效用设定离散型后果的效用设定n3连续型后果的效用函数构造连续型后果的效用函数构造n4用解析函数近似效用曲线用解析函数近似效用曲线1估计效用函数值的方法估计效用函数值的方法 概率当量法概率当量法 确定当量法确定当量法 增益当量法增益当量法 损失当量法损失当量法 从纯理论角度看,这四种方法并没有实质性的区别;但是实验结果表明,使用确定当量法时决策人对最优后果(增益)的保守性和对损失的冒险性都比概率当量法严重(Hersh
13、ey,1982);采用增益当量法与损失当量法时产生的误差也比用概率当量法大,因此只要有可能,应该尽可能使用概率当量法。概率当量法概率当量法2离散型后果的效用设定离散型后果的效用设定n后果为离散型随机变量时,后果集C中元素为有限个,构造后果集上的效用函数有两方面的内容:(1)确定各后果之间的优先序;(2)确定后果之间的优先程度。n离散型后果效用值的设定可以采用概率当量法,简称NM法。NM法步骤如下:例3.6 例例3.6 天气预报说球赛时可能有雨,一个足球爱好者要决定是否去球场看球。首先作该问题的决策树如图所示。由题意可知决策人对四种后果优劣的排序是:c2c3c4c1。步骤:n第一步:令u(c1)
14、=0,u(c2)=1。n第二步:询问决策人,下雨在家看电视这种后果与去球场看球有多大概率下雨被淋相当,若决策人的回答是0.3,则c30.7 c2+0.3c1,u(c3)0.7u(c2)0.7。n第三步:询问决策人,无雨看电视这种后果与去球场看球有多大概率下雨被淋相当,若决策人的回答是0.6,则c40.4c2+0.6c1,得u(c4)0.4c20.4。n第 四 步:进 行 一 致 性 校 验。c30.4c2+0.6c4,则u(c3)=0.640.7。重复二、三,若u(c3)不变,则调整u(c4)=0.5,决策人仍认为c30.4c2+0.6c4,则通过校验。3连续型后果的效用函数构造连续型后果的效
15、用函数构造n当后果c为连续变量时,上述方法就不再适用。n但是如果能通过分析找到u(c)的若干特征值,求特征点的效用后,再连成光滑曲线;n或者u(c)是连续、光滑的,则可以分段构造u(c)。每天学习时间与效用随着学习时间的增加,效用值也会有所增加但是由于进入状态需要一定的时间,所以在t较小时,效用的增加较慢;过了一小段时间后,效用与所化时间基本上是线性关系;随着学习时间的不断增加,人会疲劳,效率会下降;时间太长,这时的效果不如时间适度,即存在效用值最大的点tm;再增加学习时间又会从效用最大值处下降。其中与效用最大值对应的tm是因人而异。由于效用函数的惟一性(即在正线性变换下惟一,见效用的公理化定
16、义),效用的值域可以是整个实轴,而不必限于0,1区间。4用解析函数近似效用曲线用解析函数近似效用曲线n为了分析和运算方便,分析人员通常希望能够用某种解析函数式u(x)来近似地表达效用。n常用的函数有幂函数和对数函数.3.4 风险与效用n3.4.1 风险的含义n3.4.2 效用函数包含的内容n3.4.3 相对风险态度3.4.1 风险的含义n风险包含有两个方面的内容:n(1)后果的损失严重程度;n(2)出现损失的可能性的大小.n一般的,可以用以下几种指标来度量风险。(1)方差(2)自方差(3)临界概率(4)Fishburn的风险定义3.4.2 效用函数包含的内容n1.对风险的态度对风险的态度n2.
17、对后果的偏好强度对后果的偏好强度n3.可测价值函数可测价值函数1.对风险的态度对风险的态度 如图所示为几种典型的效用函数曲线。曲线A是下凹的,曲线N是线性的,曲线P是凸函数。这三种形状的曲线分别反映了决策人的三种风险态度:风险厌恶风险厌恶(risk aversion)、风风险中立险中立(risk neutralness)和风风险追求险追求(risk proneness)。理解:设某人现有1250,再增加1250,此人的财富价值函数如何变化。风险酬金2对后果的偏好强度对后果的偏好强度 n考察一下钱的边缘价值:设某人现有积蓄为0,增加1000元对此人的作用(价值)与有了1000元后再加1500元相
18、等,则此人的财富的价值函数是凹函数,如右图。n若询问货币后果对这个决策人的实际价值即效用时,决策人认为1000元(0.5,0;0.5,2500),则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化,这就是可测价值函数。3.可测价值函数可测价值函数-确定性后果偏好强度的量化定义定义:在后果空间X上的实值函数v,对w,x,y,zX有I、(wx)(yz)当且仅当v(w)v(x)v(y)v(z),II、v对正线性变换是唯一确定的。则称v为可测价值函数。可测价值函数的示意图如右。3.可测价值函数可测价值函数3.4.3 相对风险态度决策人的真实的风险态度被称作相对风险态
19、度相对风险态度(relative risk attitude)。设效用函数和测价值函数在上都是单调递增,且连续二次可微。1效用函数反映的风险的局部测度 0 u在x 处凹,风险厌恶 r(x)=-u”(x)/u(x)=0 u在x 处线性,风险中立 0 在x处有递减的边缘价值 m(x)=-v”(x)/v(x)=0 在x处有不变的边缘价值 m(x),称为在x 处相对风险厌恶 r(x)m(x),称为在x 处相对风险中立 r(x)m(x),称为在x 处相对风险追求 3.5 货币的效用作业3:n1)四、某厂考虑两种生产方案(P54)n2)六、把一副扑克牌的4张A取出(P54)谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH