第03讲随机决策理论与方法-1bbzr.pptx-淘文阁

资源描述

《第03讲随机决策理论与方法-1bbzr.pptx》由会员分享，可在线阅读，更多相关《第03讲随机决策理论与方法-1bbzr.pptx（58页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、决策理论与方法决策理论与方法(3)随机决策理论与方法随机决策理论与方法(1)合肥工业大学管理学院合肥工业大学管理学院合肥工业大学管理学院合肥工业大学管理学院Saturday,March 25,2023Saturday,March 25,2023随机性决策随机性决策vv风险性决策（随机性决策）风险性决策（随机性决策）风险性决策（随机性决策）风险性决策（随机性决策）：指有多种未来状态和：指有多种未来状态和：指有多种未来状态和：指有多种未来状态和相应后果，但只能得到各种状态发生的概率而难以相应后果，但只能得到各种状态发生的概率而难以相应后果，但只能得到各种状态发生的概率而难以相应后果，但只能得到各种

2、状态发生的概率而难以获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。vv特点特点特点特点：状态的随机性；决策结果的效用特性。：状态的随机性；决策结果的效用特性。：状态的随机性；决策结果的效用特性。：状态的随机性；决策结果的效用特性。vv决策的已知变量决策的已知变量决策的已知变量决策的已知变量：状态空间的概率分布状态空间的概率分布状态空间的概率分布状态空间的概率分布=,后果的效用函数后果的效用函数后果的效用函数后果的效用函数(或损失函数或损失函数或损失函数或损失函数)：u u(c(cij ij)，c cij ij表示采取方案表示采取

3、方案表示采取方案表示采取方案a ai i时出现状态时出现状态时出现状态时出现状态 j j的后果的后果的后果的后果vv解决问题的主要理论方法解决问题的主要理论方法解决问题的主要理论方法解决问题的主要理论方法：概率论与数理统计：概率论与数理统计：概率论与数理统计：概率论与数理统计决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1 1、主观概率、主观概率、主观概率、主观概率2 2、效用函数、效用函数、效用函数、效用函数3 3、决策准则、决策准则、决策准则、决策准则4 4、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析决策理论与方法-随机决策理论与方法主观概率主观

4、概率概率的定义概率的定义vv古典概率的定义古典概率的定义古典概率的定义古典概率的定义：在相同条件下进行了：在相同条件下进行了：在相同条件下进行了：在相同条件下进行了n n次试验（随机试验）次试验（随机试验）次试验（随机试验）次试验（随机试验），其中事件，其中事件，其中事件，其中事件A A发生的次数发生的次数发生的次数发生的次数n nA A称为事件称为事件称为事件称为事件A A发生的频数，比值发生的频数，比值发生的频数，比值发生的频数，比值n nA A/n n称为事件称为事件称为事件称为事件A A发生的频率，记为发生的频率，记为发生的频率，记为发生的频率，记为f fn n(A)(A)，则古典概率

5、的定义，则古典概率的定义，则古典概率的定义，则古典概率的定义为：为：为：为：p p(A)=(A)=limlimn nf fn n(A)(A)vvLaplaceLaplace的定义的定义的定义的定义：p p(A)=(A)=k k/n n；其中；其中；其中；其中k k为事件为事件为事件为事件A A所包含的基本事所包含的基本事所包含的基本事所包含的基本事件数，件数，件数，件数，n n为基本事件为基本事件为基本事件为基本事件e ei i的总数。（基本事件数有限，每个基本的总数。（基本事件数有限，每个基本的总数。（基本事件数有限，每个基本的总数。（基本事件数有限，每个基本事件等概率）事件等概率）事件等概

6、率）事件等概率）vv公理化定义公理化定义公理化定义公理化定义：E E是随机事件，是随机事件，是随机事件，是随机事件，S S是是是是E E的样本空间，对的样本空间，对的样本空间，对的样本空间，对E E的每一的每一的每一的每一事件事件事件事件A A，对应有确定的实数，对应有确定的实数，对应有确定的实数，对应有确定的实数p p(A)(A)，若，若，若，若p p(A)(A)满足：满足：满足：满足：非负性：非负性：非负性：非负性：p p(A)0(A)0；规范性：规范性：规范性：规范性：p p(S)=1(S)=1；列可加性：对两两不相容事列可加性：对两两不相容事列可加性：对两两不相容事列可加性：对两两不相

7、容事件件件件A Ak k，有，有，有，有p p(k kA Ak k)=)=k kp p(A(Ak k)。(A(Ai iAAj j=,=,i i j j)决策理论与方法-随机决策理论与方法主观概率主观概率概率的定义概率的定义vv客观客观客观客观(Objective)(Objective)概率概率概率概率：上述三种定义的概率是在多次重复：上述三种定义的概率是在多次重复：上述三种定义的概率是在多次重复：上述三种定义的概率是在多次重复试验（随机试验）中，随机事件试验（随机试验）中，随机事件试验（随机试验）中，随机事件试验（随机试验）中，随机事件A A发生的可能性的大小的度发生的可能性的大小的度发生的可

8、能性的大小的度发生的可能性的大小的度量，称为客观概率。量，称为客观概率。量，称为客观概率。量，称为客观概率。vv主观主观主观主观(Subjective)(Subjective)概率概率概率概率：在实际管理决策中，许多事件的发：在实际管理决策中，许多事件的发：在实际管理决策中，许多事件的发：在实际管理决策中，许多事件的发生概率是无法通过随机试验获得的，或条件不允许，或事件生概率是无法通过随机试验获得的，或条件不允许，或事件生概率是无法通过随机试验获得的，或条件不允许，或事件生概率是无法通过随机试验获得的，或条件不允许，或事件本身不允许。因此需要一种方法来人为设定事件发生的概率，本身不允许。因此需

9、要一种方法来人为设定事件发生的概率，本身不允许。因此需要一种方法来人为设定事件发生的概率，本身不允许。因此需要一种方法来人为设定事件发生的概率，称为主观概率。称为主观概率。称为主观概率。称为主观概率。主观概率是人们根据经验、各方面的知识以主观概率是人们根据经验、各方面的知识以主观概率是人们根据经验、各方面的知识以主观概率是人们根据经验、各方面的知识以及了解到的客观情况进行分析、推理、综合判断，对特定事及了解到的客观情况进行分析、推理、综合判断，对特定事及了解到的客观情况进行分析、推理、综合判断，对特定事及了解到的客观情况进行分析、推理、综合判断，对特定事件发生的可能性的信念（或意见、看法）的度

10、量件发生的可能性的信念（或意见、看法）的度量件发生的可能性的信念（或意见、看法）的度量件发生的可能性的信念（或意见、看法）的度量(Savage,1954)(Savage,1954)。决策理论与方法-随机决策理论与方法主观概率主观概率先验分布与先验假设先验分布与先验假设vv先验分布先验分布先验分布先验分布(Prior Distribution)(Prior Distribution)：根据先验信息所确定的概率：根据先验信息所确定的概率：根据先验信息所确定的概率：根据先验信息所确定的概率分布叫先验分布，获得先验分布是贝叶斯分析的基础。分布叫先验分布，获得先验分布是贝叶斯分析的基础。分布叫先验分布，

11、获得先验分布是贝叶斯分析的基础。分布叫先验分布，获得先验分布是贝叶斯分析的基础。决策决策决策决策中先验分布的获得具有高度的主观性中先验分布的获得具有高度的主观性中先验分布的获得具有高度的主观性中先验分布的获得具有高度的主观性。vv先验假设先验假设先验假设先验假设：为使先验分布估计规范化，需要做一定的假设。：为使先验分布估计规范化，需要做一定的假设。：为使先验分布估计规范化，需要做一定的假设。：为使先验分布估计规范化，需要做一定的假设。连通性假设连通性假设连通性假设连通性假设：指事件：指事件：指事件：指事件A A和事件和事件和事件和事件B B发生的可能性是可比的，即发生的可能性是可比的，即发生的

12、可能性是可比的，即发生的可能性是可比的，即p p(A)(A)p p(B),(B),p p(A)(A)p p(B),(B),p p(A)(A)(A)p p(B),(B),p p(B)(B)p p(C),(C),则则则则p p(A)(A)p p(C)(C)。（满足连通性和传递性的二元关系才能构成完全序）。（满足连通性和传递性的二元关系才能构成完全序）。（满足连通性和传递性的二元关系才能构成完全序）。（满足连通性和传递性的二元关系才能构成完全序）部分与全体关系假设部分与全体关系假设部分与全体关系假设部分与全体关系假设：若事件：若事件：若事件：若事件A A是事件是事件是事件是事件B B的一部分，则的一

13、部分，则的一部分，则的一部分，则p p(B)(B)p p(A)(A)。决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计先验分布估计:比较法比较法vv比较法比较法比较法比较法1-1-离散型离散型离散型离散型（对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对似然率对似然率对似然率对似然率）某气象专家对当年的气候状况进行评估，认为当年气候某气象专家对当年的气候状况进行评估，认为当年气候某气象专家对当年的气候状况进行评估，认为当年气候某气象专家对当年的气候状况进行评估，认为当年气候正常正常正常正常(

14、1 1)与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为3:23:2；如果受灾，则水；如果受灾，则水；如果受灾，则水；如果受灾，则水灾灾灾灾(2 2)、旱灾、旱灾、旱灾、旱灾(3 3)的可能性相当。据此，我们可推算出的可能性相当。据此，我们可推算出的可能性相当。据此，我们可推算出的可能性相当。据此，我们可推算出当年气候状况的先验分布：当年气候状况的先验分布：当年气候状况的先验分布：当年气候状况的先验分布：(1 1)+)+(2 2)+)+(3 3)=1;)=1;(1 1)/()/(2 2)+)+(3 3)=3/2;)=3/2;(2 2)=)=(3 3)解得

15、：解得：解得：解得：(1 1)=0.6)=0.6，(2 2)=0.2)=0.2，(3 3)=0.2)=0.2思考：设某决策问题有思考：设某决策问题有思考：设某决策问题有思考：设某决策问题有n n个状态，有个状态，有个状态，有个状态，有mm个专家对各状态发个专家对各状态发个专家对各状态发个专家对各状态发生的可能性进行了比较评估，我们如何综合利用所有专生的可能性进行了比较评估，我们如何综合利用所有专生的可能性进行了比较评估，我们如何综合利用所有专生的可能性进行了比较评估，我们如何综合利用所有专家的评估结果得到最终的先验分布？家的评估结果得到最终的先验分布？家的评估结果得到最终的先验分布？家的评估结

16、果得到最终的先验分布？决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计：打赌法先验分布估计：打赌法vv打赌法（离散型）打赌法（离散型）打赌法（离散型）打赌法（离散型）设打赌者设打赌者设打赌者设打赌者(A)(A)的个人财产为的个人财产为的个人财产为的个人财产为WW。设事件。设事件。设事件。设事件E E发生时发生时发生时发生时A A获得收入获得收入获得收入获得收入为为为为p p，(0(0p p11；p pW：a a b b表示表示表示表示a a优于优于优于优于b b。满足传递性和非对称性。满足传递性和非对称性。满足传递性和非对称性。满足传递性和非对称性。无差异无差异无差异无差异：a

17、a b b表示表示表示表示a a与与与与b b无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和传递性。传递性。传递性。传递性。弱序弱序弱序弱序：a a b b表示表示表示表示a a不劣于不劣于不劣于不劣于b b。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对称性。称性。称性。称性。展望展望展望展望(prospect)(prospect)（事态体事态体事态体事态体）：各种后果）：各种后果）：各种后果）：各种后果(r r种种种种)及后果出现及后果出现及后果出现及后果出现的概率的组

18、合，记为：的概率的组合，记为：的概率的组合，记为：的概率的组合，记为：P Pj j=，(j j=1,2,m;m=1,2,m;m为行动的可能种数为行动的可能种数为行动的可能种数为行动的可能种数)决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义复合展望：当无法确定采取某个行动时，可随机选择一复合展望：当无法确定采取某个行动时，可随机选择一复合展望：当无法确定采取某个行动时，可随机选择一复合展望：当无法确定采取某个行动时，可随机选择一种行动，设选择行动种行动，设选择行动种行动，设选择行动种行动，设选择行动a aj j的概率为的概率为的概率为的概率为q qj j。则决策的展望就是

19、一。则决策的展望就是一。则决策的展望就是一。则决策的展望就是一种复合展望，记为种复合展望，记为种复合展望，记为种复合展望，记为P=P=。所有展。所有展。所有展。所有展望（包括简单展望和复合展望）构成展望空间。望（包括简单展望和复合展望）构成展望空间。望（包括简单展望和复合展望）构成展望空间。望（包括简单展望和复合展望）构成展望空间。vv效用的定义效用的定义效用的定义效用的定义若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数u u对于展望空间的任意两个展望对于展望空间的任意两个展望对于展望空间的任意两个展望对于展望空间的任意两个展望P P1 1、P P2

20、2，有，有，有，有P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2)，则称，则称，则称，则称u u为效用函数。为效用函数。为效用函数。为效用函数。决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义vv效用存在性公理（理性行为公理）效用存在性公理（理性行为公理）效用存在性公理（理性行为公理）效用存在性公理（理性行为公理）连通性：任意两个展望的优劣都是可比的连通性：任意两个展望的优劣都是可比的连通性：任意两个展望的优劣都是可比的连通性：任意两个展望的优劣都是可比的传递性：展望的优劣满足传递性传递性：展望的优劣满足传递性传递性：展望的优劣满足传递性

21、传递性：展望的优劣满足传递性复合保序性：展望的优劣关系是可以复合的，且复合不复合保序性：展望的优劣关系是可以复合的，且复合不复合保序性：展望的优劣关系是可以复合的，且复合不复合保序性：展望的优劣关系是可以复合的，且复合不会破坏原有的优劣关系会破坏原有的优劣关系会破坏原有的优劣关系会破坏原有的优劣关系展望的优劣是相对的，没有无限优的展望，也不存在无展望的优劣是相对的，没有无限优的展望，也不存在无展望的优劣是相对的，没有无限优的展望，也不存在无展望的优劣是相对的，没有无限优的展望，也不存在无限劣的展望。限劣的展望。限劣的展望。限劣的展望。vv理性行为公理认为合乎理性的决策人在进行价值判理性行为公理

22、认为合乎理性的决策人在进行价值判理性行为公理认为合乎理性的决策人在进行价值判理性行为公理认为合乎理性的决策人在进行价值判断时一定能满足这些公理。（实际决策中是否存在断时一定能满足这些公理。（实际决策中是否存在断时一定能满足这些公理。（实际决策中是否存在断时一定能满足这些公理。（实际决策中是否存在某种悖论呢？）某种悖论呢？）某种悖论呢？）某种悖论呢？）决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义vvAllaisAllais悖论悖论悖论悖论抽奖抽奖抽奖抽奖a a1 1抽奖抽奖抽奖抽奖a a2 21.01.00.890.890.010.015050万元万元万元万元5050万

23、元万元万元万元0 0元元元元0.100.10250250万元万元万元万元决策决策决策决策A A决策决策决策决策A A抽奖抽奖抽奖抽奖b b1 1抽奖抽奖抽奖抽奖b b2 20.110.110.900.905050万元万元万元万元0 0元元元元0.100.10250250万元万元万元万元决策决策决策决策B B实际上决策实际上决策实际上决策实际上决策B B B B是在决策是在决策是在决策是在决策A A A A的基础上同时减去了的基础上同时减去了的基础上同时减去了的基础上同时减去了89%89%89%89%的的的的机会获得机会获得机会获得机会获得50505050万元，万元，万元，万元，复合保序性没有得

24、到满足复合保序性没有得到满足复合保序性没有得到满足复合保序性没有得到满足决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义vv思考思考思考思考：效用函数一定是连续的吗？是否存在某种临：效用函数一定是连续的吗？是否存在某种临：效用函数一定是连续的吗？是否存在某种临：效用函数一定是连续的吗？是否存在某种临界点使得效用函数是一种分段函数，而在分段函数界点使得效用函数是一种分段函数，而在分段函数界点使得效用函数是一种分段函数，而在分段函数界点使得效用函数是一种分段函数，而在分段函数内满足效用存在公理？内满足效用存在公理？内满足效用存在公理？内满足效用存在公理？vv效用的公理化定义效

25、用的公理化定义效用的公理化定义效用的公理化定义：在上述公理系统中，若展望空：在上述公理系统中，若展望空：在上述公理系统中，若展望空：在上述公理系统中，若展望空间上存在实值函数间上存在实值函数间上存在实值函数间上存在实值函数u u，有：，有：，有：，有：对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望P P1 1、P P2 2，P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2)u u(P P1 1+(1-+(1-)P)P2 2)=)=u u(P(P1 1)+(1-)+(1-)u u(P(P2 2)()(复合展望的效用复合展望

26、的效用复合展望的效用复合展望的效用等于展望效用的复合等于展望效用的复合等于展望效用的复合等于展望效用的复合)对满足上述条件的对满足上述条件的对满足上述条件的对满足上述条件的u u1 1,u u2 2,必有必有必有必有u u1 1(P(Pi i)=)=bubu2 2(P(Pi i)+)+c c,其中其中其中其中b b,c cR R1 1，b b00。（。（。（。（任意两个决策人的效用是线性相关的任意两个决策人的效用是线性相关的任意两个决策人的效用是线性相关的任意两个决策人的效用是线性相关的）决策理论与方法-随机决策理论与方法效用函数效用函数基数性和序数性基数性和序数性vv前述定义的效用是一种基数

27、效用，不仅能够反映决前述定义的效用是一种基数效用，不仅能够反映决前述定义的效用是一种基数效用，不仅能够反映决前述定义的效用是一种基数效用，不仅能够反映决策者的偏好次序，还能够反映决策者的偏好强度。策者的偏好次序，还能够反映决策者的偏好强度。策者的偏好次序，还能够反映决策者的偏好强度。策者的偏好次序，还能够反映决策者的偏好强度。vv但在实际决策中，有时只需要偏好次序而不一定需但在实际决策中，有时只需要偏好次序而不一定需但在实际决策中，有时只需要偏好次序而不一定需但在实际决策中，有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用要知

28、道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介就可以了。有关序数效用的应用在多属性决策中介就可以了。有关序数效用的应用在多属性决策中介就可以了。有关序数效用的应用在多属性决策中介绍。绍。绍。绍。vvHicksHicks对效用函数的基数性和序数性的比喻对效用函数的基数性和序数性的比喻对效用函数的基数性和序数性的比喻对效用函数的基数性和序数性的比喻：如果：如果：如果：如果知道两个人的身高，那么我们可以把高个儿排在第知道两个人的身高，那么我们可以把高个儿排在第知道两个人的身高，那么我们可以把高个儿排在第知道两个人的身高

29、，那么我们可以把高个儿排在第一位；如果不知道他俩的身高也没关系，让他们比一位；如果不知道他俩的身高也没关系，让他们比一位；如果不知道他俩的身高也没关系，让他们比一位；如果不知道他俩的身高也没关系，让他们比一下就可以了。一下就可以了。一下就可以了。一下就可以了。决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计vv概率当量法概率当量法概率当量法概率当量法(Von Neumann,Morgenstern(Von Neumann,Morgenstern，N-MN-M法法法法)：设设设设决策系统的自然状态集决策系统的自然状态集决策系统的自然状态集决策系统的自然状态集=1

30、 1,n n、行动集行动集行动集行动集A=A=a a1 1,a amm、后果集、后果集、后果集、后果集C=C=c cij ij=c c(a ai i,j j)，最优后果为，最优后果为，最优后果为，最优后果为c c*=max*=max c cij ij，最劣后果为，最劣后果为，最劣后果为，最劣后果为c c0 0=min=min c cij ij。则对于任意后果。则对于任意后果。则对于任意后果。则对于任意后果c cij ij的效的效的效的效用值用值用值用值u(u(c cij ij)，可按以下步骤获得：，可按以下步骤获得：，可按以下步骤获得：，可按以下步骤获得：设设设设u(c*)=1,u(cu(c*

31、)=1,u(c0 0)=0)=0；建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c，p p可调可调可调可调反复向决策人提问，改变可调概率反复向决策人提问，改变可调概率反复向决策人提问，改变可调概率反复向决策人提问，改变可调概率p p，使得当，使得当，使得当，使得当p=pp=pij ij时得到如下时得到如下时得到如下时得到如下的无差异关系：的无差异关系：的无差异关系：的无差异关系：c cij ijp 测得后果测得后果测得后果测得后果c cij ij的效用值为：的效用值为：的效用值为：的效用值为：u(u(c cij ij)=p)=pij ij*u(c*)+(1-p*u(c*)+

32、(1-pij ij)*u(c)*u(c0 0)=p)=pij ij决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计vv确定当量法确定当量法确定当量法确定当量法（修正（修正（修正（修正N-MN-M法）法）法）法）：设设设设u(c*)=1,u(cu(c*)=1,u(c0 0)=0)=0；建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c，p p为为为为0-10-1间的给定值，如间的给定值，如间的给定值，如间的给定值，如p=0.5p=0.5反复向决策人提问，改变反复向决策人提问，改变反复向决策人提问，改变反复向决策人提问，改变c cij ij得到如

33、下的无差异关系：得到如下的无差异关系：得到如下的无差异关系：得到如下的无差异关系：c cij ijp,c*;1-p,c 测得后果测得后果测得后果测得后果c cij ij的效用值为：的效用值为：的效用值为：的效用值为：u(u(c cij ij)=p*u(c*)+(1-p)*u(c)=p*u(c*)+(1-p)*u(c0 0)=p)=pij ijvv增益当量法增益当量法增益当量法增益当量法：已知：已知：已知：已知u(cu(cij ij)和和和和u(cu(c0 0)，确定，确定，确定，确定u(c*)u(c*)的方法的方法的方法的方法vv损失当量法损失当量法损失当量法损失当量法：已知：已知：已知：已知

34、u(cu(cij ij)和和和和u(c*)u(c*)，确定，确定，确定，确定u(cu(c0 0)的方法的方法的方法的方法决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造（离散型）效用函数的构造（离散型）vv看球的效用函数构造（不考虑经济成本）看球的效用函数构造（不考虑经济成本）看球的效用函数构造（不考虑经济成本）看球的效用函数构造（不考虑经济成本）1.1.构建问题的决策树，根据一般偏好，四种后构建问题的决策树，根据一般偏好，四种后构建问题的决策树，根据一般偏好，四种后构建问题的决策树，根据一般偏好，四种后果的优劣是果的优劣是果的优劣是果的优劣是C2C3C4C1C2C3C4C1；

35、2.2.令令令令u(C1)=0,u(C2)=1u(C1)=0,u(C2)=1；3.3.询问询问询问询问1 1：“下雨看电视转播下雨看电视转播下雨看电视转播下雨看电视转播”的后果与的后果与的后果与的后果与“现现现现场看球场看球场看球场看球”时有多大的概率下雨被淋相当？时有多大的概率下雨被淋相当？时有多大的概率下雨被淋相当？时有多大的概率下雨被淋相当？(例如：例如：例如：例如：0.30.3，则，则，则，则u(C3)=0.7)u(C3)=0.7)4.4.询问询问询问询问2 2：“天晴看电视转播天晴看电视转播天晴看电视转播天晴看电视转播”的后果与的后果与的后果与的后果与“现现现现场看球场看球场看球场看

36、球”时有多大的概率下雨被淋相当？时有多大的概率下雨被淋相当？时有多大的概率下雨被淋相当？时有多大的概率下雨被淋相当？(例如：例如：例如：例如：0.60.6，则，则，则，则u(C4)=0.4)u(C4)=0.4)5.5.一致性检验：用一致性检验：用一致性检验：用一致性检验：用C3C3，C4C4加上加上加上加上C1(C1(或或或或C2)C2)进行进行进行进行校验，直至一致性得到满足。校验，直至一致性得到满足。校验，直至一致性得到满足。校验，直至一致性得到满足。现场现场现场现场看球看球看球看球a a1 1电视电视电视电视看球看球看球看球a a2 2C4:C4:天晴看电视天晴看电视天晴看电视天晴看电视

37、C3:C3:下雨没被淋下雨没被淋下雨没被淋下雨没被淋C2:C2:天晴未被淋天晴未被淋天晴未被淋天晴未被淋C1:C1:下雨被淋下雨被淋下雨被淋下雨被淋决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造（连续型）效用函数的构造（连续型）vv若后果是连续型，则可通过分析若后果是连续型，则可通过分析若后果是连续型，则可通过分析若后果是连续型，则可通过分析u(c)u(c)的若干特征值，的若干特征值，的若干特征值，的若干特征值，求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。vv例：试作出每天投入学习的时

38、间例：试作出每天投入学习的时间例：试作出每天投入学习的时间例：试作出每天投入学习的时间t t对应的效用曲线。对应的效用曲线。对应的效用曲线。对应的效用曲线。分析特征点：分析特征点：分析特征点：分析特征点：u(t=0)=0;u(tTu(t=0)=0;u(tTMM)=0(T)=0(TMM=?)=?)；状态导入期；状态导入期；状态导入期；状态导入期（0 0t t0 0），效用增加较慢；状态稳定期），效用增加较慢；状态稳定期），效用增加较慢；状态稳定期），效用增加较慢；状态稳定期(t(t0 0t t1 1)，效用与，效用与，效用与，效用与投入学习的时间基本成比例关系；效率下降，效用增加投入学习的时间基

39、本成比例关系；效率下降，效用增加投入学习的时间基本成比例关系；效率下降，效用增加投入学习的时间基本成比例关系；效率下降，效用增加期期期期(t(t1 1ttmm)，效用是投入学习的时间的单调增函数，但增，效用是投入学习的时间的单调增函数，但增，效用是投入学习的时间的单调增函数，但增，效用是投入学习的时间的单调增函数，但增长率小于状态稳定期且随着时间的增加越来越小，最终长率小于状态稳定期且随着时间的增加越来越小，最终长率小于状态稳定期且随着时间的增加越来越小，最终长率小于状态稳定期且随着时间的增加越来越小，最终达到零达到零达到零达到零(t=t(t=tmm)，此时效用达到最大；当投入的学习时间，此时

40、效用达到最大；当投入的学习时间，此时效用达到最大；当投入的学习时间，此时效用达到最大；当投入的学习时间大于大于大于大于t tmm时，将会得不偿失，学习效率急剧降低，效用减少。时，将会得不偿失，学习效率急剧降低，效用减少。时，将会得不偿失，学习效率急剧降低，效用减少。时，将会得不偿失，学习效率急剧降低，效用减少。决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造（连续型）效用函数的构造（连续型）t t0 0t t1 1t tmmt tMM0 02424U U(t t)U Umaxmaxt t决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用vv风险风险风险风险：

41、遇到破坏或损失的机会或危险。：遇到破坏或损失的机会或危险。：遇到破坏或损失的机会或危险。：遇到破坏或损失的机会或危险。“风险风险风险风险”：以打鱼捕捞为生的渔民们在长期的捕捞实践：以打鱼捕捞为生的渔民们在长期的捕捞实践：以打鱼捕捞为生的渔民们在长期的捕捞实践：以打鱼捕捞为生的渔民们在长期的捕捞实践中，深深的体会到中，深深的体会到中，深深的体会到中，深深的体会到“风风风风”给他们带来的无法预测无法确给他们带来的无法预测无法确给他们带来的无法预测无法确给他们带来的无法预测无法确定的危险，他们认识到，在出海捕捞打鱼的生活中，定的危险，他们认识到，在出海捕捞打鱼的生活中，定的危险，他们认识到，在出海捕

42、捞打鱼的生活中，定的危险，他们认识到，在出海捕捞打鱼的生活中，“风风风风”即意味着即意味着即意味着即意味着“险险险险”，因此有了，因此有了，因此有了，因此有了“风险风险风险风险”一词的由来。一词的由来。一词的由来。一词的由来。风险包含两个方面的内容：一是后果的损失严重程度；风险包含两个方面的内容：一是后果的损失严重程度；风险包含两个方面的内容：一是后果的损失严重程度；风险包含两个方面的内容：一是后果的损失严重程度；二是损失出现的可能性大小。二是损失出现的可能性大小。二是损失出现的可能性大小。二是损失出现的可能性大小。参考：参考：参考：参考：http:/ a的后果为收益的后果为收益的后果为收益的

43、后果为收益y y，y y的概率密度函数的概率密度函数的概率密度函数的概率密度函数为为为为f f(y y)，期望值为，期望值为，期望值为，期望值为E(E(y y)，则方差，则方差，则方差，则方差可用来度量风险，方差越大风险越大。可用来度量风险，方差越大风险越大。可用来度量风险，方差越大风险越大。可用来度量风险，方差越大风险越大。协方差协方差协方差协方差：若期望收益为决策人设定的目标收益：若期望收益为决策人设定的目标收益：若期望收益为决策人设定的目标收益：若期望收益为决策人设定的目标收益c c，则可用，则可用，则可用，则可用协方差度量风险。协方差度量风险。协方差度量风险。协方差度量风险。临界概率临

44、界概率临界概率临界概率：小于目标收益的概率。：小于目标收益的概率。：小于目标收益的概率。：小于目标收益的概率。决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用vv效用与风险效用与风险效用与风险效用与风险：效用反映的就是决策人对风险的一种：效用反映的就是决策人对风险的一种：效用反映的就是决策人对风险的一种：效用反映的就是决策人对风险的一种态度。态度。态度。态度。U(t)Umax=1C(万元)风险厌恶型风险厌恶型风险中立型风险中立型风险追求型风险追求型0.50912.51425风险酬金风险酬金k决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1 1、主观

45、概率、主观概率、主观概率、主观概率2 2、效用函数、效用函数、效用函数、效用函数3 3、决策准则、决策准则、决策准则、决策准则4 4、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析决策理论与方法-随机决策理论与方法决策准则决策准则决策问题的表示决策问题的表示vv决策树表示法决策树表示法决策树表示法决策树表示法决策点决策点决策点决策点机会点机会点机会点机会点C1C1决策枝决策枝决策枝决策枝机会枝机会枝机会枝机会枝后果点后果点后果点后果点C2C2C3C3C4C4后果值后果值后果值后果值a a1 1a a2 2 (1 1)(2 2)(1 1)(2 2)决策理论与方法-随机决策理论与方

46、法决策准则决策准则决策问题的表示决策问题的表示vv决策表表示法决策表表示法决策表表示法决策表表示法 1 1 2 2 j j n n (j j)(1 1)(2 2)(j j)(n n)a a1 1c c1111c c1212c c1j1jc c1n1na a2 2c c1111c c1212c c1j1jc c1n1na ai ic ci1i1c ci2i2c cij ijc cinina ammc cm1m1c cm2m2c cmjmjc cmnmn状态状态行动行动后果后果后果后果(效用值、损失值、价值效用值、损失值、价值效用值、损失值、价值效用值、损失值、价值)决策理论与方法-随机决策理论与

47、方法决策准则决策准则最大可能值准则最大可能值准则vv决策者决策时都需要根据某种准则来选择决策方案决策者决策时都需要根据某种准则来选择决策方案决策者决策时都需要根据某种准则来选择决策方案决策者决策时都需要根据某种准则来选择决策方案决策准则。准则不同，决策结果就可能不同。决策准则。准则不同，决策结果就可能不同。决策准则。准则不同，决策结果就可能不同。决策准则。准则不同，决策结果就可能不同。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。vv最大可能值准则最大可能值准则最大可能值准则最大可

48、能值准则：（众数原则）：（众数原则）：（众数原则）：（众数原则）j j 1 1 2 2 3 3E(E(a ai i)=)=i i (j j)c)cij ij (j j)0.20.20.50.50.30.3a a1 17 73 34 44.14.1a a2 26.56.54 41 13.63.6a a3 36 65 50 03.73.7注：后果为损失值注：后果为损失值注：后果为损失值注：后果为损失值此准则在状态出现的概率差距此准则在状态出现的概率差距此准则在状态出现的概率差距此准则在状态出现的概率差距不大时的决策效果可能很差！不大时的决策效果可能很差！不大时的决策效果可能很差！不大时的决策效果可

49、能很差！决策理论与方法-随机决策理论与方法决策准则决策准则贝叶斯准则贝叶斯准则vv贝叶斯准则贝叶斯准则贝叶斯准则贝叶斯准则：期望效用最大或期望损失最小。：期望效用最大或期望损失最小。：期望效用最大或期望损失最小。：期望效用最大或期望损失最小。在实际决策中，一般先确定后果对决策人的实际价值即在实际决策中，一般先确定后果对决策人的实际价值即在实际决策中，一般先确定后果对决策人的实际价值即在实际决策中，一般先确定后果对决策人的实际价值即效用函数（若是损失则使用效用函数（若是损失则使用效用函数（若是损失则使用效用函数（若是损失则使用负效用负效用负效用负效用）（称为）（称为）（称为）（称为伯努利过程伯努

50、利过程伯努利过程伯努利过程），然后再应用贝叶斯准则。，然后再应用贝叶斯准则。，然后再应用贝叶斯准则。，然后再应用贝叶斯准则。j j 1 1 2 2 3 3E(E(a ai i)=i i (j j)c)cij ij (j j)0.20.20.50.50.30.3a a1 17 73 34 44.14.1a a2 26.56.54 41 13.63.6a a3 36 65 50 03.73.7注：后果为损失值注：后果为损失值注：后果为损失值注：后果为损失值决策理论与方法-随机决策理论与方法决策准则决策准则E-V准则准则vvE-VE-V准则准则准则准则：用期望与方差（度量风险）共同判决一个方案的：用

展开阅读全文