决策理论与方法概述课件.ppt-淘文阁

资源描述

《决策理论与方法概述课件.ppt》由会员分享，可在线阅读，更多相关《决策理论与方法概述课件.ppt（76页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、决策理论与方法决策理论与方法随机决策理论与方法随机决策理论与方法(1)合肥工业大学管理学院合肥工业大学管理学院合肥工业大学管理学院合肥工业大学管理学院20232023年年年年5 5月月月月3131日日日日随机性决策随机性决策uu风险性决策（随机性决策）风险性决策（随机性决策）风险性决策（随机性决策）风险性决策（随机性决策）：指有多种未来状态和：指有多种未来状态和：指有多种未来状态和：指有多种未来状态和相应后果，但只能得到各种状态发生的概率而难以相应后果，但只能得到各种状态发生的概率而难以相应后果，但只能得到各种状态发生的概率而难以相应后果，但只能得到各种状态发生的概率而难以获得充分可靠信息的

2、决策问题。获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。uu特点特点特点特点：状态的随机性；决策结果的效用特性。：状态的随机性；决策结果的效用特性。：状态的随机性；决策结果的效用特性。：状态的随机性；决策结果的效用特性。uu决策的已知变量决策的已知变量决策的已知变量决策的已知变量：l l状态空间的概率分布状态空间的概率分布状态空间的概率分布状态空间的概率分布=,l l后果的效用函数后果的效用函数后果的效用函数后果的效用函数(或损失函数或损失函数或损失函数或损失函数)：u u(c(cij ij)，c cij ij表示采取方案表示采取方案表示采取方案表示采取方

3、案a ai i时出现状态时出现状态时出现状态时出现状态 j j的后果的后果的后果的后果uu解决问题的主要理论方法解决问题的主要理论方法解决问题的主要理论方法解决问题的主要理论方法：概率论与数理统计：概率论与数理统计：概率论与数理统计：概率论与数理统计2023/5/31决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1 1、主观概率、主观概率、主观概率、主观概率2 2、效用函数、效用函数、效用函数、效用函数3 3、决策准则、决策准则、决策准则、决策准则4 4、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析2023/5/31决策理论与方法-随机决策理论与方法主

4、观概率主观概率概率的定义概率的定义uu古典概率的定义古典概率的定义古典概率的定义古典概率的定义：在相同条件下进行了：在相同条件下进行了：在相同条件下进行了：在相同条件下进行了n n次试验（随机试验）次试验（随机试验）次试验（随机试验）次试验（随机试验），其中事件，其中事件，其中事件，其中事件A A发生的次数发生的次数发生的次数发生的次数n nA A称为事件称为事件称为事件称为事件A A发生的频数，比值发生的频数，比值发生的频数，比值发生的频数，比值n nA A/n n称为事件称为事件称为事件称为事件A A发生的频率，记为发生的频率，记为发生的频率，记为发生的频率，记为f fn n(A)(A)，

5、则古典概率的定义，则古典概率的定义，则古典概率的定义，则古典概率的定义为：为：为：为：p p(A)=(A)=limlimn nf fn n(A)(A)uuLaplaceLaplace的定义的定义的定义的定义：p p(A)=(A)=k k/n n；其中；其中；其中；其中k k为事件为事件为事件为事件A A所包含的基本事所包含的基本事所包含的基本事所包含的基本事件数，件数，件数，件数，n n为基本事件为基本事件为基本事件为基本事件e ei i的总数。（基本事件数有限，每个基本的总数。（基本事件数有限，每个基本的总数。（基本事件数有限，每个基本的总数。（基本事件数有限，每个基本事件等概率）事件等概率

6、）事件等概率）事件等概率）uu公理化定义公理化定义公理化定义公理化定义：E E是随机实验，是随机实验，是随机实验，是随机实验，S S是是是是E E的样本空间，对的样本空间，对的样本空间，对的样本空间，对E E的每一的每一的每一的每一事件事件事件事件A A，对应有确定的实数，对应有确定的实数，对应有确定的实数，对应有确定的实数p p(A)(A)，若，若，若，若p p(A)(A)满足：满足：满足：满足：非负性：非负性：非负性：非负性：p p(A)0(A)0；规范性：规范性：规范性：规范性：p p(S)=1(S)=1；列可加性：对两两不相容事列可加性：对两两不相容事列可加性：对两两不相容事列可加性：

7、对两两不相容事件件件件A Ak k，有，有，有，有p p(k kA Ak k)=)=k kp p(A(Ak k)。(A(Ai iAAj j=,=,i i j j)2023/5/31决策理论与方法-随机决策理论与方法主观概率主观概率概率的定义概率的定义uu客观客观客观客观(Objective)(Objective)概率概率概率概率：上述三种定义的概率是在多次重复试：上述三种定义的概率是在多次重复试：上述三种定义的概率是在多次重复试：上述三种定义的概率是在多次重复试验（随机试验）中，随机事件验（随机试验）中，随机事件验（随机试验）中，随机事件验（随机试验）中，随机事件A A发生的可能性的大小的度量

8、，发生的可能性的大小的度量，发生的可能性的大小的度量，发生的可能性的大小的度量，称为客观概率。称为客观概率。称为客观概率。称为客观概率。uu主观主观主观主观(Subjective)(Subjective)概率概率概率概率：在实际管理决策中，许多事件的发：在实际管理决策中，许多事件的发：在实际管理决策中，许多事件的发：在实际管理决策中，许多事件的发生概率是无法通过随机试验获得的，或条件不允许，或事件生概率是无法通过随机试验获得的，或条件不允许，或事件生概率是无法通过随机试验获得的，或条件不允许，或事件生概率是无法通过随机试验获得的，或条件不允许，或事件本身不允许。因此需要一种方法来人为设定事件发

9、生的概率，本身不允许。因此需要一种方法来人为设定事件发生的概率，本身不允许。因此需要一种方法来人为设定事件发生的概率，本身不允许。因此需要一种方法来人为设定事件发生的概率，称为主观概率。称为主观概率。称为主观概率。称为主观概率。主观概率是人们根据经验、各方面的知识以主观概率是人们根据经验、各方面的知识以主观概率是人们根据经验、各方面的知识以主观概率是人们根据经验、各方面的知识以及了解到的客观情况进行分析、推理、综合判断，对特定事及了解到的客观情况进行分析、推理、综合判断，对特定事及了解到的客观情况进行分析、推理、综合判断，对特定事及了解到的客观情况进行分析、推理、综合判断，对特定事件发生的可能

10、性的信念（或意见、看法）的度量件发生的可能性的信念（或意见、看法）的度量件发生的可能性的信念（或意见、看法）的度量件发生的可能性的信念（或意见、看法）的度量(Savage,1954)(Savage,1954)。2023/5/31决策理论与方法-随机决策理论与方法主观概率主观概率先验分布与先验假设先验分布与先验假设uu先验分布先验分布先验分布先验分布(Prior Distribution)(Prior Distribution)：根据先验信息所确定的概率：根据先验信息所确定的概率：根据先验信息所确定的概率：根据先验信息所确定的概率分布叫先验分布，获得先验分布是贝叶斯分析的基础。分布叫先验分布，获

11、得先验分布是贝叶斯分析的基础。分布叫先验分布，获得先验分布是贝叶斯分析的基础。分布叫先验分布，获得先验分布是贝叶斯分析的基础。决策决策决策决策中先验分布的获得具有高度的主观性中先验分布的获得具有高度的主观性中先验分布的获得具有高度的主观性中先验分布的获得具有高度的主观性。uu先验假设先验假设先验假设先验假设：为使先验分布估计规范化，需要做一定的假设。：为使先验分布估计规范化，需要做一定的假设。：为使先验分布估计规范化，需要做一定的假设。：为使先验分布估计规范化，需要做一定的假设。l l连通性假设连通性假设连通性假设连通性假设：指事件：指事件：指事件：指事件A A和事件和事件和事件和事件B B发

12、生的可能性是可比的，即发生的可能性是可比的，即发生的可能性是可比的，即发生的可能性是可比的，即p p(A)(A)p p(B),(B),p p(A)(A)p p(B),(B),p p(A)(A)(A)p p(B),(B),p p(B)(B)p p(C),(C),则则则则p p(A)(A)p p(C)(C)。（满足连通性和传递性的二元关系才能构成完全序）。（满足连通性和传递性的二元关系才能构成完全序）。（满足连通性和传递性的二元关系才能构成完全序）。（满足连通性和传递性的二元关系才能构成完全序）l l部分与全体关系假设部分与全体关系假设部分与全体关系假设部分与全体关系假设：若事件：若事件：若事件：

13、若事件A A是事件是事件是事件是事件B B的一部分，则的一部分，则的一部分，则的一部分，则p p(B)(B)p p(A)(A)。2023/5/31决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计先验分布估计:比较法比较法uu比较法比较法比较法比较法1-1-离散型离散型离散型离散型（对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对事件发生的各种状态加以比较确定相对似然率对似然率对似然率对似然率）l l某气象专家对当年的气候状况进行评估，认为当年气候正某气象专家对当年的气候状况进行评估，认为当年气候正某气象专家对当年的气候状况进

14、行评估，认为当年气候正某气象专家对当年的气候状况进行评估，认为当年气候正常常常常(1 1)与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为3:23:2；如果受灾，则水灾；如果受灾，则水灾；如果受灾，则水灾；如果受灾，则水灾(2 2)、旱灾、旱灾、旱灾、旱灾(3 3)的可能性相当。据此，我们可推算出当的可能性相当。据此，我们可推算出当的可能性相当。据此，我们可推算出当的可能性相当。据此，我们可推算出当年气候状况的先验分布：年气候状况的先验分布：年气候状况的先验分布：年气候状况的先验分布：(1 1)+)+(2 2)+)+(3 3)=1;)=1;(1 1)/(

15、)/(2 2)+)+(3 3)=3/2;)=3/2;(2 2)=)=(3 3)解得：解得：解得：解得：(1 1)=0.6)=0.6，(2 2)=0.2)=0.2，(3 3)=0.2)=0.2l l思考：设某决策问题有思考：设某决策问题有思考：设某决策问题有思考：设某决策问题有n n个状态，有个状态，有个状态，有个状态，有mm个专家对各状态发个专家对各状态发个专家对各状态发个专家对各状态发生的可能性进行了比较评估，我们如何综合利用所有专生的可能性进行了比较评估，我们如何综合利用所有专生的可能性进行了比较评估，我们如何综合利用所有专生的可能性进行了比较评估，我们如何综合利用所有专家的评估结果得到最

16、终的先验分布？家的评估结果得到最终的先验分布？家的评估结果得到最终的先验分布？家的评估结果得到最终的先验分布？2023/5/31决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计：打赌法先验分布估计：打赌法uu打赌法（离散型）打赌法（离散型）打赌法（离散型）打赌法（离散型）l l设打赌者设打赌者设打赌者设打赌者(A)(A)的个人财产为的个人财产为的个人财产为的个人财产为WW。设事件。设事件。设事件。设事件E E发生时发生时发生时发生时A A获得收入获得收入获得收入获得收入为为为为p p，(0(0p p11；p pW：a a b b表示表示表示表示a a优于优于优于优于b b。满足传

17、递性和反对称性。满足传递性和反对称性。满足传递性和反对称性。满足传递性和反对称性。l l无差异无差异无差异无差异：a a b b表示表示表示表示a a与与与与b b无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和传递性。传递性。传递性。传递性。l l弱序弱序弱序弱序：a a b b表示表示表示表示a a不劣于不劣于不劣于不劣于b b。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对称性。称性。称性。称性。l l展望展望展望展望/前景前景前景前景(prospect)(prospe

18、ct)（事态体事态体事态体事态体）：每种行动）：每种行动）：每种行动）：每种行动i i都有都有都有都有n n种后果，种后果，种后果，种后果，n n种后果及后果出现的概率种后果及后果出现的概率种后果及后果出现的概率种后果及后果出现的概率（自然状态发生的概率）（自然状态发生的概率）（自然状态发生的概率）（自然状态发生的概率）的组的组的组的组合，记为：合，记为：合，记为：合，记为：P Pi i=，(i i=1,2,m)=1,2,m)2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义l l复合展望：当无法确定采取某个行动时，可随机选择一种复合展望：当无法确定采取某

19、个行动时，可随机选择一种复合展望：当无法确定采取某个行动时，可随机选择一种复合展望：当无法确定采取某个行动时，可随机选择一种行动，设选择行动行动，设选择行动行动，设选择行动行动，设选择行动a ai i的概率为的概率为的概率为的概率为q qi i。则决策的展望就是一种。则决策的展望就是一种。则决策的展望就是一种。则决策的展望就是一种复合展望，记为复合展望，记为复合展望，记为复合展望，记为P=P=。所有展望。所有展望。所有展望。所有展望（包括简单展望和复合展望）构成展望空间。（包括简单展望和复合展望）构成展望空间。（包括简单展望和复合展望）构成展望空间。（包括简单展望和复合展望）构成展望空间。uu

20、效用的定义效用的定义效用的定义效用的定义l l若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数u u对于展望空间的任意两个展望对于展望空间的任意两个展望对于展望空间的任意两个展望对于展望空间的任意两个展望P P1 1、P P2 2，有，有，有，有P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2)，则称，则称，则称，则称u u为效用函数为效用函数为效用函数为效用函数（不（不（不（不同的决策者同的决策者同的决策者同的决策者u u是不同的）是不同的）是不同的）是不同的）。2023/5/31决策理论与方法-随机决策理论与方法效用函

21、数效用函数效用的定义效用的定义uu效用存在性公理（效用存在性公理（效用存在性公理（效用存在性公理（理性行为公理理性行为公理理性行为公理理性行为公理）l l连通性：任意两个展望的优劣都是可比的。连通性：任意两个展望的优劣都是可比的。连通性：任意两个展望的优劣都是可比的。连通性：任意两个展望的优劣都是可比的。l l传递性：展望的优劣满足传递性。传递性：展望的优劣满足传递性。传递性：展望的优劣满足传递性。传递性：展望的优劣满足传递性。l l复合保序性：展望的优劣关系是可以复合的，且复合不会复合保序性：展望的优劣关系是可以复合的，且复合不会复合保序性：展望的优劣关系是可以复合的，且复合不会复合保序性：

22、展望的优劣关系是可以复合的，且复合不会破坏原有的优劣关系。破坏原有的优劣关系。破坏原有的优劣关系。破坏原有的优劣关系。l l展望的优劣是相对的，没有无限优的展望，也不存在无限展望的优劣是相对的，没有无限优的展望，也不存在无限展望的优劣是相对的，没有无限优的展望，也不存在无限展望的优劣是相对的，没有无限优的展望，也不存在无限劣的展望。劣的展望。劣的展望。劣的展望。2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义uu效用的公理化定义效用的公理化定义效用的公理化定义效用的公理化定义：在上述公理系统中，若展望空：在上述公理系统中，若展望空：在上述公理系统中，若展

23、望空：在上述公理系统中，若展望空间上存在实值函数间上存在实值函数间上存在实值函数间上存在实值函数u u，有：，有：，有：，有：l l对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望P P1 1、P P2 2，P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2)l lu u(P P1 1+(1-+(1-)P)P2 2)=)=u u(P(P1 1)+(1-)+(1-)u u(P(P2 2)()(复合展望的效用等复合展望的效用等复合展望的效用等复合展望的效用等于展望效用的复合于展望效用的复合于展望效用的复合于展望效用的复合)l l

24、对满足上述条件的对满足上述条件的对满足上述条件的对满足上述条件的u u1 1,u u2 2,必有必有必有必有u u1 1(P(Pi i)=)=bubu2 2(P(Pi i)+)+c c,其中其中其中其中b b,c cR R1 1，b b00。（。（。（。（任意两个决策人的效用是线性相关的任意两个决策人的效用是线性相关的任意两个决策人的效用是线性相关的任意两个决策人的效用是线性相关的）2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数基数性和序数性基数性和序数性uu前述定义的效用是一种基数效用，不仅能够反映决前述定义的效用是一种基数效用，不仅能够反映决前述定义的效用是一种基数效

25、用，不仅能够反映决前述定义的效用是一种基数效用，不仅能够反映决策者的偏好次序，还能够反映决策者的偏好强度。策者的偏好次序，还能够反映决策者的偏好强度。策者的偏好次序，还能够反映决策者的偏好强度。策者的偏好次序，还能够反映决策者的偏好强度。uu但在实际决策中，有时只需要偏好次序而不一定需但在实际决策中，有时只需要偏好次序而不一定需但在实际决策中，有时只需要偏好次序而不一定需但在实际决策中，有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用就可以

26、了。就可以了。就可以了。就可以了。uu基数性和序数性的差异基数性和序数性的差异基数性和序数性的差异基数性和序数性的差异：基数性效用给出的是效用：基数性效用给出的是效用：基数性效用给出的是效用：基数性效用给出的是效用的绝对值，而序数性效用给出的是效用的相对值。的绝对值，而序数性效用给出的是效用的相对值。的绝对值，而序数性效用给出的是效用的相对值。的绝对值，而序数性效用给出的是效用的相对值。2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计uu概率当量法概率当量法概率当量法概率当量法(Von Neumann,Morgenstern(Von Neum

27、ann,Morgenstern，N-MN-M法法法法)：设设设设决策系统的自然状态集决策系统的自然状态集决策系统的自然状态集决策系统的自然状态集=1 1,n n、行动集行动集行动集行动集A=A=a a1 1,a amm、后果集、后果集、后果集、后果集C=C=c cij ij=c c(a ai i,j j)，最优后果为，最优后果为，最优后果为，最优后果为c c*=max*=max c cij ij，最劣后果为，最劣后果为，最劣后果为，最劣后果为c c0 0=min=min c cij ij。则对于任意后果。则对于任意后果。则对于任意后果。则对于任意后果c cij ij的效用的效用的效用的效用值值

28、值值u(u(c cij ij)，可按以下步骤获得：，可按以下步骤获得：，可按以下步骤获得：，可按以下步骤获得：l l设设设设u(c*)=1,u(cu(c*)=1,u(c0 0)=0)=0；l l建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c，p p可调可调可调可调l l反复向决策人提问，改变可调概率反复向决策人提问，改变可调概率反复向决策人提问，改变可调概率反复向决策人提问，改变可调概率p p，使得当，使得当，使得当，使得当p=pp=pij ij时得到如下时得到如下时得到如下时得到如下的无差异关系：的无差异关系：的无差异关系：的无差异关系：c cij ijp l l测得后

29、果测得后果测得后果测得后果c cij ij的效用值为：的效用值为：的效用值为：的效用值为：u(u(c cij ij)=p)=pij ij*u(c*)+(1-p*u(c*)+(1-pij ij)*u(c)*u(c0 0)=p)=pij ij2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计礼品礼品礼品礼品a a1 1抽奖抽奖抽奖抽奖a a2 21.01.0p=?p=?1-p1-p20002000元元元元50005000元元元元0 0元元元元概率当量法就是调整p值，使得行动a1和a2的效用相当。2023/5/31决策理论与方法-随机决策理论与方法效

30、用函数效用函数效用函数值的估计效用函数值的估计uu确定当量法确定当量法确定当量法确定当量法（修正（修正（修正（修正N-MN-M法）法）法）法）：l l设设设设u(c*)=1,u(cu(c*)=1,u(c0 0)=0)=0；l l建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c，p p为为为为0-10-1间的给定值，如间的给定值，如间的给定值，如间的给定值，如p=0.5p=0.5l l反复向决策人提问，改变反复向决策人提问，改变反复向决策人提问，改变反复向决策人提问，改变c cij ij得到如下的无差异关系：得到如下的无差异关系：得到如下的无差异关系：得到如下的无差异关系：c

31、 cij ijp,c*;1-p,c l l测得后果测得后果测得后果测得后果c cij ij的效用值为：的效用值为：的效用值为：的效用值为：u(u(c cij ij)=p*u(c*)+(1-p)*u(c)=p*u(c*)+(1-p)*u(c0 0)=p)=p2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计礼品礼品礼品礼品a a1 1抽奖抽奖抽奖抽奖a a2 21.01.00.50.50.50.5C=?C=?50005000元元元元0 0元元元元确定当量法就是调整C值，使得行动a1和a2的效用相当。2023/5/31决策理论与方法-随机决策理论与

32、方法效用函数效用函数效用函数的构造（连续型）效用函数的构造（连续型）uu若后果是连续型，则可通过分析若后果是连续型，则可通过分析若后果是连续型，则可通过分析若后果是连续型，则可通过分析u(c)u(c)的若干特征值，的若干特征值，的若干特征值，的若干特征值，求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。uu例：试作出每天投入学习的时间例：试作出每天投入学习的时间例：试作出每天投入学习的时间例：试作出每天投入学习的时间t t对应的效用曲线。对应的效用曲线。对应的效用曲线。对应的效用曲线。l l分析特征点：分析

33、特征点：分析特征点：分析特征点：u(t=0)=0;u(tTu(t=0)=0;u(tTMM)=0(T)=0(TMM=?)=?)；状态导入期；状态导入期；状态导入期；状态导入期（0 0t t0 0），效用增加较慢；状态稳定期），效用增加较慢；状态稳定期），效用增加较慢；状态稳定期），效用增加较慢；状态稳定期(t(t0 0t t1 1)，效用与，效用与，效用与，效用与投入学习的时间基本成比例关系；效率下降，效用增加投入学习的时间基本成比例关系；效率下降，效用增加投入学习的时间基本成比例关系；效率下降，效用增加投入学习的时间基本成比例关系；效率下降，效用增加期期期期(t(t1 1ttmm)，效用是投入

34、学习的时间的单调增函数，但增长，效用是投入学习的时间的单调增函数，但增长，效用是投入学习的时间的单调增函数，但增长，效用是投入学习的时间的单调增函数，但增长率小于状态稳定期且随着时间的增加越来越小，最终达率小于状态稳定期且随着时间的增加越来越小，最终达率小于状态稳定期且随着时间的增加越来越小，最终达率小于状态稳定期且随着时间的增加越来越小，最终达到零到零到零到零(t=t(t=tmm)，此时效用达到最大；当投入的学习时间大于，此时效用达到最大；当投入的学习时间大于，此时效用达到最大；当投入的学习时间大于，此时效用达到最大；当投入的学习时间大于t tmm时，将会得不偿失，学习效率急剧降低，效用减少

35、。时，将会得不偿失，学习效率急剧降低，效用减少。时，将会得不偿失，学习效率急剧降低，效用减少。时，将会得不偿失，学习效率急剧降低，效用减少。2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造（连续型）效用函数的构造（连续型）t t0 0t t1 1t tmmt tMM0 02424U U(t t)U Umaxmaxt t2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用uu风险风险风险风险：是指生产目的与劳动成果之间的不确定性。：是指生产目的与劳动成果之间的不确定性。：是指生产目的与劳动成果之间的不确定性。：是指生产目的与劳

36、动成果之间的不确定性。l l“风险风险风险风险”：以打鱼捕捞为生的渔民们在长期的捕捞实践中，：以打鱼捕捞为生的渔民们在长期的捕捞实践中，：以打鱼捕捞为生的渔民们在长期的捕捞实践中，：以打鱼捕捞为生的渔民们在长期的捕捞实践中，深深的体会到深深的体会到深深的体会到深深的体会到“风风风风”给他们带来的无法预测无法确定的给他们带来的无法预测无法确定的给他们带来的无法预测无法确定的给他们带来的无法预测无法确定的危险，他们认识到，在出海捕捞打鱼的生活中，危险，他们认识到，在出海捕捞打鱼的生活中，危险，他们认识到，在出海捕捞打鱼的生活中，危险，他们认识到，在出海捕捞打鱼的生活中，“风风风风”即意味着即意味着

37、即意味着即意味着“险险险险”，因此有了，因此有了，因此有了，因此有了“风险风险风险风险”一词的由来。一词的由来。一词的由来。一词的由来。l l风险包含两个方面的内容：一是风险发生的可能性大小，风险包含两个方面的内容：一是风险发生的可能性大小，风险包含两个方面的内容：一是风险发生的可能性大小，风险包含两个方面的内容：一是风险发生的可能性大小，二是风险后果的严重程度。二是风险后果的严重程度。二是风险后果的严重程度。二是风险后果的严重程度。2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用uu风险的度量风险的度量风险的度量风险的度量l l方差：方差：方差：方差：

38、设某决策方案设某决策方案设某决策方案设某决策方案a a的后果为收益的后果为收益的后果为收益的后果为收益y y，y y的概率密度函数的概率密度函数的概率密度函数的概率密度函数为为为为f f(y y)，期望值为，期望值为，期望值为，期望值为E(E(y y)，则方差，则方差，则方差，则方差可用来度量风险，方差越大风险越大。可用来度量风险，方差越大风险越大。可用来度量风险，方差越大风险越大。可用来度量风险，方差越大风险越大。l l协方差：协方差：协方差：协方差：若期望收益为决策人设定的目标收益若期望收益为决策人设定的目标收益若期望收益为决策人设定的目标收益若期望收益为决策人设定的目标收益c c，则可用

39、，则可用，则可用，则可用协方差度量风险。协方差度量风险。协方差度量风险。协方差度量风险。l l临界概率：临界概率：临界概率：临界概率：小于目标收益的概率。小于目标收益的概率。小于目标收益的概率。小于目标收益的概率。2023/5/31决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用uu效用与风险效用与风险效用与风险效用与风险：效用反映的就是决策人对风险的一种：效用反映的就是决策人对风险的一种：效用反映的就是决策人对风险的一种：效用反映的就是决策人对风险的一种态度。态度。态度。态度。U U(t t)U Umaxmax=1=1C C(万元万元)风险厌恶型风险厌恶型风险厌恶型风险

40、厌恶型风险中立型风险中立型风险中立型风险中立型风险追求型风险追求型风险追求型风险追求型0.50.50 09 912.512.514142525风险酬金风险酬金风险酬金风险酬金k k2023/5/31决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1 1、主观概率、主观概率、主观概率、主观概率2 2、效用函数、效用函数、效用函数、效用函数3 3、决策准则、决策准则、决策准则、决策准则4 4、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析、贝叶斯决策分析2023/5/31决策理论与方法-随机决策理论与方法决策准则决策准则决策问题的表示决策问题的表示uu决策树表示法决策树表示法

41、决策树表示法决策树表示法决策点决策点决策点决策点机会点机会点机会点机会点C1C1决策枝决策枝决策枝决策枝机会枝机会枝机会枝机会枝后果点后果点后果点后果点C2C2C3C3C4C4后果值后果值后果值后果值a a1 1a a2 2 (1 1)(2 2)(1 1)(2 2)2023/5/31决策理论与方法-随机决策理论与方法决策准则决策准则决策问题的表示决策问题的表示uu决策表表示法决策表表示法决策表表示法决策表表示法 j j 1 1 2 2 j j n n (j j)(1 1)(2 2)(j j)(n n)a a1 1c c1111c c1212c c1j1jc c1n1na a2 2c c1111

42、c c1212c c1j1jc c1n1na ai ic ci1i1c ci2i2c cij ijc cinina ammc cm1m1c cm2m2c cmjmjc cmnmn状态状态状态状态行动行动行动行动后果后果后果后果(效用值、损失值、价值效用值、损失值、价值效用值、损失值、价值效用值、损失值、价值)概率概率概率概率2023/5/31决策理论与方法-随机决策理论与方法决策准则决策准则决策示例决策示例uu决策者决策时都需要根据某种准则来选择决策方案决策者决策时都需要根据某种准则来选择决策方案决策者决策时都需要根据某种准则来选择决策方案决策者决策时都需要根据某种准则来选择决策方案决策准则。

43、准则不同，决策结果就可能不同。决策准则。准则不同，决策结果就可能不同。决策准则。准则不同，决策结果就可能不同。决策准则。准则不同，决策结果就可能不同。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。j j 1 1 2 2 3 3 (j j)0.20.20.50.50.30.3a a1 17 73 34 4a a2 26.56.54 41 1a a3 36 65 50 0注：后果为损失值注：后果为损失值注：后果为损失值注：后果为损失值2023/5/31决策理论与方法-随机决策理论与方法

44、决策准则决策准则最大可能值准则最大可能值准则uu最大可能值准则最大可能值准则最大可能值准则最大可能值准则：（众数原则）：（众数原则）：（众数原则）：（众数原则）注：后果为损失值注：后果为损失值注：后果为损失值注：后果为损失值此准则在状态出现的概率差距此准则在状态出现的概率差距此准则在状态出现的概率差距此准则在状态出现的概率差距不大时的决策效果可能很差！不大时的决策效果可能很差！不大时的决策效果可能很差！不大时的决策效果可能很差！j j 1 1 2 2 3 3 (j j)0.20.20.50.50.30.3a a1 17 73 34 4a a2 26.56.54 41 1a a3 36 65 5

45、0 02023/5/31决策理论与方法-随机决策理论与方法决策准则决策准则贝叶斯准则贝叶斯准则uu贝叶斯准则贝叶斯准则贝叶斯准则贝叶斯准则：期望效用最大或期望损失最小。：期望效用最大或期望损失最小。：期望效用最大或期望损失最小。：期望效用最大或期望损失最小。l l在实际决策中，一般先确定后果对决策人的实际价值即效在实际决策中，一般先确定后果对决策人的实际价值即效在实际决策中，一般先确定后果对决策人的实际价值即效在实际决策中，一般先确定后果对决策人的实际价值即效用函数（若是损失则使用用函数（若是损失则使用用函数（若是损失则使用用函数（若是损失则使用负效用负效用负效用负效用）（称为）（称为）（称为

46、）（称为伯努利过程伯努利过程伯努利过程伯努利过程），），），），然后再应用贝叶斯准则。然后再应用贝叶斯准则。然后再应用贝叶斯准则。然后再应用贝叶斯准则。j j 1 1 2 2 3 3 (j j)0.20.20.50.50.30.3a a1 17 73 34 4a a2 26.56.54 41 1a a3 36 65 50 0注：后果为损失值注：后果为损失值注：后果为损失值注：后果为损失值 j j 1 1 2 2 3 3E(E(a ai i)=j j (j j)c)cij ij (j j)0.20.20.50.50.30.3a a1 17 73 34 44.14.1a a2 26.56.54 4

47、1 13.63.6a a3 36 65 50 03.73.72023/5/31决策理论与方法-随机决策理论与方法决策准则决策准则E-V准则准则uuE-VE-V准则准则准则准则：用期望与方差（风险）共同判决一个方案的优劣。：用期望与方差（风险）共同判决一个方案的优劣。：用期望与方差（风险）共同判决一个方案的优劣。：用期望与方差（风险）共同判决一个方案的优劣。l l帕累托优帕累托优帕累托优帕累托优：若不存在方案：若不存在方案：若不存在方案：若不存在方案a al l，使得方案，使得方案，使得方案，使得方案a ak k的期望与风险均的期望与风险均的期望与风险均的期望与风险均劣于劣于劣于劣于a al l

48、，称，称，称，称a ak k为有效方案或帕累托优。所有有效方案的集为有效方案或帕累托优。所有有效方案的集为有效方案或帕累托优。所有有效方案的集为有效方案或帕累托优。所有有效方案的集合构成有效前沿面。示例中合构成有效前沿面。示例中合构成有效前沿面。示例中合构成有效前沿面。示例中a a1 1和和和和a a2 2均是有效方案。均是有效方案。均是有效方案。均是有效方案。l l评价函数评价函数评价函数评价函数：f fi i(E,V)=E(E,V)=E(a ai i)+)+i i2 2。反映了决策人的风险态反映了决策人的风险态反映了决策人的风险态反映了决策人的风险态度，度，度，度，00风险厌恶；风险厌恶；

49、风险厌恶；风险厌恶；=0=0风险中立（对应于贝叶斯准则）；风险中立（对应于贝叶斯准则）；风险中立（对应于贝叶斯准则）；风险中立（对应于贝叶斯准则）；00.6)0.6时，方案时，方案时，方案时，方案a a1 1最优；当最优；当最优；当最优；当 (1 1)0.6)0)0，(k kl l)=0()=0(k k l l)；j j(j j)=S)=S。称。称。称。称j j是样本空间的一个划分。则对任一事件是样本空间的一个划分。则对任一事件是样本空间的一个划分。则对任一事件是样本空间的一个划分。则对任一事件A A【发烧超过发烧超过发烧超过发烧超过3838度度度度】，有：，有：，有：，有：2023/5/31

50、决策理论与方法-随机决策理论与方法贝叶斯决策分析贝叶斯决策分析贝叶斯定理贝叶斯定理uu贝叶斯定理贝叶斯定理贝叶斯定理贝叶斯定理：已知：已知：已知：已知 (A|(A|j j)、(j j)或者或者或者或者 (A,(A,j j)()(先验概率先验概率先验概率先验概率)(j j=1,=1,n n)，求当事件，求当事件，求当事件，求当事件A A【发烧超过发烧超过发烧超过发烧超过3838度度度度】发生发生发生发生(随机试验的结随机试验的结随机试验的结随机试验的结果或观察值果或观察值果或观察值果或观察值)时时时时k k 【患甲流患甲流患甲流患甲流】发生的概率发生的概率发生的概率发生的概率(后验概率后验概率后

展开阅读全文