博弈论教学课件第六讲 混合策略和监督博弈.pptx

上传人:蓝**** 文档编号:91010084 上传时间:2023-05-21 格式:PPTX 页数:33 大小:1.29MB
返回 下载 相关 举报
博弈论教学课件第六讲 混合策略和监督博弈.pptx_第1页
第1页 / 共33页
博弈论教学课件第六讲 混合策略和监督博弈.pptx_第2页
第2页 / 共33页
点击查看更多>>
资源描述

《博弈论教学课件第六讲 混合策略和监督博弈.pptx》由会员分享,可在线阅读,更多相关《博弈论教学课件第六讲 混合策略和监督博弈.pptx(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第六讲混合策略与监督博弈第十三章混合策略第十四章监督博弈第十三章混合策略第一节概念及说明纯策略和混合策略纯策略:如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动。混合策略:如果一个策略要求参与者在给定信息情况下以某种概率分布随机地选择不同的行动。混合策略在n个参与人博弈的战略式表述个参与人博弈的战略式表述G=S1,,Sn;u1,un 中,假定参与人中,假定参与人i 有K个纯战略:SI=si1,,siK,那么,概率分布,那么,概率分布i=(i1,iK)称称为为i的一个混合策略,这这里里iK=(sik)是是i选择sik的概率,对于所有的有的k=1,K,0iK1,iK=1.随机药物检

2、测运动员服药未服药IOC 抽检1,-1-1,1 未抽检-1,1 1,-1 点球射门攻方的策略是:攻左边,或攻右边守方的策略是:守左边,或守右边(以守方的方向为准)守左边右边攻左边-1,1 1,-1 右边1,-1-1,1 石头、剪子、布浙江大学发研究报告:石头剪刀布百战百胜策略浙江大学、浙江工商大学和中科院理论物理研究所的研究人员通过实验发现了石头剪刀布的一个制胜策略。研究人员招募了360名学生,将他们分成六组,随机配对玩300轮石头剪刀布游戏,在每一轮中获胜的学生将会获得少量人民币奖励。通过观察学生使用的策略,他们发现了获胜者或失利者习惯使用的游戏策略。简单说,如果你的剪刀输给了对手的石头,那

3、么下一轮你更有可能出能战胜石头的布;而如果你是获胜者,那么下一轮你更有可能沿用相同的出手。赢家保持现状输家做出改变的策略(胜留败走)。石头剪刀布的制胜策略:如果你是输家,下一轮换用能打败对手的出手;如果你是赢家,下一轮不要再使用原来的出手。也就是说,你用石头打败了对手的剪刀,那么下一轮你不能再出石头,而应该出剪刀,因为对方很有可能会出布。哈哈,刚偷学了,和老婆猜了五次都赢了浪费纳税人的钱、简直比日本人都可恶真他妈一群脑残,这东西能破解的了吗大学就干这些?科学家真他妈辛苦啊,这个难度的问题几天就观察出来了!科学家不应研究3岁小孩都能知道的“石头剪子布”哪招能赢这样高端的问题,应该去研究他们自己脑

4、子里为什么会进水这样简单的问题。真是拿着纳税人的钱开玩笑,吃饱了撑的!课课堂堂测试测试假假设设我和你一起玩我和你一起玩“石石头头、剪子、布、剪子、布”的游的游戏戏,如果我告如果我告诉诉你你说说,我准,我准备备出出“石石头头”,请问请问:你会出什么?(赌注为10元)请问:事先的告知会影响你的选择吗?特别提示:小得失相信人,大得失怀疑人!石石头头剪子布(高剪子布(高级级版)版)石头剪子布石头0,0 1,-1-5,5 剪子-1,1 0,0 2,-2 布5,-5-2,2 0,0 出石头和出布的学生,哪个多?仁慈的教授张三平时勤快平时偷懒教授放过,2 -1,3 不放过,1 0,0 3-1第二节扩展分析一

5、、智猪博弈中的混合策略在前述的智猪博弈中,当A1时,任一方去按的净收益都大于0,在确知对方去按的条件下,一方将选择等待。在确知对方等待的条件下,一方的选择是去按。因此两种明显存在的均衡结局为(9,1-A)和(6-A,4),其整体的净收益都为10-A。然而,究竟哪种组合会在实际中出现呢?二、懦夫(斗鸡)博弈中的混合策略懦夫(斗鸡)博弈鹰鸽博弈参与人A 当AC时,老鹰策略的概率*=A/C。各自的期望收益是=A(1-A/C)双方总期望收益是=2A(1-A/C)参与人B 老鹰鸽子老鹰 A-C,A-C2A,0鸽子0,2A A,A 特别提示:利益冲突需要协调,协调成本过高,不如不协调。特别提示:能够降低协

6、调成本的制度(技术),是一种更好的制度(技术)。第十四章监督博弈第一节雇主与雇员的监督博弈V是雇员的贡献,即雇员为雇主创造的价值。W是雇员的工资,除了员工偷懒被雇主查到的情况,雇主是要给雇员发工资的。H是雇员的付出,当雇员不偷懒时,雇员的收益将损失H,即努力工作的成本。C是检查的成本,当雇主选择检查的时候,雇主的收益将减少C。F是雇主发现雇员偷懒时的惩罚即没收雇员所交的抵押金。3个问题:1、求解混合策略纳什均衡。2、求解雇主支付W为多少时,其期望收益最大?3、如何理解雇员所交的抵押金?一、混合策略纳什均衡微分法(P152-153)1、根据所设的策略集(各个策略选择的概率)求出雇主与雇员的期望收

7、益。2、将雇主的期望收益对、将雇主的期望收益对求导,结果为求导,结果为0,解出出。再将雇。再将雇员员的期望收益的期望收益对对求求导导,结结果果为0,解出,解出。运用均衡的理念(P154)当达到纳什均衡的时候,任何一方都不愿意改变自己的策略。即对于雇主来说:不检查当T检查T不检查的时候达到均衡。同理,对于雇员来说:T不偷懒TT偷懒不偷懒(CF)(VWC1检查(F)(W)(1TT(W)(VW1偷懒(WH)(WH)1混合策略均衡解:当雇员以H/(W+F)的概率偷懒,雇主以C/(W+F)的概率检查,达到均衡状态。若干推论H越大,雇主越容易检查。C越大,雇员越容易偷懒。W越大,雇员越少偷懒,雇主越少检查

8、。F越大,雇员越少偷懒,雇主越少检查。雇主检查的概率H/(W+F),雇员偷懒的概率C/(W+F)T3 个问题:2、求解雇主支付W为多少时,其期望收益最大?雇主的期望收益=-W+(V-W)(1-)=V-W-V=V-W-V(1-C/(W+F(W)(VW)(1(CF)(VWC)(1不检查检查T)当雇主支付的工资额为CV F时,雇主的期望收益最大。此时,雇主的期望收益是:T=V-2 +F 雇员的期望收益:双方总的期望收益是:T总=V-H-CV/(W+F)当W=时,双方总的期望收益是T总=V-H-CVWHCVT不偷懒:若干推论雇主的期望收益会随着F的增加而上升。雇员的期望收益会随着F的增加而减少。总的期望收益和支付的工资W和抵押金F的大小无关,只和雇员的贡献V、雇员的劳动力机会成本H和监督成本有关。T总=V-H-CV二、抵押金 V代表雇员创造的价值,t代表雇员为公司服务的时间,W代表薪水。课堂讨论:A企业起薪高,涨薪慢;B企业起薪低,涨薪快。你会选哪一个?特别提示:选一些难学的专业,成功的路并没有你想象的那么拥挤!谢谢T H A N K Y O U

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理手册

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁