学生评教博弈模型及其均衡再研究.pdf

上传人:qwe****56 文档编号:69625516 上传时间:2023-01-07 格式:PDF 页数:13 大小:161.73KB
返回 下载 相关 举报
学生评教博弈模型及其均衡再研究.pdf_第1页
第1页 / 共13页
学生评教博弈模型及其均衡再研究.pdf_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《学生评教博弈模型及其均衡再研究.pdf》由会员分享,可在线阅读,更多相关《学生评教博弈模型及其均衡再研究.pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、学生评教博弈模型及其均衡再研究学生评教博弈模型及其均衡再研究 (西南财经大学金融学院 张靖 张淑怡 611130)内容摘要:内容摘要:针对目前许多高校采用的学生评教制度,本文运用博弈论相关知识分析学生评教过程中教师与学生的行为选择,构建了一种新的学生评教模型老师与学生间的不完全信息动态博弈模型及学生间的完全信息静态博弈模型,并通过对模型均衡结果的分析,对学生评教的有效性问题进行了探讨,提出了改进意见。关键词关键词:学生评教;不完全信息动态博弈;精炼贝叶斯均衡 一、绪论 近些年来,学生评教作为高等教育制度改革的一大举措,在各大高校中普遍盛行。作为一件“舶来品”,学生评教的初衷是为了改进教师教学方

2、式,提高学生学习兴趣。但这一举措被引进我国后,不少高校把学生评价结果用于决定教师的职称、考核、工资等。尽管学生在评教过程中掌握着较高的话语权,但由于教师在很大程度上决定着学生的学期成绩,进而影响到学生奖学金的评比,学生在评教中的这种话语权又受到一定的制约。现实中,对教学水平和方式能得到学生认可的老师,学生在评教时没有动机给老师做出低的评价,而只有当老师教学水平和方式一般或较差,学生认可度不高时,利益冲突就会体现出来。在这种情况下,学生评教能否如实反映教师的教学效果,学生评价的实际意义又将何在,成为我们思考的方向。很显然,在学生评教中存在着不同的利益主体,即教师和学生利益集合,教师掌控着学生的学

3、期成绩,学生决定着对教师的评价。这为我们采用博弈模型进行评教分析提供了条件。在以往有关学生评教博弈的分析中,博弈的参与人往往仅有两个,教师和学生。但在本文中除了会讨论教师和学生集合间的博弈外,我们还将引进学生集合内部的博弈。因为在学生集合内部,明显存在着两种类型的学生,一种学生相对比较勤奋,他们倾向于通过自己的努力获得有用的知识和奖学金,而另一类学生倾向于以较少的付出获取高的分数,甚至得到奖学金。我们将前者定义为勤奋的学生(1s),后者定义为懒惰的学生(2s)。不同类型的学生在给教师进行评价时,会考虑教师的学期评分对奖学金评比的影响,而教 师是根据学生的考试成绩和日常表现客观给出学生学期成绩,

4、还是根据学生的评教结果高低相应给学生打分,我们用教师的“职业道德”高或低这一概念来区分。显然,两种不同类型的学生会从自身角度出发,各有侧重地考虑自己的选择以及对方的选择对最后结果的影响。所以在本文的分析中,除了将教师与学生集合看成是博弈的两个参与人外,在学生集合内部也会分析两类参与人的博弈。通常情况下,教师与学生集合的博弈是一个动态过程,决策主体之间的行动具有先后顺序。当先行动的参与人开始行动时,后行动的参与人将根据前者的选择而调整自己的行动和战略,而先行动者自然会理性地期望到这一点,不得不考虑自己的决策会对后行动者的影响。在以往的评教博弈分析中,作者多是采用动态博弈分析,这一点不置可否。但作

5、者往往是假定信息完全,即认为每一个参与人对所有其他参与人(对手)的特征、战略空间以及支 作者:张靖,05 级金融学院金融学 2 班;张淑怡,05 级金融学院金融学 4 班 付函数有准确的知识。也就是说,所有决策的行为是双方“共有知识”,学生知道教师在什么时候选择什么行动,教师也知道学生在何时选择何种行动,每个人都知道每个人知道。实际上,在教师集合与学生集合的博弈中,信息是不对称的,后行动者能观测到先行动者的行动,但不能观测到先行动者的类型。具体地说,在本文中,假定教师先行动,学生知道教师的战略空间是打高分或打低分,但学生无法知道教师真实的类型教师的“职业道德”高低,这是因为教师同时也知道自己的

6、行动会被学生利用,会设法传递对自己有利的信息。所以,我们将从不完全信息动态博弈的角度来分析两者间的博弈。二、学生与教师评教的不完全动态博弈分析(一)若干假设(一)若干假设 1 在评教博弈中,有一个教师和两种不同类型的学生三个决策主体,用 I=(1,2,3)表示参与者的集合,1 代表教师,2 代表勤奋学生1s,3 代表懒惰学生2s。教师与学生集合间是不完全信息动态博弈,学生集合中1s和2s是在进行完全信息静态博弈。2在现实中,一个教师在性质判定上不外乎有两种:“职业道德”高的教师1和“职业道德”低的教师2。那么,定义参与者 1 的类型空间()1,2 =,这是参与者1 的私人信息,其中,12,三个

7、参与者都知道取值的情况,而参与者2和3 仅 仅 知 道 其 概 率 分 布,即 先 验 概 率 为:1Pp=,21Pp=3()12,Mm m=表示参与者 1 的行动空间,M是老师平时的语言、行为等。当1Mm=时,表示教师向学生传递的信号为1,当2Mm=时,表示教师向学生传递的信号为2。特别地,当1=时,必有1Mm=,因为“职业道德”较高教师决不会向学生传递自己是低素质教师的信号,其行动必然符合自身效用的最大化。4 学生观察到教师的行动m,接受相应的信号之后,选择是给予教师高评价还是低评价。因此定义参与者 2,3 的行动空间(),NH L=,nH=表示学生对教师做出的是高评价,nL=表示学生对教

8、师做出的是低评价。同时,学生从自身利益出发,需要收集有关教师的信息,了解教师的特征,所以就存在一定的成本,分别表示为2C,()323C CC 5 作为教师,在教学过程中,都需要花费时间精力来备课,准备教学用的课件,补充课外的资料等等,我们将其规定为教学成本B。相对来说,“职业道德”较高的教师付出的成本1B小于“职业道德”较低的教师付出的成本212()B BB,即:当超额成本X大于教学成本之差21BB时,教师会向学生真实的反映自己的类型。参与者 2,3 相应的信息推断(后验概率)为()1122/(/)1PmPm=()1221/(/)0PmPm=参与者 2,3 的策略行为是选择()N mN,最大化

9、其期望效用函数:,(,)(/)nMAXUm n n Pm 其中,是教师的类型,m是教师的行动,第一个n是1s的行动,第二个n是2s的行动。当1Mm=时:对1s:211,(,)(/)nMAXUm n n Pm()()()()2111122121,/,/Um n n PmMAXUm n n Pm=+211(,)MAXUm n n=()()()()211211211211,Um H HUm H LMAXUm L HUm L L=22222,MAX KCR KCR KC KCKC=所以,1s最大化自己的期望效用会选择 L,并期望2s选择 H 或者 L。同理,对2s可以得到3113,(,)(/)nMAX

10、Um n n PmC=2s会选择 H 或者L。即是说,当教师教学水平和方式较低、而职业道德较高时,2s给教师做高评价或低评价其效用水平均不发生变化。结合以上两点,1Mm=时,2s会选择 H 或者 L,而1s只会选择 L。学生内部博弈的均衡结果为L,H、L,L,当2Mm=时:对1s:222,(,)(/)nMAXUm n n Pm()()()()2121222222,/,/Um n n PmMAXUm n n Pm=+222(,)MAXUm n n=()()()()222222222222,Um H HUm H LMAXUm L HUm L L=22222/2,MAX KC KC KCRCRKC=

11、所以,1s最大化自己的期望效用会选择 H,并期望2s选择 L 同理,对2s可以得到3223,(,)(/)/2nMAXUm n n PmKC=,即是说,2s最大化自己的期望效用会选择 H,并期望1s选择 H。结合以上两点,当2Mm=时,2s有占优均衡 H,1s会选择 H,学生内部博弈的均衡结果为H,H。对学生内部博弈我们总结如下:教师类型1 教师类型2 教师行动1m 教师行动2m 学生行动组合L,H,L,L 学生行动组合H,H 对于参与者 2,3 的行动,参与者 1 的策略行为是选择mM,使得自己的期望效用最大化,验证教师是否会如实反映自己的类型 对于=1,11(,)MAXUm n n()()(

12、)111111112,MAX Um L HUm L L Um n n=1121,MAXBWBBB=即教师的行动为11()Mm=对于=2,12(,)MAXUm n n()()121122,MAX Um H HUm H H=12,MAX WBX WB=利用条件21XBB,得到122(,)MAXUm n nWB=即教师的行动为22()Mm=结合上面对于1和2的分析,参与者 1 的最佳反应是如实的反映自己的信息,就是说,当剩余成本X大于教学成本之差21BB时,参与者 1 的子博弈精炼贝叶斯均衡为:1m =1()M=2m =2 第二部分 当21XBB时,参与者 1 会采取混同战略1()Mm=,参与者 2

13、,3 相应的信息推断(后验概率)为:()22/1Pm=()12/0Pm=()11/Pmp=()21/1Pmp=参与者 2,3 的策略行为是选择()N mN,最大化其期望效用函数:,(,)(/)nMAXUm n n Pm 当1Mm=时 对1s:211,(,)(/)nMAXUm n n Pm()()()()2111122121,/,/Um n n PmMAXUm n n Pm=+211221211221211221211221(,)(1)(,);(,)(1)(,);(,)(1)(,);(,)(1)(,)pUm H Hp Um H HpUm H Hp Um H HMAXpUm H Hp Um H H

14、pUm H Hp Um H H+=+22222222()(1)(/2);()(1)();()(1)();()(1)()p KCRp KCp KCRp KCMAXp KCp KCRp KCpCR+=+(1)当 p1/2 时,这时,1s最大化自己的期望效用会选择 H,并期望2s选择 L;(2)当 p1/2 时,这时,1s最大化自己的期望效用会选择 L,并期望2s选择 H;对2s:311,(,)(/)nMAXUm n n Pm()()()()3111132121,/,/Um n n PmMAXUm n n Pm=+311321311321311321311321(,)(1)(,);(,)(1)(,)

15、;(,)(1)(,);(,)(1)(,)pUm H Hp Um H HpUm H Hp Um H HMAXpUm H Hp Um H HpUm H Hp Um H H+=+33333333()(1)(/2);()(1)();()(1)();()(1)()pCp KCpCpCMAXpCpCpCpC+=+的期望效用是最大的,所以,2s最大化自己的期望效用会选择 H,并期望1s选择 H。结合上面的分析,当1Mm=时,H 是2s的占优均衡,但在考虑到 p1/2(此时,2s的选择 H 与1s期望的不一致)时,1s会理性地预期到,再次最大化自己的效用:2222()(1)(/2);()(1)()p KCRp

16、 KCMAXp KCp KCR+由条件 p1/2 和 RK/2,可知,即1s会选择 L。当 p1/2 时,2s的选择 H 是与1s期望一致的,因此1s选择 L。所以,学生内部的均衡行动组合:教师类型 概率 1s 2s p1/2 L H 11m p1/2 L H p1/2 L H 21m p1/2 L H 当2Mm=时:对1s:222,(,)(/)nMAXUm n n Pm()()()()2121222222,/,/Um n n PmMAXUm n n Pm=+222(,)MAXUm n n=()()()()222222222222,Um H HUm H LMAXUm L HUm L L=222

17、22/2,MAX KC KC KCRCRKC=所以,1s最大化自己的期望效用会选择 H,并期望2s选择 L。同理,对1s可以得到3223,(,)(/)/2nMAXUm n n PmKC=,即是说,2s最大化自己的期望效用会选择 H,并期望1s选择 H。结合上面对1s的分析,在2Mm=时,H是2s的占优均衡,但此时,2s的选择 H 与1s期望的不一致,1s会理性地预期到,再次最大化自己的效用:()()222222,MAX Um H HUm L H 22/2,MAX KC KCR=由条件 RK/2,可知2/2KC小于2KCR,即1s会选择 L。所以学生内部的均衡行动组合:教师类型 1s 2s 22

18、m L H 我们看到参与者 2,3 对于混同策略的最佳反应各有不同。那么,对于学生的这些行动组合和不同条件,教师的策略行为是选择mM,使得自己的期望效用最大化。对于=1:(1)P1/2 时,11(,)MAXUm n n()()111112,MAX Um L HUm n n=121,MAXBBB=教师的行动为11()Mm=(2)P1/2 时,11(,)MAXUm n n()()111112,MAX Um L HUm n n=121,MAXBBB=教师的行动为11()Mm=对于=2:(1)P1/2 时,12(,)MAXUm n n()()121122,MAX Um L HUm L H=12,MAX

19、BXB=利用条件21XBB,得到121(,)MAXUm n nBX=教师的行动为21()Mm=(2)P1/2 时,12(,)MAXUm n n()()121122,MAX Um L HUm L H=12,MAXBXB=利用条件21XBB,得到121(,)MAXUm n nBX=教师的行动为21()Mm=结 合 对=1和=2的 讨 论,我 们 看 到 教 师 最 佳 反 应 的 混 同 策 略 是1()Mm=,这样,当超额成本X小于等于教学成本之差21BB时,无论教师实际职业道德的高低,教师都会偏向于向学生传递信号1m。如下表:教师 1s 2s 11()Mm=L H 21()Mm=L H 在第一

20、部分和第二部分中的,(),(),(/)Mm Pm 是整个博弈模型的子博弈精炼贝叶斯均衡。分析结果总结如下:(1)分离均衡:教师 1s 2s 11()Mm=L H,L 21()Mm=H H(2)混同均衡:教师 1s 2s 11()Mm=L H 21()Mm=L H 三学生评教制度的有效性分析 三学生评教制度的有效性分析 通过前面的分析我们可以看到,在学生给教学水平较低、方式不恰当的教师进行评教中,学生集合内部进行完全信息静态博弈,教师和学生集合进行不完全信息动态博弈,但模型最终得到的结果并不令人满意。这里需要先说明一下超额成本的问题。根据原先的假设,超额成本是指“职业道德”较低的教师在向学生传递

21、自己是“职业道德”较高的教师的信号时需付出的成本。但实际上,从博弈的最终结果可以看到,当职业道德较低的老师如实向学生传达自己的类型时,他/她得到的评价反而对自己是最有利的。那么职业道德较低的老师为什么会愿意付出这个超额成本呢?这是因为每一个生活在现实社会中的理性人除了要追求物质财富,在精神层面同样期望得到社会、他人对自己高的评价或认可,而当这种精神面的追求与物质追求相冲突时,理性人必然会面临一个选择,采取一些伪装行为来掩饰自己。通俗点说,就是理性人“言不由衷”需要付出的代价。具体在本文中,一个“职业道德”较低的教师,尽管他是根据学生的评教结果来给学生打分,但他绝对不会明确告诉学生自己的职业道德

22、是如此之低。1、我们看到在分离均衡中,当超额成本过高,两种类型的教师都如实向学生反映自己的类型时,学生给老师的评价会使得学生评教工作变得无效:教学水平和方式较差、“职业道德”又很低的教师反而会得到学生的高评价,而“职业道德”较高的教师得到的学生评价反而较低。这对那些教学水平和职业道德都很高的教师显得尤为不公平,学生评教不能发挥其反映出教师教学效果的作用。所幸的是,由于高超额成本的存在,这种可能性在现实中发生的概率极小。2、现实中往往存在超额成本较低的情况,即“职业道德”较低的教师必然会发出“职业道德”高的信息。此时,教师对学生学期成绩打分的因素完全不会影响学生对老师的评教,勤奋学生认为老师“职

23、业道德”高就会如实给教师低评价,反之就给高评价;而懒惰学生始终会给教师高评价。尽管此时教师期末打分对学生评教的影响十分弱化,但学生做出高评价和低评价,很大程度依赖于对教师“职业道德”的判断,而遗憾的是这种判断的结果造成了高“职业道德”教师得到的评价与低“职业道德”教师的评价无差异。加之学生在对教师的“职业道德”判断是本身存在一些主观性,所以混同均衡的结果也显示出学生评教的失效。那么是什么原因导致学生评教的无效呢?统观整个模型,我们发现,由于“学生评教的结果直接关系着教师的职称、考核、工资等切身利益”这一共有信息导致学生在评教过程中举棋不定、相互揣测,以致最终评教的失效。实际中,尽管许多学校已经

24、意识到学生评教与教师打分之间的矛盾冲突,而将学生评教的结果在教师给学生打出学期成绩后再反馈给教师。但是,学生评教结果对老师的决定性作用总会给学生一种“幻觉”给教师评价的高低多少会对自己的学期成绩产生影响。学生与学生之间、学生与教师之间不得不展开一番博弈的较量。除此以外,我们还应看到,在学生评教失效的情况出现后,这为部分教师,特别是教学水平和方式较差的教师提供了一个放松对学生的要求(如默许学生旷课、迟到、不交作业等),给学生打高分来获得部分学生高评价的机会,而这又势必会加重导致学生评教结果的无效性。过分强调学生评教结果对教师职称、考核、工资的影响,强化学生与教师之间的利益关联性会导致学生评教的失效,这些都是与学生评教的初衷时相违背的。因此弱化在学生评教过程中学生与教师之间利益的关联性,对教师教学采取新的激励机制、加强对学生评教的宣传、引导显得尤为重要。参考文献 参考文献 1.张维迎.博弈论与信息经济学M.上海:上海人民出版社,2004.2.于维生,于惠春.出口退税问题的不完全信息动态博弈分析J.统计研究 STATISTICAL RESERCH,2001年第2期 3.刘芸.学生测评教学质量过程中的博弈分析J.厦门理工学院学报,2007,6.4.罗杰B迈尔森.博弈论-矛盾冲突分析M.北京:中国经济出版社,2001.(责任编辑:张燕江)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁