《第三节离散确定性动态规划模型的求解精选文档.ppt》由会员分享,可在线阅读,更多相关《第三节离散确定性动态规划模型的求解精选文档.ppt(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三节离散确定性动态规划模型第三节离散确定性动态规划模型的求解的求解1本讲稿第一页,共十页例例4:本讲稿第二页,共十页解:解:(表格法)把12支巡逻队往4个部位派遣看作依次分四个阶段(用k表示,k=1,2,3,4)。(1)状态变量sk表示每个阶段初拥有的可派遣的巡逻队数,是前面阶段决策结果,是本阶段决策依据。(2)各阶段的决策变量就是对各部位派出的巡逻队数,用xk表示。本讲稿第三页,共十页其中其中pk(xk)表示表示k阶段派出巡逻队数为阶段派出巡逻队数为xk时,该阶段部位时,该阶段部位预期损失值。预期损失值。(3)各阶段允许决策集合为:各阶段允许决策集合为:(4)状态转移律为状态转移律为:(5
2、)指标函数为指标函数为:本讲稿第四页,共十页(6)用用fk(sk)表示表示k阶段状态为阶段状态为sk,以此出发采用最优子策略,以此出发采用最优子策略到过程结束时预期损失值到过程结束时预期损失值 (7)边界条件为边界条件为 f5(s5)=0。本讲稿第五页,共十页表8-2采用逆序法,先考虑给D部位派巡逻队即k=4 x4s4p4(x4)f4(s4)x4*234234563434343434-31313131252525343125252523444本讲稿第六页,共十页联合考虑C、D两部位派巡逻队 x3s3p3(x3)+f4(s3-x3)f3(s3)x3*2344567824+3424+3124+25
3、24+2524+2522+3422+3122+2522+2521+3421+3121+25585549474622234表 8-3本讲稿第七页,共十页联合考虑B、C、D三部位派巡逻队8 x2s2p2(x2)+f3(s2-x2)f2(s2)x2*234891038+4938+4738+4635+5535+4935+4731+5831+5531+49878480234表8-4本讲稿第八页,共十页联合考虑A、B、C、D四部位派巡逻队,即k=1 x1s1p1(x1)+f2(s1-x1)f1(s1)x1*2341218+8014+8410+87974表8-5本讲稿第九页,共十页x1*=4,x2*=2,x3*=2,x4*=4。因此该警卫 部门派巡逻队数最优策略为:A部门4支,B部门2支,C部门2支,D部门4支,总预期损失为97单位。本讲稿第十页,共十页