《第三节离散确定性动态规划模型的求解PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第三节离散确定性动态规划模型的求解PPT讲稿.ppt(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三节离散确定性动态规划模型第三节离散确定性动态规划模型的求解的求解1第1页,共10页,编辑于2022年,星期二例例4:第2页,共10页,编辑于2022年,星期二解:解:(表格法)把12支巡逻队往4个部位派遣看作依次分四个阶段(用k表示,k=1,2,3,4)。(1)状态变量sk表示每个阶段初拥有的可派遣的巡逻队数,是前面阶段决策结果,是本阶段决策依据。(2)各阶段的决策变量就是对各部位派出的巡逻队数,用xk表示。第3页,共10页,编辑于2022年,星期二其中其中pk(xk)表示表示k阶段派出巡逻队数为阶段派出巡逻队数为xk时,该阶段部位时,该阶段部位预期损失值。预期损失值。(3)各阶段允许决策
2、集合为:各阶段允许决策集合为:(4)状态转移律为状态转移律为:(5)指标函数为指标函数为:第4页,共10页,编辑于2022年,星期二(6)用用fk(sk)表示表示k阶段状态为阶段状态为sk,以此出发采用最优子策,以此出发采用最优子策略到过程结束时预期损失值略到过程结束时预期损失值 (7)边界条件为边界条件为 f5(s5)=0。第5页,共10页,编辑于2022年,星期二表8-2采用逆序法,先考虑给D部位派巡逻队即k=4 x4s4p4(x4)f4(s4)x4*234234563434343434-31313131252525343125252523444第6页,共10页,编辑于2022年,星期二联
3、合考虑C、D两部位派巡逻队 x3s3p3(x3)+f4(s3-x3)f3(s3)x3*2344567824+3424+3124+2524+2524+2522+3422+3122+2522+2521+3421+3121+25585549474622234表 8-3第7页,共10页,编辑于2022年,星期二联合考虑B、C、D三部位派巡逻队8 x2s2p2(x2)+f3(s2-x2)f2(s2)x2*234891038+4938+4738+4635+5535+4935+4731+5831+5531+49878480234表8-4第8页,共10页,编辑于2022年,星期二联合考虑A、B、C、D四部位派巡逻队,即k=1 x1s1p1(x1)+f2(s1-x1)f1(s1)x1*2341218+8014+8410+87974表8-5第9页,共10页,编辑于2022年,星期二x1*=4,x2*=2,x3*=2,x4*=4。因此该警卫 部门派巡逻队数最优策略为:A部门4支,B部门2支,C部门2支,D部门4支,总预期损失为97单位。第10页,共10页,编辑于2022年,星期二