第八章动态规划原理与最优控制精选文档.ppt-淘文阁

资源描述

《第八章动态规划原理与最优控制精选文档.ppt》由会员分享，可在线阅读，更多相关《第八章动态规划原理与最优控制精选文档.ppt（52页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第八章动态规划原理与最优控制1本讲稿第一页，共五十二页动态规划动态规划求解最优控制问题的有效方法之一求解最优控制问题的有效方法之一二十世纪五十年代由二十世纪五十年代由 Bellman Bellman 提出提出动态规划与极小值原理在数学上是等效的动态规划与极小值原理在数学上是等效的从不同的角度发展了古典变分学从不同的角度发展了古典变分学本讲稿第二页，共五十二页最优性原理多级决策过程的最优策略具有这种性质。不论初始状态和初始决策为何，其余的决策对于由初始决策所形成的状态来说，必定也是一个最优策略。本讲稿第三页，共五十二页主要内容主要内容n离散动态规划离散动态规划 n离散动态规划在离散系统最优控制

2、中的应用离散动态规划在离散系统最优控制中的应用 n连续动态规划在连续系统最优控制中的应用连续动态规划在连续系统最优控制中的应用本讲稿第四页，共五十二页7.1 7.1 离散动态规划离散动态规划n最优性原理最优性原理动态规划的基础动态规划的基础n若一个若一个 N N 级决策系统是最优的级决策系统是最优的,则以第则以第 k k 级（级（）决策所形成的状态作为初态的任何一个）决策所形成的状态作为初态的任何一个 N-K N-K 级子决级子决策也必然是最优的。策也必然是最优的。本讲稿第五页，共五十二页n根据最优性原理根据最优性原理n确定了一个从后向前的递推过程确定了一个从后向前的递推过程n基于最优性原理

3、的动态规划方法基于最优性原理的动态规划方法成为成为解决最优控制问题的有力工具解决最优控制问题的有力工具本讲稿第六页，共五十二页动态规划原理求从S F 点路程最短的方法本讲稿第七页，共五十二页枚举法S X1(1)X1(2)X1(3)F 4+6+1+4=15S X1(1)X2(2)X1(3)F 4+6+2+4=16S X1(1)X2(2)X2(3)F 4+6+2+3=15S X1(1)X1(2)X2(3)F 4+6+1+3=14S X2(1)X1(2)X1(3)F 5+4+1+4=14S X2(1)X1(2)X2(3)F 5+4+1+3=13S X2(1)X2(2)X1(3)F 5+7+2+4=1

4、8S X2(1)X2(2)X2(3)F 5+7+2+3=17本讲稿第八页，共五十二页可能解数量为 2(n-1)n=4,为 23=8 种.加法次数为：(n-1)*2(n-1)n=4,为 (4-1)*23 =24 次.若n=10,则可能解数为：2(10-1)=29 =512 种.加法(10-1)*29=9*29=9*512=4608 次.本讲稿第九页，共五十二页动态规划法从最后一级开始：J X1(3)=4 J X2(3)=3,J*X1(3)=4,J*X2(3)=3倒数第二级：路线 X1(2)X1(3)F J=1+J*X1(3)=5 X1(2)X2(3)F J*=1+J*X2(3)=4 X2(2)

5、X1(3)F J=2+J*X1(3)=6 X2(2)X2(3)F J*=2+J*X2(3)=5 J*X1(2)=4,J*X2(2)=5本讲稿第十页，共五十二页倒数第三级路线 X1(1)X1(2)F J*=6+4=10 X1(1)X2(2)F J=6+5=11 X2(1)X1(2)F J*=4+4=8 X2(1)X2(2)F J=7+5=12 J*X1(1)=10,J*X2(1)=8本讲稿第十一页，共五十二页第一级路线 S X1(1)F J=4+10=14 S X2(1)F J*=5+8=13 即 J*S=13本讲稿第十二页，共五十二页最优决策为 S X2(1)X1(2)X2(3)F J*S=1

6、3加法次数:4*(n-2)+2 次 n=4时，4*(4-2)+2=10 次本讲稿第十三页，共五十二页各个状态到终点的最短距离各个状态到终点的最短距离J*S=13J*X1(1)=10 J*X2(1)=8J*X1(2)=4J*X2(2)=5J*X1(3)=4J*X2(3)=3本讲稿第十四页，共五十二页本讲稿第十五页，共五十二页n设离散系统的状态方程为设离散系统的状态方程为 nx x n n 维状态向量，维状态向量，u u m m 维控制向量维控制向量n始端始端和终端和终端固定固定7.2 7.2 离散动态规划在离散系统最优控制中的应用离散动态规划在离散系统最优控制中的应用本讲稿第十六页，共五

7、十二页n求最优控制序列求最优控制序列n使目标泛函使目标泛函n取极小值取极小值本讲稿第十七页，共五十二页n动态规划的目的动态规划的目的n使使 J J 最小最小n即即 n将以将以为初态的为初态的 N-j(=k)N-j(=k)级最优决策级最优决策本讲稿第十八页，共五十二页n根据最优性定理根据最优性定理n如果如果 N N 级决策是最优的级决策是最优的n则以在前则以在前 j 1 j 1 决策上形成的决策上形成的为初态的为初态的 N N j j 级决策是最优决策级决策是最优决策n从这点出发，形成了逆向递推的最优化方法，这种方法被从这点出发，形成了逆向递推的最优化方法，这种方法被称为称为动态规划动态规

8、划本讲稿第十九页，共五十二页n根据最优性定理根据最优性定理n利用动态规划方法形成递推公式利用动态规划方法形成递推公式 n当终端固定时当终端固定时n直接利用递推公式求解最优控制问题直接利用递推公式求解最优控制问题本讲稿第二十页，共五十二页本讲稿第二十一页，共五十二页令：令：本讲稿第二十二页，共五十二页本讲稿第二十三页，共五十二页n例例 1 1n设离散系统的状态方程为设离散系统的状态方程为n已知已知n求最优控制求最优控制 u u 使目标泛函为使目标泛函为n最小最小本讲稿第二十四页，共五十二页n解：解：由递推公式由递推公式 K=3时时本讲稿第二十五页，共五十二页上述最优化问题的解为上述最优化问题的

9、解为最优目标函数为最优目标函数为K=2时时本讲稿第二十六页，共五十二页K=1时求解可得求解可得最优目标函数为最优目标函数为本讲稿第二十七页，共五十二页K=0时时求解可得求解可得最优目标函数为最优目标函数为本讲稿第二十八页，共五十二页求解的结果求解的结果本讲稿第二十九页，共五十二页本讲稿第三十页，共五十二页7.3 7.3 连续动态规划连续动态规划在连续系统最优控制中的应用在连续系统最优控制中的应用 n动态规划动态规划n可用于连续系统的优化问题可用于连续系统的优化问题n对于连续系统对于连续系统n根据最优性原理根据最优性原理n可得到可得到 Hamilton-Jacobi Hamilton-Jacob

10、i 方程方程本讲稿第三十一页，共五十二页n对于连续系统对于连续系统nx n x n 维状态向量，维状态向量，u u m m 维控制向量维控制向量n且容许控制且容许控制 u u 在在 m m 维欧氏空间维欧氏空间的某一给定域的某一给定域中取值即中取值即本讲稿第三十二页，共五十二页n已知始端固定已知始端固定n即即n求最优控制求最优控制n使目标泛函使目标泛函 n取极小值取极小值（3）本讲稿第三十三页，共五十二页由最优性原理推导出极大值原理由最优性原理推导出极大值原理定义定义式中式中而而x(s)是在区间是在区间上和最优控制函数有关的轨线，其中上和最优控制函数有关的轨线，其中，且，且给定。给

11、定。（4）（5）本讲稿第三十四页，共五十二页n显然显然n所有所有都满足都满足n假设假设 V V 存在，连续存在，连续n并且具有连续的一阶和二阶偏导数并且具有连续的一阶和二阶偏导数（6）本讲稿第三十五页，共五十二页推导动态规划的推导动态规划的Hamilton-Jacobi方程方程（7）本讲稿第三十六页，共五十二页（8）本讲稿第三十七页，共五十二页等式两边消去等式两边消去，得，得上式称为上式称为Hamilton-Jacobi方程方程或者称为或者称为 Hamilton-Jacobi-Bellman方程方程（9）本讲稿第三十八页，共五十二页对于所给最优控制问题，重复以上讨论，导致对于所给最优控制

12、问题，重复以上讨论，导致由此，对于所有由此，对于所有，u必须满足必须满足（10）（11）（12）本讲稿第三十九页，共五十二页上式说明，上式说明，Lagrange乘子向量（或协态向量）乘子向量（或协态向量）是最小目标函数在最优轨线上的梯度。是最小目标函数在最优轨线上的梯度。从（从（9）、（）、（10）式可以看出）式可以看出即在最优轨线上应使即在最优轨线上应使Hamilton函数函数H为全局最小，这为全局最小，这正是庞特里亚金的极大值原理。正是庞特里亚金的极大值原理。本讲稿第四十页，共五十二页n例例 1 1n考虑线性定常系统考虑线性定常系统n式中式中n假定任何的假定任何的都是容许控制都是容许

13、控制n要求找到作为要求找到作为的函数的函数，使得，使得本讲稿第四十一页，共五十二页n解：解：n即即本讲稿第四十二页，共五十二页n这样这样本讲稿第四十三页，共五十二页n因为因为n 时不变时不变n且最优化是针对一个无限持续的过程且最优化是针对一个无限持续的过程n 只依赖于初始状态只依赖于初始状态n即即本讲稿第四十四页，共五十二页n由于由于n故故 Hamilton Jacobi Hamilton Jacobi 方程变成方程变成本讲稿第四十五页，共五十二页n假设一个解假设一个解n则则n -对称矩阵对称矩阵本讲稿第四十六页，共五十二页则则Hamilton-Jacobi方程变成方程变成P必须满足的代数方程必须满足的代数方程本讲稿第四十七页，共五十二页例例2 考虑如下系统考虑如下系统目标函数为目标函数为本讲稿第四十八页，共五十二页Hamilton 函数为函数为令令本讲稿第四十九页，共五十二页Hamilton-Jacobi方程为方程为若优化区间为无穷大，则若优化区间为无穷大，则我们求解如下微分方程我们求解如下微分方程本讲稿第五十页，共五十二页为了求解上述非线性微分方程，将为了求解上述非线性微分方程，将V(x)展展开成如下级数形式：开成如下级数形式：令令n=4，则得，则得本讲稿第五十一页，共五十二页所以最优控制作用为所以最优控制作用为闭环系统为闭环系统为本讲稿第五十二页，共五十二页

展开阅读全文