第07章：最优控制的计算方法精选文档.ppt-淘文阁

资源描述

《第07章：最优控制的计算方法精选文档.ppt》由会员分享，可在线阅读，更多相关《第07章：最优控制的计算方法精选文档.ppt（102页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第07章：最优控制的计算方法本讲稿第一页，共一百零二页本章主要内容n7.1 直接法 7.2 间接法 7.3 小结返回主目录本讲稿第二页，共一百零二页在前面讨论变分法、极小值原理和动态规划时，我们列举了一些例子。为了易于说明问题，这些例子都是非常简单的，可以用手算来解决问题。但是在实际工作中所遇到的最优控制问题，一般都是很复杂的，必须用计算机求解。因此，最优控制的计算方法就变得十分重要了。这方面的内容十分丰富，由于篇幅所限，我们只介绍几种典型的算法。本讲稿第三页，共一百零二页(无约束)（ii）哈密顿函数取极小的必要条件(有约束)（7-2）或由极小值原理可知，最优控制问题的解必须满足以下几

2、个条件（iii）边界条件（包括横截条件）（i）正则方程（7-1）本讲稿第四页，共一百零二页最优控制的计算方法一般是先求出满足上面三个条件中某两个的解，然后用合适的迭代计算形式逐次改变这个解，以达到满足剩下的另一个条件的解（即最优解）。通常把最优控制的计算方法分成两类：直接法和间接法。本讲稿第五页，共一百零二页 n直接法它的特点是，在每一步迭代中，不一定要满足取极小的必要条件，而是逐步改善它，在迭代终了使它满足这个必要条件，而且，积分状态方程是从到，积分协态方程是从到，这样就避免了去寻找缺少的协态初值的困难。常用的直接法有梯度法，二阶梯度法，共轭梯度法。本讲稿第六页，共一百零二页

3、 n间接法它的特点是，在每一步迭代中都要满足取极小的必要条件，而且要同时积分状态方程和协态方程，两种方程的积分都从到或从到。常用的间接法有边界迭代法和拟线性化法。本讲稿第七页，共一百零二页7.1 直接法直接法（一）梯度法这是一种直接方法，应用比较广泛。它的特点是：先猜测任意一个控制函数，它可能并不满足取极小的必要条件，然后用迭代算法根据梯度减小的方向来改善，使它最后满足必要条件。计算步骤如下：本讲稿第八页，共一百零二页1 先猜测中的一个控制向量，是迭代步数，初始时。的决定要凭工程经验，猜得合理，计算收敛得就快。本讲稿第九页，共一百零二页2 在第步，以估计值和给定

4、的初始条件，从到顺向积分状态方程，求出状态向量。本讲稿第十页，共一百零二页 3 用、和横截条件求得的终端值，从到反向积分协态方程，求出协态向量。本讲稿第十一页，共一百零二页4 表示在、处取值。当这些量非最优值时，。计算哈密顿函数对的梯度向量本讲稿第十二页，共一百零二页5、是一个步长因子，它是待定的数。选择使指标达到极小。这是一维寻优问题，有很多现成的优化方法可用。如分数法，0.618法，抛物线法，立方近似法等。(7-3)表明迭代是沿着梯度的负方向进行的。修正控制向量（7-3）本讲稿第十三页，共一百零二页 6、计算是否满足下列指标（7-4）是指定小量，若满足则停止计算，

5、否则，令 ,转步骤2。另一停止计算的标准是（7-5）本讲稿第十四页，共一百零二页例7-1考虑下面的一阶非线性状态方程（7-6）用梯度法寻找最优控制使下面的指标最小（7-7）本讲稿第十五页，共一百零二页解因自由，由横截条件得哈密顿函数为（7-8）协态方程为（7-9）本讲稿第十六页，共一百零二页、选初始估计。代入初始条件：，确定积分常数、将代入状态方程（7-6）可得（7-11）积分上式可得（7-12）代入（7-12）式即可得（7-13）本讲稿第十七页，共一百零二页3将代入协态方程（7-9），且由边界条件从t=1倒向积分可得5 。这里选步长因子。如此继续下去，直至指标函数随迭代变化很小为

6、止。4由本讲稿第十八页，共一百零二页图7-1用梯度法寻找最优控制图7-2 最优状态的求解图7-1和图7-2表示了控制和状态的初始值和第一次迭代值，可以看到第一次迭代就几乎收敛到最优值，与最优值还有差异，而且一般说来愈接近最优值收敛愈慢本讲稿第十九页，共一百零二页梯度法应用得比较多，它的优点是：（1）简单，编制程序容易；（2）计算稳定可靠。缺点是：（1）在接近最优解时，迭代收敛很慢，为改善收敛性可用共轭梯度法和二阶变分法等；（2）不能区分局部极小和全局极小；（3）对控制变量受约束，终端状态受约束的情况不能直接处理。对于这种有约束的情况可用约束梯度法或惩罚函数法加以处理。

7、本讲稿第二十页，共一百零二页约束梯度法可处理如下的不等式约束：（7-15）首先，对于任何控制，定义约束算子（7-16）本讲稿第二十一页，共一百零二页显然满足约束，即满足约束，其中，再由用无约束的梯度法求解，在每一次迭代中得出，然后用代替，再进行下一次迭代。（7-17）本讲稿第二十二页，共一百零二页惩罚函数法可处理如下形式的约束：（7-18）（7-19）本讲稿第二十三页，共一百零二页这时，将性能指标增广为其中，（7-21）（7-20）本讲稿第二十四页，共一百零二页显然，当满足约束时，中后两项为零。当不满足约束时，后两项将使增大，故称为惩罚函数。在迭代过程中，逐次增大和。

8、显然当和很大时，所求得的的无约束最优控制近似于的有约束最优控制。本讲稿第二十五页，共一百零二页（二）共轭梯度法用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义，我们先从求函数极值问题的共轭梯度法开始，再推广到求泛函极值问题。本讲稿第二十六页，共一百零二页 1求函数极值的共轭梯度法其中，为常数，为正定阵。是和的内积。要求寻找使取极值。(7-23)设是定义在空间中的二次指标函数（7-22）本讲稿第二十七页，共一百零二页定义则称和是共轭的。（单位阵）时，共轭就变为通常的正交。若中两个向量和满足（7-24）本讲稿第二十八页，共一百

9、零二页设向量，是两两共轭的，以为寻找方向，可得共轭梯度法的迭代寻优程序：（7-25）与梯度法不同处仅在于用共轭梯度代替负梯度。问题是如何产生共轭梯度方向。本讲稿第二十九页，共一百零二页值由和对共轭的关系来确定，即（7-26）（7-27）令，即初始时共轭梯度与梯度方向相反、大小相等。以后的共轭梯度可如下递归产生：本讲稿第三十页，共一百零二页将（7-26）代入（7-27），得称为共轭系数。故（7-28）本讲稿第三十一页，共一百零二页用（7-28）式计算是不方便的，因为要用到二阶导数阵。由（7-22）和（7-23）知分别为的第个和第个分量，右端表示由的第行第

10、列元素构成的矩阵。计算这个二阶导数阵非常困难。为此，有必要推导不用来计算的公式。（7-29）本讲稿第三十二页，共一百零二页性质1 若是空间中彼此共轭的向量，则它们是线性独立的。在这个推导中要用到共轭梯度的下列性质：本讲稿第三十三页，共一百零二页证明：证明：因为正定，上式对每一个成立，所以必须有与假设矛盾，这说明是线性独立的，它们构成了空间中的一组基向量。上式左端各项对取内积后有（7-31）用反证法。若不线性独立，则必存在不全为零的常数使（7-30）本讲稿第三十四页，共一百零二页其中,可这样来求：作内积（7-33）从而按照这个性质，函数的极小点可用这组基来表示，即（

11、7-32）本讲稿第三十五页，共一百零二页性质2 式中，。（7-34）说明，在处函数的梯度与前一步的寻找方向必正交。如果，则有（7-34）本讲稿第三十六页，共一百零二页若不然，不妨先设。再设 ,即是最优步长。在附近选一个，将在处展开，保留一阶项后，有证明：证明：（7-35）本讲稿第三十七页，共一百零二页这与为极小相矛盾。若设则可取，同样得出矛盾，于是必有（7-34）成立。本讲稿第三十八页，共一百零二页性质3（7-36）说明，在处的梯度与以前各步的共轭梯度寻找方向都正交。若，则必有（7-36）本讲稿第三十九页，共一百零二页证明证明由（7-22）式所假定的二次函数

12、，可得（7-38）（7-37）得到重复使用本讲稿第四十页，共一百零二页设为极小点，则（7-39）（7-38）减去（7-39）得（7-40）本讲稿第四十一页，共一百零二页上式两边对作内积，得（7-42）（7-41）=（7-37）代入（7-40），得本讲稿第四十二页，共一百零二页由性质2知再由与是共轭的定义可知（7-42）右端第二项也为零，因此（7-36）得证。本讲稿第四十三页，共一百零二页但是线性无关的，它们构成中一组基，与所有基正交，而中只有个基，故。这说明处的梯度为零，即为二次函数的极小点。如果取，则（7-43）本讲稿第四十四页，共一百零二页如果一个算法能在有

13、限步内求出二次函数的极小点，就称这个算法具有二阶收敛性或有限步收敛性。由此可见，在空间中，对二次函数用（7-25）式所示的共轭梯度法寻优，迭代至多步就可达到极小点。本讲稿第四十五页，共一百零二页性质4若，则（7-44）本讲稿第四十六页，共一百零二页证：证：（7-44）得证。由性质3和（7-26）式知本讲稿第四十七页，共一百零二页下面根据这四个性质来推出的一个简单的计算公式。在（7-41）中令 ,可导出本讲稿第四十八页，共一百零二页再利用（7-26）式，可得由性质4知，因此得（7-45）本讲稿第四十九页，共一百零二页用（7-46）计算，只用到在和两处的梯度，因此非常方便

14、。（7-46）对二次函数是精确的，对非二次函数，它只是一个近似公式由性质3，就可得出（7-46）本讲稿第五十页，共一百零二页将共轭梯度法求的极小解的算式归纳如下：（4）递推逼近极值点解用一维寻优决定。（2）算共轭系数，（1）算梯度（3）算共轭梯度本讲稿第五十一页，共一百零二页2、用共轭梯度法解最优控制问题前面已说过，最优控制计算的直接法是用迭代方法逐步改善控制量，使它最后满足哈密顿函数取极小的必要条件。本讲稿第五十二页，共一百零二页除了这些以外，其它在形式上与求函数极值的共轭梯度法一样。故梯度向量为（7-47）这里梯度向量是时间的函数，向量时间函数的内积定义为（7-48）本

15、讲稿第五十三页，共一百零二页共轭梯度法求最优控制步骤为（1）（2）（3）设已求出第K步估计的控制函数可任选。以为初值，从到积分状态方程，得出状态轨迹。以为终值，从到反向积分协态方程，求得协态轨迹。本讲稿第五十四页，共一百零二页（4）（5）（6）计算梯度向量计算共轭系数时，。（7-49）时，。（7-50）计算共轭梯度本讲稿第五十五页，共一百零二页（7）（8）停止计算。否则令 ,回到步骤2。当满足下面的不等式（7-53）用一维寻优决定，即（7-52）（7-51）计算控制函数本讲稿第五十六页，共一百零二页例7-2要求用共轭梯度法决定最优控制，使最小。性能指标（7-56）设系

16、统状态方程为（7-54）（7-55）本讲稿第五十七页，共一百零二页解（常数）（7-59）（7-58）协态方程为（7-57）哈密顿函数为本讲稿第五十八页，共一百零二页（7-62）（7-63）故协态方程化为（7-61）（7-60）由横截条件本讲稿第五十九页，共一百零二页（1）选，代入状态方程和协态方程（7-54）、（7-55）、（7-62）和（7-63），时的计算可求得积分可得本讲稿第六十页，共一百零二页梯度向量共轭梯度。本讲稿第六十一页，共一百零二页（2）时，用一维寻优来决定。将代入状态方程（7-54）、（7-55）和协态方程（7-62）、（7-63），得本讲稿第六十二页，共一百零二页

17、积分得可求得的最优值为于是本讲稿第六十三页，共一百零二页由（7-62）式积分上式可得本讲稿第六十四页，共一百零二页共轭系数共轭梯度本讲稿第六十五页，共一百零二页（3）时，控制量为同以上步骤，将代入状态方程和协态方程，求出对寻优，可得，于是由本讲稿第六十六页，共一百零二页所以这个例子只要两步迭代即可得到最优解。一般说来，共轭梯度法比梯度法收敛快，但接近最优解后收敛性仍是较慢的。一个补救办法是重新启动，即找出几个共轭梯度方向后，令，再用（7-50）重新迭代，寻找共轭梯度方向。可以证明，即为最优控制。这只要证明即可。本讲稿第六十七页，共一百零二页7.2 间接法（一）边界迭代法这个

18、方法的特点是逐步改善对缺少的初始条件的估计，以满足规定的边界条件。它的原理如下。本讲稿第六十八页，共一百零二页可解出，将它表示为和的函数，即利用哈密顿函数H取极小的方法（7-64）将所求得的代入正则方程（7-1），消去正则方程中的。再引入增广状态（7-65）本讲稿第六十九页，共一百零二页设（7-65）式有个已知初始条件，个终端条件已知，设为和，这是混合式的两点边值条件（参见例3-6），用边界迭代法也很易处理。一般是非线性向量函数。则正则方程（7-1）可写成（7-66）本讲稿第七十页，共一百零二页显然，是已知的，设（7-67）定义本讲稿第七十一页，共一百零二页因未知，用一

19、个估计值得到的解为（7-69）设由、出发积分正则方程（7-66），求得解 ,从中抽出个分量构成。显然的值将随而变，记成（7-68）本讲稿第七十二页，共一百零二页因估计得不一定准确，故一般不等于给定值 .将（7-68）在处展开为台劳级数，保留一次项，得其中，是维矩阵，称为敏感矩阵或转移矩阵。（7-70）本讲稿第七十三页，共一百零二页式中，是的第行，第列元素。（7-71）式右端表示由第行第列元素构成的矩阵。由（7-69）和（7-70）可得（7-71）（7-72）因一般是非线性函数，（7-72）式是一个近似式，为了求得正确的，要用迭代求解。本讲稿第七十四页，共

20、一百零二页其中，是迭代次数，是松驰因子，可改善收敛性，收敛到最后时，将取为1。在第步，用作为估值，积分正则方程，求得，令是第步的估值，则根据（7-72）可得到下面的迭代格式（7-73）本讲稿第七十五页，共一百零二页为指定的小值，则停止计算。否则用代替，再积分正则方程，重复进行。若（7-74）本讲稿第七十六页，共一百零二页计算步骤如下（1）（2）由解出，代入状态和协态方程。设已求出的第步估计值和给定的合在一起，从积分正则方程，求出抽出个要求的分量的终值，若，停止计算，否则进行下一步。本讲稿第七十七页，共一百零二页（3）（4）（5）按（7-73）计算。令

21、回到步骤2。求敏感矩阵本讲稿第七十八页，共一百零二页这种方法的缺点是：（1）（2）（3）第一次估计很困难，终端值对非常敏感时，与相差很大，线性关系（7-70）不成立。敏感矩阵难于确定得很精确，对它求逆的运算也容易引入误差。本讲稿第七十九页，共一百零二页例7-3 系统状态方程为性能指标为用边界迭代法寻找，使最小。（7-77）（7-76）（7-75）本讲稿第八十页，共一百零二页解因终端，自由，故设的初始估计值为零，迭代结果见表7-1。可见在第7次迭代时，、已为零，满足了边界条件。本讲稿第八十一页，共一百零二页表7-1本讲稿第八十二页，共一百零二页这个方法的特点是用迭代算法来改善对

22、正则方程解的估计，使它逐步逼近正则方程的精确解。和前面一样，将正则方程写成。（二）拟线性化法设已知个初始条件和个终端条件（7-79）（7-78）本讲稿第八十三页，共一百零二页拟线性化法将非线性两点边值问题转化为线性两点边值问题，因此变得容易求解。设在迭代的第步获得近似解，将正则方程（7-78）在展开，保留一次项，可得到步的近似解，有（7-80）本讲稿第八十四页，共一百零二页满足给定边界条件（7-81）（7-82）本讲稿第八十五页，共一百零二页（7-80）可写成下面的线性非齐次方程（7-83）或（7-84）是的系统矩阵，其中（7-85）本讲稿第八十六页，共一百零二页可停止

23、计算当满足（7-87）是驱动函数向量。（7-84）是线性微分方程，由给定的个边界条件可确定其通解的个未知常数，故解可完全被确定。（7-86）本讲稿第八十七页，共一百零二页例7-4用拟线性化法求，使最小。系统方程为性能指标为（7-89）（7-88）本讲稿第八十八页，共一百零二页解哈密顿函数为（7-90）（7-91）本讲稿第八十九页，共一百零二页上式代入状态方程后得到（7-92）（7-93）或写成（7-94）上式与（7-78）对照可知（7-95）本讲稿第九十页，共一百零二页根据（7-85）、（7-86）可得（7-96）（7-97）本讲稿第九十一页，共一百零二页于是线性化后的正则方程（

24、7-84）中的系数阵和驱动项都已确定，解这个非齐次时变微分方程，并用边界条件和以决定通解中的未定常数，就完全确定了，这就完成了一次迭代。当满足（7-87）式时，停止计算，求解结束。本讲稿第九十二页，共一百零二页7.3 小结小结 1 最优控制的计算方法可分为直接法和间接法两大类。直接法中我们列举了梯度法和共轭梯度法。间接法中列举了边界迭代法和拟线性化法。本讲稿第九十三页，共一百零二页2 直接法的特点是：在每步迭代中并不满足哈密顿函数取极小的必要条件，只是在迭代终了才满足这个条件；另外积分状态方程时是从，而积分协态方程时是从。由于状态和协态的稳定性是相反的，所以这种双向积分，可使最

25、优化过程非常稳定。这可举一简单例子来说明。本讲稿第九十四页，共一百零二页例 7-5 （7-98）（7-99）本讲稿第九十五页，共一百零二页解：（7-100）于是协态方程为（7-101）本讲稿第九十六页，共一百零二页设，则从，收敛，而发散。若从，则就变为收敛了。解这两个方程，得（7-102）（7-103）本讲稿第九十七页，共一百零二页3 梯度法是利用梯度信息来不断改善对控制函数的估计，最后满足的必要条件。这是一种简单又稳定的算法，几乎对所有的的初始估计都有很好的收敛性。但在远离最优解时收敛速度快，在接近最优解时收敛得慢（原因在于）。本讲稿第九十八页，共一百零二页共轭梯度法

26、比梯度法稍微复杂些，但收敛速度也快些。同样，在接近最优解时，共轭梯度法收敛速度变慢。要加速接近最优解时的收敛速度可用二阶变分法，不过这种方法的计算复杂程度要增加很多。本讲稿第九十九页，共一百零二页4 间接法的特点是：在每步迭代中都满足取极小的必要条件；另外，它同时从一个方向（从或从）积分状态和协态方程。由于状态和协态的稳定性相反，这就使得对边界条件的初始估计非常敏感。尤其当终端时刻远远大于系统的最小时间常数时，收敛性可能很差。本讲稿第一百页，共一百零二页5 边界迭代法是在每步迭代中不断改善对缺少的初始条件的估计去满足给定的终端条件（也可改善对缺少的终端条件的估计去满足给定的初始条件），这种方法对初始估计（如）是非常敏感的，只有在能获得良好的初始估计时，才建议使用这种方法。本讲稿第一百零一页，共一百零二页拟线性化法将非线性正则方程围绕上一步的估计解轨迹线性化，递推解出最后满足正则方程。这种方法对初始估计可能不如边界迭代法对初始估计那么敏感。并且求线性微分方程的解也比较容易。本讲稿第一百零二页，共一百零二页

展开阅读全文