第三章-用变分法解最优控制-—泛函极值问题-最优控制课件.ppt-淘文阁

资源描述

《第三章-用变分法解最优控制-—泛函极值问题-最优控制课件.ppt》由会员分享，可在线阅读，更多相关《第三章-用变分法解最优控制-—泛函极值问题-最优控制课件.ppt（107页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第三章第三章用变分法解最优控制用变分法解最优控制泛函极值问题泛函极值问题本章主要内容3.1 变分法基础3.2 无约束条件的泛函极值问题 3.3 有约束条件的泛函极值动态系统的最优控制问题3.4 小结返回主目录在动态系统最优控制问题中，性能指标是一个泛函，性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果，大部分不加证明，但读者可对照微分学中的结果来理解。3.1 变分法基础变分法基础如果对某一类函数中的每一个函数，有一个实数值与之相对应，则称为依赖于函数的泛函，记为粗略来说，泛函是以函数为自变量的函数。1、泛函：先来给出下

2、面的一些定义。满足下面条件的泛函称为线性泛函这里是实数，和是函数空间中的函数。3、线性泛函：4、自变量函数的变分：自变量函数的变分是指同属于函数类中两个函数、之差这里,t 看作为参数。当为一维函数时，可用图3-1来表示。图3-1自变量函数的变分6、泛函的极值：若存在，对满足的一切X，具有同一符号，则称在处有极值。定理：在处有极值的必要条件是对于所有容许的增量函数（自变量的变分），泛函在处的变分为零为了判别是极大还是极小，要计算二阶变分。但在实际问题中根据问题的性质容易判别是极大还是极小，故一般不计算。于是泛函J 的增量可计算如下（以下将*号省去）上式中

3、是高阶项。为此，让自变量函数、在极值曲线、附近发生微小变分、，即 J取极值的必要条件是等于零。因是任意的，要使（3-2）中第一项（积分项）为零，必有（3-3）上式称为欧拉拉格朗日方程。（3-2）式中第二项为零的条件要分两种情况来讨论：1、固定端点的情况这时，它们不发生变化，所以。而（3-2）中第二项可写成当时，（3-4）式自然为零。（3-4）因为这里讨论是标量函数的情况，和也是标量，且是任意的，故（3-5）、（3-6）可化为（3-7）、（3-8）称为横截条件横截条件。（3-8）（3-7）当边界条件全部给定（即固定端点）时，不需要这些横截条件。当给定时，不要（3-8）。当

4、给定时，不要（3-7）。3.2.2 泛函的自变量函数为向量函数的情况泛函的自变量函数为向量函数的情况现在，将上面对是标量函数时所得到的公式推广到是n维向量函数的情况。这时，性能泛函为(3-9)(3-10)式中向量欧拉拉格朗日方程为(3-11)式中泛函变分由（3-2）式改为（当和时）横截条件为（自由端点情况）解即它的通解形式为式中：这是固定端点问题，相应的欧拉拉格朗日方程为由初始条件，可得A=0。再由终端条件，可得，因而极值轨迹为例3-2 求使指标取极值的轨迹，并要求，但对没有限制。容易验证时，对应局部极小；时，对应局部极大。由上式解得或。时的极值轨迹为

5、；时的极值轨迹为。即3.3 有约束条件的泛函极值有约束条件的泛函极值动态系统的最优控制问题动态系统的最优控制问题前面讨论泛函极值问题时，对极值轨迹没有附加任何约束条件。但在动态系统最优控制问题中，极值轨迹必须满足系统的状态方程，也就是要受到状态方程的约束。考虑下列系统（3-13）在下面的讨论中，假定初始时刻和初始状态是给定的，终端则可能有几种情况。我们将就几种常见的情况来讨论，即给定，自由和自由,属于一个约束集。3.3.1 终端时刻终端时刻给定，终端状态给定，终端状态自由自由（3-16）（3-15）与有约束条件的函数极值情况类似，引入待定的n维拉格朗日乘子向量函数将状态方

6、程（3-13）写成等式约束方程的形式与以前不同的是，在动态问题中拉格朗日乘子向量是时间函数。在最优控制中经常将称为伴随变量，协态（协状态向量）或共轭状态。引入后可作出下面的增广泛函（3-17）于是有约束条件的泛函的极值问题化为无约束条件的增广泛函的极值问题。（3-18）再引入一个标量函数它称为哈密顿（Hamilton）函数，在最优控制中起着重要的作用于是可写成（3-19）对上式积分号内第二项作分部积分后可得设、相对于最优值、的变分分别为和因为自由，故还要考虑变分。下面来计算由这些变分引起的泛函的变分。为极小的必要条件是：对任意的、，变分等于零。由（3-18）

7、及（3-20）可得下面的一组关系式（协态方程）（3-21）（状态方程）（3-22）（控制方程）（3-23）（横截条件）（3-24）（3-21）（3-24）即为取极值的必要条件，由此即可求得最优值，。（3-22）式即为状态方程，这可由的定义式（3-18）看出，实际解题时无需求，只要直接用状态方程即可，这里为形式上对称而写成（3-22）式。（3-21）与（3-22）一起称为哈密顿正则程哈密顿正则程。（3-23）是控制方程，它表示在最优控制处取极值。注意，这是在为任意时得出的方程，当有界且在边界上取得最优值时，就不能用这方程，这时要用极小值原理求解。（3-24）是在固定、自由时得出

8、的横截条件。当固定时，就不需要这个横截条件了。横截条件表示协态终端所满足的条件。在求解（3-21）（3-24）时，我们只知道初值和由横截条件（3-24）求得的协态终端值，这种问题称为两点边值问题，一般情况下它们是很难求解的。因为不知道，如果假定一个，然后正向积分（3-21）（3-24），则在时的值一般与给定的不同，于是要反复修正的值，直至与给定值的差可忽略不计为止。非线性系统最优控制两点边值问题的数值求解是一个重要的研究领域。对于线性系统两点边值问题的求解，则可寻找缺少的边界条件并只要进行一次积分，下面的例3-4给出了求解过程。例3-3 设系统状态方程为的边界条件为。求

9、最优控制，使下列性能指标为最小。解这里、均给定，故不需要横截条件（3-24）式。作哈密顿函数则协态方程和控制方程为即故可得正则方程对正则方程进行拉氏变换，可得（3-25）（3-26）（3-27）由（3-25）式可求得于是，解出为（3-28）代入（3-26），即得（3-29）反变换可求得将（3-28）代入（3-26）可得故由，从上式可得把代入（3-29），可得，而最优控制为设系统的状态方程为要求确定最优控制，使指标泛函例3-4初始条件为取极小值终端条件为自由这里是自由的，所以要用到横截条件（3-24）式，因终端指标解:作哈密顿函数由（3-21）（3-23）可求

10、得所以（3-30）（3-31）将代入状态方程，可得即得（3-32）边界条件为（3-37）（3-36）（3-35）（3-34）（3-33）（3-39）（3-38）（3-40）（3-41）可见这是两点边值问题，对正则方程（3-33）（3-36）进行拉氏变换，可得代入初始条件，可得故由（3-38）（3-41）可解出同样可解得利用终端条件，由（3-42）、（3-43）可得（3-43）（3-42）由上二式可解出由（3-42）式可得最优状态轨迹由（3-43）式可得最优协态由（3-32）式可得最优控制同理还可求出图3-2 最优控制和最优状态轨迹解注意，这个系统是线性定常系统，这种线性两点

11、边值问题的解可以通过寻找缺少的边界条件，并且进行一次积分而求得其解。对非线性两点边值问题，则要借助于迭代方法产生一个序列，来多次修正缺少的初始条件的试探值，直到满足两点边值的条件。图3-2是最优解的轨迹曲线。3.3.2 终端时刻自由，终端状态受约束终端时刻自由，终端状态受约束设终端状态满足下面约束方程（3-46）（3-45）（3-44）性能指标为其中引入n维拉格朗日乘子向量函数和维拉格朗日乘子向量，作出增广性能泛函将代入（3-47），可得（3-49）（3-48）（3-47）引入哈密顿函数与固定时的情况不同，现在由、和所引起。这里不再为零，而可计算如下（参见图3-3）

12、：（3-51）则（3-50）令图3-3 各种变分的表示（3-52）令一是在时函数相对的变化 .另一是因的变化所引起的函数值的变化量后者可用它的线性主部来近似。注意，这里和不同，故*号不能省去。上式表明由两部分组成：现在来计算（只计算到一阶小量）。上式中方括号外的下标*表示、是最优值、。是上式的线性主部，故对第三项作分部积分，可得第四项可表示为（忽略二阶小量）上式最后一个等号用到了（3-52）式。表示的自变量取最优值时的值。根据上面的结果可得取极值的必要条件为因、为任意，故得（省去*号）（协态方程）（3-53）（状态方程）（3-54）（控制方程）（3-5

13、5）（横截方程）（3-56）与固定情况相比，这里多了一个方程，用它可求出最优终端时间。（3-57）要求确定最优控制，使最小。例3-5设系统状态方程为边界条件为自由性能指标为解这是自由问题。终端状态固定，是满足约束集的特殊情况，即作哈密顿函数正则方程是控制方程是将代入，可得因边界条件全部给定，故不用横截条件。确定最优终端时刻的条件（3-57）式为因为由正则方程，所以，于是最优控制再由正则方程，可得由上式求得由初始条件，求得，故最优轨迹为以终端条件代入上式，即求得最优终端时刻火箭发射最优程序问题。设火箭在垂直平面内运动，加速度与水平面夹角为，是控制作用，见图3-4

14、。令例3-6（水平速度）（垂直速度）（水平距离）（垂直高度）图3-4 火箭发射示意图忽略重力和空气阻力时，系统的状态方程和初始条件为(3-58)要求选择最优控制程序，使性能指标自由终端状态为为最小。因为要求最小，故是自由问题。由给定的终端状态可得三个约束方程为解(3-59)作哈密顿函数协态方程为（3-60）横截条件为即上式右端矩阵中的自变量已省略。由（3-59）式求出上式中的偏导数，可得协态的终值为（3-61）常数积分协态方程可得常数代入协态终值条件后，得故（3-62）由控制方程，得（3-63）即下面来积分状态方程（3-58），为此将自变量变成。由（3-63）式得为了

15、确定最优程序，还需确定拉格朗日未定常数、。将上面关系代入状态方程，即得积分上面两式得由初始条件可求得(3-64)（3-65）将上面的和代入状态方程（3-58）的后两式，积分并经较复杂运算得（3-66）（3-67）（注：另一解为，但这时由（3-67）式可得出与给定终端条件不符，故略去的解）由终端条件和（3-65）式得故（3-68）由（3-63）式得于是（3-70）故（3-69）将终端条件和（3-69）式代入（3-64）式，可得（3-71）将终端条件，（3-69）式和（3-71）式代入（3-67）式可得（3-72）现在归纳一下所得的结果：由（3-72）式可确定，由（3-7

16、1）式确定最短时间，由（3-70）式即可求得最优推力方向角。由上面的计算可知，对于这样一个比较简单的例子求出解析解也是比较困难的。一般情况下可用数值积分法求解。3.4 小结小结1、函数的函数叫做泛函。性能指标是控制作用的函数，故称为性能泛函。和微分类似可引入泛函的变分。取极值的必要条件为。2、泛函（为向量）取无约束极值的必要条件为（欧拉拉格朗日方程）当、自由时，还有横截条件（当和时）3、求解动态系统的最优控制是一个求取有约束条件的泛函极值问题。系统的状态方程就是状态变量要满足的一个约束方程，即设系统状态方程为，性能指标为，初始状态给定，终端状态满足向量约束方程

17、（包括给定的情况）。4、则由变分法可得下面的结果：其中，称为哈密顿函数。（1）终端时刻给定时，取极值的必要条件为（横截条件）（控制方程）正则方程有个变量，积分时要个边界条件，初始条件给定时提供了个边界条件，若也完全给定则又提供了个边界条件，这时可不需要横截条件，见例3-3。当自由或部分分量自由就要靠横截条件来提供缺少的边界条件，见例3-4。（2）终端条件自由，取极值的必要条件与给定时的不同处，仅在于多一个求最优终端时刻的条件（3-57）5、用经典变分法求解最优控制时，假定不受限制，为任意，故得出控制方程不满足这种情况时，要用极小值原理或动态规划求解。这些内容在下面的章节中介绍。

展开阅读全文