《第三章-用变分法解最优控制-—泛函极值问题-最优控制课件.ppt》由会员分享,可在线阅读,更多相关《第三章-用变分法解最优控制-—泛函极值问题-最优控制课件.ppt(107页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 用变分法解最优控制用变分法解最优控制 泛函极值问题泛函极值问题本章主要内容3.1 变分法基础3.2 无约束条件的泛函极值问题 3.3 有约束条件的泛函极值动态系 统的最优控 制问题3.4 小结返回主目录 在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。3.1 变分法基础变分法基础 如果对某一类函数 中的每一个函数 ,有一个实数值 与之相对应,则称 为依赖于函数 的泛函,记为粗略来说,泛函是以函数为自变量的函数。1、泛函:先来给出下
2、面的一些定义。满足下面条件的泛函称为线性泛函 这里 是实数,和 是函数空间中的函数。3、线性泛函:4、自变量函数的变分:自变量函数 的变分 是指同属于函数类 中两个函数 、之差 这里,t 看作为参数。当 为一维函数时,可用图3-1来表示。图3-1自变量函数的变分6、泛函的极值:若存在 ,对满足的 一切X,具有同一符号,则 称 在 处有极值。定理:在 处有极值的必要条件是对于所有容许的增量函数 (自变量的变分),泛函 在 处的变分为零为了判别是极大还是极小,要计算二阶变分 。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般不计算 。于是泛函J 的增量 可计算如下(以下将*号省去)上式中
3、 是高阶项。为此,让自变量函数 、在极值曲线 、附近发生微小变分 、,即 J取极值的必要条件是 等于零。因 是任意的,要使(3-2)中第一项(积分项)为零,必有(3-3)上式称为欧拉拉格朗日方程。(3-2)式中第二项为零的条件要分两种情况来讨论:1、固定端点的情况 这时 ,它们不发生变化,所以 。而(3-2)中第二项可写成当 时,(3-4)式自然为零。(3-4)因为这里讨论 是标量函数的情况,和 也是标量,且是任意的,故(3-5)、(3-6)可化为(3-7)、(3-8)称为横截条件横截条件。(3-8)(3-7)当边界条件全部给定(即固定端点)时,不需要这些横截条件。当给定时,不要(3-8)。当
4、给定时,不要(3-7)。3.2.2 泛函的自变量函数为向量函数的情况泛函的自变量函数为向量函数的情况现在,将上面对 是标量函数时所得到的公式推广到 是n维向量函数的情况。这时,性能泛函为(3-9)(3-10)式中 向量欧拉拉格朗日方程为(3-11)式中泛函变分由(3-2)式改为 (当 和 时)横截条件为(自由端点情况)解 即它的通解形式为 式中:这是固定端点问题,相应的欧拉拉格朗日方程为 由初始条件 ,可得A=0。再由终端条 件 ,可得 ,因而极值轨迹为 例3-2 求使指标 取极值的轨迹 ,并要求 ,但对 没有限制。容易验证 时,对应局部极小;时,对应局部极大。由上式解得 或 。时的极值轨迹为
5、 ;时的极值轨迹为 。即3.3 有约束条件的泛函极值有约束条件的泛函极值 动态系统的最优控制问题动态系统的最优控制问题前面讨论泛函极值问题时,对极值轨迹 没有附加任何约束条件。但在动态系统最优控制问题中,极值轨迹必须满足系统的状态方程,也就是要受到状态方程的约束。考虑下列系统(3-13)在下面的讨论中,假定初始时刻 和初始状态 是给定的,终端则可能有几种情况。我们将就几种常见的情况来讨论,即 给定,自由和 自由,属于一个约束集。3.3.1 终端时刻终端时刻 给定,终端状态给定,终端状态 自由自由(3-16)(3-15)与有约束条件的函数极值情况类似,引入待定的n维拉格朗日乘子向量函数 将状态方
6、程(3-13)写成等式约束方程的形式 与以前不同的是,在动态问题中拉格朗日乘子向量 是时间函数。在最优控制中经常将 称为伴随变量,协态(协状态向量)或共轭状态。引入 后可作出下面的增广泛函(3-17)于是有约束条件的泛函 的极值问题化为无约束条件的增广泛函 的极值问题。(3-18)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用 于是 可写成(3-19)对上式积分号内第二项作分部积分后可得 设 、相对于最优值 、的变分分别为 和 因为 自由,故还要考虑变分 。下面来计算由这些变分引起的泛函 的变分。为极小的必要条件是:对任意的 、,变分 等于零。由(3-18)
7、及(3-20)可得下面的一组关系式(协态方程)(3-21)(状态方程)(3-22)(控制方程)(3-23)(横截条件)(3-24)(3-21)(3-24)即为 取极值的必要条件,由此即可求得最优值 ,。(3-22)式即为状态方程,这可由 的定义式(3-18)看出,实 际解题时无需求 ,只要直接用状态方程即可,这里为形式上对称而写成(3-22)式。(3-21)与(3-22)一起称为哈密顿正则程哈密顿正则程。(3-23)是控制方程,它表示 在最优控制处取极值。注意,这是在 为任意时得出的方程,当 有界且在边界上取得最优值时,就不能用这方程,这时要用极小值原理求解。(3-24)是在 固定、自由时得出
8、的横截条件。当 固定时,就不需要这个横截条件了。横截条件表示协态终端所满足的条件。在求解(3-21)(3-24)时,我们只知道初值 和由横截条件(3-24)求得的协态终端值 ,这种问题称为两点边值问题,一般情况下它们是很难求解的。因为 不知道,如果假定一个 ,然后正向积分(3-21)(3-24),则在 时的 值一般与给定的 不同,于是要反复修正 的值,直至 与给定值的差可忽略不计为止。非线性系统最优控制两点边值问题的数值求解是一个重要的研究领域。对于线性系统两点边值问题的求解,则可寻找缺少的边界条件并只要进行一次积分,下面的例3-4给出了求解过程。例3-3 设系统状态方程为 的边界条件为 。求
9、最优控制 ,使下列性能指标 为最小。解 这里 、均给定,故不需要横截条件(3-24)式。作哈密顿函数则协态方程和控制方程为即 故可得正则方程 对正则方程进行拉氏变换,可得(3-25)(3-26)(3-27)由(3-25)式可求得 于是,解出 为(3-28)代入(3-26),即得(3-29)反变换可求得 将(3-28)代入(3-26)可得 故 由 ,从上式可得把 代入(3-29),可得 ,而最优控制为设系统的状态方程为要求确定最优控制 ,使指标泛函例3-4初始条件为取极小值终端条件为自由 这里 是自由的,所以要用到横截条件(3-24)式,因终端指标 解:作哈密顿函数由(3-21)(3-23)可求
10、得所以(3-30)(3-31)将 代入状态方程,可得 即得(3-32)边界条件为(3-37)(3-36)(3-35)(3-34)(3-33)(3-39)(3-38)(3-40)(3-41)可见这是两点边值问题,对正则方程(3-33)(3-36)进行拉氏变换,可得 代入初始条件 ,可得故由(3-38)(3-41)可解出 同样可解得 利用终端条件 ,由(3-42)、(3-43)可得(3-43)(3-42)由上二式可解出 由(3-42)式可得最优状态轨迹由(3-43)式可得最优协态 由(3-32)式可得最优控制同理还可求出图3-2 最优控制和最优状态轨迹解 注意,这个系统是线性定常系统,这种线性两点
11、边值问题的解可以通过寻找缺少的边界条件,并且进行一次积分而求得其解。对非线性两点边值问题,则要借助于迭代方法产生一个序列,来多次修正缺少的初始条件的试探值,直到满足两点边值的条件。图3-2是最优解的轨迹曲线。3.3.2 终端时刻自由,终端状态受约束终端时刻自由,终端状态受约束设终端状态 满足下面约束方程(3-46)(3-45)(3-44)性能指标为其中 引入n维拉格朗日乘子向量函数 和 维拉格朗日乘子向量 ,作出增广性能泛函 将 代入(3-47),可得(3-49)(3-48)(3-47)引入哈密顿函数 与 固定时的情况不同,现在 由 、和 所引起。这里 不再为零,而 可计算如下(参见图3-3)
12、:(3-51)则(3-50)令图3-3 各种变分的表示(3-52)令一是在 时函数 相对 的变化 .另一是因 的变化所引起的函数值的变化量 后者可用它的线性主部 来 近似。注意,这里 和 不同,故*号不能省去。上式表明 由两部分组成:现在来计算 (只计算到一阶小量)。上式中方括号外的下标*表示 、是最优 值 、。是上式的线性主部,故 对第三项作分部积分,可得 第四项可表示为(忽略二阶小量)上式最后一个等号用到了(3-52)式。表示 的自变量取最优值时 的值。根据上面的结果可得 取极值的必要条件为 因 、为任意,故得(省去*号)(协态方程)(3-53)(状态方程)(3-54)(控制方程)(3-5
13、5)(横截方程)(3-56)与 固定情况相比,这里多了一个方程,用它可求出最优终端时间 。(3-57)要求确定最优控制 ,使 最小。例3-5设系统状态方程为边界条件为自由性能指标为 解这是 自由问题。终端状态固定,是满足约束集的特殊情况,即作哈密顿函数正则方程是控制方程是将 代入,可得因边界条件全部给定,故不用横截条件。确定最优终端时刻的条件(3-57)式为 因为由正则方程 ,所以 ,于是最优控制再由正则方程 ,可得由上式求得 由初始条件 ,求得 ,故最优轨迹为以终端条件代入上式,即求得最优终端时刻 火箭发射最优程序问题。设火箭在垂直平面内运动,加速度 与水平面夹角为 ,是控制作用,见图3-4
14、。令 例3-6(水平速度)(垂直速度)(水平距离)(垂直高度)图3-4 火箭发射示意图 忽略重力和空气阻力时,系统的状态方程和初始条件为(3-58)要求选择最优控制程序 ,使性能指标自由终端状态为为最小。因为要求 最小,故是 自由问题。由给 定的终端状态可得三个约束方程为解(3-59)作哈密顿函数协态方程为(3-60)横截条件为即上式右端矩阵中 的自变量 已省略。由(3-59)式求出上式中的偏导数,可得协态的终值为(3-61)常数积分协态方程可得常数代入协态终值条件后,得故(3-62)由控制方程 ,得(3-63)即 下面来积分状态方程(3-58),为此将自变量 变成 。由(3-63)式得 为了
15、确定最优程序 ,还需确定拉格朗日未定常数 、。将上面关系代入状态方程,即得积分上面两式得由初始条件可求得(3-64)(3-65)将上面的 和 代入状态方程(3-58)的后两式,积分并经较复杂运算得(3-66)(3-67)(注:另一解为 ,但这时由(3-67)式可得出 与给定终端条件 不符,故略去 的解)由终端条件 和(3-65)式得 故(3-68)由(3-63)式得于是(3-70)故(3-69)将终端条件 和(3-69)式代入(3-64)式,可得(3-71)将终端条件 ,(3-69)式和(3-71)式代入(3-67)式可得(3-72)现在归纳一下所得的结果:由(3-72)式可确定 ,由(3-7
16、1)式确定最短时间 ,由(3-70)式即可求得最优推力方向角 。由上面的计算可知,对于这样一个比较简单的例子求出解析解也是比较困难的。一般情况下可用数值积分法求解。3.4 小结小结1、函数的函数叫做泛函。性能指标 是控制作用 的函数,故称为性能泛函。和微分类似可引入泛函的变分 。取极值的必要条件为 。2、泛函 (为向量)取无约束极值的必要条件为(欧拉拉格朗日方程)当 、自由时,还有横截条件(当 和 时)3、求解动态系统的最优控制是一个求取有约束条件的泛函极值问 题。系统的状态方程就是状态变量要满足的一个约束方程,即 设系统状态方程为 ,性能指标为 ,初始状态 给定,终端状态 满足向量约束方程
17、(包括 给定的情况)。4、则由变分法可得下面的结果:其中,称为哈密顿函数。(1)终端时刻 给定时,取极值的必要条件为(横截条件)(控制方程)正则方程有 个变量,积分时要 个边界条件,初始条件 给定时提供了 个边界条件,若 也完全给定则又提供了 个边界条件,这时可不需要横截条件,见例3-3。当 自由或部分分量自由就要靠横截条件来提供缺少的边界条件,见例3-4。(2)终端条件 自由,取极值的必要条件与 给定时的不同处,仅在于多一个求最优终端时刻的条件(3-57)5、用经典变分法求解最优控制时,假定 不受限制,为任意,故得出控制方程 不满足这种情况时,要用极小值原理或动态规划求解。这些内容在下面的章节中介绍。