《用变分法求解最优控制问题.pptx》由会员分享,可在线阅读,更多相关《用变分法求解最优控制问题.pptx(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、本章主要内容5.1 变分法基础5.2 无约束条件的泛函极值问题 5.3 有约束条件的泛函极值动态系 统的最优控 制问题5.4 小结第1页/共102页 在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面再次列出变分法中的一些主要结果,可对照微分学中的结果来理解,以加深印象及理解。第2页/共102页5.1 变分法基础回顾 如果对某一类函数 中的每一个函数 ,有一个实数值 与之相对应,则称 为依赖于函数 的泛函,记为简单来说,泛函是以函数为自变量的函数。1、泛函:相关的定义:第3页/共102页 若对任给的 ,存在当时,就有则称 在
2、处是连续的。2、泛函的连续性:第4页/共102页 满足下面条件的泛函称为线性泛函齐次性:叠加性:这里 是实数,和 是函数空间中的函数。3、线性泛函:第5页/共102页4、自变量函数的变分:自变量函数 的变分 是指同属于函数类 中两个函数 、之差 这里,t 看作为参数。当 为一维函数时,可用图5-1来表示。第6页/共102页图5-1自变量函数的变分第7页/共102页 这里,是 的线性泛函,若 时,有 ,则称 是泛函 的变分。是 的线性主部。当自变量函数 有变分 时,泛函的增量为 5、泛函的变分:第8页/共102页6、泛函的极值:若存在 ,对满足的 一切X,具有同一符号,则 称 在 处有极值。第9
3、页/共102页定理:在 处有极值的必要条件是对于所有容许的增量函数 (自变量的变分),泛函 在 处的变分为零为了判别是极大还是极小,要计算二阶变分 。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般不计算 。第10页/共102页5.2 无约束条件的泛函极值问题5.2.1 泛函的自变量函数为标量函数的情况 为简单起见,先讨论自变量函数为标量函数 (一维)的情况。我们要寻求极值曲线 ,使下面的性能泛函取极值(5-1)第11页/共102页于是泛函J 的增量 可计算如下(以下将*号省去)上式中 是高阶项。为此,让自变量函数 、在极值曲线 、附近发生微小变分 、,即(泰勒级数展开)第12页/共
4、102页 根据定义,泛函的变分 是 的线性主部,即对上式第二项作分部积分,按公式可得(5-2)第13页/共102页 J取极值的必要条件是 等于零。因 是任意的,要使(5-2)中第一项(积分项)为零,必有(5-3)上式称为欧拉拉格朗日方程。(5-2)式中第二项为零的条件要分两种情况来讨论:第14页/共102页 1、固定端点的情况 这时 ,它们不发生变化,所以 。而(5-2)中第二项可写成当 时,(5-4)式自然为零。(5-4)第15页/共102页2、自由端点的情况 这时 和 可以发生化,而且可以独立地变化。于是要使(5-2)中第二项为零,由(5-4)式可得(5-6)(5-5)第16页/共102页
5、 因为这里讨论 是标量函数的情况,和 也是标量,且是任意的,故(5-5)、(5-6)可化为(5-7)、(5-8)称为横截条件。(5-8)(5-7)第17页/共102页 当边界条件全部给定(即固定端点)时,不需要这些横截条件。当给定时,不要(5-8)。当给定时,不要(5-7)。第18页/共102页5.2.2 泛函的自变量函数为向量函数的情况现在,将上面对 是标量函数时所得到的公式推广到 是n维向量函数的情况。这时,性能泛函为(5-9)(5-10)式中第19页/共102页 向量欧拉拉格朗日方程为(5-11)式中泛函变分由(5-2)式改为第20页/共102页 (分以下 和 两种情况:)横截条件为(自
6、由端点情况)第21页/共102页 例5-1 取极值的轨迹 。求通过点(0,0)及(1,1)且使第22页/共102页 解 即它的通解形式为 式中:这是固定端点问题,相应的欧拉拉格朗日方程为Sht双曲正弦函数Cht双曲余弦函数第23页/共102页 由初始条件 ,可得A=0。再由终端条 件 ,可得 ,因而极值轨迹为第24页/共102页 例5-2 求使指标 取极值的轨迹 ,并要求 ,但对 没有限制。第25页/共102页解即 常数于是 是常数,则是时间的线性函数,令 由 可得 ,又终端是自由的,由式(5-7)可得横截条件为这是终端自由的情况。欧拉拉格朗日方程为第26页/共102页容易验证 时,对应局部极
7、小;时,对应局部极大。由上式解得 或 。时的极值轨迹为 ;时的极值轨迹为 。即第27页/共102页5.3 有约束条件的泛函极值 动态系统的最优控制问题前面讨论泛函极值问题时,对极值轨迹 没有附加任何约束条件。但在动态系统最优控制问题中,极值轨迹必须满足系统的状态方程,也就是要受到状态方程的约束。考虑下列系统(5-13)第28页/共102页这是综合指标。我们要求出最优控制 和满足状态方程的极值轨迹 ,使性能指标取极值。式中,为 维状态向量,为 维控制向量(这里假定 不受限制.否则不能用变分法求解,而要用极小值原理或动态规划法求解)是n维连续可微的向量函数。性能指标如下:(5-14)第29页/共1
8、02页 在下面的讨论中,假定初始时刻 和初始状态 是给定的,终端则可能有几种情况。我们将就几种常见的情况来讨论,即 给定,自由和 自由,属于一个约束集。第30页/共102页5.3.1 终端时刻 给定,终端状态 自由(5-16)(5-15)与有约束条件的函数极值情况类似,引入待定的n维拉格朗日乘子向量函数 将状态方程(5-13)写成等式约束方程的形式 第31页/共102页 与以前不同的是,在动态问题中拉格朗日乘子向量 是时间函数。在最优控制中经常将 称为伴随变量,协态(协状态向量)或共轭状态。引入 后可作出下面的增广泛函(5-17)第32页/共102页 于是有约束条件的泛函 的极值问题化为无约束
9、条件的增广泛函 的极值问题。(5-18)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用第33页/共102页 于是 可写成(5-19)对上式积分号内第二项作分部积分后可得第34页/共102页 设 、相对于最优值 、的变分分别为 和 因为 自由,故还要考虑变分 。下面来计算由这些变分引起的泛函 的变分。第35页/共102页 为极小的必要条件是:对任意的 、,变分 等于零。由(5-18)及(5-20)可得下面的一组关系式计算增量,然后用泰勒级数展开到一阶项即可得到第36页/共102页(协态方程)(5-21)(状态方程)(5-22)(控制方程)(5-23)(横截条件
10、)(5-24)第37页/共102页 (5-21)(5-24)即为 取极值的必要条件,由此即可求得最优值 ,。(5-22)式即为状态方程,这可由 的定义式(5-18)看出,实 际解题时无需求 ,只要直接用状态方程即可,这里为形式上对称而写成(5-22)式。(5-21)与(5-22)一起称为哈密顿正则程。第38页/共102页(5-23)是控制方程,它表示 在最优控制处取极值。注意,这是在 为任意时得出的方程,当 有界且在边界上取得最优值时,就不能用这方程,这时要用极小值原理求解。(5-24)是在 固定、自由时得出的横截条件。当 固定时,就不需要这个横截条件了。横截条件表示协态终端所满足的条件。第3
11、9页/共102页 在求解(5-21)(5-24)时,我们只知道初值 和由横截条件(5-24)求得的协态终端值 ,这种问题称为两点边值问题,一般情况下它们是很难求解的。因为 不知道,如果假定一个 ,然后正向积分(5-21)(5-24),则在 时的 值一般与给定的 不同,于是要反复修正 的值,直至 与给定值的差可忽略不计为止。第40页/共102页非线性系统最优控制两点边值问题的数值求解是一个重要的研究领域。对于线性系统两点边值问题的求解,则可寻找缺少的边界条件并只要进行一次积分,下面的例5-4给出了求解过程。第41页/共102页例5-3 设系统状态方程为 的边界条件为 。求最优控制 ,使下列性能指
12、标 为最小。第42页/共102页 解 这里 、均给定,故不需要横截条件(5-24)式。作哈密顿函数则协态方程和控制方程为即第43页/共102页 故可得正则方程 对正则方程进行拉氏变换,可得(5-25)(5-26)(5-27)由(5-25)式可求得第44页/共102页 于是,解出 为(5-28)代入(5-26),即得第45页/共102页(5-29)反变换可求得第46页/共102页 将(5-28)代入(5-26)可得 故第47页/共102页 由 ,从上式可得把 代入(5-29),可得 ,而最优控制为第48页/共102页设系统的状态方程为要求确定最优控制 ,使指标泛函例5-4初始条件为取极小值终端条
13、件为自由第49页/共102页 这里 是自由的,所以要用到横截条件(5-24)式,因终端指标 解:作哈密顿函数由(5-21)(5-25)可求得所以(5-30)(5-31)第50页/共102页将 代入状态方程,可得 即得(5-32)第51页/共102页边界条件为(5-37)(5-36)(5-35)(5-34)(5-33)第52页/共102页 (5-39)(5-38)(5-40)(5-41)可见这是两点边值问题,对正则方程(5-33)(5-36)进行拉氏变换,可得 第53页/共102页代入初始条件 ,可得故由(5-38)(5-41)可解出第54页/共102页 同样可解得 利用终端条件 ,由(5-42
14、)、(5-43)可得(5-43)(5-42)第55页/共102页 由上二式可解出 由(5-42)式可得最优状态轨迹第56页/共102页由(5-43)式可得最优协态 由(5-32)式可得最优控制同理还可求出第57页/共102页图5-2 最优控制和最优状态轨迹解第58页/共102页 注意,这个系统是线性定常系统,这种线性两点边值问题的解可以通过寻找缺少的边界条件,并且进行一次积分而求得其解。对非线性两点边值问题,则要借助于迭代方法产生一个序列,来多次修正缺少的初始条件的试探值,直到满足两点边值的条件。图5-2是最优解的轨迹曲线。第59页/共102页5.3.2 终端时刻自由,终端状态受约束 (拦截问
15、题)设终端状态 满足下面约束方程(5-46)(5-45)(5-44)性能指标为其中第60页/共102页 引入n维拉格朗日乘子向量函数 和 维拉格朗日乘子向量 ,作出增广性能泛函 将 代入(5-47),可得(5-49)(5-48)(5-47)引入哈密顿函数第61页/共102页 与 固定时的情况不同,现在 由 、和 所引起。这里 不再为零.(5-51)则(5-50)令第62页/共102页 系统性能指标泛函的一次变分为:计算增量,然后用泰勒级数展开到一阶即可得到第63页/共102页 取极值的必要条件为 因 、为任意,故得(省去*号)(协态方程)(5-53)(状态方程)(5-54)(控制方程)(5-5
16、5)(横截方程)(5-56)第64页/共102页 与 固定情况相比,这里多了一个方程,用它可求出最优终端时间 。(5-57)第65页/共102页要求确定最优控制 ,使 最小。例5-5设系统状态方程为边界条件为自由性能指标为第66页/共102页 解这是 自由问题。终端状态固定,是满足约束集的特殊情况,即作哈密顿函数第67页/共102页正则方程是控制方程是第68页/共102页将 代入,可得因边界条件全部给定,故不用横截条件。确定最优终端时刻的条件(5-57)式为第69页/共102页 因为由正则方程 ,所以 ,于是最优控制再由正则方程 ,可得由上式求得第70页/共102页 由初始条件 ,求得 ,故最
17、优轨迹为以终端条件代入上式,即求得最优终端时刻第71页/共102页 火箭发射最优程序问题。设火箭在垂直平面内运动,加速度 与水平面夹角为 ,是控制作用,见图5-4。令 例5-6(水平速度)(垂直速度)(水平距离)(垂直高度)第72页/共102页图5-4 火箭发射示意图第73页/共102页 忽略重力和空气阻力时,系统的状态方程和初始条件为(5-58)第74页/共102页要求选择最优控制程序 ,使性能指标自由终端状态为为最小。第75页/共102页因为要求 最小,故是 自由问题。由给 定的终端状态可得三个约束方程为解(5-59)第76页/共102页作哈密顿函数协态方程为(5-60)第77页/共102
18、页 横截条件为即第78页/共102页上式右端矩阵中 的自变量 已省略。由(5-59)式求出上式中的偏导数,可得协态的终值为(5-61)第79页/共102页常数积分协态方程可得常数第80页/共102页代入协态终值条件后,得故(5-62)第81页/共102页由控制方程 ,得(5-63)即第82页/共102页 下面来积分状态方程(5-58),为此将自变量 变成 。由(5-63)式得 为了确定最优程序 ,还需确定拉格朗日未定常数 、。第83页/共102页将上面关系代入状态方程,即得积分上面两式得第84页/共102页由初始条件可求得(5-64)(5-65)第85页/共102页 将上面的 和 代入状态方程
19、(5-58)的后两式,积分并经较复杂运算得(5-66)(5-67)第86页/共102页 (注:另一解为 ,但这时由(5-67)式可得出 与给定终端条件 不符,故略去 的解)由终端条件 和(5-65)式得 故(5-68)第87页/共102页由(5-63)式得于是(5-70)故(5-69)第88页/共102页 将终端条件 和(5-69)式代入(5-64)式,可得(5-71)第89页/共102页 将终端条件 ,(5-69)式和(5-71)式代入(5-67)式可得(5-72)第90页/共102页 现在归纳一下所得的结果:由(5-72)式可确定 ,由(5-71)式确定最短时间 ,由(5-70)式即可求得
20、最优推力方向角 。由上面的计算可知,对于这样一个比较简单的例子求出解析解也是比较困难的。一般情况下可用数值积分法求解。第91页/共102页5.4 小结1、函数的函数叫做泛函。性能指标 是控制作用 的函数,故称为性能泛函。和微分类似可引入泛函的变分 。取极值的必要条件为 。第92页/共102页2、泛函 (为向量)取无约束极值的必要条件为(欧拉拉格朗日方程)当 、自由时,还有横截条件(当 和 时)第93页/共102页 3、求解动态系统的最优控制是一个求取有约束条件的泛函极值问 题。系统的状态方程就是状态变量要满足的一个约束方程,即第94页/共102页 设系统状态方程为 ,性能指标为 ,初始状态 给
21、定,终端状态 满足向量约束方程 (包括 给定的情况)。4、则由变分法可得下面的结果:第95页/共102页 其中,称为哈密顿函数。(1)终端时刻 给定时,取极值的必要条件为(横截条件)(控制方程)第96页/共102页 正则方程有 个变量,积分时要 个边界条件,初始条件 给定时提供了 个边界条件,若 也完全给定则又提供了 个边界条件,这时可不需要横截条件,见例5-3。当 自由或部分分量自由就要靠横截条件来提供缺少的边界条件,见例5-4。第97页/共102页(2)终端条件 自由,取极值的必要条件与 给定时的不同处,仅在于多一个求最优终端时刻的条件(5-57)第98页/共102页 5、用经典变分法求解最优控制时,假定 不受限制,为任意,故得出控制方程 不满足这种情况时,要用极小值原理或动态规划求解。这些内容在下面的章节中介绍。第99页/共102页 作业11、试求从(0,1)引向直线y=2-x的最短曲线方程。(答案:y=x+1)第100页/共102页 作业1第101页/共102页感谢您的观看!第102页/共102页