《现代控制理论变分法在最优控制中的应用.pptx》由会员分享,可在线阅读,更多相关《现代控制理论变分法在最优控制中的应用.pptx(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 最优控制问题的提法 性能指标的分类 最优控制研究的问题是:对一个控制系统,在给定的性能指标要求下,如何选择控制规律,使性能指标达到最优(极值)。第1页/共88页初始状态:目标集:控制域:性能指标:一、最优控制问题的提法 设动态系统的状态方程:第2页/共88页最优控制的问题就是:从所有可供选择的容许控制中寻找一个最优控制 ,使状态 由 经过一定时间转移到目标集 ,并且沿此轨线转移时,使相应的性能指标达到极值(极大或极小)。第3页/共88页二、性能指标的分类 能指标函数(又称价值函数、目标函数、性能泛函),最优控制问题可归结为求性能指标的极值问题。按照实际控制性能的要求大致可以分为:最短时间问题
2、:拦截导弹最短时间控制第4页/共88页 最小燃料消耗问题:控制量u(t)与燃料消耗量成正比。导弹最小燃料控制第5页/共88页 最小能量控制问题:考虑与消耗功率成正比。航天飞机最小能量控制第6页/共88页特别要注意以下的指标形式:线性调节器问题:导弹滚动通道调节问题第7页/共88页、两类性能指标统称为二次型性能指标,这是工程实践中应用最广的一类性能指标。状态跟踪器问题:如果在过程中要求状态x(t)跟踪目标轨线 。弹道导弹的弹道跟踪控制第8页/共88页 积分型性能指标:在变分法中这类问题称为拉格朗日问题。它要求状态向量及控制向量在整个动态过程中都应满足一定要求。性能指标还可以按其数学形式大致分为下
3、列三类:导弹稳定控制第9页/共88页 在变分法中称为迈耶尔问题。它只要求状态在过程终端时满足一定要求,但在整个动态过程中对状态及控制的演变不作要求。终值型性能指标:卫星的指向控制第10页/共88页 在变分法中称为波尔札问题。它要求状态在过程终端时满足一定要求,而且状态向量及控制向量在整个动态过程中都应满足一定要求。复合型性能指标:卫星的指向和稳定控制第11页/共88页本篇主要内容本篇主要内容变分法解最优控制极小值原理动态规划法二次型性能指标的最优控制第12页/共88页第七章 变分法在最优控制中的应用 主要内容:无约束条件的性能指标(泛函)极值问题有约束条件的性能指标(泛函)极值问题变分法法解最
4、优控制问题第13页/共88页(从最简单的情况开始)设性能指标为积分型(拉格朗日问题)(7-1)7.1 7.1 无约束条件的性能指标(泛函)无约束条件的性能指标(泛函)极值问题极值问题第14页/共88页固定或自由固定或自由第15页/共88页7.1 无约束条件的泛函极值问题无约束条件的泛函极值问题 在无约束条件下,按边界条件,极值问题一般分为:1.1.固定边界的极值 给定,且 固定 2.2.可动边界的极值 给定,固定或自由 自由 3.3.终端时刻自由的极值 给定,固定,,自由第16页/共88页一、固定边界的极值问题一、固定边界的极值问题已知条件:假定 为一维变量,在 区间上二次可导,并设起始及终端
5、时刻 均给定,且(7-2)要求确定使 达极小的 轨线。现在我们讨论两种解法:复合求导法和变分法第17页/共88页 1.1.复合求导法 设 为满足以上边界条件并使 达到极小的最优状态轨线,如图所示。则其邻区的状态轨迹 可用下式表示:(7-3)这里,是一个小参变量,但不是时间函数。是时间函数。且满足(7-4)第18页/共88页将 及 的表示式代入指标函数 式得 即在 的邻区的所有 均应满足边界条件(7-5)(7-6)并当 时,则(7-7)对 求导得(7-8)(7-9)第19页/共88页根据性能指标极值的必要条件,应满足(7-10)为此,我们采用复合求导的方法,将 在 处对 求导(7-11)第20页
6、/共88页对于积分号内第二项的变换,利用分步积分的方法:这样,积分号内第二项作分部积分后可得:第21页/共88页代入式(7-11)则得:(7-12)第22页/共88页从边界条件知,(7-13)由于 可以任取,故为使上式成立,必须满足:因此等式右边第二项等于零。根据式(7-10)有:第23页/共88页 这就是著名的欧拉-拉格朗日方程,简称欧拉方程。解此方程就可求得状态的最优轨线 。(7-14)欧拉拉格朗日第24页/共88页2.2.变分法变分法 在无约束条件下,性能指标的极值问题一般可以由经典变分法来解决。有关变分法的知识,对以下几个经常用到的定义及定理用一简单介绍。(1)泛函 设函数x(t),有
7、另一个函数J(x)依赖于函数x(t),用J(x)于表示,则函数J(x)称为函数x(t)的泛函,而x(t)称为泛函J(x)的变量。第25页/共88页泛函的特点:函数的函数 泛函是标量第26页/共88页(7-17)将J(x)在 邻展开成泰勒级数(7-15)(7-16)可见一阶变分的意义为泛函增量的线性主部。(2)变分(7-18)第27页/共88页变量的变分:(7-16)可定义泛函的二阶变分为(7-20)(7-15)(7-19)第28页/共88页(3)泛函 在 处达到极小值的必要条件为:(7-21)其充分条件为:仍然讨论固定边界的泛函极值,即设泛函为积分型(拉格朗日问题):(7-23)(7-22)第
8、29页/共88页 显然,泛函 的值将随着选取不同的 而变化。设 为满足以上边界条件并使 达到极小的最优状态轨线,如图所示 则其邻区的状态轨迹 可用下式表示:(7-24)这里,是时间函数。且满足(7-25)第30页/共88页即在 的邻区的所有 均应满足边界条件(7-26)(7-27)并当 时,则(7-28)对 求导得(7-29)将 及 的表示式代入指标函数 式得(7-30)第31页/共88页根据泛函极值的必要条件,应满足(7-31)为此,我们将 在 处求变分(7-32)第32页/共88页对于积分号内第二项的变换,仍然利用分步积分的方法:第33页/共88页这样,积分号内第二项作分部积分后可得:第3
9、4页/共88页代入式(7-32)则得:(7-33)第35页/共88页同样,因为 ,因此等式右边第二项等于零。根据式(7-33)有:(7-34)第36页/共88页(7-35)由于 可以任取,故为使上式成立,必须满足:第37页/共88页 欧拉方程是一个二阶微分方程,求解过程中要确定两个积分常数,因此要用到两个边界条件来求解。对于不同形式的被积函数F,相应的欧拉方程式亦将不同,我们可以用相似的方法求得,现将结果列于下表。第38页/共88页 F的 形 式 欧拉-拉格朗日方程 第39页/共88页例7-1 设泛函形式为:边界条件为:求 达到极值时的最优轨线 。解 已知被积函数为:可求得:第40页/共88页
10、代入欧拉方程得:其解为:根据边界条件可求得:,最后可得最优轨线为:第41页/共88页由于边界可动,及 不会同时为零,因此第二项不会自然满足,为使上式成立,必须同时满足:假设 及 仍为固定,只是边端状态可以变动,这时,我们可以得到与式(7-35)同样的泛函变分表示式,当J达到极值时,应 ,得:二、可动边界的泛函极值二、可动边界的泛函极值第42页/共88页式(7-30)称为横截条件。由此可见,在边界可动情况下,欧拉方程仍然成立,求解时同样要求有两组边界条件,这时,横截条件便补充了所缺少的边界条件。(7-30)(7-29)第43页/共88页 当边界状态可动,且终端时刻 为自由时,则指标泛函的变分应包
11、括由于 的变化而引起的变分项。这时泛函形式为:三、终端时刻自由的极值问题三、终端时刻自由的极值问题(7-31)第44页/共88页(7-32)由于 很小,因此第二项积分可由积分中值定理求出,J可表示成:即第45页/共88页等式右边第一项与 固定情况完全一样,第二项表示由于终端时刻可动引起的变分项。参照固定边界的情况,可得这时的指标泛函的极值条件为:(7-33)第46页/共88页下面分情况讨论获得极值的条件:如果 与 为互相独立的任意函数,欲使上式成立,必须同时满足以下条件第一种情况:第47页/共88页(7-34)(7-35)(7-36)这里,式(7-36)作为一个补充条件可确定最优终端时刻 。第
12、48页/共88页(7-37)第二种情况:如果 与 是不互相独立的函数,则终端状态受下式约束 条件第49页/共88页最优轨线应满足以下关系:(7-38)等式两边对 求导,并 令 对的变分为零,考虑到则得:(7-39)第50页/共88页将上式代入式(7-33)(7-40)为使上式成立,必须同时满足:(7-41)第51页/共88页(7-42)(7-43)式(7-42)为终端横截条件,同样,这个条件可用来确定最优终端时刻 。从以上讨论可以看出,不论边界情况如何,泛函极值都必须满足欧拉方程,只是在求解欧拉方程时对于不同边界情况应采用不同的边界条件及横截条件。以上结论完全可以推广到 为向量的情况。第52页
13、/共88页例7-2 求使性能指标为极小时的最优轨线 。设 ,这里,如图7-2所示。图7-2 例7-2最优轨线 第53页/共88页解 显然,现在的性能指标就是 的弧长,也就是说,要求从 到直线 的曲线 的弧长为最短。直接应用上面求得的结论来求 及 。已知指标泛函的被积函数为:其一阶偏导数为:第54页/共88页代入欧拉方程,可得:于是 式中,c为积分常数,上式可写成:设:则 第55页/共88页利用边界条件及横截条件可以确定常数a及b。已知 ,则得b=1。由横截条件有 解得 由于 最优轨线为:第56页/共88页根据终端约束:有 则 将 ,代入指标泛函,可J求得的极小值为:第57页/共88页7.2 有
14、约束条件的泛函极值问题 在实际问题中,对应泛函极值的最优轨线通常不可以任意选取,而受着各种约束。单级倒立摆的稳定控制中,一方面受到电机控制力矩大小的限制,另一方面受到滑轨长度尺寸的限制。第58页/共88页 导弹的稳定飞行控制中,一方面受到舵机控制力矩大小的限制,另一方面飞行时间也是受到约束。航天器的稳定飞行控制中,一方面受到发动机输出力矩大小的限制,另一方面受到携带能量的约束。第59页/共88页 还有动态系统的状态变化规律便受系统本身动态特性(状态方程)的约束。下面,我们讨论有约束条件的泛函极值问题。仍设指标泛函形式为积分型 第60页/共88页并设边界时刻 、及边界状态均 给定,则最优轨线受以
15、下不同约束:代数方程约束,约束方程为:(7-43)微分方程约束,约束方程为:(7-44)等周长(积分方程)约束,约束方程为(7-45)第61页/共88页代数方程约束设约束方程为:(7-46)这里有m个约束方程,如x为n维变量,则x只n-m有维是独立的。引入m维的拉格朗日乘子(7-47)第62页/共88页得到增广泛函 (7-48)可按无约束条件来求泛函的极值。根据泛函极值的必要条件可得(7-49)经过同前节中相似的处理,并考虑 ,则得:第63页/共88页(7-50)(7-51)上式即为约束方程。(7-52)定义 整理可表示成:(7-53)第64页/共88页 上式(7-53)为对应于增广泛函的欧拉
16、方程。解此方程,就可得最优轨线 。这里要指出的是 中包含有未知的m维变量函数 ,因此。在求解欧拉方程时除了已有边界条件外,还需要m个条件,这恰好由m个约束方程来补足。显然,所求得的极值满足约束方程。第65页/共88页2.微分方程约束设约束方程为:(7-54)第66页/共88页可得到与代数约束完全相同的结果,这里同样定义(7-56)经过同样类似步骤的推导可得:为使指标泛函在微公方程约束下达到极值,应同时满足(7-55)第67页/共88页3.等周长(积分方程)约束设约束方程为(7-57)第68页/共88页一般情况下,可将积分方程约束转化为微分方程约束:并设其边界条件为:(7-58)(7-59)则(
17、7-60)(7-61)因此我们可以将积分约束方程变换成微分方程约束:第69页/共88页 直接利用微分方程约束情况所得的结果,得到使指标泛函在积分方程约束下达到极值条件:(7-62)(7-63)其中第70页/共88页因此,式(7-62)可以分解成:(7-64)(7-65)由于:第71页/共88页 以上讨论中,我们可以看出,对于有约束条件的泛函极值问题,只需用拉格朗日乘子法将有约束条件问题转化为无约束条件问题来解决。同样,对于不同边界情况,欧拉方程不变,只是边界条件及横截条件不同。(7-67)最后可得欧拉方程为:(7-66)第72页/共88页7.3 变分法解最优控制问题 无约束条件和有约束条件极值
18、问题的求法为我们在实际控制问题的求解提供了理论分析的基础,对于象倒立摆稳定控制、导弹稳定控制和航天器稳定控制等实际控制 稳定,可获得相应最优控制。第73页/共88页设系统状态方程为:(7-68)性能指标为:(7-69)并设:初始及终端时刻 、给定 ,终端不受约束。求使J达到极值时的最优控制规律 及最优状态轨线 。第74页/共88页用拉格朗日乘子法约束条件问题化成无约束条件问题,即(7-70)定义哈密尔顿函数如下:(7-71)则(7-72)第75页/共88页其变分为:(7-73)由于:(7-74)第76页/共88页化简得:(7-75)第77页/共88页由于 互相独立,因此,为使上式成立,应同时满
19、足(7-76)(7-77)(7-78)(7-79)第78页/共88页欧拉方程:式(7-76)、式(7-77)、式(7-78)横截条件:式(7-79)其中,伴随方程/协态方程:式(7-77)哈密尔顿正则方程/规范方程:式(7-76)、式(7-77)控制方程:式(7-78)在求解正则方程时,需要有2n个边界条件。显然这两组边界条件仍是分处在两个端点,因此仍然是两点边值问题。在求解正则方程时,需要正确选用不同的边界条件及横截条件。第79页/共88页例7-3 设系统状态方程为:给定边界条件为:求最优控制 ,使下列性能指标为极小。第80页/共88页解 列写哈密尔顿函数伴随方程及控制方程为:由此可得正则方程为:第81页/共88页联立求解正则方程为:已知边界条件x(0)=1,可得:第82页/共88页最后可得第83页/共88页 例7-4 设一阶系统状态方程为:给定边界条件为:终端时刻 自由,求最优控制 ,使下列性能指标为极小。第84页/共88页解 由性能指标可知,这里 ,列写哈密尔顿函数伴随方程及控制方程为:第85页/共88页由此可得正则方程为:由横截条件 可得:因为 代入得第86页/共88页解得:又因 最后得最优控制代入状态方程可解得:根据边界条件 ,可得 ,则最优状态轨线为:将终端状态条件 代入上式,可得终端时刻第87页/共88页感谢您的观看!第88页/共88页