《极小值原理及其应用PPT学习教案.pptx》由会员分享,可在线阅读,更多相关《极小值原理及其应用PPT学习教案.pptx(128页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1极小值原理极小值原理(yunl)及其应用及其应用第一页,共128页。4.1 经典经典(jngdin)变分法的局限性变分法的局限性 上面我们(w men)用经典变分法解最优控制问题时,得出了最优性的必要条件 在得出这个条件时,作了下面的假定:是任意的,即不受限制,它遍及整个向量空间,是一个开集;是存在的。第1页/共128页第二页,共128页。在实际工程问题中,控制作用常常是有界的。如飞机舵面的偏角有限制,火箭的推力有限制,生产过程中的生产能力有限制等等。一般(ybn),我们可用下面的不等式来表示iiMtu)(这时 属于一个有界的闭集,写成 ,为闭集。更一般的情况可用下面的不等式约束来表示
2、。第2页/共128页第三页,共128页。当 属于有界闭集,在边界上取值时,就不是任意的了,因为无法向边界外取值,这时 就不一定是最优解的必要条件。考察由图 4-1所表示的几种情况,图中横轴上每一点都表示一个标量控制函数 ,其容许取值范围为 。第3页/共128页第四页,共128页。图4-1有界闭集内函数的几种(j zhn)形状第4页/共128页第五页,共128页。对于图4-1(a)仍对应最优解 。对于图4-1(b)所对应的解 不是最优解,最优解 在边界上。对于图 4-1(c)常数,由这个方程解不出最优控制 来(这种情况称为奇异情况),最优解 在边界上。另外,也不一定是存在的。例如状态方程的右端
3、对U的一阶偏导数可能不连续,或由于有些指标函数,如燃料最优控制问题中,具有下面的形式这时 对U的一阶偏导数不连续。第5页/共128页第六页,共128页。经典变分法无法处理上面的情况,必须另辟新的途径。极小值原理就是解决这类问题的有力工具。用极小值原理求解控制无约束的最优控制问题和古典变分法是完全一样的。1956年前苏联学者庞特里雅金提出这个原理时,把它称为极大值原理,目前较多地采用极小值原理这个名字(mng zi)。下面给出这个原理及其证明,并举例说明其应用。第6页/共128页第七页,共128页。4.2 连续系统连续系统(xtng)的极小值原理的极小值原理 由于可以利用扩充变量的方法将各类最优
4、控制问题化为定常系统,末值型性能指标情况下的标准形式。我们这里只就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。第7页/共128页第八页,共128页。设系统(xtng)的状态方程为(4-1)初始条件为 (4-2)控制向量,并受下面的约束 (4-3)第8页/共128页第九页,共128页。末值状态必须满足的约束条件为 (4-4)(4-5)其中性能指标函数为为待定列向量。第9页/共128页第十页,共128页。在本节中,假设函数 ,存在且连续,并假定容许控制 是在控制域内取值的任何分段连续函数。这时如果选定了某一容许控制 ,则容易证明在任意的初始条件 下,方程(4-1)唯一
5、的确定了系统状态的变化规律 ,且 是连续的和分段可微的。在这些条件下,我们就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。第10页/共128页第十一页,共128页。证明证明(zhngmng)(zhngmng):采用扰动法,即给最优控制一个变分 ,它将引起最优轨线的变分 ,并使性能指标有一增量 ,当 为极小时,必有 ,由此即可导出最优控制所应满足的必要条件。在变分法中,是微量,即将最优控制和邻近的容许控制相比较,因而最多只能建立哈密顿函数 的相对极小值性质。第11页/共128页第十二页,共128页。庞特里亚金极大值原理却将最优控制与控制域内所有可能的值进行比较,因而得
6、出结论,在整个控制域内最优控制使哈密顿函数 成为绝对极小值。正是这个性质使得庞特里亚金极大值原理成为寻找最优控制的有力工具。但是这样,的改变量 必须看成有限量,而不再是微量。如果让改变的时间很短,则由此引起的最优轨线的改变 仍是微量,性能指标的增量 也是微量,因而对各关系式的数学处理仍是比较容易的。第12页/共128页第十三页,共128页。设 为最优控制,任选一时刻 及一微量 ,在时间间隔中 给 一有限大小的改变量 ,且使得 。现在研究由 引起的最优轨线 的变化。分为三段考虑:1在这一段中,因而 。第13页/共128页第十四页,共128页。2系统的状态方程(4-1)可在初始条件下直接积分。当
7、时,当 时,第14页/共128页第十五页,共128页。两式相减可得这一段的 (4-6)可以对 的大小作估计由于 是微量,所以 也是微量,因而在精确到一阶微量的情况下,下式成立 (4-7)第15页/共128页第十六页,共128页。将式(4-7)代入(4-6),并注意到微量 在微小时间间隔上的积分是高阶微量,即得在第二段时间间隔得终点 ,则有或 (4-8)其中 表示二阶以上的微量。第16页/共128页第十七页,共128页。3这时又有 ,系统的状态方程为而状态变量 的变分满足方程 (4-9)第17页/共128页第十八页,共128页。引入变量 及哈密顿函数 (4-10)(4-11)(4-12)第18页
8、/共128页第十九页,共128页。显然,方程(4-9)和(4-11)为共轭方程,立即求得积分或 (4-13)即最终求得了由于 的有限改变而引起的最优轨线的变化 ,特别是末值状态的变化 。第19页/共128页第二十页,共128页。下面研究由 引起的最优性能指标的改变量 。由于 故有 (4-14)综合(4-8)、(4-12)、(4-13)和(4-14)等式,可以建立 与有限改变量 之间的关系第20页/共128页第二十一页,共128页。已知 中的任意时刻,并以 表示 ,当 时,上式变为 ,或用哈密顿函数 的表达式(4-10)表示可得 (4-15)或 于是定常系统、末值型性能指标、固定、末端受约束情况
9、下极小值原理得以证明。第21页/共128页第二十二页,共128页。总结上述(shngsh)讨论,可将庞特里雅金极小值原理写为如下形式:定理定理定理定理(dngl(dngl)(极小值原理):(极小值原理):(极小值原理):(极小值原理):系统状态方程(4-1)初始条件 (4-2)第22页/共128页第二十三页,共128页。控制向量 ,并受下面的约束 (4-3)终端约束 (4-4)指标函数 (4-5)第23页/共128页第二十四页,共128页。要求选择最优控制 ,使 取极小值。取极小值的必要条件是 、和 满足下面的一组方程1 正则方程 (协态方程)(4-16)(状态方程)(4-17)第24页/共1
10、28页第二十五页,共128页。2 边界条件 (4-18)3 横截条件 (4-19)第25页/共128页第二十六页,共128页。4 最优终端时刻条件 (4-20)5在最优轨线 和最优控制 上哈密 顿函数取极小值 (4-21)第26页/共128页第二十七页,共128页。将上面的结果与用古典变分法所得的结果(3-34)(3-38)式)对比可见,只是将 这个条件用(4-21)代替,其它无变化。应该指出,当 存在,且 得出的 绝对极小,如图 4-1(a)所示时,即为条件(4-21)式。所以极小值原理可以解决变分法所能解决的问题,还能解决变分法不能解决的问题。如何应用条件(4-21)式,这是一个关键,我们
11、将用具体例子来说明。第27页/共128页第二十八页,共128页。4.3 最短时间控制最短时间控制(kngzh)问题问题 节省时间意味着提高(t go)生产率或先发制人取得军事行动的胜利。所以人们很早就开始了对最短时间控制的研究,这方面的研究结果很多,这里先就简单的重积分系统的最短时间控制展开讨论。在前面的绪论中列举了火车快速行驶问题。设火车质量 m=1,把运动方程写成状态方程形式,令 可化为下面的最短时间控制问题。第28页/共128页第二十九页,共128页。例例例例4-1 4-1 4-1 4-1 重积分重积分重积分重积分(jfn)(jfn)(jfn)(jfn)系统的最短时间控制系统的最短时间控
12、制系统的最短时间控制系统的最短时间控制状态方程 (4-22)初始条件为 (4-23)第29页/共128页第三十页,共128页。终端条件为 (4-24)控制约束为 (4-25)求出使性能指标 (4-26)取极小的最优控制。第30页/共128页第三十一页,共128页。解解解解 ;因为控制作用(zuyng)有限制(属于有界闭集),故要用极小值原理求解。取哈密顿函数 (4-27)协态方程为 (4-28)(4-29)第31页/共128页第三十二页,共128页。积分上面两个方程可得 (4-30)(4-31)其中,、是积分常数。由的表达式(4-27)可见,若要选择 使 取极小,只要使 越负越好,而 ,故当
13、,且 与 反号时,取极小,即最优控制为第32页/共128页第三十三页,共128页。由此可见,最优解 取边界值+1或-1,是开关函数的形式。什么时候发生开关转换,将取决于 的符号。而由(4-31)式可见,是 的线性函数,它有四种可能的形状(见图 4-2),也相应有四种序列 由图4-2可见,当 为 的线性函数时 最多改变一次符号。第33页/共128页第三十四页,共128页。图图图图4-2 4-2 4-2 4-2 与与与与 的四种的四种的四种的四种(s zhn)(s zhn)(s zhn)(s zhn)形状形状形状形状第34页/共128页第三十五页,共128页。从上面两式消去 t,即可得相轨迹方程
14、(4-33)当时 ,状态方程的解为 (4-32)下面来求出 取不同值时的状态轨迹(也称为相轨迹)。第35页/共128页第三十六页,共128页。在图4-3中用实线表示,不同的 C值可给出一簇曲线。由(4-32)第一式知 增大时 增大,故相轨迹进行方向是自下而上,如图中曲线上箭头所示。当 时,状态方程的解为 (4-34)消去 ,可得相轨迹方程第36页/共128页第三十七页,共128页。图图图图4-3 4-3 4-3 4-3 相轨迹相轨迹相轨迹相轨迹(guj)(guj)(guj)(guj)图图图图第37页/共128页第三十八页,共128页。在图4-3中用虚线表示。因 增大时,减少,故相轨迹进行方向是
15、自上而下。两簇曲线中,每一簇中有一条曲线的半支进入原点。在 的曲线簇中,通过原点的曲线方程为 (4-36)第38页/共128页第三十九页,共128页。这半支用 表示。在 的曲线簇中,通过原点的曲线方程为 (4-37)这半支用 表示。和 这两个半支通过原点的抛物线称为开关线,其方程为 (4-38)第39页/共128页第四十页,共128页。图图图图4-4 4-4 4-4 4-4 最优相轨迹最优相轨迹最优相轨迹最优相轨迹(guj)(guj)(guj)(guj)与开关线与开关线与开关线与开关线第40页/共128页第四十一页,共128页。当初始状态 在开关线左侧,如图 4-4中D点,从D点转移到原点,并
16、在转移过程中只允许 改变一次符号的唯一途径如图所示,即从 D点沿 的抛物线移到与 相遇,在相遇点改变 的符号为 ,再沿 到达原点。因此,只要初始状态在开关线左侧,都沿 的抛物线转移到 ,然后 改变符号为 ,并沿 到达原点。同样,当初始状态在开关线右侧,如图 4-4中的M点,则先沿 的抛物线转移到 ,然后 改变符号为 ,并沿 到达原点。第41页/共128页第四十二页,共128页。在图4-4中开关曲线(由 和 组成)把 -平面划成两个区域。开关线左侧(图中划阴影线部分)区域用 表示,中的点满足 则 (4-39)开关线右侧区域用 表示,中的点满足 则 (4-40)第42页/共128页第四十三页,共1
17、28页。于是最优控制规律可表示为状态 的函数,即 (4-41)(4-42)根据上面的关系,可以通过非线性的状态反馈来构成。第43页/共128页第四十四页,共128页。图图图图4-5 4-5 4-5 4-5 重积分重积分重积分重积分(jfn)(jfn)(jfn)(jfn)系统时间最优控制的框图系统时间最优控制的框图系统时间最优控制的框图系统时间最优控制的框图第44页/共128页第四十五页,共128页。图4-5表示了重积分系统时间最优控制的工程实现。由图可见 时,即满足(4-39)式,时,即满足(4-40)式。图中的继电函数早期是用继电器实现的,由于继电器在动作时有砰砰声,故这种最优控制又称为(c
18、hn wi)“砰砰”控制。当然,现在可以用无接触的电子开关或微处理机来实现这种控制规律,既方便、可靠,又无砰砰声了。第45页/共128页第四十六页,共128页。例例例例4 4 4 42 2 2 2 积分环节和惯性环节串联系统积分环节和惯性环节串联系统积分环节和惯性环节串联系统积分环节和惯性环节串联系统(xtng)(xtng)(xtng)(xtng)的最短时间控制的最短时间控制的最短时间控制的最短时间控制其传递函数为 (4-43)其中 为大于零的实数。由(4-43)式可得运动方程为(4-44)第46页/共128页第四十七页,共128页。令 和 为状态变量,并有(4-45)控制约束为 ,最优控制只
19、能取 。第47页/共128页第四十八页,共128页。(1)对于 情形,状态方程为其状态轨线相迹为 (4-46)第48页/共128页第四十九页,共128页。如图4-6(a)所示,箭头为状态运动方向。它有一条渐近线 ,如图中虚线所示。在这簇曲线中,只有 到达平衡位置0。,(4-47)第49页/共128页第五十页,共128页。(2)对于 的情形,状态方程为其状态轨线相迹为 (4-48)第50页/共128页第五十一页,共128页。如图4-6(b)所示,箭头为状态运动方向。它有一条渐近线 ,如图中虚线所示。在这簇曲线中,只有 到达平衡位置0。(4-49)第51页/共128页第五十二页,共128页。(a)
20、u=1(a)u=1(a)u=1(a)u=1第52页/共128页第五十三页,共128页。(b)u=-1(b)u=-1(b)u=-1(b)u=-1图4-6 系统的相轨迹第53页/共128页第五十四页,共128页。将 和 合并成一条曲线,其方程为 (4-50)令 (4-51)(4-52)第54页/共128页第五十五页,共128页。于是曲线 方程可写为 (4-53)曲线 将相平面分成两部分,如图 4-7所示。的上半平面包括 记为 ,的下半平面包括记为 ,那么 (4-54)第55页/共128页第五十六页,共128页。图图图图4-74-74-74-7 系统的时间最优相轨迹(guj)和开关线第56页/共12
21、8页第五十七页,共128页。由于最优控制只取 ,它们的切换最多一次,根据状态初始位置不同,它们最优控制是不同的,如图中初始状态在A点时,它属于 ,所以开始 。当运动到达时 ,与交于a点,马上切换为 ,以后沿 运动直到平衡位置 0,再除去控制量 。当初始状态在 B点时,它属于 ,最优控制应先取 ,到达 交于b点时,马上切换为 ,以后沿 继续运动,直到平衡位置 0,切除控制量。第57页/共128页第五十八页,共128页。综上所述,最优控制的状态反馈规律为 (4-55)最短时间最优控制的方框图如图 4-8所示,图中虚线(xxin)部分是最短时间最优控制器。第58页/共128页第五十九页,共128页。
22、图图图图4-84-84-84-8 系统的时间(shjin)最优控制框图第59页/共128页第六十页,共128页。4.4 最少燃料控制最少燃料控制(kngzh)问题问题在人类的经济活动、军事行动以及其它活动中无时无刻不在消耗着形形色色的燃料,减少燃料消耗,节省能源成了当今世界科研的重要课题。特别在宇宙航行中,所消耗的燃料十分昂贵,而且如果需要的燃料多了,会减少运送的有效载荷(如卫星、空间站等),因此在宇宙航行中最早提出了最少燃料消耗的最优控制问题。一般来说,控制物体运动(yndng)的推力或力矩的大小,是和单位时间内燃料消耗量成正比的,因而在某一过程中所消耗的燃料总量可用下面的积分指标来表示第6
23、0页/共128页第六十一页,共128页。其中 是单位时间内的燃料消耗量。第61页/共128页第六十二页,共128页。值得指出的是,在最少燃料控制问题中,终端时间 一般应给定,或者是考虑响应时间和最少燃料的综合最优问题。因为若考虑纯粹的最少燃料控制问题,则将导致系统的响应时间过长,理论上要经过无穷长时间,系统才转移到所要求的状态。这是很显然的,因为燃料消耗得少,推力就小,系统的运动加速度和速度就小。另一方面所指定的时间 必须大于同一问题的最短时间控制所解出的最短时间 ,否则最少燃料控制将会无解。我们还是以重积分系统为例来说明最少燃料控制的解法。第62页/共128页第六十三页,共128页。例例例例
24、4 4 4 43 3 3 3 重积分系统重积分系统重积分系统重积分系统(xtng)(xtng)(xtng)(xtng)的最少燃料控制的最少燃料控制的最少燃料控制的最少燃料控制系统状态方程 (4-56)初始条件 (4-57)终端条件 (4-58)第63页/共128页第六十四页,共128页。控制约束 (4-59)求出使性能指标 (4-60)取极小的最优控制。第64页/共128页第六十五页,共128页。解 用极小值原理求解(qi ji),哈密顿函数为(4-61)协态方程为 (4-62)第65页/共128页第六十六页,共128页。积分上面两个方程可得 (4-63)这里哈密顿函数 与最短时间控制的 不同
25、,考察的表达式可知,无论 为何值,使极小等价于求下式的极小第66页/共128页第六十七页,共128页。考察上面的表达式,当 时,如 ,则 ,故应取 ;当时,则应取,使 ,于是可得出使 极小的最优控制规律为第67页/共128页第六十八页,共128页。(4-64)(4-65)(4-66)(4-67)第68页/共128页第六十九页,共128页。注意到上面得到的最优控制规律中前两式确定了 可取值0、1,而后两式只确定了 的符号,未确定 的值。但由 的表达式可知,只要 就随 而线性变化并有图 4-2所示四种图形,于是 只可能在两个孤立的时刻 取得值+1和-1。这两个孤立时刻 的值对积分指标 的贡献为零,
26、因此我们可不加考虑,而认为 只能取值0和1。这说明 可用带死区的继电函数描述,如图 4-9。和最短时间控制一样,时的状态轨迹为第69页/共128页第七十页,共128页。(4-68)图4-9 带死区的继电函数(hnsh)第70页/共128页第七十一页,共128页。图4-10 最少燃料(rnlio)控制的控制量和相轨迹第71页/共128页第七十二页,共128页。在图4-10中用实线表示。时的状态轨迹为 (4-69)在图4-10中用虚线表示。第72页/共128页第七十三页,共128页。最少燃料控制的特点是 可取零值。当 ,由状态方程可求得 (4-70)状态轨迹为水平线,在图 4-10中用点划线表示。
27、当 时,水平线向右移动,时,水平线向左移动。第73页/共128页第七十四页,共128页。若初始状态 是第一象限内的点 A,则从图4-10状态轨迹的运动方向可知,引向原点的轨迹有下面几种(见图4-11):第74页/共128页第七十五页,共128页。图图图图4-114-114-114-11最少燃料最少燃料最少燃料最少燃料(rnlio)(rnlio)(rnlio)(rnlio)控制的相轨迹控制的相轨迹控制的相轨迹控制的相轨迹第75页/共128页第七十六页,共128页。1 沿ABO到达原点,对应的控制序列 为 。这是最少燃料控制,但因为在 BO段 (即 ),故 到达原点的时间 为无穷大,不能满足给定值
28、的要求。第76页/共128页第七十七页,共128页。2 沿ADO到达原点,对应的控制序列为 。这是最短时间控制的轨迹,到达原点时间将小于给定的 ,但它不是最少燃料控制。第77页/共128页第七十八页,共128页。3 沿ACEO到达原点。其中 C点和E点坐标待定,以满足给定的终端时刻 。这是满足终端时刻 要求的最少燃料控制。设初始点A的时刻为 ,坐标为 ;到达C点的时刻为 ,坐标为 ,到E点的时刻为 ,坐标为 ;到达原点 的时刻为 。AC段对应 ,CE段 ,EO段 ,由积分状态方程(4-56)可得第78页/共128页第七十九页,共128页。:(4-71)(4-72)第79页/共128页第八十页,
29、共128页。(4-73)(4-74)第80页/共128页第八十一页,共128页。(4-75)(4-76)第81页/共128页第八十二页,共128页。由上面六个方程来解六个未知数:、。第82页/共128页第八十三页,共128页。由(4-75)、(4-76)两式消去 ,再考虑(4-73)式可得 (4-77)(4-78)由(4-71)、(4-72)两式得 (4-79)(4-80)第83页/共128页第八十四页,共128页。由(4-78)、(4-79)两式得 (4-81)将(4-81)代入(4-74)式得 第84页/共128页第八十五页,共128页。再利用(4-77)和(4-80)式,即得 由上式解出
30、 (4-82)第85页/共128页第八十六页,共128页。这里必须保证 为实数,并在上式中选择正确的加减号。为了使 为实数,必须有 这说明,若 规定小于最短时间(使上式等于零的 值),最少燃料控制是无解的。第86页/共128页第八十七页,共128页。为了选择正确(zhngqu)的加、减号,应注意有下面的关系即 ,由(4-81)式可得 于是(ysh)从(4-82)式可知,应选择加号,即(4-83)第87页/共128页第八十八页,共128页。将上式代入(4-78)和(4-79)式可得 (4-84)(4-85)第88页/共128页第八十九页,共128页。这样,我们就完全可以确定转换点 C和E的坐标。
31、由图4-11可见E点的坐标 处在开关线 上,可按最短时间控制一样的方式来构成反馈控制。C点坐标 由式(4-80)和(4-83)给出,由此二式可见,它们取决于 和 、。当 给定时,还要给定一个初始条件,譬如 ,才能从此二式消去 得到下面的C点轨迹曲线(在图 4-12中用 来表示)第89页/共128页第九十页,共128页。当 、可取各种值时,开关曲线将取决于初始条件,这在工程实现上是不方便的。第90页/共128页第九十一页,共128页。最后,我们要强调指出,规定了终端时刻,最少燃料的控制量 不仅可取边界值 ,而且还可取零值,对重积分系统来讲,系统有加速段,减速段和等速运行段。而最短时间控制系统只有
32、加速和减速段。以飞机为例,从一个城市以规定的时间飞到另一城市且使燃料消耗为最少的策略是,作一段加速飞行,作一段等速滑翔飞行,再作一段减速飞行,而且规定的时间要足够大,否则最少燃料问题是无解的。第91页/共128页第九十二页,共128页。图图图图4-12 4-12 4-12 4-12 满足终端时刻满足终端时刻满足终端时刻满足终端时刻 要求要求要求要求(yoqi)(yoqi)(yoqi)(yoqi)的最少燃料控制的相轨迹的最少燃料控制的相轨迹的最少燃料控制的相轨迹的最少燃料控制的相轨迹第92页/共128页第九十三页,共128页。4.5 离散系统的极小值原理离散系统的极小值原理(yunl)在现实世界
33、中有些系统本身是离散(lsn)的,要用离散(lsn)的状态方程来加以描述。有些系统本身虽是连续的,但采用计算机控制,控制量只在离散(lsn)的时刻算出来,设计这类系统时,连续对象的状态方程要进行离散(lsn)化。下面就来讨论离散(lsn)系统的极小值原理。问题的提法如下:第93页/共128页第九十四页,共128页。系统的状态方程为 (4-86)为 维向量,为 维向量。上式右端在一般情况下是 和 的非线性函数。第94页/共128页第九十五页,共128页。初始条件为 (4-87)终端约束为 (4-88)是 维向量方程。第95页/共128页第九十六页,共128页。性能指标为 (4-89)要求确定控制
34、序列 ,1,使 最小。下面按控制向量 受约束和不受约束两种情况来讨论。第96页/共128页第九十七页,共128页。(一)控制(一)控制(一)控制(一)控制(kngzh)(kngzh)(kngzh)(kngzh)向量无约束向量无约束向量无约束向量无约束 1这时可用古典变分法求解(qi ji)。作增广性能指标(4-90)式中,是协态向量(维),是拉格朗日乘子向量(q 维)第97页/共128页第九十八页,共128页。引入下面的哈密顿函数 (4-91)并令 (4-92)第98页/共128页第九十九页,共128页。则 (4-93)第99页/共128页第一百页,共128页。的一次变分可写成 (4-94)第
35、100页/共128页第一百零一页,共128页。上式中 。由于初始条件 给定,故 。根据 以及 ,的任意性,可推导出最优控制序列应满足的必要条件:正则方程 (4-95)(4-96)第101页/共128页第一百零二页,共128页。横截条件 (4-97)控制方程 (4-98)初始条件 (4-99)第102页/共128页第一百零三页,共128页。所得结果与连续系统类似,但应注意协态方程(4-95)的右侧无负号。从上面的一组方程可知,我们已知初始条件 ,又从横截条件可求出 ,这样得出了离散非线性两点边值问题,求解一般是困难的。第103页/共128页第一百零四页,共128页。(二)控制(二)控制(二)控制
36、(二)控制(kngzh)(kngzh)向量有约束。向量有约束。向量有约束。向量有约束。这时 一般不成立。根据极小值原理,哈密顿函数在最优控制序列上取极小值,即第104页/共128页第一百零五页,共128页。例例例例4 4 4 44 4 4 4 系统的状态方程为 (4-100)无约束,指标函数为 (4-101)用离散极小值原理求最优控制 ,使 取极小。第105页/共128页第一百零六页,共128页。解 哈密顿函数为 (4-102)协态方程为 (4-103)即协态为常数。第106页/共128页第一百零七页,共128页。横截条件为 (4-104)控制方程为 (4-105)(4-106)第107页/共
37、128页第一百零八页,共128页。因协态为常数,故控制也是常数,令 (4-107)现在来解系统的状态方程,由初始条件 可得 (4-108)(4-109)第108页/共128页第一百零九页,共128页。因为 (4-110)故 (4-111)于是最优控制为 (4-112)第109页/共128页第一百一十页,共128页。代入系统状态方程,可求得最优状态为 (4-113)第110页/共128页第一百一十一页,共128页。例例例例4-54-54-54-5 在N级换热器系列的最优设计中,设 为流出第 个换热器的油料温度,是第 个换热器的换热面积,是第 个换热器的热载体温度,是第 个换热器的正常数。第111
38、页/共128页第一百一十二页,共128页。则状态方程为 (4-114)方程右端对 是非线性的。这里 表示加热器级数,是空间离散变量,但在求解时与时间离散问题一样。第112页/共128页第一百一十三页,共128页。边界条件为 (4-115)性能指标是使换热总面积最小,即 (4-116)最小。第113页/共128页第一百一十四页,共128页。解 这里 无约束,可用变分法求解。作哈密顿函数 (4-117)协态方程为 即 (4-118)第114页/共128页第一百一十五页,共128页。控制方程为 即 (4-119)第115页/共128页第一百一十六页,共128页。由上式求出 比求 容易,故解得 (4-
39、120)将(4-120)式代入协态方程(4-118),消去 ,得 (4-121)第116页/共128页第一百一十七页,共128页。由状态方程(4-114)可解出 (4-122)令 ,由上式可得 (4-123)第117页/共128页第一百一十八页,共128页。将(4-122)、(4-123)代入(4-121),消去 ,可得 (4-124)第118页/共128页第一百一十九页,共128页。(4-124)式是关于 的非线性差分方程,若 已知和 就可递推求出 ,故从终端 向后递推比较方便。已知 ,但不知 ,只能先假定一个 ,由(4-124)算出 ;再循环用(4-124)可依次递推求得,。若最后求出的
40、等于或很接近于给定的初始条件 ,则这组序列 就是最优状态轨迹;否则另取 再重算,直到 ,这组序列 就是最优状态轨迹。把 代入式(4-122)就可求出最优控制序列 。第119页/共128页第一百二十页,共128页。从上面的说明可知,我们要反复试凑以满足 的边界条件,这是非线性两点边值问题所引起的。这里因为 的初始和终端条件都给定,我们采用的解题技巧是消去协态量 ,直接解 。第120页/共128页第一百二十一页,共128页。4.6 4.6 小结小结(xioji)(xioji)1、极小值原理是对经典变分法的扩展,它可以解决经典变分法无法解决的最优控制问题。也就是当控制有约束(控制变量属于一个有界闭集
41、,可表示为 或 ),哈密顿函数 对 不可微时,要用极小值原理。第121页/共128页第一百二十二页,共128页。2、极小值原理所得出的最优控制必要条件与变分法所得的条件的差别,仅在于用哈密顿函数在最优控制上取值的条件 代替 ,而后者可作为前者的特殊情况。其它条件如正则方程,横截条件,边界条件等都一样。第122页/共128页第一百二十三页,共128页。参看图4-1可知,极小值原理可解决在边界上取极值的情况,因此(ync)比变分法所得的条件大大加强了。总之,极小值原理可解决经典变分法可解决的问题,也可解决经典变分法不能解决的问题。所以有些书上把用经典变分法解决的问题也称为用极小值原理求解。若系统方
42、程是非线性的,则用极小值原理求解(和经典变分法一样)将产生非线性微分方程两点边值问题,求解非常困难。第123页/共128页第一百二十四页,共128页。3、前面我们讨论了极小值原理,但经过简单的转换就可将极大值原理化为极小值原理。设要使性能指标 极大,对应的协态变量为 ,拉格朗日乘子为 ,则令 就化为 的极小值问题,并且极小值问题 的和 与 和 的关系为 ,。第124页/共128页第一百二十五页,共128页。4、离散系统的极小值原理与连续系统的极小值原理所得出的最优解的必要条件在形式上是相似的,只是前者的协态方程(4-95)的右端没有负号。若系统方程是非线性差分方程,则离散极小值原理将产生非线性
43、差分方程两点边值问题(wnt)。从例4-5可见,即使对于一个简单的问题(wnt),求解也是很困难的。第125页/共128页第一百二十六页,共128页。5、极小值原理可成功地解决最短时间控制问题。若控制量满足约束条件 ,则最短时间的控制量只能取约束的边界值+1或-1。于是在系统中必然要有一个二位置继电式元件来生 这就是所谓的砰砰控制。对于简单二阶系统 重积分系统,在相平面 上的相轨迹是抛物线,开关曲线由 和 两个半支抛物线组成。第126页/共128页第一百二十七页,共128页。6、最少燃料控制的控制量可取边界值+1、-1和0,因此系统中必然要有一个包含死区的三位置继电式元件来产生 。重积分系统的相轨迹除抛物线外还有平行于横轴的直线段。另外,终端时刻 必须大于同一问题的最短时间控制所需时间,否则最少燃料控制无解。第127页/共128页第一百二十八页,共128页。