《变分法及其在最优控制中的应用.ppt》由会员分享,可在线阅读,更多相关《变分法及其在最优控制中的应用.ppt(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、变分法及其在最优控制中的应用现在学习的是第1页,共94页主 要 内 容 1.1 泛函的变分泛函的变分 1.2 欧拉方程欧拉方程 1.3 横截条件横截条件 1.4 泛函局部极值的充分条件泛函局部极值的充分条件 1.5 等式约束条件下的变分问题等式约束条件下的变分问题 1.6 利用变分法求解最优控制问题利用变分法求解最优控制问题 课外习题课外习题返回目录返回目录现在学习的是第2页,共94页1.1 1.1 泛函的变分泛函的变分一、泛函的定义 如果变量J对于某一函数类中的每一个函数x(t),都有一个 与之对应,那么就称变量J为依赖于函数x(t)的泛函,记为:J=Jx(t)。确定的值说明:由于函数的值是
2、由自变量的选取而确定的,而泛函的值是由自变量的函数的选取而确定的,所以将泛函理解为“函数的函数”。例1.1.1 函数的定积分是泛函。因为变量J的值是由函数的选取而确定的。现在学习的是第3页,共94页例1.1.2 在平面上连接给定两点A(ta,xa)和B(tb,xb)的曲线的弧长J是一个泛函,如图1-1所示。当曲线方程x=x(t)(满足x(ta)=xa,x(tb)=xb)给定后,可算出它在A、B两点间的弧长为:例1.1.3 函数的不定积分 不是泛函。泛函的上述概念,可以推广到含有几个函数的泛函的情况,例如:现在学习的是第4页,共94页从例1.1.2可以知道,连接A、B两点的曲线之弧长的泛函,其被
3、积函数 是未知函数导数的函数。在一般情况下,被积函数是自变量t,未知函数x(t)及其导数 的函数。所以最简单的一类泛函可表示为:求函数的极值时,微分或导数起着重要的作用。求泛函的极值时,变分起着类似的作用。我们将求泛函的极值问题称为变分问题,其相应的方法称为变分法。(1.1.1)如图1-2所示。二、泛函宗量的变分 泛函Jx(t)的宗量是函数x(t),其变分是指在同一函数类中的两个函数间的差:现在学习的是第5页,共94页三、泛函的连续性三、泛函的连续性 函数相近函数相近 当函数当函数x x(t t)与与 x x0 0(t t)之差的绝对值,即之差的绝对值,即 x x(t t)-)-x x0 0(
4、t t),t t1 1 t t t t2 2 (1.1.2)(1.1.2)对于对于x x(t t)的定义域中的一切的定义域中的一切t t(t t1 1 t t t t2 2 )都很小时,称函数)都很小时,称函数x x(t t)与函数与函数x x0 0(t t)是相近的,也称为零阶相近。如图是相近的,也称为零阶相近。如图1-31-3所示。所示。现在学习的是第6页,共94页 一阶相近一阶相近 当函数当函数x x(t t)与与 x x0 0(t t)之差的绝对值以及它们的一阶导数之差的绝对值以及它们的一阶导数 和和 之差的绝对值,即之差的绝对值,即 t t1 1 t t t t2 2 (1.1.3)
5、(1.1.3)都很小,称函数都很小,称函数x x(t t)与函数与函数x x0 0(t t)是一阶相近的,如图是一阶相近的,如图1-41-4所示。所示。注意:一阶相近的两个函数,必然是零阶相近,反之不成立。现在学习的是第7页,共94页 k k阶接近阶接近 当当 t t1 1 t t t t2 2 (1.1.4)(1.1.4)都很小时,称函数都很小时,称函数x x(t t)与函数与函数x x0 0(t t)是是k k阶相近的。阶相近的。函数间距离函数间距离 在不同的函数空间,函数间的距离定义也不同。在不同的函数空间,函数间的距离定义也不同。在函数空间在函数空间C C a a,b b(在区间在区间
6、 a a,b b 上连续的函数的全体构成的函数空间)上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:中,通常采用下式定义距离:(1.1.51.1.5)在函数空间在函数空间C Ck k a a,b b(在区间在区间 a a,b b 上连续且具有连续的上连续且具有连续的k k阶导数的函数的阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:全体构成的函数空间)中,任意两个函数间的距离定义为:(1.1.61.1.6)显然,式(1.1.5)定量地表示两个函数之间的零阶相近度,而式(1.1.6)定量地表示两个函数之间的k阶相近度。现在学习的是第8页,共94页 泛函的连续性泛函的
7、连续性 如果对于任意给定的正数如果对于任意给定的正数,可以找到这样一个,可以找到这样一个 00,当,当 ddx x(t t),x x0 0(t t)(1.1.71.1.7)时,存在时,存在 J J x x(t t)J J x x0 0(t t)(1.1.8)(1.1.8)那么,就说泛函那么,就说泛函J J在点在点x x0 0(t t)处是连续的。处是连续的。根据所采用的函数之间距离定义的不同,是按式(根据所采用的函数之间距离定义的不同,是按式(1.1.51.1.5)还是式)还是式(1.1.61.1.6),其对应的泛函分别称为零阶连续泛函或),其对应的泛函分别称为零阶连续泛函或k k阶连续泛函。
8、阶连续泛函。四、线性泛函四、线性泛函 连续泛函如果满足下列条件:(1)Jx1(t)+x2(t)=Jx1(t)+Jx2(t)(2)Jcx(t)=c Jx(t)现在学习的是第9页,共94页其中,c是任意常数,就称为线性泛函。例如都满足上述两个条件,故均为线性泛函。五、泛函的变分如果连续泛函Jx(t)的增量可以表示为:(泰勒级数)其中,Lx(t),x(t)是关于x(t)的线性连续泛函,而rx(t),x(t)是关于x(t)的高阶无穷小。Lx(t),x(t)称为泛函的变分,记为(1.1.9)现在学习的是第10页,共94页(1.1.10)也就是说,泛函的变分是泛函增量的线性主部。当一个泛函具有变分时,即泛
9、函的增量可以用式(1.1.9)来表示时,称该泛函是可微的。例如,泛函的增量为:于是,其变分为:现在学习的是第11页,共94页可以证明,泛函的变分是唯一的。因为,若泛函的变分不是唯一的,则泛函的增量可以写为:引理1.1.1 泛函Jx(t)的变分为:证明:如上所述,泛函Jx(t)的增量为:其中,(0 1)是一个参变量。由于Lx(t),x(t)是关于 x(t)的线性连续泛函,根据线性泛函的性质(2),有(1.1.11)现在学习的是第12页,共94页又由于rx(t),x(t)是关于 x(t)的高阶无穷小,所以利用上述两点结论,便得根据偏微分的定义现在学习的是第13页,共94页因为泛函Jx(t)的变分为
10、:所以QED现在学习的是第14页,共94页例1.1.4 求泛函 的变分。根据式(1.1.11),该泛函的变分为:现在学习的是第15页,共94页例1.1.5 求泛函 的变分 根据式(1.1.11),所求泛函的变分为:现在学习的是第16页,共94页若设 则六、泛函的极值 如果泛函Jx(t)在函数空间中点x=x0(t)的邻域内,其增量为:就称泛函Jx(t)在点x0(t)处达到极小值;如果泛函Jx(t)在函数空间中点x=x0(t)的邻域内,其增量为:就称泛函Jx(t)在点x0(t)处达到极大值;x0(t)的邻域包含满足条件:的所有点x(t)的球(即以x0(t)为圆心,以为半径的球)。现在学习的是第17
11、页,共94页注意:所采用的函数间的距离的定义的不同,点 x0(t)的邻域内所包含的函数也不同。若强极值若弱极值 显然,如果泛函Jx(t)在点x0(t)处达到强极值,那么它在点x0(t)处也一定达到弱极值。反之不成立。定理1.1.1(必要条件)(必要条件)若泛函Jx(t)是连续可微的,并且在点x0(t)处达到极值,则泛函在点x0(t)处的变分等于零,即(1.1.12)现在学习的是第18页,共94页证明:对于任意给定的x(t),Jx0(t)+x(t)既是函数x(t)的泛函,又是变量的函数。泛函Jx0(t)+x(t)在x0(t)处达到极值,也可看成是函数Jx0(t)+x(t)在=0处达到极值,所以函
12、数Jx0(t)+x(t)对变量的偏导数在=0处应等于零,即而由式(1.1.11)有比较上面两式,又考虑x(t)是任意给定的,所以,QED现在学习的是第19页,共94页 从定理1.1.1的推证中可见,泛函达到强极值与弱极值的必要条件是相同的。应当指出:本节所讨论的定义、引理和定理,稍加变动就可以应用于含有多个未知函数的泛函:Jx1(t),x2(t),xn(t)现在学习的是第20页,共94页 拉格朗日(拉格朗日(LagrangeLagrange)问题问题基本问题基本问题 (1.2.1)(1.2.1)麦耶耳麦耶耳(Mayer)Mayer)问题问题 (1.2.2)(1.2.2)波尔扎(波尔扎(Bolz
13、aBolza)问题问题 (1.2.3)(1.2.3)1.2 1.2 欧拉方程欧拉方程 最优控制问题中,根据性能指标的类型(积分型性能指标、终值型性能指标、复合型性能指标)的不同,分别对应了古典变分法中的三类基本问题。现在学习的是第21页,共94页固定端点的Lagrange问题问题描述:假定点A(t0,x0)和B(tf,xf)是所要寻求的泛函(1.2.1)的极值曲线x(t)的两个固定端点,如图1-5所示,其坐标为:(1.2.4)现在的问题是:从满足边界条件(1.2.4)的二阶可微的函数中,选择使泛函(1.2.1)达到极小值的函数x(t)。解:设x*(t)是使泛函(1.2.1)达到极小值且满足边界
14、条件(1.2.4)的极值条件。现用表示满足边界条件(1.2.4)的极值曲线x*(t)的邻域曲线。其中(1.2.5)现在学习的是第22页,共94页x(t)是泛函宗量x(t)的变分,(01)是一参变量。为使x(t)是满足边界条件(1.2.4)的极值曲线x*(t)的邻域曲线,x(t)应具有连续导数且满足条件:x(t0)=x(tf)=0 (1.2.6)于是,由式(1.2.5)得到(1.2.7)由于x*(t)是极值曲线,所以泛函(1.2.1)在极值曲线x*(t)上的变分等于零(定理1.1.1),即由引理1.1.1知,泛函的变分为(1.2.8)(1.2.9)现在学习的是第23页,共94页将式(1.2.1)
15、代入式(1.2.9),得(1.2.10)现在学习的是第24页,共94页 对式(1.2.10)右端第二项进行分部积分(1.2.12)将式(1.2.11)代入式(1.2.10),并考虑式(1.2.8)得利用条件(1.2.6),则上式变为(1.2.13)(1.2.11)考虑到泛函宗量的变分x(t)是任意的函数,不妨选择(1.2.14)其中w(t)是任一满足下列条件的函数:现在学习的是第25页,共94页将式(1.2.14)代入式(1.2.13),可得由上式可见,一个非负的函数的定积分为零,只能是被积函数恒等于零,因此有(1.2.15)将上式左端第二项展开,可得(1.2.16)欧拉(Euler)方程欧拉
16、方程现在学习的是第26页,共94页式中若 时,欧拉方程是一个二阶微分方程。定理1.2.1 若给定曲线x(t)的始端x(t0)=x0和终端x(tf)=xf,则泛函达到极值的必要条件是,曲线x(t)满足欧拉方程其中x(t)应有连续的二阶导数,则至少应是二次连续可微的。现在学习的是第27页,共94页几种特殊的欧拉方程(可以得到封闭形式的解)几种特殊的欧拉方程(可以得到封闭形式的解)被积函数被积函数L L不依赖于不依赖于 ,即,即 被积函数被积函数L L不依赖于不依赖于x x,即即 被积函数被积函数L L不依赖于不依赖于t t,即即 在这种情况下,欧拉方程的首次积分为在这种情况下,欧拉方程的首次积分为
17、 (1.2.171.2.17)其中其中c c是待定的积分常数。实际上,将上式左边对是待定的积分常数。实际上,将上式左边对t t求全导数,有求全导数,有 被积函数被积函数L L 线性地依赖于线性地依赖于 ,即,即 式(1.2.16)现在学习的是第28页,共94页 对于向量空间的泛函,也存在着欧拉方程,不过是欧拉方程组(即向量欧拉方程)。定理1.2.2 在n维函数空间中,若极值曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T和终端X(tf)=x1(tf),x2(tf),xn(tf)T是给定的,则泛函达到极值的必要条件是曲线X(t)满足向
18、量欧拉方程其中X(t)应有连续的二阶导数,而 则至少应是二次连续可微的。(1.2.18)现在学习的是第29页,共94页例1.2.1 求泛函 满足边界条件 的极值函数。解:由式(1.2.18)得:其特征方程为:特征根为:从而得现在学习的是第30页,共94页由给定的边界条件得于是得极值函数:可以利用MATLAB符号工具箱求解,求解过程如下:syms x1 x2;s=dsolve(D2x1-x2=0,D2x2-x1=0,x1(0)=0,x1(pi/2)=1,x2(0)=0,x2(pi/2)=-1,t);x1=s.x1x2=s.x2运行结果如下:x1=sin(t)x1=-sin(t)现在学习的是第31
19、页,共94页例1.2.2 最速降线(又称捷线)问题 所谓最速降线问题是:设在竖直平面内有两点A和B,它们不在同一条铅垂线上,现有一质点受重力的作用自较高的A点向较低的B点滑动,如果不考虑各种阻力的影响,问应取怎样的路径,才能使所经历的时间最短?解:在A、B两点所在的竖直平面内选择 一坐标系,如图16所示。A点为坐标原点,水平线为x轴,铅垂线为y轴。设质点的初速度为零,则由力学的知识可知,质点在重力的作用下,不考虑各种阻力的影响,从A点向B点下滑的速度的大小为(1.2.19)现在学习的是第32页,共94页由图16得(1.2.20)将式(1.2.20)代入式(1.2.19)中,并变换,得对上式两边
20、进行积分,可得质点自点A(0,0)滑动到点B(xf,yf)所需的时间为(1.2.21)设y=y(x)是连接点A(0,0)和点B(xf,yf)的任一光滑曲线,则最速降线问题的数学提法是:在XOY平面上确定一条满足边界条件(1.2.22)现在学习的是第33页,共94页的极值曲线y=y(x),使泛函(1.2.23)达到极小值。这时被积函数为:不显含自变量x,由(1.2.17)知,它的首次积分为化简上式得现在学习的是第34页,共94页这种方程宜于利用参数法求解,为此,令于是,又由对上式积分,得由边界条件y(0)知,c2=0,于是现在学习的是第35页,共94页令最后得 这是圆滚线的参数方程。式中r是滚动
21、圆半径,其值由另一边界条件y(xf)=yf确定。所以,最速降线是一条圆滚线。现在学习的是第36页,共94页1.3 横截条件当极值曲线x*(t)的端点变化时,要使泛函 达到极小值,x*(t)首先应当满足欧拉方程:若端点固定,可以利用端点条件:确定欧拉方程中的两个待定的积分常数。问题:若端点可变,如何确定这两个积分常数?现在学习的是第37页,共94页横截条件推导过程问题描述:假定极值曲线的始端A(t0,x0)是固定的,而终端B(tf,xf)是可变的,并沿着给定的曲线(1.3.1)变动,如图17所示。现在的问题是需要确定一条从给定的点A(t0,x0)到给定的曲线(1.3.1)上的某一点B(tf,xf
22、)的连续可微的曲线x(t),使得泛函达到极小值。(1.3.2)现在学习的是第38页,共94页解:设x*(t)是泛函(1.3.2)的极值曲线。x*(t)的邻域曲线可表示为:(1.3.3)(1.3.4)由图1-7可见,每一条邻域曲线x(t)都对应一个终端时刻tf,设极值曲线x*(t)所对应的终端时刻为tf*,则邻域曲线x(t)所对应的终端时刻tf可以表示为:(1.3.5)将式(1.3.3)(1.3.5)代入式(1.3.2),得(1.3.6)现在学习的是第39页,共94页根据泛函达到极值的必要条件则有:(1.3.7)式(1.3.7)左边第一项相当于tf固定时的泛函的变分,按照上一节推导的结果可得(1
23、.3.8)现在学习的是第40页,共94页式(1.3.7)左边第二项先利用中值定理,然后求导,则得(1.3.9)将式(1.3.8)和式(1.3.9)代入式(1.3.7),得考虑到欧拉方程和始端固定所以(1.3.10)若x(t*f)与dtf互不相关,则由上式得现在学习的是第41页,共94页(1.3.11)但是,终端点沿曲线(1.3.1)变动,所以x(t*f)与dtf相关。为了进一步简化式(1.3.10),应当求出x(t*f)与dtf之间的关系。根据终端约束条件(1.3.1),应有将上式对取偏导数,并令=0,利用式(1.3.4),整理得将上式代入式(1.3.10),可得现在学习的是第42页,共94页
24、由于dtf是任意的,所以(1.3.12)横截条件定理1.3.1 若曲线x(t)由一给定的点(t0,x0)到给定的曲线x(tf)=(tf)上的某一点(tf,xf),则泛函达到极值的必要条件是,x(t)满足欧拉方程和横截条件其中x(t)应有连续的二阶导数,则至少应是二次连续可微的,而(t)则应有连续的一阶导数。现在学习的是第43页,共94页若极值曲线的始端不是固定的,并沿着曲线(1.3.13)变动,则同样可以推导出始端的横截条件(1.3.14)根据定理1.3.1和式(1.3.14),可得到端点可变时,Lagrange问题的解,除有欧拉方程外,还有横截条件:(1)始端、终端可变,即x(t0)=(t0
25、),x(tf)=(tf),则横截条件为:(2)当t0、tf 可变,而x(t0)与x(tf)固定时,则横截条件为:现在学习的是第44页,共94页(3)当t0、tf 固定,而x(t0)与x(tf)可变时,即始端与终端分别在t=t0、t=tf上滑动,则横截条件为:定理1.3.1和以上几种情况的横截条件,都可以将其推广到n维函数向量X(t)=x1(t),x2(t),xn(t)T的泛函的情形。定理1.3.2 在n维函数空间中,若曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T是固定的,而终端X(tf)=x1(tf),x2(tf),xn(tf)
26、T是可变的,且在曲面X(tf)=(tf)上变动,则泛函达到极值的必要条件是,曲线X(t)满足向量欧拉方程现在学习的是第45页,共94页其中X(t)应有连续的二阶导数,而 则至少应是二次连续可微的,而(t)=1(t),2(t),n(t)T则应有连续的一阶导数。和横截条件 若曲线X(t)=x1(t),x2(t),xn(t)T的始端不是固定的,而是可变的,并在给定的曲面上变动,其中 ,则同样可以推导出始端的横截条件为:现在学习的是第46页,共94页例1.3.1 求t-x平面上由给定A(0,1)至给定直线x=2t的弧长最短的曲线方程。解:由图18,弧长根据题意,目标泛函应选为:这是一个始端固定,终端可
27、变的泛函的变分问题。由于泛函的被积函数 中不显含x(t),所以Euler方程为:现在学习的是第47页,共94页由初始条件x(0)=1,得c2=1,从而有由横截条件(1.3.12),得经整理得 ,所以c1=1。最优轨线方程为:最优轨线与给定直线垂直。现在学习的是第48页,共94页1.4 泛函局部极值的充分条件泛函二阶变分推导过程:给定泛函为其一阶变分为(1.4.1)(1.4.2)现在学习的是第49页,共94页而二阶变分为现在学习的是第50页,共94页(1.4.3)于是,为使泛函(1.4.1)在曲线x(t)上达到极小(或极大)值,其一阶变分(1.4.2)应为零,而其二阶变分(1.4.3)必须为正(
28、或负)。由此,得到下面的定理。现在学习的是第51页,共94页定理1.4.1 若泛函的一阶变分则Jx(t)达到极小值的充分条件是二阶型矩阵(1.4.4)是正定的或半正定的;而Jx(t)达到极大值的充分条件是式(1.4.4)是负定的或半负定的。定理1.4.1可以推广到含有n个未知函数的泛函的情形。现在学习的是第52页,共94页1.5 等式约束条件下的变分问题一、回顾等式约束条件下函数极值问题的解法 设有函数(1.5.2)现在需要求函数Z在约束条件为(1.5.1)情况下的极值。(1)消元法:从约束条件(1.5.2)中将y解出来。用x表示y,即 y=y(x)然后将y(x)代入f(x,y)中,得到 Z=
29、fx,y(x)(1.5.3)这样,函数Z就只含有一个自变量x了,在等式(1.5.2)约束条现在学习的是第53页,共94页件下的函数(1.5.1)的极值问题,就变成无约束条件的函数(1.5.3)的极值问题了。但是,消元法存在两个问题:从方程(1.5.2)中将y解出来往往是很困难的;对x和y这两个自变量未能平等看待。(2)拉格朗日乘子法(Lagrange factor)步骤如下:作一个辅助函数 F=f(x,y)+g(x,y)式中,是待定的常数,称为拉格朗日乘子;求辅助函数F的无条件极值,即令(1.5.4)联立求解方程(1.5.2)和(1.5.4),求出驻点(x0,y 0)和待定常数值;判断(x0,
30、y 0)是否是函数f(x,y)的极值点。现在学习的是第54页,共94页 拉格朗日乘子法对于求n元函数 y=f(x1,x2,xn)在多个约束方程 gi(x1,x2,xn)=0,i=1,2,m;m n条件下的极值问题,同样适用。二、等式约束条件下泛函极值问题的解法求泛函(1.5.5)在约束方程为(1.5.6)和端点条件为(1.5.7)现在学习的是第55页,共94页 利用拉格朗日乘子法求解上述等式约束条件下的泛函极值问题,利用拉格朗日乘子法求解上述等式约束条件下的泛函极值问题,其具体步骤为其具体步骤为 构造辅助泛函构造辅助泛函 其中其中(t t)=)=1 1(t t),),2 2(t t),),m
31、m(t t)T T是是m m维待定向量乘子。于是,就将有维待定向量乘子。于是,就将有约束条件(约束条件(1.5.61.5.6)的泛函()的泛函(1.5.51.5.5)的极值问题转化成无约束条件的)的极值问题转化成无约束条件的泛函(泛函(1.5.81.5.8)的极值问题。)的极值问题。令令 (1.5.9)(1.5.9)写出向量形式的欧拉方程写出向量形式的欧拉方程 (1.5.101.5.10)情况下的极值曲线。这里 X(t)=x1(t),x2(t),xn(t)T,f=f1,f2,fmT,m n。而 是x1(t),x2(t),xn(t)和t的标量函数。(1.5.8)现在学习的是第56页,共94页 联
32、立求解欧拉方程(联立求解欧拉方程(1.5.101.5.10)和约束方程()和约束方程(1.5.61.5.6),可以得到),可以得到n n维维向量函数向量函数X X(t t)和和m m维向量乘子维向量乘子 (t t)。利用端点条件(利用端点条件(1.5.71.5.7)确定欧拉方程解中的)确定欧拉方程解中的2 2n n个积分常数,得到候个积分常数,得到候选函数选函数X X(t t)。检验候选函数检验候选函数X X(t t)是否使泛函(是否使泛函(1.5.81.5.8)达到极值以及是极大)达到极值以及是极大值还是极小值。值还是极小值。说明:利用拉格朗日乘子法求得的函数X(t),如果(1.5.8)达到
33、极值,就一定是原泛函(1.5.5)的极值函数。因为由约束方程(1.5.6)和欧拉方程(1.5.10)联立解出的向量函数X(t)和(t)一定满足约束方程(1.5.6),所以必有J0=J,另外,当将所解出的(t)代入辅助泛函(1.5.8)时,函数X(t)将使辅助泛函(1.5.8)达到无条件极值,因为函数X(t)是辅助泛函(1.5.8)的欧拉方程(1.5.10)的解。现在学习的是第57页,共94页 上面的论述仅仅指出了利用拉格朗日乘子法求出的辅助泛函(1.5.8)的无条件的极值函数,一定是原泛函(1.5.5)在等式(1.5.6)约束条件下的极值函数。但是,却没有说明原泛函(1.5.5)在等式(1.5
34、.6)约束条件下的所有极值函数是否都能利用拉格朗日乘子法求出来?下面的定理将回答这个问题。定理1.5.1 如果n维向量函数 X(t)=x1(t),x2(t),xn(t)T (1.5.11)能使泛函(1.5.15)在等式约束(1.5.12)条件下达到极值,这里f是m维向量函数,m n,必存在适当的m维向量函数 (t)=1(t),2(t),m(t)T (1.5.14)使泛函(1.5.13)现在学习的是第58页,共94页达到无条件极值。即函数X(t)是泛函(1.5.15)的欧拉方程的解,其中(1.5.16)而X(t)和(t)由欧拉方程(1.5.16)和约束方程(1.5.13)共同确定。说明:定理1.
35、5.1表明,泛函(1.5.12)在等式(1.5.13)约束条件下的极值函数X(t),同时也使泛函(1.5.15)达到无条件极值。这就进一步说明泛函(1.5.12)在等式(1.5.13)约束条件下的极值函数X(t)都可通过拉格朗日乘子法求得。如果不仅将X(t),而且连函数(t)在内,都看成是泛函(1.5.15)的宗量,那么,约束方程(1.5.13)也可以看成是泛函(1.5.15)的欧拉方程。方程(1.5.13)和(1.5.16)共有n+m个方程,恰好可以解出n维和m维未知函数X(t)和(t)。当约束方程中(1.5.13)中的函数f不包括有 X(t)的导数 时,则式(1.5.13)便成为一种代数方
36、程约束。定理1.5.1仍然成立。现在学习的是第59页,共94页例1.5.1 已知受控系统的动态结构如图19所示。求最优控制u*(t),使目标泛函取极小值。给定的边界条件为解:令则得系统的状态方程为:现在的目标泛函为应用拉格朗日乘子法,构造辅助泛函(1.5.17)现在学习的是第60页,共94页令则向量形式的欧拉方程为根据状态方程(1.5.17),得现在学习的是第61页,共94页利用边界条件,可得所以,最优控制现在学习的是第62页,共94页1.6 利用变分法求解最优控制问题 对于最优控制问题来说,当状态变量和控制变量均不受约束,即 X(t)Rn,U(t)Rm时,是个在等式约束条件下求泛函极值的变分
37、问题,因此,可以利用在上一节中介绍的拉格朗日乘子法来求解。在这一节中,利用拉格朗日乘子法求解最优控制问题时,将引入哈密顿(Hamilton)函数,推导出几种典型的最优控制问题应满足的必要条件。1.6.1 拉格朗日问题的解问题1.6.1 给定系统状态方程(1.6.2)初始条件(1.6.1)终端条件:tf固定,X(tf)自由和性能泛函(1.6.3)现在学习的是第63页,共94页要求从容许控制U(t)Rm中确定最优控制U*(t),使系统(1.6.1)从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函(1.6.3)达到极小值。这是拉格朗日问题,又称为积分型最优控制问题。解:将状态方程(1.6
38、.1)改写为(1.6.4)于是,上述最优控制问题就变成为在微分方程(1.6.4)约束条件下求泛函(1.6.3)极值的变分问题。利用拉格朗日乘子法,引入n维拉格朗日乘子向量(t)=1(t),2(t),n(t)T(t)称为协态变量,以便与状态变量相对应。构造辅助泛函(1.6.5)现在学习的是第64页,共94页其中,(1.6.6)于是,求泛函(1.6.3)在等式(1.6.1)约束条件下的极值问题,就转变成为求泛函(1.6.5)的无约束条件的极值问题。定义哈密顿(Hamilton)函数为(1.6.7)它是一标量函数,则式(1.6.6)变为 利用变分法可以写出辅助泛函(1.6.5)的欧拉方程(1.6.8
39、)现在学习的是第65页,共94页将式(1.6.8)代入上式,得(1.6.11)(1.6.10)(1.6.9)协态方程(或共轭方程)状态方程规范方程(或正则方程)控制方程现在学习的是第66页,共94页(1.6.12)初始状态为由于终端时刻tf固定,终端状态X(tf)自由,所以横截条件为 考虑式(1.6.8),得(1.6.13)式(1.6.9)(1.6.13)就是式(1.6.1)(1.6.3)所给定的最优控制问题的解应满足的必要条件。这些条件也可以由求辅助泛函J0对状态变量X(t)和控制变量U(t)的变分中推导出来。联立求解规范方程(1.6.9)和(1.6.10)可以得到两个未知函数X(t)和(t
40、),其一个边界在始端(1.6.12),另一个边界在终端(1.6.13),故称为混合边界问题或两点边界值问题。现在学习的是第67页,共94页求解两点边界值问题步骤求解两点边界值问题步骤 由由控制方程控制方程(1.6.111.6.11)求得)求得 U U=U U X X(t t),(t t),t t (1.6.141.6.14)将式(将式(1.6.141.6.14)代入规范方程()代入规范方程(1.6.91.6.9)和()和(1.6.101.6.10)消去其中)消去其中的的U U(t t),得到得到 (1.6.151.6.15)(1.6.161.6.16)利用利用边界条件边界条件(1.6.121.
41、6.12)和()和(1.6.131.6.13)联立求解方程)联立求解方程(1.6.151.6.15)和()和(1.6.161.6.16),可得唯一确定的解),可得唯一确定的解X X(t t)和和(t t)。将所求得的将所求得的X X(t t)和和(t t)代入式(代入式(1.6.141.6.14)中,可求得相应的)中,可求得相应的U U(t t)。现在学习的是第68页,共94页说明:(1)对于两点边界值问题,一般难以求得其解析解,通常需要采用数值计算方法求其数值解。(2)利用引入哈密顿函数的方法求解拉格朗日型最优控制问题,是将求泛函(1.6.3)在等式(1.6.1)约束条件下对控制函数U(t)
42、的条件极值问题转化为求哈密顿函数H对控制变量U(t)的无条件极值问题。这种方法称为哈密顿方法。定理1.6.1 设系统的状态方程 则为将系统从给定的初态转移到终端时刻 tf固定,终端状态X(tf)自由的某个终态,并使性能泛函现在学习的是第69页,共94页达到极小值的最优控制应满足的必要条件是 (1)设U*(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的n维协态变量(t),使得X(t)与(t)满足规范方程其中 (2)边界条件为现在学习的是第70页,共94页 (3)哈密顿函数H对控制变量U(t)(t0ttf)取极值,即*沿着最优控制和最优轨线,哈密
43、顿函数H对时间t求全导数,得若H不显含t时,则有 H(t)=常数 tt0,tf;也就是说,当H不显含t时,哈密顿函数H是不依赖于t的常数。现在学习的是第71页,共94页例1.6.1 已知 系统方程和边界条件为求使性能泛函为极小值的最优控制函数与最优轨线。解:这是一个最小能量控制问题。其哈密顿函数为由控制方程得现在学习的是第72页,共94页协态方程为解协态方程,得于是由状态方程解得现在学习的是第73页,共94页利用边界条件求得积分常数为于是,最优控制与最优轨线分别为现在学习的是第74页,共94页可以利用MATLAB符号工具箱求解上述微分方程,程序如下:syms l1 l2 x1 x2;s=dso
44、lve(D1l1=0,D1l2=-l1-l2,D1x1=x2,D1x2=x2-l2,x1(0)=1,x2(0)=1,x1(1)=0,x2(1)=0,t)l1=s.l1,l2=s.l2,x1=s.x1,x2=s.x2运行结果为:s=l1:1x1 sym l2:1x1 sym x1:1x1 sym x2:1x1 sym现在学习的是第75页,共94页l1=-2*exp(1)/(exp(1)-3)l2=2*exp(1)/(exp(1)-3)-2*exp(1)/(exp(1)-3)*exp(-t)-2*exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)x1=-exp(1)/(exp
45、(1)-3)*exp(t)+2*exp(1)/(exp(1)-3)*t+exp(1)/(exp(1)-3)*exp(-t)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)-2*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(t)x2=2*exp(1)/(exp(1)-3)-exp(1)/(exp(1)-3)*exp(-t)-exp(1)/(exp(1)-3)*exp(t)-exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(1)/(exp(1)-1)
46、/(exp(1)-3)*exp(t)+exp(t)例1.6.2 问题同例1.6.1,只是终端条件为x1(1)=0,x2(1)自由,求该最优控制问题。解:问题的规范方程和控制方程均与例1.6.1相同,但边界条件变为现在学习的是第76页,共94页由这些边界条件求得的积分常数为于是,所求得的最优解为 由例1.6.1和例1.6.2可见,对于两个相同的最优控制问题,只是部分终端状态不相同,所得到的最优解则完全不同。现在学习的是第77页,共94页1.6.2 波尔扎问题的解问题1.6.2 给定系统状态方程(1.6.18)初始条件(1.6.17)和性能泛函(1.6.19)要求从容许控制U(t)Rm中确定最优控
47、制U*(t),使系统(1.6.17)从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函(1.6.19)达到极小值。这是波尔扎问题,又称为复合型最优控制问题。由于给定的端点条件不同,上述最优控制问题的解将不同。下面根据三种不同的端点条件,分别予以讨论。现在学习的是第78页,共94页 1.终端时刻tf固定,终端状态X(tf)自由的情况 构造辅助泛函为:若令哈密顿函数为(1.6.20)(1.6.21)并对式(1.6.20)积分号内第三项进行分部积分,则辅助泛函变为现在学习的是第79页,共94页(1.6.22)求上式对状态变量X(t)和控制变量U(t)的变分,得(1.6.24)由于泛函J0达
48、到极值的必要条件为(1.6.23)由于X(t0)=0,X(tf)0,X(t)0,U(t)0,则由式(1.6.23)和(1.6.24)可得上述波尔扎型最优控制问题的解应现在学习的是第80页,共94页满足的必要条件为这些关系与拉格朗日型最优控制问题的完全相同,所不同的只是横截条件,即协态变量的终端值现在学习的是第81页,共94页 2.终端时刻tf固定,终端状态X(tf)受约束的情况 设终端状态受到如下等式的约束(1.6.25)其中为r(当L=0,rn-1;当L0,rn)维向量,即这时,终端状态X(tf)即不是固定的,也不是完全自由的,只能在终端流型(1.6.25)上变动。在构造辅助泛函时,应考虑终
49、端约束条件(1.6.25),为此,需要引入待定的拉格朗日乘子向量于是,所构造的辅助泛函为现在学习的是第82页,共94页考虑到哈密顿函数为(1.6.26)并对式(1.6.26)积分号内第三项进行分部积分,则辅助泛函变为现在学习的是第83页,共94页求J0对状态变量X(t)和控制变量U(t)的变分,得考虑到 J0=0,X(t0)=0,X(tf)0,X(t)0,U(t)0,则得到所述最优控制问题的解应满足的必要条件现在学习的是第84页,共94页这些关系与1中的完全相同,所不同的是状态变量的终端约束条件和横截条件现在学习的是第85页,共94页 3.终端时刻tf可变,终端状态X(tf)受约束的情况 设终
50、端状态X(tf)受到式(1.6.25)的约束条件。辅助泛函为其中这时,不仅存在最优控制和最优轨线,还存在一个最优的终端时刻。最优控制和最优轨线应满足2中的必要条件,即(1.6.27)现在学习的是第86页,共94页 为了确定最优的终端时刻,令式(1.6.27)对时间t的全导数等于零,即得代入现在学习的是第87页,共94页(1.6.28)式(1.6.28)也称为横截条件。定理1.6.2 设系统状态方程为 则为将系统从给定的初态的某个终态X(tf),其中 tf是可变的,并使性能泛函转移到满足约束条件达到极小值的最优控制应满足的必要条件。现在学习的是第88页,共94页 (1)设U*(t)是最优控制,X