《智能控制学习控制迭代学习控制.pptx》由会员分享,可在线阅读,更多相关《智能控制学习控制迭代学习控制.pptx(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1/51迭代学习控制的基本思想线性时变系统的迭代学习控制一类非线性动态系统的迭代学习控制多关节机械手的迭代学习控制迭代学习控制面临的挑战6.1 迭代学习控制第1页/共50页2/51基本思想基本思想 迭代学习(Iterative learning)的基本思想在于总结人类学习的方法,即通过多次的训练,从经验中学会某种技能。迭代学习控制是智能控制中具有严格数学描述的一个分支。它以极为简单的学习算法,在给定的时间区间上实现未知被控对象以任意精度跟踪某一给定的期望轨迹的控制问题。第2页/共50页3/51特点特点控制器在运行过程中不需要辨识系统的参数,属于基于品质的自学习控制。这种控制方法特别适用于具有重
2、复运行的场合。它的研究对诸如机器人那样有着非线性、强耦合、难以建模又需要高精度轨迹控制的场合是非常有意义的。第3页/共50页4/51迭代学习控制的基本思想线性时变系统的迭代学习控制一类非线性动态系统的迭代学习控制多关节机械手的迭代学习控制迭代学习控制面临的挑战6.1 迭代学习控制第4页/共50页5/51线性时变系统的迭代学习控制线性时变系统的迭代学习控制 考虑DC伺服驱动控制的速度控制系统。第5页/共50页6/51数学模型数学模型假设电枢电感足够小,而且忽略机械摩擦。则系统可以简化为一阶系统。y(t)、v(t)分别表示电机角速度和输入控制电压;K-力矩系数Tm-电机的时间常数 第6页/共50页
3、7/51求解求解简化模型a=(1+AB/K)/Tm;b=A/KTm。求解得:第7页/共50页8/51迭代学习的引入迭代学习的引入假设期望速度特性 足够光滑,可以由离散数据来拟合。则初始控制的系统误差为根据则下一次校正后的输出控制电压可取:第8页/共50页9/51迭代过程迭代过程第9页/共50页10/51收敛性分析收敛性分析对于所有的k,取;第10页/共50页11/51其中可见,前述条件下,迭代学习的过程是收敛的。第11页/共50页12/51参数的替换参数的替换对于参数b预先不知道的情况,可以用另一近似值来代替。只要满足以下不等式:迭代学习公式仍是收敛的。具体证明请见定理6-1。第12页/共50
4、页13/51线性时变系统的一般情况线性时变系统的一般情况 系统模型解为状态转移矩阵。第13页/共50页14/51迭代学习公式迭代学习公式其中 是一个给定的矩阵函数。第14页/共50页15/51定理定理6-1:收敛性定理:收敛性定理假设 。若给定的任一初始输入矢量u0(t)在0,T区间内连续。则存在正常数和0使得范数 定义:rr的矩阵F=(fij)范数F定义 第15页/共50页16/51证明证明 定义一矢量范数则有:第16页/共50页17/51两边同乘e-t,并取范数可得:第17页/共50页18/51其中可知,所以,总可以选择较大的,使得:从而保证了时,。第18页/共50页19/51状态空间表示
5、状态空间表示 如果矩阵B,C是定常、BC是可逆的,只需满足以下条件:即可满足迭代学习的收敛性。第19页/共50页20/51迭代学习控制的基本思想线性时变系统的迭代学习控制一类非线性动态系统的迭代学习控制多关节机械手的迭代学习控制迭代学习控制面临的挑战6.1 迭代学习控制第20页/共50页21/511.问题的提出问题的提出 考虑一个二阶非线性动力学系统可化为一阶微分方程组 简记为:第21页/共50页22/51假设xd(t),t0,T是系统的一个状态矢量,且属于R2n有界闭合子集W。则控制的问题就是寻找分段连续的控制输入uj(t)序列,使得系统的状态xj(t)跟随xd(t),其跟随误差小于某一给定
6、的精度,即 其中j表示第j次迭代。第22页/共50页23/51被控系统进行控制的条件被控系统进行控制的条件系统的运行条件如采样频率、初始的控制结构是固定的;系统不确定性时,在时间0,T内是重复作业的;函数f()、g()满足Lipshitz连续;g(x(t),t)在t0,T内是齐次和正定函数。第23页/共50页24/51函数f()、g()满足Lipshitz连续,即:其中(t)、(t)为有界的正函数,表示欧几里德范数,定义为:Lipshitz连续连续 第24页/共50页25/51g(x(t),t)在t0,T内是齐次和正定函数,即满足:00,b2,v,v=a+(2+1/a)(m+m|ud|m)第3
7、0页/共50页31/51精度分析精度分析定理(6-3)表明了系统的最大跟踪误差与的大小成正比。因此只要控制序列 在整个时间域0,T内收敛于,则系统的跟踪误差可以达到任意精度。这样,系统的轨迹跟踪控制问题就归结为寻求在时间域0,T上一致收敛于 的前馈输入控制序列的问题了。第31页/共50页32/51梯度法梯度法定义指标函数应用梯度法我们得到第j次迭代计算的公式:的取值范围必须满足00 (2-)db-1-(r0+2a/1)=l20 第35页/共50页36/51其中 p=min(al1,l2);q=(m+mu0)/1 。则新的迭代学习策略是收敛的,即:其中 目标函数定义为:第36页/共50页37/5
8、1定理6-5:如果状态误差取:xd(t)-xj+1(t)学习规则改为:则 a,b,d的取值满足下列不等式:(2+)db-1-2r0=l10 (2+)db-1-(r0+2a/1)=l20 系统收敛。另一种迭代方法的收敛性另一种迭代方法的收敛性第37页/共50页38/51迭代学习控制的特点迭代学习控制的特点不需要精确的模型参数,只要一些模型的极限参数;对周期性的系统扰动完全可以通过迭代学习来克服,对随机扰动也有较强的抑制能力。学习控制的结构相当简单,学习的信息只须利用线性反馈控制量。学习算法的收敛条件非常简单,具有有界的不确定性。第38页/共50页39/51迭代学习控制的基本思想线性时变系统的迭代
9、学习控制一类非线性动态系统的迭代学习控制多关节机械手的迭代学习控制迭代学习控制面临的挑战6.1 迭代学习控制第39页/共50页40/51多关节机械手的迭代学习控制多关节机械手的迭代学习控制 固定负载下的机器人迭代学习控制 负载经常变化下的机器人轨迹跟踪的迭代学习控制方法 第40页/共50页41/51机械手动力学方程机械手动力学方程 D(q):惯量矩阵;:非线性哥氏力和向心力;G(q):重力项;a:不确定力矩项(包括磨擦力矩等);:各关节的输入力矩。第41页/共50页42/51状态方程状态方程取第42页/共50页43/51迭代学习策略迭代学习策略 第43页/共50页44/5110次迭代学习控制效
10、果次迭代学习控制效果期望轨迹曲线实际系统响应第一关节第一关节第44页/共50页45/5110次迭代学习控制效果期望轨迹曲线实际系统响应第二关节第二关节第45页/共50页46/5110次迭代学习控制效果期望轨迹曲线实际系统响应第三关节第三关节第46页/共50页47/51 负载经常变化下的机器人迭代学习控负载经常变化下的机器人迭代学习控制制 一种基于知识库的改进迭代学习算法 改进迭代学习算法的目的在于如何尽快地得到准确的前馈补偿力矩d,当负载发生变化时,它的基本思想是利用一组已知的、按一定规则排列的、与d相关的数据库,并通过推理机制来求得当前负载m下准确的前馈补偿力矩d(m)。能经过一个周期的运行达到高精度跟踪控制的目的。第47页/共50页48/51迭代学习控制的基本思想线性时变系统的迭代学习控制一类非线性动态系统的迭代学习控制多关节机械手的迭代学习控制迭代学习控制面临的挑战6.1 迭代学习控制第48页/共50页49/51迭代学习控制面临的挑战迭代学习控制面临的挑战向一般系统的推广问题;学习收敛的速率问题;要求初始状态在期望轨迹上;如果期望轨迹发生变化,学习必须重新进行。第49页/共50页50/51感谢您的观看!第50页/共50页