《倒立摆智能控制算法的研究毕业论文.doc》由会员分享,可在线阅读,更多相关《倒立摆智能控制算法的研究毕业论文.doc(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 . 毕业论文倒立摆智能控制算法的研究摘要倒立摆是典型的多变量、非线性、强耦合的自然不稳定系统。本设计选用单级旋转倒立摆,采用模糊控制的智能算法进行倒立摆的稳定控制研究。为了克服模糊控制中存在的不足之处,引入了线性二次最优控制和状态变量融合函技术。论文主要工作如下:采用用拉格朗日方程建模法建立旋转式倒立摆系统数学模型,并对其线性化得到系统的状态方程。首先利用线性二次最优控制对倒立摆进行了稳定控制仿真研究,求得最优状态反馈阵;为了解决控制中的“规则爆炸”问题,引入了融合技术。本文所使用的融合技术是根据线性二次最优控制原理,计算出倒立摆系统的状态反馈矩阵,生成转换状态向量的融合函数,采用融合技术设
2、计 “线性融合函数”将最优控制理论与模糊控制算法的结合起来设计模糊控制器。用Matlab/Simulink工具对旋转倒立摆模糊控制系统进行仿真研究,最后结果证明:所设计的模糊控制器可以实现对倒立摆系统的稳定控制。关键词单级旋转倒立摆;线性二次最优控制;状态融合函数;模糊控制III / 67AbstractInverted pendulum is a typical,multi-variable. inverted pendulum non-liner, Intelligent algorithm based on fuzzy control research on stability of I
3、nverted Pendulum control. In order to overcome the deficiencies in the fuzzy control, and introduces linear quadratic optimal control and status variables fusion technology. Main work of the thesis is as follows:The mathematical model of the inverted pendulum with Lagrange equation is deduced.First,
4、 by using linear quadratic optimal control Simulation Study on stability control of Inverted Pendulum, find the optimal State Feedback matrix ;The fusion techniques used in this article is based on the linear quadratic optimal control theory, to calculate the Inverted Pendulum System State Feedback
5、matrix, the resulting conversion integration of the state vector functions.And then uses the fusion design linear combination of functions The combination of fuzzy control algorithm of optimal control theory and design of fuzzy controller.With matlab/simulink tool Simulation Study on fuzzy control s
6、ystem of Rotary Inverted Pendulum, the final results proved that the design of fuzzy controller can be achieved on stability control of Inverted Pendulum systems.Keywordsrotational inverted pendulum; linear quadratic optimal control;State Fusion function; fuzzy control目 录摘要IAbstractII第1章绪论11.1 课题背景1
7、1.2 倒立摆研究发展现状11.3 倒立摆系统的控制算法21.3.1 经典控制理论的方法21.3.2现代理论控制方法21.3.3 智能控制方法31.4 本课题研究的主要容5第2章倒立摆系统的定性分析和数学建模62.1 倒立摆系统的特性分析62.2 倒立摆系统的建模72.2.1 旋转倒立摆的控制结构分析72.2.2 数学模型的建立82.3本章小结11第3章倒立摆LQR控制器的设计与仿真123.1 LQR控制器的设计与调节123.2 LQR控制器的仿真研究143.3本章小结17第4章模糊控制原理与模糊控制器设计184.1 模糊控制理论的基本知识184.1.1模糊控制的数学基础184.1.2模糊控制
8、系统的特点194.2模糊控制器基本原理204.3 模糊控制器设计214.3.1 模糊控制器的结构设计224.3.2 精确量的模糊化方法234.3.3 模糊推理244.3.4 模糊量的去模糊化264.4 本章小结27第5章倒立摆系统模糊控制器的设计与仿真295.1 状态变量融合设计295.1.1状态变量融合技术295.1.2.最优状态变量合成函数的设计295.2 基于变量融合模糊控制器的设置315.3 量化因子和比例因子355.4 基于变量融合模糊控制器的仿真365.5本章小结39结论41参考文献42致45附录1 开题报告46附录2 文献综述50附录3 中期报告.52附录4外文译文与其复印件55
9、第1章 绪论1.1 课题背景杂技演员顶杆表演是人们熟悉的一种表演形式,不仅需要精湛的技艺,更重要的是它的物理机制与控制系统的稳定性密切相关。它深刻地揭示了自然界的一种基本现象,即一个自然不稳定的被控对象,通过人的直觉的、定性的控制手段,就可以具有良好的稳定性。倒立摆系统的控制策略和杂技运动员顶杆平衡表演的技巧有异曲同工之处1。 倒立摆控制是一个经典的控制平衡问题。许多抽象的控制概念如控制系统的稳定性、可控性、系统收敛速度和系统抗干扰能力等,都可以通过倒立摆系统直观的表现出来2。倒立摆系统是一种高阶次、不稳定、多变量、非线性、强耦合的系统,是进行控制理论研究的典型实验平台。对倒立摆的研究不仅有深
10、刻的理论意义,还有重要的工程背景3。工程中的许多控制问题,都和倒立摆的控制有很大的相似性,如海上钻井平台的稳定控制、卫星发射架的稳定控制、火箭姿态控制、飞机安全着陆、化工过程控制、步行机器人的稳定控制等都可以用倒立摆来进行模拟。可见,倒立摆控制的研究具有重要的理论与实际意义8。1.2 倒立摆研究发展现状国外对倒立摆系统的研究始于上世纪五十年代,麻省理工学院机电工程系的控制论专家根据火箭发射助推器原理设计出一级倒立摆试验装置4。1995 年,Tetsuhiko Yamamoto,Shin-ichi Hanada 等人提出了应用遗传算法优化神经网络控制单级倒立摆制9。1996 年,Lin ZL.,
11、 Gutmann M, Shamash YA,Saberi A 提出采用线性状态反馈方法控制单级倒立摆12。2002 年,Seong Ik Han, Jong Shik Kim, Jae Weon Choi 应用非线性鲁棒 H 控制平行倒立摆。国的研究工作是从八十年代开始的, 1982 年,交通大学采用最优控制和降维观测器完成了二级倒立摆系统的研制和控制15。国飞,基于 Q 学习算法和 BP 神经网络进行倒立摆控制,实现了神经网络在控制上的应用。王卫华在 1999 年,运用专家模糊控制,实现了单级倒立摆的动态控制。中国的理工大学洪兴教授领导的“模糊系统与模糊信息研究中心”暨复杂系统智能控制实验
12、室采用变论域自适应模糊控制成功地实现了四级倒立摆13。是世界上第一个成功完成四级倒立摆实验的国家。2003 年 将变论域自适应模糊控制理论结合最优控制理论和经典 PID 控制理论的某些特点形成了具有高维PID 调节功能的变论域自适应控制理论,实现了对平面三级倒立摆系统的实物控制。2005 年国防科技大学罗成教授等人利用基于 LQR 的模糊插值实现了五级倒立摆的控制28。现在的神经网络与预测控制算法的接合理论,拟人智能控制理论,云模型控制理论。由许多现代控制理论的研究人员一直将它视为典型的研究对象,不断从中发掘出新的控制策略和控制方法,相关的科研成果在航天科技和机器人学方面获得了广阔的应用。近年
13、来,更加复杂多种形式的倒立摆系统成为控制理论研究领域的热点。1.3 倒立摆系统的控制算法早期的倒立摆控制大多采用状态反馈,随着智能控制理论的发展,人们逐渐将模糊控制算法、神经网络理论等智能控制理论用于控制倒立摆。目前,倒立摆常见的控制方法有如下几种:1.3.1 经典控制理论的方法一级倒立摆系统的控制对象是一个单输入两输出的非最小相位系统,它提供了用经典控制理论解决单输入多输出系统的控制方法。根据对系统的力学分析,应用牛顿第二定律,建立倒立摆非线性的运动方程8,并进行线性化,拉氏变换,得出传递函数,从而得到零、极点分布情况,根据使闭环系统能稳定工作的思想设计控制器。为此,需引入适当的反馈,使闭环
14、系统特征方程的根都位于左平面上。用经典控制理论的频域法设计非最小相位系统的控制器并不需要十分精确的对象数学模型,因为只要控制器使系统具有充分大的相位裕量16,就能获得系统参数很宽围的稳定性。但是,由于经典控制理论本身的局限性,它只能用来控制一级倒立摆,对于复杂的二级、三级倒立摆却无能为力。1.3.2现代理论控制方法用现代控制理论方法的前提是倒立摆在平衡点附近,偏移很小,系统可以近似用线性模型来描述。将倒立摆系统的非线性化的模型在系统平衡点附近进行近似线性化处理得到线性化的模型,然后再利用线性系统控制器设计方法得到控制器。用这类控制方法对于一、二级倒立摆进行稳定控制,可以得到较好的效果,但对于三
15、级与三级以上的倒立摆系统,有很大局限性。现代控制的典型方法有状态反馈控制、LQR控制算法20等。状态反馈控制主要是用H状态状态反馈来实现的。通过对倒立摆的物理模型进行分析,建立倒立摆的动力学模型,然后使用状态空间理论推导出状态方程和输出方程,应用H状杰反馈和Kalman滤波相结合的方法,对倒立摆讲行控制。1.3.3 智能控制方法智能控制是控制理论发展的高级阶段,主要解决传统方法难以实现的复杂系统的控制问题,其中包括智能机器人系统,复杂的工业过程控制系统,航天航空控制系统,社会经济管理系统以与交通运输系统等。而基于包含模糊逻辑、人工神经网络和遗传算法22在的智能控制是当前自动化学科中最火热的研究
16、领域之一。(1) 神经网络控制神经网络能够任意充分地逼近复杂的非线性关系,能够学习与适应严重不确定性的系统的动态特性,所有定量与定性的信息都等势分布贮存在网络的各种神经元,故有很强的鲁棒性和容错性。但神经网络控制方法的局限性在于缺乏一种专门适合于控制问题的动态神经网络,而且多层网络的层数、隐层神经元的数量、激发函数类型的选择缺乏指导性原则。 神经网络的权系数常采用反向传播算法来学习,BP算法15是沿着梯度下降来指导搜索,易于陷入局部极小值点,而且学习时间长甚至达不到学习的目的,求解精度不高8。(2) 模糊控制模糊控制理论是智能控制中常用的一种算法,其产生于二十世纪六十年代,是美国加利福尼亚U.
17、C.B erkkley学校的自动控制理论专家扎德教授首先提出的,主要是为了克服过程本身的不确定性、不精确性,因此在处理复杂系统的大时滞、时变与非线性方面显示出了极大的优越性。无论是经典控制理论还是现代控制理论,均需预先建立被控对象的数学模型。然而,在实际的工业过程中,由于大多数系统过于复杂,尤其是那些非线性和时变性的不确定系统,它们的传递函数或状态方程难以用传统的定量分析方法加以实现。即使采用“系统辨识”理论,通过各种测量手段和数据处理方法来获得系统的数学模型,往往也是一种近似,很难获得系统运动状态的传递函数或状态方程。有时为了数学上处理方便,往往简化系统的模型,采用模型近似化、线性化、高阶系
18、统降阶手段6。这样虽然在处理问题时比较方便,但是利用这样的数学模型进行系统分析和控制的时候,其控制结果很难令人满意,甚至会产生错误的结论或控制失败,况且并不是所有的经典的模糊控制器利用模糊集合理论将专家知识或操作人员经验形成的语言规则直接转化为自动控制策略,其设计不依靠对象精确数学模型,二是利用器语言知识模型进行设计和修正控制算法。实验证明,模糊控制的方法对一级、二级倒立摆有较好的控制效果。多级倒立摆是一个多变量系统,一般采用多个模糊控制器来实现。但这样的控制方法,控制器多,控制规则复杂,可调参数也多,实现困难。可见,常规的模糊控制器具有很大局限性。研究表明,将现代控制理论用于模糊控制器中处理
19、多变量问题是一种可行的办法,如将倒立摆系统在平衡点附近进行线性化,然后利用现代控制理论得到各状态变量之间的关系,形成综合误差和综合误差变化率,在此基础上构造模糊控制器。采用模糊控制理论控制倒立摆时,常将模糊控制与其他的智能控制算法相结合,如将模糊控制与神经网络控制相结合,用遗传算法对模糊控制器隶属度函数进行优化等。 (3) 拟人智能控制其基本思想就是在控制过程中,利用计算机模拟人的控制行为19,最大限度地识别和利用控制系统动态过程所提供的特征信息,进行启发和直觉推理,在线推理确定控制策略,从而实现对缺乏数学模型的控制对象进行有效地控制。这在具有很强非线性特性的倒立摆系统研究中具有非常明显的局限
20、性,大量的研究和实践都已证明,这种近似处理方法的控制效果是不能令人满意的。传统常规控制理论无论从处理方法和手段来看,都无法满足非线性领域应用的要求。要解决倒立摆系统的控制问题,需要新的方法和思路。而智能控制的方法,以与对人类智能活动的自然表达、模仿和应用,加之形象、直观、便于理解和使用,是非线性控制领域实用而有效的手段和方法。对于非线性的倒立摆系统模型,智能控制方法提供了简单有效的处理方法。1.4 本课题研究的主要容本论文的主要工作是研究旋转倒立摆系统的稳定控制问题,首先对倒立摆系统建模,然后用Matlab和Shaulink设计智能模糊控制系统进行控制仿真研究具体容如下:阐述了倒立摆系统控制的
21、研究发展过程和现状,利用拉格朗日方程建立旋转式倒立摆系统数学模型,对得到的动态方程在平衡点附近进行线性化处理,得出其线性化方程。利用线性二次最优控制对旋转倒立摆进行了稳定控制仿真研究,适当选取最优状态加权阵,求得最优状态反馈阵。运用最优控制方法设计最优状态变量合成函数,减少模糊控制器输入变量的维数,成功解决了“规则爆炸问题”,分析量化因子对控制效果的影响,提升模糊控制器的性能品质。利用Matlab/Simulink工具进行了旋转倒立摆模糊控制系统的仿真研究,从而成功实现旋转倒立摆模糊控制的仿真,仿真结果证明:所设计的模糊控制器可以实现旋转倒立摆系统的稳定控制。第2章 倒立摆系统的定性分析和数学
22、建模2.1 倒立摆系统的特性分析倒立摆系统按结构来分可分为直线型倒立摆系统、环形倒立摆系统平面倒立摆、复合倒立摆 ;按倒立摆的级数来分:有一级倒立摆、二级倒立摆、三级倒立摆和四级倒立摆,一级倒立摆常用于控制理论的基础实验,多级倒立摆常用于控制算法的研究,倒立摆的级数越高,其控制难度越大21。倒立摆的运动轨道可以是水平的,也可以是倾斜的。倒立摆的控制电机可以是单电机也可以是多电机。倒立摆系统是一种典型的电子机械系统,一般具有如下的特性:(1) 不确定性由于模型误差、机械传动间隙和各种阻力、量测噪声与机械传动过程中的非线性因素等使倒立摆系统带有不确定性。可以通过施加预紧力减少皮带或齿轮的传动误差、
23、涂润滑油减少阻力、利用滚珠轴承减少摩擦阻力等方法来降低倒立摆的不确定性。(2) 藕合性倒立摆小车与摆杆之间,多级倒立摆系统的摆杆与摆杆之间都有很强的藕合关系。这是可以采用单电机驱动倒立摆系统的原因,也使控制系统的设计、控制器参数的调节变得复杂。可以在平衡点附近进行解藕计算23。(3) 非线性 倒立摆系统是一个典型的非线性系统,可以在平衡点位置线性化后得到系统的近似数学模型,再据此数学模型进行控制。也可以利用非线性控制理论进行控制。倒立摆的非线性控制正成为研究的一个热点。(4) 开环不稳定型倒立摆有摆杆竖直向上和垂直向下两个平衡状态,其中垂直向下为自然稳定的平衡状态,垂直向上为绝对不稳定的平衡状
24、态,开环时微小的扰动都会使系统离开竖直向上的状态而进入到竖直向下的状态。(5) 欠冗余性 倒立摆控制系统采用单电机驱动,因而它有冗余机构。采用欠冗余设计目的是在不失系统可靠性的前提下节约经济成本或节约有效地空间。(6) 约束限制由于机构的限制,如运动模块行程限制,电机力矩限制等。为了制造方便和降低成本,倒立摆的结构尺寸和电机功率都尽量要求最小,行程限制对倒立摆的摆起影响尤为突出,容易出现小车的撞边现象。2.2 倒立摆系统的建模2.2.1 旋转倒立摆的控制结构分析控制器输入为旋臂相对零位的转角和摆杆相对零位的转角;控制器输出为直流伺服电机的电枢电压。因此,该系统是一个双输入单输出闭环控制系统。作
25、为系统的控制对象,单级旋转倒立摆由连接在直流伺服电机转轴上的水平旋臂和可白由摆动的摆杆组成,旋臂和摆杆之问以铰链相连接。倒立摆系统具有2个白由度,旋臂为定轴转动,摆杆为空间一般运动。由于受到铰链的作用,倒立摆杆只能沿圆周的切线方向摆动。此时,铰链上和直流电机转轴上的角位移传感器将检测到的角位移量,经过数据采集卡的A/ D转换送入控制计算机。再经过数据采集卡的D/ A转换以与功率放大器放大后加载于直流伺服电机,驱动旋臂在水平面转动,从而使摆杆保持倒立平衡姿态。倒立摆的控制目标:在倒立摆系统中,摆杆的位置有竖直向上和竖直向下两种平衡状态。二者的区别是竖直向下的状态(图1-1中B点)是稳定的平衡点,
26、而竖直向上的状态(图1-1中A点)是不稳定的平衡点。在不施加控制作用的情况下,只要施加微小的扰动就会使系统偏离平衡点A而振荡发散。在振荡过程中,由于存在空气阻力和机械摩擦力,系统将耗散能量,因此摆杆最终将回复到稳定的平衡点B。倒立摆平衡状态的分析如图1-1所示:图1-1 倒立摆平衡姿态倒立摆的控制目标就是使倒立摆在不稳定的平衡点附近的运动成为一个稳定的运动。控制夹角,在各自的零点附近变化,而整个摆处于一种动态平衡,要使摆静止在平衡位置是不可能的,只能是在平衡位置处的振荡。2.2.2 数学模型的建立 对旋转倒立摆系统建立数学模型是实现倒立摆控制的基础,下面对实验采用的单级旋转倒立摆系统的数学模型
27、进行分析。如图3所示,在忽略各种阻力和摩擦的条件下,旋臂和摆杆可以抽象为的2个匀质杆,其中旋臂长度为r,相对其水平方向零位的角位移为;摆杆质心与铰链距离为L,相对其竖直方向零位的角位移为。图2-1 系统模型分析由动力学理论,摆杆质心在x方向和y方向的速度分量为: (2-1) 方程组式(2-1)给出了完整的摆杆速度描述,应用Lagrange方程可推导出系统的动态方程。以旋臂所在水平面为零势能面,则系统的势能为摆杆的重力势能为:。系统的动能4部分构成,包括:旋臂在水平面的转动,摆杆在竖直平面的转动,摆杆质心沿x轴方向的速度、沿y轴方向的速度。对应的动能分量分别用T1, T2, T3, T4表示,因
28、此系统动能T为四者之和。旋臂在水平面的转动惯量: (2-2)摆杆在竖直平面的转动惯量: (2-3)摆杆质心沿x轴方向的转动惯量: (2-4)摆杆质心沿x轴方向的转动惯量: (2-5)所以系统的动能为: (2-6)设R为摆杆长度,由于L为R的一半,即R=2L。因此,摆杆对质心的转动惯量为: (2-7)将J2代入式(2-6),可推导出Lagrange函数: (2-8)应用Lagrange方程: (2-9)其中,L为拉格朗日算子,q为系统的广义坐标,T为系统的动能, V为系统的势能。Lagrange方程由广义坐标qi和L表示为:(2-10)在系统中,i=1,2,为系统沿该广义坐标方向上的外力,可得方
29、程组: (2-11) (2-12)其中为直流伺服电机的输出转矩, (2-13)在平衡点附近,假设和同1 rad相比很小,即则方程组可局部线性化为 (2-14) 由方程组式(2-14),代入上述相关参数,可以写出单级旋转倒立摆系统的线性(2-15)其中 (2-14)将系统各机械参数值代入式(2-16),得单级旋转倒立摆系统的线性化数学模型如下:(2-17)(2-18)上述推导过程中各参数的物理意义和数值单位如下表所示。表2-1 系统物理参数表摆杆质量M0.105kg 反向电势系数 7.710-3Vsrad-1 旋臂长度R 0.175m 变速器齿轮比 51 摆杆质心到转轴的距离L 0.165m 直
30、流电机电枢电阻 2.6 旋臂的转动惯量 2.010-3kgm2 粘性阻尼系数4.010-3Nsrad-1 摆杆对质心的转动惯量9.5310-4kgm2 直流电机效率 69%电机力矩系数 7.710-3NmA-1 变速器效率 90%2.3本章小结本章对倒立摆系统的特性进行分析。介绍了单级旋转倒立摆系统的结构和组成;并分析了其工作原理,明确了倒立摆系统的控制目标。然后利用Lagrange方程建立了倒立摆系统的数学模型,并在平衡位置对其进行附近线性化,得到倒立摆系统的状态方程。第3章 倒立摆LQR控制器的设计与仿真现代控制理论采用状态空间法,把经典控制理论的高阶常微分方程转化为一阶微分方程组,用以描
31、述系统的动态过程,这种方法可以解决多输入多输出问题,系统既可以是线性的、非线性的,也可以是定常的、时变的。现代控制理论有较强的系统性,从分析到设计、综合都有比较完整的理论和方法。最优控制理是现代控制理论的核心。其研究的主要问题是,根据已经建立的被控对象的数学模型,在一定的限制条件下,选择一个容许的控制规律完成所要求的控制任务,使系统规定的评价函数具有最优值的一种控制。这里的限制条件即约束条件是物理上对系统所施加的一些限制;评价函数即性能指标,是为评价系统的优劣所规定的标准,也称为目标函数;要寻找的控制规律也就是综合控制器。在实行具体的控制时,有必要选择某一种控制方式,是性能指标达到最优值,这就
32、是最优控制。线性二次型性能指标易于分析、处理和计算,使用线性二次型最优控制器进行控制系统设计和校正不必根据要求的性能指标确定闭环极点的位置,只需根据系统的响应曲线寻找出合适的状态变量和控制量的加权矩阵即可。线性二次型的性能指标可以通过Riccatti方程得到控制器的参数,而且随着计算机技术的发展,求解过程变得越来越简单,而且二次型公式可以导出易于实现和分析的线性控制规律。本章利用最优LQR控制器方法实现对倒立摆的稳定性控制。3.1 LQR控制器的设计与调节最优控制理论主要是依据庞德里亚金的极小值原理,通过对性能指标的优化寻找可以使目标极小的控制器。线性二次型(LQ-Linear Quadrat
33、ic)是指系统的状态方程是线性的,性能指标函数是对象状态变量和控制输入变量的二次型函数18。二次型最优控制问题就是在线性系统的约束条件下,选择控制输入位得二次型目标函数达到最小。其最终目标是为系统设计线性二次型调节器。 LQR调节器在工程实际中应用线性二次型最优控制是非常普遍的。这是因为,二次型性能指标有较为明确的物理概念;而且采用二次型性能指标在数学处理上比较简单,甚至能得到解析形式表达的线性反馈规律,可以实现状态的线性反馈。线性二次型控制理论是状态反馈系统设计的一种重要工具,它为多变量反馈系统的设计提供了一种有效的分析方法,可以适应于时变系统,能够处理扰动信号和测量噪声问题,并可以处理有限
34、和无限时间区间。最优控制 LQR 控制原理图如图所示。图3-1 最优控制器原理使用线性二次型最优控制器进行控制系统设计和校正的最大优点就是不必根据要求的性能指标确定闭环极点的位置,只需根据系统的响应曲线寻找出合适的状态变量和控制量的加权矩阵。并确定一个最优反馈控制律:(3-1)使得二次型性能指标最小,线性系统的状态方程为:(3-2)定义二次型性能指标为:式中,x(t)为系统的状态变量;,为起始时间与终止时间:,为状态终值约束的二次型,其中s为终态约束矩阵,为对称半正定矩阵;为运动状态约束的二次型,其中Q(t)为运动约束矩阵,为对称半正定矩阵;为控制输入约束的二次型,其中R(t)为约束控制矩阵,
35、为对称半正定矩阵7。其中Q、R决定了系统误差与控制能量消耗之间的相对重要性。综上所述,具有二次型函数的最优控制问题,实际上就是在于用较小的控制能量实现对较小的误差的控制,从而在能量和误差两方面实现综合最优控制。为使J最小,由最小值原理得到最优控制为: (3-3)式中,矩阵P(t)为黎卡提矩阵微分方程: (3-4)的解。如果令终止时间,则相应的二次型性能指标变为:(3-5)可得到的最优控制为: (3-6)式中,常数矩阵P为黎卡提矩阵代数方程 (3-7)的解。因此可得状态反馈向量: (3-8)由此可见最优控制器的设计的关键是选择合适的加权阵Q和R,并据此计算出黎卡提矩阵代数方程中的P,就可以求出反
36、馈增益K了。3.2 LQR控制器的仿真研究利用LQR方法设计控制器时,一个最关键的问题就是二次型性能指标的选取。加权矩阵Q和R的选取是在立足提高控制性能与降低控制能量消耗的折衷上考虑的。为了使问题简单,并且使加权阵Q和R的各元素有明显的物理意义,通常将加权阵Q和R选为对角阵。R是对控制量u的平方的加权,当R相对较大,意味着控制费用增高,使得控制能量较小,反馈减弱,当R相对很小时,控制费用较低,消耗能能量增多,反馈增强,系统动态响应迅速。LQR最优控制器有两个控制参数矩阵Q,R,通过选用不同的权重系数,来平衡状态向量和输入控制量的的权重。权重矩阵Q、R的各个参数是相互耦合的,一般情况下,Q和R
37、由工程人员根据经验主观臆断决定,不同的权重矩阵会得到不同控制效果。有时,为了达到使输入量和状态量在系统响应过程中都控制在许可的围这个目标,工程人员就需要多次试探不同的Q和R 矩阵才能达到满意的效果。而对于倒立摆这样的具有多个状态变量和输出变量的系统,其变量之间具有强耦合性,且各变量量纲不统一,通过试差法寻求系统的最优LQR控制器,使得各输出变量的超调量、调整时间达到最优化目标,是一件十分困难的工作。如果选取不当,则可能使求得的解不能满足实际系统的性能要求。在选取阵Q和R 阵时,主要考虑以下几个方面:(1) LQR 法中的Q和R 矩阵要正定的,加权矩阵的选取是立足于提高控制性能与降低控制能量消耗
38、的折衷考虑。Q阵中对角在线的元素与状态变量一一对应,数值越大,对应状态的响应速度越快,其他状态的响应速度变慢,该状态变。量对系统的影响越显著,所以一定要对各元素的之间的数值关系重点考虑。(2) 由于采用的是经过线性化以后的模型,为使控制器有效工作,应该使各状态尽量工作在系统的线性围之,这样就要求得到的各状态量不应该过大。(3) 也要注意加权矩阵R 矩阵不要过小,否则会导致控制量的增大。控制量太大,会超过系统执行机构的能力,R 阵也不要过大,否则控制作用太小会影响控制性能。基于以上考虑,可以通过改变Q矩阵中的非零元素来调节控制器以得到期望的响应,若某状态变量对系统的影响越显著,则矩阵中相对应的数
39、值取值越大。在SIMULINK中搭建的仿真模型如下所示:图3-2 LQR仿真模型通过多次仿真最后选取最优的,此时,的仿真波形如下图所示:图3-3 旋臂仿真图图3-4 摆杆的仿真图经过比较,加权矩阵Q,R的选取和系统动态响应之间的关系为:(1) Q不变R减小时,系统的调整时间和超调量减小,上升时间和稳态误差增大。(2) R不变Q变大时,系统的调整时间和超调量减小,摆杆角度变化也减小,上升时间和稳态误差增大。经过多次仿真最后取,.通过计算得最优反馈增益矩阵为3.3本章小结木章简要介绍了线性二次型最优控制LQR的相关知识,接着基于第二章所建立的旋转倒立摆的数学模型,详细讨论了LQR设计中主要参数Q阵
40、的选取,并给出了旋转倒立摆系统在平衡点处进行线性化所设计的LQR控制仿真,结果可得利用最优LQR控制器方法能实现对倒立摆的稳定性控制,控制效果比较好。第4章 模糊控制原理与模糊控制器设计 模糊控制是以模糊集合、模糊语言变量与模糊逻辑推理为基础的一种计算机数字控制。模糊控制不需要被控对象的精确数学模型,而是基于专家的知识和操作者的经验建立模糊控制模型,通过模糊逻辑推理完成控制决策过程,最后实现对被控对象的调节控制。从线性控制与非线性控制的角度分类,模糊控制是一种非线性控制;从控制器的智能性看,模糊控制属于智能控制的畴,而且它己经成为目前智能控制的一种重要而有效的形式。4.1 模糊控制理论的基本知
41、识4.1.1模糊控制的数学基础 模糊控制的基础是模糊数学,正是有了模糊数学这一数学工具,才把类的自然语言转化为计算机所能接受和处理的算法语言。1965年,美国自动控制专家扎德(Zadeh)首次提出一种完全不同于传统数学理论的Fuzzy集合论。建立在模糊集合理论基础之上的模糊数学完全有别于建立在经典集合基础之上的精确数学。经典集合理论要求一个事物对于一个集合要么属于,要么不属于,也就是二者必居其一,“属于”时为“真”,取为“1”,“不属于”为“假”,取为“0”,但是现实生活中,并非所有事物都可以用两种截然相反的状态来描述,绝对的突变是不存在的,差异往往可以通过中介形式表现出来,也就是具有“亦此亦
42、彼”的性质。扎德正是针对这一性质,在模糊集合理论中引入“隶属函数”的概念,利用这一概念来描述客观事物差异的中间过渡中的不分明性,即模糊性22。隶属函数表明事物x对一模糊子集A的隶属程度,它的取值围是在闭区间在O,l之间。由于隶属函数的取值在O,1之间可有无穷多个取值,而不同于特征函数的二值逻辑,因此隶属函数这一概念更加符合人类的自然语言。模糊集合理论的产生,为处理客观事物中业己存在的一类模糊性问题提供了强有力的工具,同时也适应科学发展的急迫需要。正是有了模糊数学这一基础,以与对控制性能要求日益高度化的紧迫情况下,模糊控制理论便应运而生了。4.1.2模糊控制系统的特点模糊控制系统具有如下优点:(
43、1) 模糊控制系统不依赖于系统精确的数学模型,特别适宜复杂系统(或者过程)与模糊性对象等采用,因为很难获得或者根本得不到它们的精确数学模型;(2) 模糊控制系统的人一机界面具有一定程度的友好性,有一定操作经验的而对控制理论并不熟悉的工作人员很容易掌握和学会,并且易于使用“语言”进行人一机对话,能够更好的为操作者提供控制信息;(3) 模糊控制系统的核心是模糊控制器,而模糊控制器均以计算机(微机、单片机等)为主体,其结构与一般的数字控制系统无异,模糊控制算法用件实现;(4) 模糊控制的知识表示、模糊规则和合成推理是基于专家知识或熟练操作者的成熟经验,并通过学习可以不断更新,因此,它具有智能性和自学
44、习性;(5) 鲁棒性好,无论被控对象是线性的还是非线性的,都能执行有效的制,具有良好的鲁棒性和适应性。模糊控制系统具有如下缺点:(1) 控制精度欠佳:稳态精度不够高。主要是由于模糊控制表的等级有限造成的,增加量化等级数目虽可提高精度,但查询表将过于庞大,往往会受物理条件限制;(2) 控制规则优化较困难:控制规则是反映人的经验的,它是人的智能活动的总结。但是,每个人的经验总是因人而异的。选择什么样的控制规则才是最合适的,目前还没有一套行之有效的解决办法; (3) 自适应能力有限:控制器对系统的一些参数不敏感,说明模糊控制器具,有较好的鲁棒性,自适应能力有限;(4) 当增大输入、输出变量数目和模糊
45、语言变量划分的等级时,模糊规则的。4.2模糊控制器基本原理模糊控制系统的接口与常规的数字计算机控制系统是相似的,不同之处在于它的控制器是模糊控制器。模糊控制器(Fuzzy Contro 11 er)是模糊控制系统的核心,它的基本结构如图4-1所示,主要有四部分组成,即模糊化接口、知识库、推理机、解模糊接口。数目便以级数的平方关系迅速增长,从而引起“规则爆炸”问题。图4-1 模糊控制器结构图1. 模糊化模糊化的作用是将输入的精确量转换成模糊化量,将输入数据转化成合适的语言值。其中输入量包括外界的参考输入、系统的输出或状态等。模糊化的具体过程如下:首先对这些输入量进行处理,以变成模糊控制器要求的输
46、入量;将上述已经处理过的输入量进行尺度变换,使其变换到各自的论域围;将己经变换到论域围的输入量进行模糊处理,使精确的输入量变成模糊量,并用相应的模糊集合来表示。2. 知识库知识库中包含了具体应用领域中的知识和要求的控制目标。它通常由数据库和模糊控制规则库两部分组成。数据库主要包括语言变量的隶属函数17,尺度变换因子与模糊空间的分级数等;规则库包括了用模糊语言变量表示的一系列控制规则。它们反映了控制专家的经验和知识。3. 模糊推理模糊推理是模糊控制器的核心,利用知识库的信息模拟人类的推理决策过程,给出适合的控制量。4. 清晰化清晰化的作用是将模糊推理得到的控制量(模糊量)变换为实际用于控制的清晰量。它包括以下两部分容;将模糊的控制量经清晰化变换,变成表示在论域围的清晰量;