《神经网络控制论精.ppt》由会员分享,可在线阅读,更多相关《神经网络控制论精.ppt(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、神经网络控制论第1页,本讲稿共10页二、神经网络控制器分类1、神经控制:以神经网络为基础而形成的独立智能控制系统;按作用不同分为两类:2、混合神经网络控制:利用神经网络学习和优化能力来改善传统控制的现代控制方法(如:自适应神经控制)。典型的神经网络的控制结构:特点:采用专家的控制经验来训练网络权值,一旦训练达到要求,网络训练结束。(1)导师指导下的控制器动力学系统专家经验控制器神经网络动力学系统图5-1导师指导下的神经控制结构图缺点:网络训练只涉及静态过程,缺乏在线学习机制。第2页,本讲稿共10页(2)逆控制器图a 直接逆建模动态系统 (F)e+yuNN-待辨识训练目的(即作用):通过学习建立
2、系统的逆模型。缺点:学习过程不是目标导向的。动态系统 (F)e+yuNN-正向模型eydyN待辨识期望输出图b 正逆建模正向模型作用:辨识作用优点:学习过程是有目标导向的(即e(k)受yd影响)。第3页,本讲稿共10页动态系统yde2yuNN1NN2+-e2V+-e1图c 直接逆控制(双网结构)NN1:前馈控制器(NNC);NN2:神经网络辨识器(NNI)要求:NN1、NN2结构相同(输入层、隐含层、输出层节点数目相同)第4页,本讲稿共10页第三节 神经网络控制的学习机制学习机制:通过什么学习方法来调整网络连接权值或网络结构,从而使网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出。学
3、习模式分类 监督式学习(有导师指导)增强式学习:(无导师指导)离线学习法在线学习法反馈误差学习法多网络学习法通过某一评价函数来对网络的权值进行更新第5页,本讲稿共10页非线性系统神经网络NN非线性系统神经网络NN监督式学习算法:一、离线学习法1、建逆模型:学习过程不是目标导向的。步骤:2、进行在线控制:学习结束后,把这个网络作为此系统的控制器直接连接在非线性系统的输入端从而构成一个逆动力学模型的控制系统。缺点:一旦离线学习结束,神经网络控制器NNC的学习能力就停止。因此这种控制系统在变化的环境下是无法适用的。性能指标为u-uc的平方误差极小,不能保证系统的最终性能yd-y的平方误差极小。逆模型
4、做控制器NNC第6页,本讲稿共10页二、在线学习法特点:控制器具备自适应、自学习的能力。神经网络非线性系统性能指标函数:梯度下降法(权值的学习算法)公式:要求:已知对象 信息(即系统模型已知)。其中:可利用广义的Delta规则来计算。第7页,本讲稿共10页固定增益控制器非线性系统神经网络NNC图5-22反馈误差学习结构特点:把反馈控制的输出作为网络控制器的训练误差信号;一旦训练结束,整个控制系统将主要由前馈神经网络控制器来实现,而反馈控制只用来解决诸如扰动之类的问题。组成:前馈控制器NNC(作用:加快控制速度)、反馈控制器。三、反馈误差学习法(对象 未知时采用)第8页,本讲稿共10页四、多网络学习法特点:针对未知非线性系统;用神经网络辨识的手段在线识别出未知系统的动态模型,并利用此模型进行神经网络控制的设计和学习。神经网络控制器非线性系统神经网络辨识器图5-23前向建模多网络控制结构图非线性系统神经网络控制器神经网络逆模型辨识器图5-24逆模型建模的多网络控制结构图第9页,本讲稿共10页习题和思考题(P87)4.如图424所示的多层前向传播神经网络,假设对期望输入 ,其期望输出为 。网络权系数初始值如图所示。试用BP算法训练此网络,并详细写出第一次迭代学习的计算结果。这里取神经元激励函数为 。图424 习题4图第10页,本讲稿共10页