《神经网络讲义第四章精品文稿.ppt》由会员分享,可在线阅读,更多相关《神经网络讲义第四章精品文稿.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、神经网络讲义第四章第1页,本讲稿共52页引言引言vNN在控制器设计中的几条路v存在的几个问题v本章简介第2页,本讲稿共52页v与已有控制结构的结合,如:NN自适应控制(NN MRAC、NN STR:直接、间接)、NN-PID、NN-IMC(PC)v与已有控制方法的结合,如:NN-Fuzzy控制、NN-expert控制vNN特有的控制器设计方法,如:监督学习控制(SNC)、评价学习控制器(ACE)、无模型的控制器设计方法(单个元的或网络的,即按误差调整的)第3页,本讲稿共52页v缺乏一种专门适用于控制的动态神经网络(目前方法:静处理动,不可避免的带来差分方程定阶问题)v稳定性、鲁棒型分析困难第4
2、页,本讲稿共52页v学习控制(监督)vNN自适应(MRAC和STR)vNN-PIDvNN-无模型控制vNN-Fuzzy(思想)v有关稳定性的一些成果第5页,本讲稿共52页监督学习NN控制器v问题的提出vSNC设计:控制系统结构 思路 实例第6页,本讲稿共52页当对象动力学特性未知时系统可控,人的知识如何传递给控制装置?解决思路解决思路:v利用专家控制、规则控制v采用监督(导师)NN控制(SNC)第7页,本讲稿共52页v弄清人在控制过程中利用了过程或人本身的何种信息v构造NNC 考虑问题:何种网络、结构(层数)参数、训练方法(实时性、收敛性)vSNC的训练过程 在人进行控制时,将控制信号及过程收
3、集起来以此为数据 训练可以是离线的也可以是在线的,即人一边控制NNC一边学习 训练结束后,网络实现了以参考信号及以往控制轴上y为网络输入,当前控制u为网络输出的I/O映射,即可实现正确控制 第8页,本讲稿共52页小车倒立摆系统的控制v数学model:令 为小车位置、速度、杆角度、角速度 第9页,本讲稿共52页NN控制器为四层BP网4-16-4-1结构,S型作用参数训练用数据:输出 输出值 控制区间仿真时用:导师为线性或非线性的控制律 取M=1kg,m=0.1kg,f=5.1kg/s,g=9.81m/第10页,本讲稿共52页线性控制为状态反馈:训练20000次后NN可实现线性律 K=11.01,
4、19.68,96.49,35.57非线性:80000次 反馈线性化及解数据格人控制:40000次 训练结束后,HSNC比 人本身操作更好 训练后,SNC还可继续在线学习以 适应新的扰动、取得新的控制策略样本、增强对系统的全面了解。第11页,本讲稿共52页问题及思路v问题:控制不成功,SNC为何v思路:引入评价学习的NNC,由ASE加上ACE构成第12页,本讲稿共52页NN-MRACvMRAC的思路vNN MRAC 1)NN控制器 2)控制框图 3)例第13页,本讲稿共52页一般控制系统可包含前馈和反馈控制器两种(前馈:由期望输出产生控制信号,反馈:由期望与实际之差产生控制信号)vMRAC思路是
5、给定期望响应的动态模型,利用期望与实际输出之差去改变调节器参数,使对象+控制器形成的闭环系统对给定信号的响应与参考模型一致。当给定模型稳定时,闭环系统稳定并改善了动态响应。调节机构设计:可利用Lyapunov或Popov方法以保证闭环的稳定第14页,本讲稿共52页NN控制器v辨识+再现控制器设计(淡化学习),间接控制v误差直接改变控制器参数(特定学习),直接控制 淡化学习+自适应 NN MRAC第15页,本讲稿共52页NNI-辨别器 NNC-控制器 NNI-对象辨识,目的、预报对象输出v做法:v准则:NNC-使 为小数 准则:控制周期 辨别周期 按常规自适应方法选取 第16页,本讲稿共52页v
6、系统 NNI:BP网 2-20-10-1结构 NNC:此时 满足 第17页,本讲稿共52页神经网络自校正控制vSTR基本思想v对象描述v一阶系统的一个实例第18页,本讲稿共52页基本思想v如果系统环境和模型的参数已知,则可采用适当方法获得某种意义下的最优控制器;若系统参数未知,则可用在线参数估计值来代替真实值(确定性等效原则)设计控制器,实现在线监控。第19页,本讲稿共52页对象描述vSISO可反馈线性化的系统设 逆存在,、已知在 未知时,用 逼近第20页,本讲稿共52页v例 引入NN NN的一步预板模型为:取:则控制器为:第21页,本讲稿共52页v 调整准则令 ,系统第22页,本讲稿共52页
7、v权系数修正公式第23页,本讲稿共52页v设隐层为 或 ,或 则 第24页,本讲稿共52页v仿真例:一个元,1-10-10-1结构 初值 逐渐减小 初始振荡,9000步以后 2500步后仍有轻微振荡第25页,本讲稿共52页NN直接自适应控制v基本概念v一种NN直接STC方案1.描述2.问题3.训练方案4.特点v基于单个自适应神经元的控制第26页,本讲稿共52页基本概念v直接自适应控制即直接根据对象的知识来调整控制器的内部参数,使得对象的输出误差尽量小 间接:辨识模型 直接:不辨识 两种方案:1.基于MRAC 2.基于STC第27页,本讲稿共52页v 只要 维持足够高,可描述任意非线性系统 设:
8、NN为BP网络 训练规则:为期望的对象输出 时对应的输入第28页,本讲稿共52页v问题希望 ,此时 应确知,但P未知,而为训练NNC,又该知v解决思路:将NNC与P看成一体,NN的最后一层(或几层)固定不变,用来描述对象,训练指标相应修改成 Q为加权阵,Q0 选择 使 第29页,本讲稿共52页梯度法v设控制器参数 空间 计算 时,当 为网络最后一层(描述对象的)时,用下法 为对象的Jacobian阵,未知第30页,本讲稿共52页v将 ,对于网络最后一层最后可得其它各层仍按标准BP算法修正第31页,本讲稿共52页v无特定学习阶段,即没有依赖于辨识,直接控制效果设计控制器v控制参数调整为依赖时间的
9、自适应过程 例:小车倒立摆控制(动力学方程同前)Rouge-kutta法求解,步长0.001秒 未时,失败 该系统NMP系统 4层BP 4-4-4-1结构,初始条件,随机 2040次后,可使平衡标度15分钟第32页,本讲稿共52页v单个自适应神经元描述v系统结构 对r为定值系统v学习方法vP为线性系统时稳定性分析第33页,本讲稿共52页v督促学习第34页,本讲稿共52页v监督与Hebb之组合 a.b.增加小误差时 的敏感性 第35页,本讲稿共52页v思想 第36页,本讲稿共52页v设 控制器等效为:将 第37页,本讲稿共52页v即:vRoche定理 若在复平面环路上有 在此环路上有相同数目的零
10、点第38页,本讲稿共52页v设v在 第39页,本讲稿共52页NN PIDv 直接NN PID1.常规NN PID 2.NN PIDv 间接NN PID1.结构2.学习3.算法流程第40页,本讲稿共52页第41页,本讲稿共52页NN PIDv采用BP网络 3-6-1结构 输入 学习方法,标准BP算法 问题:要使网络之期望值不知 先用 代替 输出层:第42页,本讲稿共52页v隐层:v讨论:1)本法不一定能保证系统稳定性与收敛性 2)实时控制时,用到 计算慢第43页,本讲稿共52页两个NN:NNC PID;NNI 辨识器vNNI:设 3层BP网 第44页,本讲稿共52页vNNC第45页,本讲稿共52
11、页v学习第46页,本讲稿共52页算法流程1.(-0.1,0.1)随机值初始化NNC,NNI2.计算3.计算NN PID之4.修正NNI权值5.修正NNC权值6.1+t t,到2第47页,本讲稿共52页NN-Fuzzy控制vFuzzy控制的基本思想做法v间接NN PIDv一个实例第48页,本讲稿共52页v基于人的经验,依据 进行表格化处理,控制规则为:if A then B形式,分为大、小、快、慢等,规则为:if and then A选作E,B选作EC(变化率)一般分成210档,通常取7档8档,NL,NM NS,NO PO PS PM PL具体计算时按隶属关系集,由具体数值 得到属于何种状态,控
12、制变量也如此处理第49页,本讲稿共52页美国Kosko教授为权威的几种做法vNN模拟Fuzzy系统中的各个模块,为Fuzzy化、推理、决策等vNN中引入Fuzzy逻辑,使之具有直接处理Fuzzy信息的能力 例:NN的加权求和变成“并”与“交”等形 式的Fuzzy逻辑运算,称为模糊神 经元第50页,本讲稿共52页由两个NN组成vNNC:PID控制器 单层网络:vNNI:3层网络 输入:输出:隐层:第51页,本讲稿共52页小车倒立摆问题v 和 为观测量;为控制量;为垂线右边,反之为 ;方向向右,反之为 ;的作用为抵消 为精确变量时,则 为精确数值 为模糊变量时,为语言值NB:negative Big,NM:negative middleNS:negative small ZE-zeroPS:positive small,PM:positive middlePB:positive big 隶属函数范围,交叠范围为25%左右为益第52页,本讲稿共52页