《模糊控制与神经网络控制.pptx》由会员分享,可在线阅读,更多相关《模糊控制与神经网络控制.pptx(86页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、智能控制的研究课题有哪些呢?智能控制的研究课题有哪些呢?生产过程的智能监控生产过程的智能监控自动加工系统的智能控制自动加工系统的智能控制智能故障检测与诊断智能故障检测与诊断飞行器的智能控制飞行器的智能控制医疗过程智能控制医疗过程智能控制智能仪器智能仪器第1页/共86页7.17.1模糊逻辑的基本原模糊逻辑的基本原理理普通集合论基础知识普通集合论基础知识AxAxxA=,0,1)(m当有两个集合A和B,Aa1,a2,am,B=b1,b2,bn,从集合A中取出一个元素ai(i=1,2,m),从集合B中取出一个元素bi(i=1,2,n),把它们搭配起来就可以组成一个序偶,记为(ai,bj)。两个集合所有
2、元素序偶的全体则可以组成一个新的集合,这个集合称为集合A和B的直积。第2页/共86页例7.1当A a1,a2,B=b1,b2,b3时,其直积为关系是指客观世界中各事物之间的联系。在数学上关系用R表示。若R为集合A与集合B之间的关系,则对应于任意就有两种表示法:当和之间有某种关系时,记作当和之间没有某种关系时,记作。7.1模糊逻辑的基本原理第3页/共86页集合A和集合B之间的关系R可用有关的序偶表示,其中,例7.2在例7.1中,若有则说有关系R,且 R RB Bb b1 1b b2 2b b3 3A Aa a1 11 10 01 1a a2 21 11 10 0集合A与集合B的关系表 所有有关系
3、R的序偶可以构成一个R集合,因此,集合R是集合A和集合B的直积的子集,记为 。7.1模糊逻辑的基本原理第4页/共86页集合A与集合B的关系矩阵:关系运算的法则设R,S是集合A到集合B的两个关系,即它们的关系矩阵分别是和(1)并运算(2)交运算7.1模糊逻辑的基本原理第5页/共86页(3)补运算(4)合成运算如果R是集合A到B的关系,S是集合B到C的关系,设Q是由定义的关系,则称Q为R和S的合成关系,其相应的运算称为合成运算。7.1模糊逻辑的基本原理第6页/共86页例7.3关系矩阵则R和S的合成关系矩阵Q为7.1模糊逻辑的基本原理第7页/共86页模糊集合模糊集合在模糊集合中,用来描述元素x属于某
4、个模糊集合A到什么程度的子函数,称为隶属函数。记作1.01.0A A(x)x)xocbaA A(x)x)xoc1.01.0A A(x)x)xoA A(x)x)xocba7.1模糊逻辑的基本原理第8页/共86页正态形三角形单点形7.1模糊逻辑的基本原理第9页/共86页模糊集合的表示法模糊集合的表示法Zadeh表示法例7.4在研究人的年龄这个论域中,年龄分别为25岁、30岁和35岁的3个人是否属于“年轻人”集合的问题时,可设“年轻人”模糊集合A的隶属函数为7.1模糊逻辑的基本原理第10页/共86页模糊关系模糊关系例7.5设集合A表示甲、乙两个学生(x1电气工程学院学生,x2为建筑工程学院学生);集
5、合B为表示某学生考试科目,B高等数学,大学英语,控制理论,建筑学原理,两学生的期末成绩如下表。x x2 2x x1 10 08181y y4 4控制论878776768383100100乙0 0898992928585甲y y5 5y y3 3y y2 2y y1 1建筑学物理英语高数 以集合A和B的直积 为论域的一个模糊子集R,叫做集合A到B的模糊关系,也称为二元模糊模关系。如果 ,则隶属函数 就表示元素ai和bj所组成的序偶属于模糊关系R的程度。7.1模糊逻辑的基本原理第11页/共86页两学生考试成绩满分的隶属度表0.8700.760.831x200.810.890.920.85x1y5y
6、4y3y2y1学生集合A与考试科目集合B之间关于成绩的模糊关系为相应的模糊关系矩阵7.1模糊逻辑的基本原理第12页/共86页模糊关系运算模糊关系运算设R,S是集合A到集合B的两个模糊关系,和它们的关系矩阵分别是和(1)并运算(2)交运算(3)补运算7.1模糊逻辑的基本原理第13页/共86页(4)合成运算如果R是集合A到B的关系,S是集合B到C的关系,设Q是由定义的关系,则称Q为R和S的合成关系,其相应的运算称为合成运算。模糊语言模糊语言在数学领域,将带有模糊性的语言称为“模糊语言”。模糊语言可以用来表达一定论域的模糊集合。它可以对语言进行量化,改变语言的性质和程序。改变的方法是在语言之前加上一
7、个加强或削弱语言表达程序的模糊化前缀词,这样的前缀词称为模糊语言算子。7.1模糊逻辑的基本原理第14页/共86页语气算子:表示语气程度的模糊量词,它有集中化算子和淡化算子。为了规范语气算子的意义作如下约定:用作为语气算子来定量描述模糊集。若模糊集为A,则把定义成常用语气算子表强化算子强化算子H H4 4H H3 3H H2 2H H1.51.5极其极其非常非常很很相当相当淡化算子淡化算子H H0.80.8H H0.60.6H H0.40.4H H0.20.2比较比较略略稍许稍许有点有点7.1模糊逻辑的基本原理第15页/共86页模糊语言和语言变量值模糊语言变量就是一个取值为模糊数并由语言词来定义
8、的变量,模糊语言变量的取值,称为模糊语言变量值或模糊语言值。7.1模糊逻辑的基本原理第16页/共86页ZadehZadeh推理法当有两个模糊子集A和B,且 在“若A则B”时,A和B蕴含的模糊关系R用表示。则 是上的一个模糊关系,即Zadeh推理法规定,取模糊关系矩阵R(x,y)相应的隶属函数为模糊关系的合成7.1模糊逻辑的基本原理模糊推理模糊推理第17页/共86页例7.6设U、V上的模糊子集“小”、“大”、“非常小”分别定义为如果已知“若a小则b大”,当a很小时,试问b如何?解:1)先根据“若a小则b大”,求模糊关系矩阵R。根据模糊关系7.1模糊逻辑的基本原理第18页/共86页例如对于R模糊关
9、系矩阵第二行第三列因子r23,则有2)把“a很小时的b”定义为B1模糊子集,再根据合成推理方法得结论:比较B和B1,当a很小时,b并不是很大。7.1模糊逻辑的基本原理第19页/共86页马丹尼推理法(MamdaniMamdani)基本原理:把和蕴含的模糊关系记作,是直接用和的直积来表示,。马丹尼推理法规定,取模糊关系矩阵R(u,v)的相应隶属函数为在已知了的模糊关系矩阵后,对于给定的,则所求的可以通过合成运算推得7.1模糊逻辑的基本原理第20页/共86页解:由“若则”,可知与之间有模糊关系矩阵,根据马丹尼推理法例7 7.已知当“若则”,问若是结果如何?7.1模糊逻辑的基本原理第21页/共86页当
10、“若时的结果”为,则因此7.1模糊逻辑的基本原理第22页/共86页多输入模糊推理 如果已知推理的大前提为“if A and B then C”,在已知推理小前提为输入A1和B1而求相应的输出C1时,设A,B,C分别是论域X,Y,Z上的集合,所以这是一个三元模糊蕴含关系,记作(AB)C。根据马丹尼推理法,其模糊关系为 在输入为A1和B1时,且 ,则推理结果C1为7.1模糊逻辑的基本原理第23页/共86页例7.9如果有求“若A1且B1则C1”时的C1。解:由于R=ABC在求(AB)C时,要将AB按行展开并写成列向量形式7.1模糊逻辑的基本原理第24页/共86页根据合成推理法则,7.1模糊逻辑的基本
11、原理第25页/共86页将A1B1按行展开并写成列向量形式7.1模糊逻辑的基本原理第26页/共86页7.2 7.2 模糊控制系统模糊控制系统模糊控制系统的工作原理模糊控制系统的工作原理第27页/共86页把偏差e在它的变化范围内按大小分为7种类别,则E的语言值可以表示为E=负大,负中,负小,零,正小,正中,正大即ENB,NM,NS,ZE,PS,PM,PB用于模糊推理和模糊决策的模糊控制规则是以规则库的形式存储在计算机中的。设模糊推理和模糊决策的输入是E E,输出是U U,规则形式为规则1 1:IFIFE E1 1THENTHENU U1 1规则2 2:IFIFE E2 2THENTHENU U2
12、2规则n n:IFIFE En nTHENTHENU Un n7.2 7.2 模糊控制系统模糊控制系统第28页/共86页每条规则建立一个模糊关系R,因此系统总的模糊关系R为当已知模糊控制器的输入e*,对应模糊变量E,可得到模糊推理输出U7.2 7.2 模糊控制系统模糊控制系统第29页/共86页模糊控制器的设计模糊控制器的设计 把物理量的清晰值转换到模糊语言变量的过程称为模糊化。模糊语言变量是以自然或人工语言的词、词组作为值的变量,它的每一个语言值都是一个在模糊论域上的模糊集,这个模糊集通过隶属函数来描述。燃烧炉的“温度”变量隶属度函数7.2 7.2 模糊控制系统模糊控制系统第30页/共86页隶
13、属函数的分布与重叠率均匀分布不均匀分布7.2 7.2 模糊控制系统模糊控制系统第31页/共86页模糊化设计精确量的离散化与模糊语言变量赋值表 精确量的离散化就是把语言变量的论域从连续域转换成以零为中心的有限整数的离散域。要此论域转换成整数N=-n,-n+1,-1,0,1,n-1,n时,可以有公式 a是X论域的清晰量,b是所对应的离散域的离散量。b有小数时采用四舍五入取整。7.2 7.2 模糊控制系统模糊控制系统第32页/共86页语言变量语言变量E E的赋值的赋值表表-6-5-4-3-2-10123456NB10.500000000000NM00.510.5000000000NS0000.510
14、.50000000ZE000000.510.500000PS00000000.510.5000PMPB0000000000.510.50000000000000.517.2 7.2 模糊控制系统模糊控制系统第33页/共86页清晰化设计清晰化设计模糊控制输出的是模糊量,为了使模糊控制器的输出能对被控对象进行控制,就要把模糊量转换成精确量,这个过程称为清晰化。在模糊控制器模糊推理结论的模糊集中,选取隶属度最大的元素作为精确量去执行控制的方法称为最大隶属度法。所选的清晰化控制量 ,此时的例7.7模糊推理结论是:对模糊推理结论的模糊集中所含所有元素求取重心元素,将这重心元素作为精确量去执行控制的方法称
15、为重心法。如果最大点同时有几个,就取它们的平均值。7.2 7.2 模糊控制系统模糊控制系统第34页/共86页重心法重心法 对模糊推理结论的模糊集里所含的所有元素求取重心元素,将这重心元素作为精确量去执行控制的方法称重心法。按重心法计算上例7.2 7.2 模糊控制系统模糊控制系统第35页/共86页模糊控制规则及控制算法的设模糊控制规则及控制算法的设计计1)根据过程模糊模型生成控制规则 当用语言对一个过程的动态特性描述时,这种语言描述可以看作过程的模糊模型。根据模糊模型,可得到模糊控制的规则集。双输入单输出PID控制的离散方程:设双输入单输出模糊控制器的语言规则为7.2 7.2 模糊控制系统模糊控
16、制系统第36页/共86页 控制规则的形成关键在于,当E,CE有语言变量值为Li、Lj时,CP语言的变量值Lij如何选择和确定。参数函数法 语言变量值的映射关系7.2 7.2 模糊控制系统模糊控制系统第37页/共86页 式中A、B是参数,D一般取例7.8 设模糊控制规则的格式为假定对语言变量E,CE和CP都取7个语言变量值:L1=NB(负大),L2=NM(负中),L3=NS(负小),L4=ZE(零),L5=PS(正小),L6=PM(正中),L7=PB(正大)。故有7.2 7.2 模糊控制系统模糊控制系统第38页/共86页 E=NBE=NB,NMNM,NSNS,ZEZE,PSPS,PMPM,PBP
17、B CECENBNB,NMNM,NSNS,ZEZE,PSPS,PMPM,PBPB CP CPNBNB,NMNM,NSNS,ZEZE,PSPS,PMPM,PBPB取参数并取参数A=B=0.7,可得控制规则表。CPEL1L2L3L4L5L6L7CEL1L1L1L1L2L3L3L4L2L1L1L2L3L3L4L5L3L1L2L3L3L4L5L5L4L2L3L3L4L5L5L6L5L3L3L4L5L5L6L7L6L3L4L5L5L6L7L7L7L4L5L5L6L7L7L77.2 7.2 模糊控制系统模糊控制系统第39页/共86页UENBNMNSZEPSPMPBCENBNBNBNBNMNSNSZENMN
18、BNBNMNSNSZEPSNSNBNMNSNSZEPS PSZENMNSNSZEPSPSPMPSNSNSZEPSPSPMPBPMNSZEPSPSPMPBPBPBZEPSPSPMPBPBPB7.2 7.2 模糊控制系统模糊控制系统第40页/共86页根据测量数据及其分析生成控制规根据测量数据及其分析生成控制规则则 对于一个不明系统的输入数据进行多次测量,根据测量数据并分析从而生成控制规则的方法,使工程中常用的有效方法。对于典型的模糊控制系统,输入量有偏差、偏差变化率,输出量为控制量,它们对应的数据组 。若对系统进行n次测量,有数据组:根据这些测量数据去生成模糊控制规则,实质上是确定映射f:7.2
19、7.2 模糊控制系统模糊控制系统第41页/共86页(1)直接法求取模糊控制表 先考虑只有一条控制规则的情况。设有推理语句为:7.2 7.2 模糊控制系统模糊控制系统模糊控制算法的设计第42页/共86页从而有关系矩阵7.2 模糊控制系统第43页/共86页 当输入A1*=(1,0,0),B1*=(1,0,0)时,有 根据关系合成推理法,对应的输出C 1*应为 同理,当输入A1*=(1,0,0),B1*=(0,1,0)时,有7.2 7.2 模糊控制系统模糊控制系统第44页/共86页 显然,对于A1*的论域,不管它的元素有多少,当A1*量化之后,只会选中某一个元素,该元素的隶属度为1,其余元素的隶属度
20、为0。设选中第i个元素,有对应的输出C 1*应为 同样,对于B1*量化之后,亦只会选中某一个元素,设选中第j个元素,有7.2 7.2 模糊控制系统模糊控制系统第45页/共86页这里,对应的输出C 1*应为为了方便起见,C 1*用下式表示考虑第2条规则,对应的推理语句则在输入为A1*,B1*时,有输出7.2 7.2 模糊控制系统模糊控制系统第46页/共86页则在输入为A1*,B1*时,有输出对于第k条推理语句对求得的模糊控制量求“并”,可得控制量C*最后,以最大隶属度法对C1*求出最大隶属度对应的元素,即为清晰的控制量。这个清晰量就是输入为A1*B1*时的输入控制量。改变A1*B1*的内容,令A
21、1*量化之后对应元素的序号i从1m变化,令B1*量化之后对应元素的序号i从1 n变化,则分别可得相应清晰值控制量,以量化后的组合和相应的清晰值控制量就可以构造一个模糊控制表。7.2 7.2 模糊控制系统模糊控制系统第47页/共86页模糊控制规则表NBNMNSZEPSPMPBNBNBNBNBNBNMZEZENMNBNBNBNBNMZEZENSNMNMNMNMZEPSPSNZNMNMNSZEPSPMPMPZNMNMNSZEPSPMPMPSNSNSZEPMPMPMPMPMZEZEPMPBPBPBPBPBZEZEPMPBPBPBPB7.2 7.2 模糊控制系统模糊控制系统第48页/共86页一个二维模糊
22、控制器模糊控制表的制作实一个二维模糊控制器模糊控制表的制作实例例设输入为偏差e和偏差变化率e,输出为控制量u。它们的模糊集和论域分别定义如下:偏差的模糊集:ENB,NM,NS,NZ,PZ,PS,PM,PB偏差变化率CE和控制量U的模糊集均为NB,NM,NS,ZE,PS,PM,PB这是为了在偏差接近于零时增加分辨率,以提高系统的稳态精度偏差E的论域:-6,-5,-4,-3,-2,-1,-0,+0,1,2,3,4,5,6偏差CE的论域:-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6偏差CE的论域:-7,-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6,77.2 7.2
23、 模糊控制系统模糊控制系统第49页/共86页由于输入E有8种状态,输入CE有7种状态,控制规则表的输出U原本有对应的56条模糊条件语句,但由于不同的输入会出现相同输出的情况,于是控制规则表可以用21条模糊条件语句来描述。对应的模糊条件语句如下:if E=NB or NM and CE=NB or NM then U=NB7.2 7.2 模糊控制系统模糊控制系统典型的模糊控制系统典型的模糊控制系统第50页/共86页7.3 7.3 神经网络的基本原理神经网络的基本原理控制领域中的人工神经网络(Artificial Neural Networks)是人类对生物神经系统进行研究,从微观结构和功能上对其
24、抽象、简化而形成的数学模型。神经网络是由大量的形式相同的人工神经元按一定方式连接组成的网络。神经网络具成很强的自适应能力、非线性映射能力和容错能力,能够分布存储和并行处理各种信息,在系统辨识、模式识别、智能控制等领域有着广泛的应用前景。在智能控制中,人们利用神经网络的自学习能力,可以使它在对不确定系统的控制过程中自动学习被控系统的特性,从而自动适应被控系统随时间的特性变化,以达到对系统的优化控制。因此,神经网络控制的研究和应用,已经成为智能控制的一个重要内容。第51页/共86页神经网络基本结构神经网络基本结构1.生物神经元的工作机理生物神经元的结构7.3 7.3 神经网络的基本原理神经网络的基
25、本原理第52页/共86页生物神经元的特点生物神经元的特点学习信息处理记忆7.3 7.3 神经网络的基本原理神经网络的基本原理第53页/共86页2.2.人工神经元模型人工神经元模型为了方便,可以把阈值Qi看成是一个其输入为负1的连接权值,则7.3 7.3 神经网络的基本原理神经网络的基本原理第54页/共86页神经元的常用激发函数神经元的常用激发函数线性型阶跃型S型7.3 7.3 神经网络的基本原理神经网络的基本原理第55页/共86页神经元的激发函数表达式神经元的激发函数表达式对称阶跃函数线性型激发函数非对称S型激发函数对称S型激发函数7.3 7.3 神经网络的基本原理神经网络的基本原理第56页/
26、共86页3.3.人工神经网络人工神经网络由许多神经元按一个方式互连在一起所组成的神经结构称为神经网络。神经网络中的每个神经元都可以有很多输入,每个输入都有对应的一个连接权值;但一个神经元却只有单一的一个输出,尽管这个输出可以连接到很多其他的神经元。前馈型神经网络结构反馈型神经网络结构7.3 7.3 神经网络的基本原理神经网络的基本原理第57页/共86页4.4.神经网络的学习方法神经网络的学习方法神经网络按不同的学习方法进行学习,连接权值的变化是不同的。在智能控制中,神经网络的学习方法主要有两类:有教师(指导式)学习和无教师(非指导式)学习。Hebb学习规则Delta学习规则7.3 7.3 神经
27、网络的基本原理神经网络的基本原理第58页/共86页前馈神经网络前馈神经网络 前馈神经网是一种典型结构的神经网络,它由一个输入层、一个输出层和零至多个隐含层组成,信息从输入层进入网络,经过隐含层最后至输出层。前馈神经网络具有学习功能,其过程是:当输入层收到外来的输入信号(输入样本)后,通过各层神经元间的连接权值计算,会在输出层输出某个结果。将实际结果与期望输出进行比较,用产生的误差去指导修改连接权值,修改的方向应使误差变小。这样不断进行下去直到误差为零或小到一个允许数值,此时实际输出应等于期望输出,这个过程称为神经网络的学习过程。由于前馈神经网络在学习过程中需要输入在以样本信号和期望输出值组成的
28、样本对的指导下进行学习,因此,这种神经网络的学习方式是有教师学习。7.3 7.3 神经网络的基本原理神经网络的基本原理第59页/共86页1.1.感知器感知器 感知器是最简单的前馈网络,它没有隐含层,感知器的学习过程是神经网络最典型的学习过程,感知器主要用于模式识别和分类。单层感知器网络单个神经元的感知器7.3 7.3 神经网络的基本原理神经网络的基本原理第60页/共86页单个神经元的感知器单个神经元的感知器只有一个神经元的感知器其表达式为 由于感知器的输出只有1或-1两种可能值,因此它可以作为分类器,也就是说可以把输入的样本信号分成两类,一类样本输入感知器的输出为1,另一类样本输入感知器的输出
29、为-1。如果把P个输入样本信号看成是n维空间的P个点,则感知器可以将P个点分成两类,它们分属于n维空间的两个不同部分。7.3 7.3 神经网络的基本原理神经网络的基本原理第61页/共86页BPBP神经网络神经网络 BP神经网络又称误差反向传播(Error Back Propagation)神经网络,在模式识别、系统辨识、自适应控制等智能控制领域的应用十分广泛,是神经网络最重要和最有用的学习算法之一。BP算法由正向传播和反向传播两部分组成,在正向传播过程中,输入的信号从输入层经隐含层处理后最终传到输出层,每一层神经元的状态只对下一层神经元的状态产生影响。在输出层把现行输出同期望输出进行比较,如果
30、两者不等,则进入反向传播过程。反向传播时,把误差信号按原来正向传播的通路反向传回,并从后到前对每层神经元的权值进行修改,以使误差信号趋于最小。7.3 7.3 神经网络的基本原理神经网络的基本原理第62页/共86页BPBP神经网络学习过程神经网络学习过程正向传播过程:每个训练的样本由一组网络输入 和一组网络期望输出值 组成,而网络的实际输出则为7.3 7.3 神经网络的基本原理神经网络的基本原理第63页/共86页当输入信号 加在输入层时,隐含层的第j个节点的输入为第j个节点的输出为同理考虑到隐含层的第j个节点的输出yj,对输出层来说即为其输入xi,故输出层的第k个节点的输入为第j个节点的网络输出
31、即实际输出为7.3 7.3 神经网络的基本原理神经网络的基本原理第64页/共86页如果实际输出与期望值不等而产生误差E,可以采用梯度搜索技术,按误差函数的负梯度方向修改连接权值,以期使网络的实际输出与期望输出值的误差均方值达到最小。定义误差函数E为权值应按E函数梯度变化的负方向进行调整,求取E函数的最小值。反向传播过程:这一过程是根据误差信号由后向前修改连接权值的过程。首先是输出层与隐含层间权值的调整,其调整公式为由于7.3 7.3 神经网络的基本原理神经网络的基本原理第65页/共86页其中则输出层权值的调整公式为同理,输入层和隐含层权值的调整公式为且隐含层的误差反传信号为定义 为误差反传信号
32、,则输出层的误差反传信号为7.3 7.3 神经网络的基本原理神经网络的基本原理第66页/共86页考虑到隐含层的输出就是输出层的输入,它对下一层即输出层的各节点都起作用,则由于 因此,隐含层的误差反传信号 可以写成由于 因此,输入层和隐含层间权值 的调整公式可写成7.3 7.3 神经网络的基本原理神经网络的基本原理第67页/共86页由此可见,求取隐含层的误差反传信号 时,要用到输出层的误差反传信号 。可以推理当有多个隐含层时,求取隐含层的误差反传信号,就要先计算出后一层的误差反传信号。所以说,误差函数的求取是从输出层开始,从后向前,最后到输入层的反向传播过程。在BP算法中,神经元常使用非对称S型
33、激发函数此时有分别写成7.3 7.3 神经网络的基本原理神经网络的基本原理第68页/共86页为了加快调整速度,可以把前一次的权值调整量作为本次调整的依据之一,从而有调整修整公式其中,为平滑因子,取 。7.3 7.3 神经网络的基本原理神经网络的基本原理第69页/共86页BPBP算法的计算步骤算法的计算步骤7.3 7.3 神经网络的基本原理神经网络的基本原理第70页/共86页7.4 7.4 神经网络控神经网络控制制 神经网络用于控制,主要是为了解决非线性、不确定、未知数学模型复杂系统的控制问题。利用神经网络所具有的智能特性,主要是其学习能力和自适应能力,通过学习训练过程,使神经网络能对变化的环境
34、具有自适应性,从而成为基本上不依赖对象模型的这类控制方式,称为神经网络控制。正向建模的一般结构逆向建模的一般结构神经网络控制中的逆模型第71页/共86页神经元自适应神经元自适应PIDPID控制控制7.4 7.4 神经网络控制神经网络控制第72页/共86页神经元自适应神经元自适应PIDPID控制的学习过控制的学习过程程 有教师的Hebb学习规则式中,与神经元的输入、输出和偏差有关,其权值的学习规则可写成:称为递进信号,随学习过程逐渐衰减最后趋于零;e(k)误差信号;是学习速率;c是一个非常小的指定常数,。由前两式可以得出若存在函数 ,且有则7.4 7.4 神经网络控制神经网络控制第73页/共86
35、页 这个算法实际使这个算法实际使用时会不会有问题用时会不会有问题?为保证神经元自适应PID控制的收敛性和鲁棒性,该控制算法在权值修正时要先进行规范化处理。分别为积分、比例、微分的学习速率7.4 7.4 神经网络控制神经网络控制第74页/共86页神经网络自适应神经网络自适应PIDPID控制控制 设该系统中BP神经网络NN的是一个三层网络。输出节点分别对应三个可调参数 。由于各系数不能为负值,故输出层神经元的激发函数取非负的S型函数,而隐含层神经元的激发函数取正负对称的S型函数。7.4 7.4 神经网络控制神经网络控制第75页/共86页神经网络自适应神经网络自适应PIDPID控制控制-BP-BP神
36、经网络的计神经网络的计算算BP神经网络输入层节点i的输出为BP神经网络隐含层节点j的输入uj和输出yi分别为M个数取决于被控系统的复杂程度Wij为隐含层权系数,w0j为节点j的阈值Qj,激发函数7.4 7.4 神经网络控制神经网络控制第76页/共86页BPBP神经网络输入层节点神经网络输入层节点l l的输入的输入u ui i和输出和输出y yi i分别为分别为Wji为输出层权系数,w0l为节点j的阈值Qi,激发函数可设定性能指标函数为 依最速下降法修正网络的连接权值,并附加一能使搜索快速收敛全局极小的惯性项,则有为学习速率为平滑因子7.4 7.4 神经网络控制神经网络控制第77页/共86页由于
37、 未知,因此可用近似符号函数 替代,由此带来的计算不精确的影响可以通过调整学习速率来补偿。由增量式PID控制算式可以求得7.4 7.4 神经网络控制神经网络控制第78页/共86页因此可得BP神经网络NN输出层的连接权值计算公式为其中依据上述推算方式,可得隐含层连接权值计算公式其中式中7.4 7.4 神经网络控制神经网络控制第79页/共86页记忆的特点记忆的特点大脑的记忆,主要是通过神经元之间突触的连接强度的调整来完成的。经常传递同一信息的相关神经元之间突触的连接强度会越来越大,不经常传递同一信息的相关神经元之间突触的连接强度会随时间的增加而慢慢变小。这种信息的存储方式是分布型的,也就是分布在在
38、大量神经元之中进行记忆的。7.4 7.4 神经网络控制神经网络控制第80页/共86页学习的特点学习的特点人的大脑皮层中神经元之间的突触连接结构,虽然基本部分由先天性遗传所决定,但大部分突触连接是后天由环境的激励逐步形成的。生物学中把环境刺激能形成和改变神经元之间突触连接的现象称为神经网络的可塑性,并把由于环境刺激形成使神经元之间突触能够形成、逐渐加强直至构成一个相应神经网络的现象称为神经网络的自组织性。人类对一件事物的学习过程,反映在大脑的物理变化上,就是相关的一大批神经元之间的突触连接逐渐形成、加强并最终发展成一个相关神经网络的过程。7.4 7.4 神经网络控制神经网络控制第81页/共86页
39、信息处理的特点信息处理的特点大脑的每个神经元都兼有存储信息和处理信息的功能。神经元之间进行信息传递的过程也就是信息处理的过程,传递过程的信息同时又以突触连接强度变化的形式被记忆下来。这与一般计算机把信息存储与信息处理分属两个独立的部件是完全不同的。而且,神经网络对信息是并行处理的,一个神经元可以对它的千万个突触同时产生脉冲信号,通过它们传递给其它神经元。7.4 7.4 神经网络控制神经网络控制第82页/共86页HebbHebb(有教师)学习规则(有教师)学习规则基本思想:当两个神经元同时处理兴奋状态时,它们之间的连接强度会增大。也就是说,在两个神经元均被激活时,它们之间的连接权值将会产生一个增
40、量。为神经元i到神经元j在k次及(k1)次时的连接权值;分别为神经元i有神经元j在k次时的输出;神经元i的输出yi(k)也就是神经元j的输入xj(k);a为强度系数。7.4 7.4 神经网络控制神经网络控制第83页/共86页Delta(Delta(无教师无教师)学习方法学习方法基本思想:根据目标值与实际值之间的误差Delta最小准则来调整权值。学习规则由神经网络的期望输出(即教师信号)与网络实际输出之间的最小平方误差的条件推出。对于只有一个输出的神经网络,其误差准则函数E:如果神经网络有L个输出,其误差准则函数E:按梯度下降法原理,通过调整权值w求E最小值的数学表达式7.4 7.4 神经网络控制神经网络控制第84页/共86页为学习速率。由于W的修正规则可以表示为 用该规则调整权值时,有一个对网络的训练过程。当输入一组作为训练样本的输入信号 时,如果网络是一个输出,就有一对相应的输出值,即期望输出d1和实际输出y1。当有P组输入信号时,相应的输出值也有P对。于是:7.4 7.4 神经网络控制神经网络控制第85页/共86页感谢您的观看。第86页/共86页