《第四讲 神经网络基础.ppt》由会员分享,可在线阅读,更多相关《第四讲 神经网络基础.ppt(89页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第6 6章章 神经网络理论基础神经网络理论基础 模糊控制从人的经验出发,解决了智能控制中人类语言的描述和推理问题,尤其是一些不确定性语言的描述和推理问题,从而在机器模拟人脑的感知、推理等智能行为方面迈出了重大的一步。模糊控制在处理数值数据、自学习能力等方面还远没有达到人脑的境界。人工神经网络从另一个角度出发,即从人恼的生理学和心理学着手,通过人工模拟人脑的工作机理来实现机器的部分智能行为。人工神经网络(简称神经网络,Neural Network)是模拟人脑思维方式的数学模型。神经网络是在现代生物学研究人脑组织成果的基础上提出的,用来模拟人类大脑神经网络的结构和行为。神经网络反映了人脑功能的基
2、本特征,如并行信息处理、学习、联想、模式分类、记忆等。20世纪80年代以来,人工神经网络(ANN,Artificial Neural Network)研究所取得的突破性进展。神经网络控制是将神经网络与控制理论相结合而发展起来的智能控制方法。它已成为智能控制的一个新的分支,为解决复杂的非线性、不确定、未知系统的控制问题开辟了新途径。神经网络的发展历程经过4个阶段。1 启蒙期(启蒙期(1890-1969年)年)1890年,W.James发表专著心理学,讨论了脑的结构和功能。1943年,心理学家W.S.McCulloch和数学家W.Pitts提出了描述脑神经细胞动作的数学模型,即M-P模型(第一个神
3、经网络模型)。6.1 神经网络发展历史神经网络发展历史1949年,心理学家Hebb实现了对脑细胞之间相互影响的数学描述,从心理学的角度提出了至今仍对神经网络理论有着重要影响的Hebb学习法则。1958年,E.Rosenblatt提出了描述信息在人脑中贮存和记忆的数学模型,即著名的感知机模型(Perceptron)。1962年,Widrow和Hoff提出了自适应线性神经网络,即Adaline网络,并提出了网络学习新知识的方法,即Widrow和Hoff学习规则(即学习规则),并用电路进行了硬件设计。2 2 低潮期(低潮期(1969-19821969-1982)受当时神经网络理论研究水平的限制及冯诺
4、依曼式计算机发展的冲击等因素的影响,神经网络的研究陷入低谷。在美、日等国有少数学者继续着神经网络模型和学习算法的研究,提出了许多有意义的理论和方法。例如,1969年,S.Groisberg和A.Carpentet提出了至今为止最复杂的ART网络,该网络可以对任意复杂的二维模式进行自组织、自稳定和大规模并行处理。1972年,Kohonen提出了自组织映射的SOM模型。3 复兴期(1982-1986)1982年,物理学家Hoppield提出了Hoppield神经网络模型,该模型通过引入能量函数,实现了问题优化求解,1984年他用此模型成功地解决了旅行商路径优化问题(TSP)。在 1986年,在 R
5、umelhart和 McCelland等 出 版Parallel Distributed Processing一书,提出了一种著名的多层神经网络模型,即BP网络。该网络是迄今为止应用最普遍的神经网络。4 新连接机制时期(1986-现在)神经网络从理论走向应用领域,出现了神经网络芯片和神经计算机。神经网络主要应用领域有:模式识别与图象处理(语音、指纹、故障检测和图象压缩等)、控制与优化、预测与管理(市场预测、风险分析)、通信等。6.26.2 神经网络原理神经网络原理 神经生理学和神经解剖学的研究表明,人脑极其复杂,由一千多亿个神经元交织在一起的网状结构构成,其中大脑皮层约140亿个神经元,小脑皮
6、层约1000亿个神经元。人脑能完成智能、思维等高级活动,为了能利用数学模型来模拟人脑的活动,导致了神经网络的研究。神经系统的基本构造是神经元(神经细胞),它是处理人体内各部分之间相互信息传递的基本单元。每个神经元都由一个细胞体,一个连接其他神经元的轴突和一些向外伸出的其它较短分支树突组成。轴突功能是将本神经元的输出信号(兴奋)传递给别的神经元,其末端的许多神经末梢使得兴奋可以同时传送给多个神经元。树突的功能是接受来自其它神经元的兴奋。神经元细胞体将接收到的所有信号进行简单地处理后,由轴突输出。神经元的轴突与另外神经元神经末梢相连的部分称为突触。图 单个神经元的解剖图 神经元由三部分构成:(1)
7、细胞体(主体部分):包括细胞质、细胞膜和细胞核;(2)树突:用于为细胞体传入信息;(3)轴突:为细胞体传出信息,其末端是轴突末梢,含传递信息的化学物质;(4)突触:是神经元之间的接口(104105个/每个神经元)。通过树突和轴突,神经元之间实现了信息的传递。神经元具有如下功能:(1)兴奋与抑制:如果传入神经元的冲动经整和后使细胞膜电位升高,超过动作电位的阈值时即为兴奋状态,产生神经冲动,由轴突经神经末梢传出。如果传入神经元的冲动经整和后使细胞膜电位降低,低于动作电位的阈值时即为抑制状态,不产生神经冲动。(2)学习与遗忘:由于神经元结构的可塑性,突触的传递作用可增强和减弱,因此神经元具有学习与遗
8、忘的功能。决定神经网络模型性能三大要素为:(1)神经元(信息处理单元)的特性;(2)神经元之间相互连接的形式拓扑结构;(3)为适应环境而改善性能的学习规则。6.3 神经网络的分类 目前神经网络模型的种类相当丰富,已有近40余种神经网络模型。典型的神经网络有多层前向传播网络(BOP网络)、Hopfield网络、CMAC小脑模型、ART网络、BAM双向联想记忆网络、SOM自组织网络、Blotzman机网络和Madaline网络等。根据神经网络的连接方式,神经网络可分为两种形式:(1)前向网络 如图所示,神经元分层排列,组成输入层、隐含层和输出层。每一层的神经元只接受前一层神经元的输入。输入模式经过
9、各层的顺次变换后,由输出层输出。在各神经元之间不存在反馈。感知器和误差反向传播网络采用前向网络形式。图 前馈型神经网络(2)反馈网络 该网络结构在输出层到输入层存在反馈,即每一个输入节点都有可能接受来自外部的输入和来自输出神经元的反馈。这种神经网络是一种反馈动力学系统,它需要工作一段时间才能达到稳定。Hopfield神经网络是反馈网络中最简单且应用最广泛的模型,它具有联想记忆的功能,如果将Lyapunov函数定义为寻优函数,Hopfield神经网络还可以解决寻优问题。图 反馈型神经网络(3)自组织网络 网络结构如图所示。Kohonen网络是最典型的自组织网络。Kohonen认为,当神经网络在接
10、受外界输入时,网络将会分成不同的区域,不同区域具有不同的响应特征,即不同的神经元以最佳方式响应不同性质的信号激励,从而形成一种拓扑意义上的特征图,该图实际上是一种非线性映射。这种映射是通过无监督的自适应过程完成的,所以也称为自组织特征图。Kohonen网络通过无导师的学习方式进行权值的学习,稳定后的网络输出就对输入模式生成自然的特征映射,从而达到自动聚类的目的。图 自组织神经网络6.4 神经网络学习算法神经网络学习算法 神经网络学习算法是神经网络智能特性的重要标志,神经网络通过学习算法,实现了自适应、自组织和自学习的能力。目前神经网络的学习算法有多种,按有无导师分类,可分为有教师学习(Supe
11、rvised Learning)、无 教 师 学 习(Unsupervised Learning)和 再 励 学 习(Reinforcement Learning)等几大类。在有教师的学习方式中,网络的输出和期望的输出(即教师信号)进行比较,然后根据两者之间的差异调整网络的权值,最终使差异变小。在无教师的学习方式中,输入模式进入网络后,网络按照一预先设定的规则(如竞争规则)自动调整权值,使网络最终具有模式分类等功能。再励学习是介于上述两者之间的一种学习方式。图 有导师指导的神经网络学习图 无导师指导的神经网络学习 最基本的神经网络学习算法:1 Hebb学习规则 Hebb学习规则是一种联想式学习
12、算法。生物学家D.O.Hebbian基于对生物学和心理学的研究,认为两个神经元同时处于激发状态时,它们之间的连接强度将得到加强,这一论述的数学描述被称为Hebb学习规则,即其中,为连接从神经元 到神经元 的当前权值,和 为神经元的激活水平。Hebb学习规则是一种无教师的学习方法,它只根据神经元连接间的激活水平改变权值,因此,这种方法又称为相关学习或并联学习。2 Delta()学习规则假设误差准则函数为:其中,代表期望的输出(教师信号);为网络的实际输出,;为网络所有权值组成的向量:为输入模式:其中训练样本数为 。神经网络学习的目的是通过调整权值W,使误差准则函数最小。权值的调整采用梯度下降法来
13、实现,其基本思想是沿着E的负梯度方向不断修正W值,直到E达到最小。数学表达式为:其中令 ,则W的修正规则为上式称为学习规则,又称误差修正规则。6.5 6.5 神经网络特征神经网络特征 神经网络具有以下几个特征:(1)能逼近任意非线性函数;(2)信息的并行分布式处理与存储;(3)可以多输入、多输出;(4)便于用超大规模集成电路(VISI)或光学集成电路系统实现,或用现有的计算机技术实现;(5)能进行学习,以适应环境的变化。6.6神经网络控制的研究领域神经网络控制的研究领域1 基于神经网络的系统辨识 将神经网络作为被辨识系统的模型,可在已知常规模型结构的情况下,估计模型的参数。利用神经网络的线性、
14、非线性特性,可建立线性、非线性系统的静态、动态、逆动态及预测模型,实现非线性系统的建模和辨识。(2)神经网络控制器 神经网络作为实时控制系统的控制器,对不确定、不确知系统及扰动进行有效的控制,使控制系统达到所要求的动态、静态特性。(3)神经网络与其他算法相结合 将神经网络与专家系统、模糊逻辑、遗传算法等相结合,可设计新型智能控制系统。(4)优化计算 在常规的控制系统中,常遇到求解约束优化问题,神经网络为这类问题的解决提供了有效的途径。目前,神经网络控制已经在多种控制结构中得到应用,如PID控制、模型参考自适应控制、前馈反馈控制、内模控制、预测控制、模糊控制等。第第7 7章章 典型典型神经网络神
15、经网络7.1 神经元模型神经元模型 图图7-1中中 为为神神经经元元的的内内部部状状态态,为为阈阈值值,为为输输入入信信号号,为为连接权系数,连接权系数,为外部输入信号。为外部输入信号。单神经元模型可描述为:单神经元模型可描述为:通常情况下,取即图7-1 单神经元模型常用的神经元非线性特性有以下四种:(1)阈值型图7-2 阈值型函数(2)分段线性型图7-3 分段线性函数(3)Sigmoid函数型图7-4 Sigmoid函数7.2 BP神经网络 1986年,Rumelhart等提出了误差反向传播神经网络,简称BP网络(Back Propagation),该网络是一种单向传播的多层前向网络。误差反
16、向传播的BP算法简称BP算法,其基本思想是梯度下降法。它采用梯度搜索技术,以期使网络的实际输出值与期望输出值的误差均方值为最小。7.2.1 BP网络特点(1)是一种多层网络,包括输入层、隐含层和输出层;(2)层与层之间采用全互连方式,同一层神经元之间不连接;(3)权值通过学习算法进行调节;(4)神经元激发函数为S函数;(5)学习算法由正向传播和反向传播组成;(6)层与层的连接是单向的,信息的传播是双向的。7.2.2BP网络结构 含一个隐含层的含一个隐含层的BP网络结构如图网络结构如图7-5所示,所示,图中图中 为输入层神经元,为输入层神经元,为隐层神经元,为隐层神经元,为输出层神经元。为输出层
17、神经元。图图7-5 BP7-5 BP神经网络结构神经网络结构7.2.3BP网络的逼近BP网络逼近的结构如图7-6所示,图中k为网络的迭代步骤,u(k)和y(k)为逼近器的输入。BP为网络逼近器,y(k)为被控对象实际输出,yn(k)为BP的输出。将系统输出y(k)及输入u(k)的值作为逼近器BP的输入,将系统输出与网络输出的误差作为逼近器的调整信号。图7-6BP神经网络逼近用于逼近的BP网络如图7-7所示。图 用于逼近的BP网络。BP算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐层逐层处理,并传向输出层,每层神经元(节点)的状态只影响下一层神经元的状态。如果在输
18、出层不能得到期望的输出,则转至反向传播,将误差信号(理想输出与实际输出之差)按联接通路反向计算,由梯度下降法调整各层神经元的权值,使误差信号减小。(1)前向传播:计算网络的输出。隐层神经元的输入为所有输入的加权之和:隐层神经元的输出采用S函数激发:则(1)前向传播:计算网络的输出。隐层神经元的输入为所有输入的加权之和:隐层神经元的输出采用S函数激发:则输出层神经元的输出:网络输出与理想输出误差为:误差性能指标函数为:(2)反向传播:采用学习算法,调整各层间的权值。根据梯度下降法,权值的学习算法如下:输出层及隐层的连接权值学习算法为:k+1时刻网络的权值为:隐层及输入层连接权值学习算法为:其中
19、k+1时刻网络的权值为:如果考虑上次权值对本次权值变化的影响,需要加入动量因子 ,此时的权值为:其中,为学习速率,为动量因子。阵(即为对象的输出对控制输入的灵敏度信息)算法为:其中取7.2.4BP网络的优缺点 BP网络的优点为:(1)只要有足够多的隐层和隐层节点,BP网络可以逼近任意的非线性映射关系;(2)BP网络的学习算法属于全局逼近算法,具有较强的泛化能力。(3)BP网络输入输出之间的关联信息分布地存储在网络的连接权中,个别神经元的损坏只对输入输出关系有较小的影响,因而BP网络具有较好的容错性。BP网络的主要缺点为:(1)待寻优的参数多,收敛速度慢;(2)目标函数存在多个极值点,按梯度下降
20、法进行学习,很容易陷入局部极小值;(3)难以确定隐层及隐层节点的数目。目前,如何根据特定的问题来确定具体的网络结构尚无很好的方法,仍需根据经验来试凑。由于BP网络具有很好的逼近非线性映射的能力,该网络在模式识别、图像处理、系统辨识、函数拟合、优化计算、最优预测和自适应控制等领域有着较为广泛的应用。由于BP网络具有很好的逼近特性和泛化能力,可用于神经网络控制器的设计。但由于BP网络收敛速度慢,难以适应实时控制的要求。7.2.5BP网络逼近仿真实例网络逼近仿真实例 使用BP网络逼近对象:BP网络逼近程序见chap7_1.m7.2.6BP网络模式识别网络模式识别 由于神经网络具有自学习、自组织和并行
21、处理等特征,并具有很强的容错能力和联想能力,因此,神经网络具有模式识别的能力。在神经网络模式识别中,根据标准的输入输出模式对,采用神经网络学习算法,以标准的模式作为学习样本进行训练,通过学习调整神经网络的连接权值。当训练满足要求后,得到的神经网络权值构成了模式识别的知识库,利用神经网络并行推理算法对所需要的输入模式进行识别。当待识别的输入模式与训练样本中的某个输入模式相同时,神经网络识别的结果就是与训练样本中相对应的输出模式。当待识别的输入模式与训练样本中所有输入模式都不完全相同时,则可得到与其相近样本相对应的输出模式。当待识别的输入模式与训练样本中所有输入模式相差较远时,就不能得到正确的识别
22、结果,此时可将这一模式作为新的样本进行训练,使神经网络获取新的知识,并存储到网络的权值矩阵中,从而增强网络的识别能力。BP网络的训练过程如下:正向传播是输入信号从输入层经隐层传向输出层,若输出层得到了期望的输出,则学习算法结束;否则,转至反向传播 以第p个样本为例,用于训练的BP网络结构如图7-11所示。图7-11 BP神经网络结构网络的学习算法如下:网络的学习算法如下:(1)前向传播:计算网络的输出。)前向传播:计算网络的输出。隐隐层层神神经经元元的的输输入入为为所所有有输输入入的的加加权权之和之和 隐隐层层神神经经元元的的输输出出 采采用用S函函数数激激发发 :则输出层神经元的输出:输出层
23、神经元的输出:网络第 个输出与相应理想输出 的误差为:第p个样本的误差性能指标函数为:其中N为网络输出层的个数。(2)反向传播:采用梯度下降法,调整各层间的权值。权值的学习算法如下:输出层及隐层的连接权值 学习算法为:其中隐层及输入层连接权值 学习算法为:如果考虑上次权值对本次权值变化的影响,需要加入动量因子 ,此时的权值为:其中其中 为学习速率,为学习速率,为动量因子。为动量因子。7.2.7仿真实例:仿真实例:取标准样本为3输入2输出样本,如表7-1所示。输输 入入输输 出出1001001000.500101表表7-1 7-1 训练样本训练样本 BP网络模式识别程序包括网络训练程序chap7
24、_2a.m和网络测试程序chap7_2b.m。7.3 RBF神经网络 径向基函数(RBF-Radial Basis Function)神经网络是由J.Moody和C.Darken在80年代末提出的一种神经网络,它是具有单隐层的三层前馈网络。由于它模拟了人脑中局部调整、相互覆盖接收域(或称感受野-Receptive Field)的神经网络结构,因此,RBF网络是一种局部逼近网络,已证明它能任意精度逼近任意连续函数。RBF网络特点(1)RBF网络的作用函数为高斯函数,是局部的,BP网络的作用函数为S函数,是全局的;(2)如何确定RBF网络隐层节点的中心及基宽度参数是一个困难的问题;(3)已证明RB
25、F网络具有唯一最佳逼近的特性,且无局部极小。7.3.1 RBF网络结构 RBF网络是一种三层前向网络,由于输入到输出的映射是非线性的,而隐含层空间到输出空间的映射是线性的,从而可以大大加快学习速度并避免局部极小问题。图7-13 RBF网络结构7.3.2 RBF网络的逼近网络的逼近 采用RBF网络逼近一对象的结构如图7-14所示。图7-14RBF神经网络逼近在RBF网络结构中,为网络的输入向量。设RBF网络的径向基向量,其中hj为高斯基函数:网络的第j个结点的中心矢量为:其中,i=1,2,n设网络的基宽向量为:为节点的基宽度参数,且为大于零的数。网络的权向量为:k时刻网络的输出为:设理想输出为y(k),则性能指标函数为:根据梯度下降法,输出权、节点中心及节点基宽参数的迭代算法如下:阵(即为对象的输出对控制输入的灵敏度信息)算法为:其中取 。其中,为学习速率,为动量因子。使用RBF网络逼近下列对象:RBF网络逼近程序见chap7_3.m。7.3.3 RBF网络逼近仿真实例实验题 设系统的输入输出关系为:用BP网络、RBF网络拟合该系统,分析神经元非线性特性、学习方法等的影响。