《模式识别概述.ppt》由会员分享,可在线阅读,更多相关《模式识别概述.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、模式识别概述现在学习的是第1页,共59页第一章第一章:模式识别概述模式识别概述现在学习的是第2页,共59页一个例子一个例子通过光学感知手段,将传送带上的鱼进行自动分类鲈鱼鱼类鱼类鲑鱼3现在学习的是第3页,共59页问题分析问题分析架设一台摄影像机,拍摄若干样品的图像架设一台摄影像机,拍摄若干样品的图像提取用于区分两类鱼的有效特征提取用于区分两类鱼的有效特征(feature)长度长度光泽度光泽度宽度宽度鳍的数目和形状鳍的数目和形状嘴的位置,等等嘴的位置,等等.上述参数即是我们对两类鱼进行分类的备选特征上述参数即是我们对两类鱼进行分类的备选特征4现在学习的是第4页,共59页 预处理预处理(prepr
2、ocessing)去除干扰,图像增强去除干扰,图像增强采用图像分割技术将不同的鱼分离开来,或者将鱼同背景分采用图像分割技术将不同的鱼分离开来,或者将鱼同背景分开开特征提取特征提取(feature extraction)将每条鱼的数据送入特征提取器,通过测量特定的将每条鱼的数据送入特征提取器,通过测量特定的“特征特征”或或“属性属性”来简化原始数据类来简化原始数据类将特征送入分类器,以便进行分类将特征送入分类器,以便进行分类 5现在学习的是第5页,共59页鲑鲑 鱼鱼鲑鲑 鱼鱼鲈鲈 鱼鱼6现在学习的是第6页,共59页分类分类(Classification)根据先验知识:鲈鱼长度一般要比鲑鱼大根据先
3、验知识:鲈鱼长度一般要比鲑鱼大选择长度(选择长度(length)作为可能的分类特征)作为可能的分类特征获取足够多的样本(获取足够多的样本(训练样本训练样本)进行统计(直方图)进行统计(直方图)确定合适的长度临界值确定合适的长度临界值 L L*作为作为分类标准分类标准lll7现在学习的是第7页,共59页鲑鲑 鱼鱼鲈鲈 鱼鱼分类标准分类标准8现在学习的是第8页,共59页单一的特征判据(长度)不足以完全正确分类单一的特征判据(长度)不足以完全正确分类无论怎样确定临界值,都有无法仅凭长度就把两类鱼截然分开无论怎样确定临界值,都有无法仅凭长度就把两类鱼截然分开9现在学习的是第9页,共59页选择光泽度(选
4、择光泽度(lightness)作为分类特征)作为分类特征获取足够多的样本(获取足够多的样本(训练样本训练样本)进行统计(直方图)进行统计(直方图)确定合适的光泽度临界值确定合适的光泽度临界值x*作为作为分类标准分类标准以光泽度为分类特征,两类鱼的分离性更好!以光泽度为分类特征,两类鱼的分离性更好!10现在学习的是第10页,共59页分类标准分类标准鲑鲑 鱼鱼鲈鲈 鱼鱼11现在学习的是第11页,共59页判别边界与判别代价判别边界与判别代价 无论采用哪一种特征进行分类都有代价:误判上述判别边界假设将鲑鱼误判为鲈鱼和将鲈鱼误判为鲑鱼的代价相等(对称代价)非对称代价:调整判别边界的位置决策论12现在学习
5、的是第12页,共59页鲑鲑 鱼鱼鲈鲈 鱼鱼调整判别边界,减小判别代价调整判别边界,减小判别代价13现在学习的是第13页,共59页为获取更好的分类效果,组合运用多个特征 选取光泽度(lightness)和宽度(width)作为分类特征鱼 xT=x1,x2特征向量:xT=x1,x2LightnessWidth14现在学习的是第14页,共59页鲑鲑 鱼鱼鲈鲈 鱼鱼判别标准:判别边界判别标准:判别边界组合特征优于单一特征组合特征优于单一特征15现在学习的是第15页,共59页需要考虑的问题:特征越多分类性能越好吗?什么样的特征才是好的特征?特征的相关性与冗余?16现在学习的是第16页,共59页如何获取判
6、别边界:判别模型?什么样的判别边界才是最优的:模型优化?17现在学习的是第17页,共59页复杂的模型复杂的模型鲑鲑 鱼鱼鲈鲈 鱼鱼18现在学习的是第18页,共59页复杂的模型可保证对所有训练样本正确分类过于复杂的模型将导致复杂的判别曲线新模式推广能力差19现在学习的是第19页,共59页分类系统的目标是对未知的样本正确分类,而不仅仅是对训练样本分类必须在模型复杂度和推广能力之间进行折中考虑最优模型20现在学习的是第20页,共59页鲑鲑 鱼鱼鲈鲈 鱼鱼优化的判别边界优化的判别边界21现在学习的是第21页,共59页什么是模式识别?定义利用机器(计算机)模仿人脑对现实世界各种事物进行描述、分类、判断和
7、识别的过程。目标用计算机实现具有感知、识别、理解、自学习和自适应能力的灵活和智能的计算机器。22现在学习的是第22页,共59页模式识别的产生与发展起源于20世纪40年代研究初期,模式识别被看作动物所具有的自然生理现象,很多人认为不值得研究。当人们试图使计算机去具有人脑的识别能力后,模式识别的难度和重要性才得以重视。23现在学习的是第23页,共59页模式识别的产生与发展随着计算机技术的发展,60年代后模式识别迅速发展为一门相对独立的新兴交叉学科明确的问题定义、严格的数学基础、坚实的理论框架、丰富的理论和应用成果、广阔的应用前景24现在学习的是第24页,共59页模式识别的相关学科模式识别人工智能计
8、算机视觉机器学习认知科学心理生物学25现在学习的是第25页,共59页模式识别的应用语音识别与理解(Speech recognition)语音识别说话人识别语种识别语音情感识别特定人、非特定人母语、非母语 孤立音、连续音26现在学习的是第26页,共59页模式识别的应用字符识别(Character Recognition)手写体印刷体汉字、英文、阿拉伯数字27现在学习的是第27页,共59页模式识别的应用生物特征识别指纹识别掌纹识别人脸识别虹膜识别28现在学习的是第28页,共59页模式识别的应用生物医学信号识别心电图、心音、多普勒生物信号、染色体、DNA序列图像检索军事目标跟踪与识别遥感图像处理29
9、现在学习的是第29页,共59页研究模式识别的意义通过模式识别的研究和应用,提高和扩展计算机的应用能力和领域,促进人工智能的应用与发展促进人们对人脑识别过程的理解和认识30现在学习的是第30页,共59页模式识别存在的问题模式识别是一门快速发展的新兴学科,涉及到多学科、多领域的复杂问题和生物认知系统相比,现有人工模式识别系统的适应和识别能力还远远不能令人满意模式识别的许多理论和基本方法方面的问题还远没有得到解决新问题层出不穷传统方法均存在一定的局限性31现在学习的是第31页,共59页模式识别的理论基础概率论与数理统计随机过程线性代数优化方法形式语言学32现在学习的是第32页,共59页模式识别的基本
10、方法模式识别方法经典方法现代方法统计决策方法句法方法神经网络方法模糊模式识别33现在学习的是第33页,共59页模式识别的基本方法统计决策法基于模式的定量描述与统计规律的识别方法,是模式识别最经典、最成熟的方法,目前广泛应用于模式识别的各个领域原理:样本观测值特征概率统计决策准则分类34现在学习的是第34页,共59页模式识别的基本方法统计方法鲑鲑 鱼鱼鲈鲈 鱼鱼决策标准:判别边界决策标准:判别边界35现在学习的是第35页,共59页模式识别的基本方法句法方法基于模式的空间结构特征的定性描述与形式语言学的方法,广泛应用于字符识别、图像识别等领域原理:样本基元字符串形式语言文法分类36现在学习的是第3
11、6页,共59页模式识别的基本方法句法方法定义基元:abcdefaabbccaaddeeff37现在学习的是第37页,共59页模式识别的基本方法模糊模式识别基于模糊数学和统计分析的识别方法,在不能明确描述模式特征和结构的复杂模式识别问题中得到了成功应用根据隶属度和模糊文法进行分类模糊模式类很像三角形的图形远大于2的整数清晰模式类三角形大于2的整数38现在学习的是第38页,共59页模式识别的基本方法神经网络方法基于现代生物学和认识科学对人类信息处理的研究成果采用人工神经网络模型,使识别和处理过程更接近人类的思维过程39现在学习的是第39页,共59页模式识别的基本方法输入层(i)输入层(j)输入层(
12、k)W i jW j k神经网络方法40现在学习的是第40页,共59页模式识别的基本方法神经网络方法人工神经网络由相互广泛连接的神经元组成,信息分布于神经网络中每一节点的输入为前一层所有节点输出的加权和通过已知类别样本的学习,调整各节点之间的加权系数具有自适应学习能力,适用于并行计算与处理41现在学习的是第41页,共59页模式识别的一般过程无论采用何种方法,模式识别一般都要包括下列两个基本过程模式识别学习过程(设计过程)识别过程(实现过程)42现在学习的是第42页,共59页模式识别的一般过程学习过程通过一批已知类别的学习样本进行分析,推出分类准则。识别过程对末知类别的单个待识样本,根据分类准则
13、进行识别分类。43现在学习的是第43页,共59页模式识别的一般过程学习样本数据获取预处理特征提取统计分析分类准则待识样本数据获取预处理特征提取识别分类分类结果统计模式识别的过程44现在学习的是第44页,共59页模式识别的一般过程数据获取采用传感器(摄像机或麦克风),通过测量、采样和量化,得到反映样本信息的原始数据(一维波形、二维图像等)数据质量依赖于传感器的特性和局限性(如带宽、分辩率、灵敏度、信噪比等)预处理采用特定方法,对样本数据进行分割、噪声滤除、边缘增加等处理预处理的方法与样本对象所属领域密切相关(如语音、图像)45现在学习的是第45页,共59页特征提取采用特定的方法提取反映样本本质特
14、性的特征(Feature),压缩原始数据。统计分析采用一定的统计方法,通过学习样本的分布规律,建立识别模型,推断出分类准则。识别分类根据分类准则,对待识样本进行分类。模式识别的一般过程46现在学习的是第46页,共59页模式识别的一般过程句法模式识别的过程学习样本数据获取预处理基元提取文法推断文法待识样本数据获取预处理基元提取句法分析分类结果47现在学习的是第47页,共59页模式识别系统实现学习过程和识别过程的计算机系统称为模式识别系统,亦称为分类器。学习过程即是分类器的设计过程识别过程即是分类器的实现过程48现在学习的是第48页,共59页分类器设计分类器设计采集数据(Data collecti
15、on)选择特征(Feature Choice)选择模型(Model Choice)训练分类器(Training)评价分类器(Evaluation)计算复杂度(Computational Complexity)49现在学习的是第49页,共59页开始开始采集数据采集数据选择特征选择特征选择模型选择模型训练分类器训练分类器评价分类器评价分类器结束结束先验知识先验知识50现在学习的是第50页,共59页采集数据(Data Collection)在开发模式识别系统费用中,数据据采集占到令人吃惊的比重为保证分类器的性能,必须有足够多的训练样本怎样才能知道已经采集到足够多有代表性的供训练和测试用的数据了呢?分
16、类器设计分类器设计51现在学习的是第51页,共59页选择特征(Feature choice)怎么做才能把先验知识和训练数据有机结合起来,以发现有用的和有效的特征呢?分类器设计分类器设计52现在学习的是第52页,共59页特征选择(Feature choice)依赖于具体的问题(语音识别、图像识别)选择反映模式本质特性的参数作为特征使样本类间距离较大、类内距离较小与类别信息不相关的变换(平移、旋转、尺度变换)具有不变性尽量选择相关性小的特征尽可能不受噪声的干扰53现在学习的是第53页,共59页模型选择(Model Choice)怎样选择合适的模型,得到识别分类的标准?模型是唯一的吗?什么样的模型更
17、优呢?分类器设计分类器设计54现在学习的是第54页,共59页训练或学习(Training)利用样本数据来确定分类器的过程“基于样本的学习”的方法是设计分类器的最有效的方法。分类器设计分类器设计55现在学习的是第55页,共59页评价分类器(Evaluation)识别率误识率实时性计算复杂度分类器设计分类器设计56现在学习的是第56页,共59页模式识别的研究机构中科院自动化所模式识别国家重点实验室模式识别基础理论研究图像处理与计算机视觉语音语言信息处理57现在学习的是第57页,共59页模式识别的研究机构微软亚洲研究院清华大学北京大学视觉与听觉信息处理国家重点实验室 58现在学习的是第58页,共59页模式识别的研究前沿多模态生物特征识别生物信息学三维视觉信息处理智能机器人智能语音信息系统59现在学习的是第59页,共59页