《模式识别jncaPPT学习教案.pptx》由会员分享,可在线阅读,更多相关《模式识别jncaPPT学习教案.pptx(90页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学 1模式识别(m sh sh bi)jnca第一页,共90 页。2 相关学科 相关学科 教学 教学(jio xu)(jio xu)目标 目标 基本要求 基本要求 教材 教材/参考文献 参考文献关于本课程(kchng)的有关说明第1 页/共90 页第二页,共90 页。3 相关(xinggun)学科 统计学 概率论 线性代数(xin xn di sh)(矩阵计算)形式语言 人工智能 图像处理 计算机视觉 等等第2 页/共90 页第三页,共90 页。4 教学(jio xu)目标 掌握模式识别的基本概念和方法 有效(yuxio)地运用所学知识和方法解决实际问题 为研究新的模式识别的理论和方法打下
2、基础 第3 页/共90 页第四页,共90 页。5 基本(jbn)要求 基本:完成课程学习,通过(tnggu)考试,获得学分。提高:能够将所学知识和内容用于课题研究,解决实际问题。飞跃:通过(tnggu)模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。第4 页/共90 页第五页,共90 页。6教材(jioci)/参考文献R.Duda,P.Hart,D.Stork,Pattern Classification,second edition,2000(有中译本).Sergios Theodoridis,Konstantinos Koutroumbas,Pattern Recogniti
3、on,Fourth Edition 李晶皎等译,模式识别(m sh sh bi),电子工业出版社。孙即祥,现代模式识别(m sh sh bi),国防科技大学出版社,2003年。边肇祺,张学工,模式识别(m sh sh bi),清华大学出版社。第5 页/共90 页第六页,共90 页。7讲授(jingshu)课程内容及安排第一章 引论 第二章 聚类分析第三章 判别域代数界面方程法 第四章 统计判决(pnju)第五章 学习、训练与错误率估计 第六章 最近邻方法第七章 特征提取和选择 第6 页/共90 页第七页,共90 页。8第一章 引论(yn ln)1.1 一个模式识别案例及基本概念1.2 特征矢量
4、(shling)和特征空间1.3 随机矢量(shling)的描述1.4 正态分布第7 页/共90 页第八页,共90 页。9一个模式识别(m sh sh bi)案例n n 识别是人类的基本行为n n 模式识别(m sh sh bi)(Pattern Recognition)n n 使用计算机来辨别事物。n n 机器识别,计算机识别,机器自动识别。第8 页/共90 页第九页,共90 页。10人类:学习、总结规律,抽象出概念机器:缺乏抽象能力基本方法(fngf)是计算机器与人类 机器与人类(rnli)(rnli)识别事物原理的比较 识别事物原理的比较第9 页/共90 页第十页,共90 页。11一个模
5、式识别(m sh sh bi)案例n n 鱼类加工厂需要(xyo)将传送带上的鱼自动进行分类n n 鲈鱼(Seabass)n n 品种n n 鲑鱼(Salmon)第10 页/共90 页第十一页,共90 页。12n n 问题分析n n 采用摄像机获取图像,根据图像对鱼进行分类。n n 可能遇到的问题:n n 目标的提取 预处理n n 分类的依据(yj)特征提取n n 判别的规则 分类器设计第11 页/共90 页第十二页,共90 页。13n n 预处理 预处理 n n 方便后续操作,同时又不损失关键信息。方便后续操作,同时又不损失关键信息。n n 去除噪声 去除噪声n n 光照调整 光照调整n n
6、 目标提取 目标提取n n 方向、位置调整 方向、位置调整n n 大小规一化 大小规一化n n n n 在本例中需要采用 在本例中需要采用(c(c iyng)iyng)分割技术将鱼和鱼、鱼和背景分开 分割技术将鱼和鱼、鱼和背景分开第12 页/共90 页第十三页,共90 页。14n n 特征提取n n 原始数据量巨大,往往含有很多冗余信息,为了有效实现分类识别,需要对原始数据进行变换,以便(ybin)得到最能反映分类本质的特征。n n 可以考虑的特征:n n 长度n n 光泽n n 宽度n n 鳍的数目和形状n n 嘴的位置,等等第13 页/共90 页第十四页,共90 页。15n n 分类 n
7、n 根据某种判决规则将被识别对象归为某一类别。n n 基本方法:n n 在训练样本集上确定某个判决规则,使按这种判决规则对被识别对象进行(jnxng)分类所造成的错误识别率最小或引起的损失最小。第14 页/共90 页第十五页,共90 页。16n n 预处理:去噪,用分割操作 预处理:去噪,用分割操作(cozu)(cozu)把鱼和 把鱼和鱼之间以及鱼和背景之间分开 鱼之间以及鱼和背景之间分开n n 特征提取和选择:对单个鱼的信息进行特征 特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量 选择,从而通过测量某些特征来减少信息量n n 长度 长度n n 亮度 亮度n n
8、宽度 宽度n n 鱼翅的数量和形状 鱼翅的数量和形状n n 嘴的位置,等等 嘴的位置,等等 n n 分类决策:把特征送入决策分类器 分类决策:把特征送入决策分类器第15 页/共90 页第十六页,共90 页。17第16 页/共90 页第十七页,共90 页。18n n 采用长度作为(zuwi)特征第17 页/共90 页第十八页,共90 页。19n n 结论n n 单独使用长度错误率太高n n 必须考虑其它特征(tzhng)n n 改进措施n n 采用光泽度进行新的尝试第18 页/共90 页第十九页,共90 页。20n n 采用光泽度作为(zuwi)特征第19 页/共90 页第二十页,共90 页。2
9、1n n 改进:n n 运用两种特征(tzhng)组和:光泽度和宽度n n 鱼 xT=x1,x2光泽度宽度设 计 实 例第20 页/共90 页第二十一页,共90 页。22n 采用(ciyng)光泽度和宽度作为特征第21 页/共90 页第二十二页,共90 页。23n n 我们可以尝试(chngsh)增加其他特征,但必须注意两点:n n 新增特征与已有特征不相关n n 不会引起性能的下降n n 我们还可以改进分类器模型,达到如下图所示的效果:第22 页/共90 页第二十三页,共90 页。24第23 页/共90 页第二十四页,共90 页。25n n 讨论(toln):这样的效果好吗?设 计 实 例第
10、24 页/共90 页第二十五页,共90 页。26n n 讨论n n 我们的目标是使所设计的分类器能够正确识别未知样本-泛化能力n n 过分复杂的判决边界,过分关注某些特定的训练样本,而忽略了类别的共同(gngtng)特征,导致泛化能力弱!第25 页/共90 页第二十六页,共90 页。27n n 决策边界过于复杂导致的问题n n 运算量大n n 数学表达困难(kn nn)n n 泛化能力差:对未知样本的分类错误率高第26 页/共90 页第二十七页,共90 页。28n n 理想状况:对训练样本的分类性能和分界面 理想状况:对训练样本的分类性能和分界面(jimin)(jimin)复杂度的 复杂度的折
11、中 折中第27 页/共90 页第二十八页,共90 页。29n n 面向特定任务的分类(fn li)系统及错误分类(fn li)(误判)的代价(损失)n n 如果两种错误代价相同,则以最小错误率为准则;n n 如果两种错误代价不等,则以最小风险为准则。n n 可以调整阈值边界,确定最优的分界点。n n 确定某种决策规则,使得决策所引起的损失最小,这是决策理论的核心任务。第28 页/共90 页第二十九页,共90 页。30n n 采用光泽度作为特征(tzhng),考虑误判代价第29 页/共90 页第三十页,共90 页。模式识别(m sh sh bi)的基本概念n 模式识别(Pattern Recog
12、nition):确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个(du)类型中的某个类型。n 样本(Sample):一个具体的研究(客观)对象。如一条鱼、患者,某人写的一个汉字,一幅(y f)图片等。第30 页/共90 页第三十一页,共90 页。n 特征(tzhng)(Features):能描述模式特性的量(测量值)。在统计模式识别方法中,通常用一个矢量 表示,称之为特征(tzhng)矢量,记为 n 模式(Pattern):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界的某一样(yyng)本的测量值的集合(或综合)。n 模式类(Class):具有某些共同(gn
13、gtng)特性的模式的集合。第31 页/共90 页第三十二页,共90 页。33模式识别系统(xtng)的主要环节:特征提取:对重要特征量测,形成特征矢量 或将对象分解为基元,符号化,形成符号串或关系图 特征选择:选择有代表性的特征,能够正确(zhngqu)分类 学习和训练:利用已知样本建立分类和识别规则 分类识别:对所获得样本按建立的分类规则进行分类识别第32 页/共90 页第三十三页,共90 页。34模式识别(m sh sh bi)的学习、训练方法n n 有监督学习(有教师学习):n n 有一个(y)已知样本集(集合中每个样本的类别已知),作为训练样本集,并通过挖掘先验已知信息来指导设计分类
14、器。n n 无监督学习(无教师学习):n n 没有已知类别标签的训练数据可用,n n 通过挖掘样本中潜在的相似性分类;第33 页/共90 页第三十四页,共90 页。35模式识别(m sh sh bi)系统数据采集特征提取二次特征提取与选择分类识别待识对象识别结果通常在采集信息过程中,还要去除所获取信息中的噪声,增强有用(yu yn)的信息等工作。这种使信息纯化的处理过程叫做信息的预处理。分类识别是根据事先确定的分类规则(guz)对前面选取的特征进行分类(即识别)。通常能描述对象的元素很多,为节约资源和提高处理速度,有时更为了可行性,在满足分类识别正确率要求的条件下,按某种准则尽量选用对正确分类
15、识别作用较大的特征。使得用较少的特征就能完成分类识别任务。预处理 这个环节的内容很广泛,与要解决的具体问题有关,例如,从 图象 中将 汽车车牌 的号码 识别 出来,就需要先将 车牌 从 图像 中找出来,再对 车牌 进行划分,将每个 数字 分别 划分 开。做到这一步以后,才能对每个 数字 进行 识别。以上工作都应该在预处理阶段完成。数字化 比特流第34 页/共90 页第三十五页,共90 页。36模式识别(m sh sh bi)系统数据采集特征提取二次特征提取与选择分类识别待识对象识别结果数据采集特征提取可改进规则的分类识别二次特征提取与选择训练样本改进采集提取方法改进特征提取与选择制定改进分类识
16、别规则人工干预正确率测试第35 页/共90 页第三十六页,共90 页。37对象(duxing)空间模式(msh)空间特征(tzhng)空间类型空间各类空间(Space)的概念模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。特征提取和特征选择:由模式空间到特征空间的变换和选择。类型判别:特征空间到类型空间所作的操作。模式识别三大任务第36 页/共90 页第三十七页,共90 页。38纸币(zhb)识别器对纸币(zhb)按面额进行分类 面额 系统(xtng)实例5元10元20元50元100元第37 页/共90 页第三十八页,共90 页。39系统(xtng)实例 长度(chngd)(mm
17、)宽度(mm)5元 1366310元 1417020元 1467050元 15170100元 15677第38 页/共90 页第三十九页,共90 页。40系统(xtng)实例磁性 金属条位置(wi zhi)(大约)5元 有 54/8210元 有 54/8720元 有 57/8950元 有 60/91100元 有 63/93第39 页/共90 页第四十页,共90 页。5元 10元 20元 50元 100元12345678反射光波形(b xn)第40 页/共90 页第四十一页,共90 页。42系统(xtng)实例数据采集、特征提取:长度、宽度(kund)、磁性、磁性的位置,光反射亮度、光透射亮度等
18、等 特征选择:长度(chngd)、磁性及位置、反射亮度分类识别:确定纸币的面额及真伪第41 页/共90 页第四十二页,共90 页。43模式识别(m sh sh bi)的其他例子计算机自动(zdng)诊断疾病:1.获取情况(信息采集)2.测量体温、血压、心率、血液化验、X光透射、B超、心电图、CT等尽可能多的信息,并将这些信息数字化后输入电脑。特征要进行选择。3.2 运行在电脑中的专家系统(zhun ji x tn)或专用程序可以分析这些数据并进行分类,得出正常或不正常的判断,不正常情况还要指出是什么问题。第42 页/共90 页第四十三页,共90 页。44模式识别的基本(jbn)方法一、统计模式
19、识别二、句法模式识别三、模糊(m hu)模式识别四、人工神经网络法五、人工智能方法第43 页/共90 页第四十四页,共90 页。45模式识别的基本(jbn)方法一、统计(tngj)模式识别模式描述方法:特征向量 模式判定:模式类用条件概率分布P(X/i)表示,m类就有m个分布,然后判定未知模式属于(shy)哪一个分布。第44 页/共90 页第四十五页,共90 页。46模式识别(m sh sh bi)的基本方法一、统计(tngj)模式识别理论基础:概率论,数理统计主要方法:线性、非线性分类、Bayes决策、聚类分析主要优点:1)比较成熟 2)能考虑干扰噪声等影响 3)识别(shbi)模式基元能力
20、强主要缺点:1)对结构复杂的模式抽取特征困难2)不能反映模式的结构特征,难以描述模式的性质3)难以从整体角度考虑识别(shbi)问题第45 页/共90 页第四十六页,共90 页。47模式识别的基本(jbn)方法二、句法(jf)模式识别模式描述方法:符号串,树,图模式判定:是一种语言,用一个文法表示一个类,m类就有m个文法,然后(rnhu)判定未知模式遵循哪一个文法。第46 页/共90 页第四十七页,共90 页。48例2:如下图中一幅图形(txng),要识别图中的物体,选用句法模式识别方法.模式识别的基本(jbn)方法第47 页/共90 页第四十八页,共90 页。49解:图形结构复杂,首先应分解
21、为简单的子图(背景、物体(wt))。构成一个多级树结构:模式识别(m sh sh bi)的基本方法第48 页/共90 页第四十九页,共90 页。50n n 在学习过程中,确定基元与基元之间的关系,推断出生成景物的方法。n n 判决过程中,首先提取基元,识别基元之间的连接关系,使用推断的文法规则做句法分析。若分析成立,则判断(pndun)输入的景物属于相应的类型。模式识别(m sh sh bi)的基本方法第49 页/共90 页第五十页,共90 页。51理论基础:形式语言,自动机技术 理论基础:形式语言,自动机技术主要方法:自动机技术、主要方法:自动机技术、CYK CYK剖析算法、剖析算法、Ear
22、ly Early算法、算法、转移图法 转移图法主要优点:主要优点:1 1)识别方便,可以从简单的基元开始,由简至繁。)识别方便,可以从简单的基元开始,由简至繁。2 2)能反映模式的结构特征)能反映模式的结构特征(tzhng)(tzhng),能描述模式,能描述模式的性质。的性质。3 3)对图象畸变的抗干扰能力较强。)对图象畸变的抗干扰能力较强。主要缺点:主要缺点:当存在干扰及噪声时,抽取特征 当存在干扰及噪声时,抽取特征(tzhng)(tzhng)基元困难,基元困难,且易失误。且易失误。模式识别的基本(jbn)方法第50 页/共90 页第五十一页,共90 页。52模式识别(m sh sh bi)的基本方法三、模糊(m hu)模式识别模式描述方法:模糊集合 A=(a,a),(b,b),.(n,n)模式判定:是一种集合运算。用隶属度将模糊集合划分为若干子集(z j),m类就有m个子集(z j),然后根据择近原则分类。第51 页/共90 页第五十二页,共90 页。