《第八章图像识别PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第八章图像识别PPT讲稿.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章图像识别第1页,共45页,编辑于2022年,星期三2模式识别和模式的概念感知:从环境获取信息感知:从环境获取信息第2页,共45页,编辑于2022年,星期三3计算机模式识别u模式识别:使计算机模仿人的感知能力,从感知数据中提取信息(判别物体和行为)的过程。数据获取模式分割模式识别姚明姚明ROCKETS11概念第3页,共45页,编辑于2022年,星期三4模式识别的意义数字化感知数据:来源丰富、数量巨大概念第4页,共45页,编辑于2022年,星期三5模式识别的难点感知数据:非结构化(像素、声波等)概念第5页,共45页,编辑于2022年,星期三6模式与模式类u样本样本(sample,object
2、):一类事物的一个具体体现,对具体的个别事物进行观测所得到的某种形式的信号。u模式模式(pattern):表示一类事物,如印刷体A与手写体A属同一模式。B与A则属于不同模式。u样本是具体的事物,而模式是对同一类事物概念性的概括。u模式类与模式联合使用时,模式表示具体的事物,而模式类则是对这一类事物的概念性描述。u模式识别是从样本到类别的映射。概念第6页,共45页,编辑于2022年,星期三7模式识别的基本问题模式识别的基本问题(1)特征如何提取?-特征产生特征产生(2)最有效的特征是那些特征?-特征选择特征选择(3)对特定任务,如何设计分类器?-分类器设计分类器设计(4)分类器设计后,如何评价分
3、类器?分类错误率是多少?-分类器评价分类器评价第7页,共45页,编辑于2022年,星期三8模式识别方法的分类模式识别方法的分类(1)监督与非监督模式识别 A、监督模式识别 利用先验知识和训练样本来设计分类器。B、非监督模式识别 利用特征向量的相似性来自动进行分类。第8页,共45页,编辑于2022年,星期三9l有监督学习(supervised learning):用已知类别的样本训练分类器,以求对训练集数据达到某种最优,并能推广到对新数据的分类。l非监督学习(unsupervised learning):样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)第9页
4、,共45页,编辑于2022年,星期三10模式分类 vs.模式聚类Classification(known categories)Clustering(creation of new categories)Category“A”Category“B”Classification(Recognition)(Supervised Classification)Clustering(Unsupervised Classification)第10页,共45页,编辑于2022年,星期三11监督与非监督学习方法比较第11页,共45页,编辑于2022年,星期三模式识别方法12参数估计近邻法直接计算判别函数非参
5、数方法有监督学习最小距离分层聚类无监督学习静态模式(不相关)HMM时序模式(相关的静态模式)统计模式识别模板匹配结构模式识别人工神经网络句法模式识别统计学习理论和支持向量机模糊模式识别第12页,共45页,编辑于2022年,星期三13模板匹配Template MatchingTemplateInput scene第13页,共45页,编辑于2022年,星期三14结构模式识别l用简单的基元(primitives)和结构关系来描述复杂对象YNMLTXZSceneObjectBackgroundDELTXYZMNDE第14页,共45页,编辑于2022年,星期三15句法模式识别l定义:描述待处理模式的结构
6、信息,并用形式语言中的文法定义模式结构,并通过句法分析进行分类对象被描述为以基元为基本单位(符号化)的文法源自语言学,但不限于语言学应用l基本概念基元:预定义的不再包含细节结构信息的子结构文法:对模式的描述(基元为字符)字符串句法:对字符串进行判别,是否文法描述的“语言”第15页,共45页,编辑于2022年,星期三16句法模式识别系统框架预处理基元分割或分解句法分析基元和关系选择文法结构及推理测试模式训练模式分类学习过程错误率检测基元及关系识别第16页,共45页,编辑于2022年,星期三17人工神经网络l计算“仿生”智能计算机 大规模并行分布式的计算学习,泛化和自适应容错,非确定,不精确的分类
7、第17页,共45页,编辑于2022年,星期三人工神经网络18第18页,共45页,编辑于2022年,星期三19模糊模式识别l1965年Zadeh提出模糊集理论是对传统集合理论的一种推广l传统:属于或者不属于l模糊:以一定的程度属于模糊逻辑:相对传统二值逻辑“是或不是”模糊数学:研究模糊集和模糊逻辑模糊系统:应用角度第19页,共45页,编辑于2022年,星期三20模糊模式识别方法l隶属度函数对象x属于集合A的程度的函数,值域0,1l模糊模式识别方法将模糊技术引入传统模式识别方法中l模糊特征l模糊分类:模糊子集代替确定子集l模糊评价第20页,共45页,编辑于2022年,星期三21统计模式识别l模式识
8、别最初从统计理论发展而来l基本思想:模式被描述为一组测量值组成的随机特征向量,用概率统计理论对其进行建模,用统计决策理论划分特征空间来进行分类。第21页,共45页,编辑于2022年,星期三22统计模式识别的一般过程预处理特征提取/选择分类预处理特征提取/选择学习分类规则测试模式训练模式分类训练错误率检测第22页,共45页,编辑于2022年,星期三23统计模式识别基本过程l基本系统组成数据获取:测量预处理:利于特征提取和分类特征提取与选择l降维l选择有利于分类的特征,去除不利分类的特征分类决策l错误率最小l损失最小第23页,共45页,编辑于2022年,星期三24统计模式识别统计模式识别 距离分类
9、法距离分类法 1.标准模式法标准模式法设由训练样例可获得c个模式类1,2,c,且可获得各个模式类的标准模式M1,M2,MC。那么,对于待识模式X,可通过计算其与各标准模式的距离d(X,Mi)(i=1,2,c)来决定它的归属。具体分类规则为:d(X,Mj)=min d(X,Mi)Xj i=1,2,c 即与X距离最小的标准模式所属的模式类即为X的所属模式类。第24页,共45页,编辑于2022年,星期三25m1m2xg(x)=0m1m2x第25页,共45页,编辑于2022年,星期三262.平均距离法平均距离法平均距离法就是将待识模式X与模式类i(i=1,2,c)中所有样例模式的距离平均值作为与X的距
10、离,然后以距离最小的模式类作为X的类属。分类规则可描述为:其中,(k=1,2,c),sk为模式类k中的样例模式数。第26页,共45页,编辑于2022年,星期三273.3.最近邻法最近邻法最近邻法是将与待识模式X距离最近的一个样例模式的模式类作为X的类属。分类规则可描述为 其中,sk为模式类k中的样例模式数。第27页,共45页,编辑于2022年,星期三28第28页,共45页,编辑于2022年,星期三29几何分类法几何分类法一个模式类就是相应特征空间中的一个点集。一般来讲,在特征空间中一个模式类的点集总是在某种程度上与另一个模式类的点集相分离。因此,模式识别的另一个思路就是设法构造一些分界面(线)
11、,把特征空间Rn分割成若干个称为决策区域的子空间Ri(i=1,2,n),使得一个模式类刚好位于一个决策区域。这样,对于待识模式X,就可以利用空间中的这些分界面来判定X的类属。分界面(线)方程gi(X)=0中的函数gi(X)称为判别函数。显然,构造分界面的关键就是构造其判别函数。分界面(线)可分为平面(直线)和曲面,相应的判别函数为线性函数和非线性函数。下面介绍分界平面和线性判别函数。第29页,共45页,编辑于2022年,星期三30对于二分类问题,显然只需一个分界平面。设判别函数为 g(X)=WTX+w0 其中W=(w1,w2,wn)T为X中各分量x1,x2,xn的系数组成的向量,称为权向量;w
12、0为一个常数,称为阈值权。那么,分界平面方程为 g(X)=WTX+w0=0 由几何知识知,位于这个分界平面两边的点X的判别函数值g(X)符号相反。于是,可有分类规则:g(X)0 X1 g(X)0 X2 g(X)=0 X属于1或2,或者不可判别 第30页,共45页,编辑于2022年,星期三31二分类问题的分界面(线)示意 第31页,共45页,编辑于2022年,星期三32概率分类法概率分类法基于最小错误率的贝叶斯决策基于最小错误率的贝叶斯决策因为模式属于哪一模式类存在不确定性,所以需要用概率来决策,就是说对于待识模式X,如果它属于哪个类的概率大则它就属于哪一类。但如果直接使用各模式类的先验概率P(
13、ci),则会因先验概率所提供的信息量太少而导致把所有模式都归入先验概率最大的模式类的无效分类。因此,应该考虑后验概率P(ci|X),但通常概率P(ci|X)不易直接求得的。幸好,概率论中的贝叶斯公式可以帮忙,事实上,由贝叶斯公式 第32页,共45页,编辑于2022年,星期三先验概率、类条件概率密度和后验概率l先先验概率概率:根据大量统计确定某类事物出现的比例,如在我国大学中,一个学生是男生的先验概率为0.7,而为女生的概率是0.3,这两类概率是互相制约的,因为这两个概率之和应满足总和为1的约束。l类条件概率密度函数条件概率密度函数:同一类事物的各个属性都有一定的变化范围,在这些变化范围内的分布
14、概率用一种函数形式表示,则称为类条件概率密度函数。这种分布密度只对同一类事物而言,与其它类事物没有关系。为了强调是同一类事物内部,因此这种分布密度函数往往表示成条件概率的形式。例如x表示某一个学生的特征向量,则,男生的概率密度表示成P(x|男生),女生的表示成P(x|女生),这两者之间没有任何关系,即一般的情况下P(x|w1)+P(x|w2)1,可为从0,2之间的任意值。l后后验概率概率:一个具体事物属于某种类别的概率,例如一个学生用特征向量x表示,它是男性或女性的概率表示成P(男生|x)和P(女生|x),这就是后验概率。由于一个学生只可能为两个性别之一,因此有P(男生|x)+P(女生|x)=
15、1的约束,这一点是与类分布密度函数不同的。后验概率与先验概率也不同,后验概率涉及一个具体事物,而先验概率是泛指一类事物,因此P(男生|x)和P(男生)是两个不同的概念。第33页,共45页,编辑于2022年,星期三图解p(x|1)p(x|2)p(1|x)p(2|x)类条件概率密度函数后验概率最小错误率决策第34页,共45页,编辑于2022年,星期三35模式识别过程示例:Fish Classification预处理:image enhancement,separating touching/occluding fishes and finding the boundary of the fishE
16、xample from:R.Duda,P.Hart,D.Stork,“Pattern Classification”,second edition,2000.第35页,共45页,编辑于2022年,星期三36l先验知识:鲈鱼一般比鲑鱼长l通过长度L是否超过了临界值L*来判断种类l为了确定恰当的L*值,必须先获得不同类别的鱼的若干样本(“设计样本”或”训练样本”)进行长度测量。第36页,共45页,编辑于2022年,星期三37第37页,共45页,编辑于2022年,星期三38l验证了平均意义上鲈鱼要比鲑鱼长的结论l令人失望的表明:单一的特征判据是不足以完美分类的。l继续尝试别的特征,如:鱼的平均光泽度
17、。第38页,共45页,编辑于2022年,星期三39第39页,共45页,编辑于2022年,星期三402022/10/19l总体代价函数:决策理论的中心任务是要确定一种决策,使该代价函数最小。l单一特征的分类效果不能令人满意,应考虑组合运用多种特征的方法。l特征组合:光泽度x1和宽度x2,简化为一个二维的特征向量,或二维空间的一个点x1,x2第40页,共45页,编辑于2022年,星期三41第41页,共45页,编辑于2022年,星期三422022/10/19出现的问题l考虑其它特征组合l特征对分类性能的重用程度l如果分类判决模型非常复杂,分界面也十分复杂。结果也不能令人满意,因为设计分类器的中心目标是对新样本能作出正确的反应,这就是”推广能力”.第42页,共45页,编辑于2022年,星期三432022/10/19第43页,共45页,编辑于2022年,星期三442022/10/19l可能的情况,采用更多的训练样本,以获得特征向量的更好估计,如使用样本的概率分布,但是样本数量毕竟有限,复杂的判断边界不可能很好的处理全新的样本模式。l“推广能力”和”复杂度”的折中第44页,共45页,编辑于2022年,星期三452022/10/19第45页,共45页,编辑于2022年,星期三