《图像模式识别的方法介绍39366.docx》由会员分享,可在线阅读,更多相关《图像模式识别的方法介绍39366.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.1图像像模式识识别的方方法 图图像模式式识别的的方法很很多,从从图像模模式识别别提取的的特征对对象来看看,图像像识别方方法可分分为以下下几种:基于形形状特征征的识别别技术、基基于色彩彩特征的的识别技技术以及及基于纹纹理特征征的识别别技术。其其中,基基于形状状特征的的识别方方法,其其关键是是找到图图像中对对象形状状及对此此进行描描述,形形成可视视特征矢矢量,以以完成不不同图像像的分类类,常用用来表示示形状的的变量有有形状的的周长、面面积、圆圆形度、离离心率等等。基于于色彩特特征的识识别技术术主要针针对彩色色图像,通通过色彩彩直方图图具有的的简单且且随图像像的大小小、旋转转变换不不敏感等等特点
2、进进行分类类识别。基基于纹理理特征的的识别方方法是通通过对图图像中非非常具有有结构规规律的特特征加以以分析或或者则是是对图像像中的色色彩强度度的分布布信息进进行统计计来完成成。从模式特征征选择及及判别决决策方法法的不同同可将图图像模式式识别方方法大致致归纳为为两类:统计模模式(决决策理论论)识别别方法和和句法(结构)模式识识别方法法。此外外,近些些年随着着对模式式识别技技术研究究的进一一步深入入,模糊糊模式识识别方法法和神经经网络模模式识别别方法也也开始得得到广泛泛的应用用。在此此将这四四种方法法进行一一下说明明。2.1.11句法模模式识别别 对对于较复复杂的模模式,如如采用统统计模式式识别的
3、的方法,所所面临的的一个困困难就是是特征提提取的问问题,它它所要求求的特征征量十分分巨大,要要把某一一个复杂杂模式准准确分类类很困难难,从而而很自然然地就想想到这样样的一种种设计,即即努力地地把一个个复杂模模式分化化为若干干较简单单子模式式的组合合,而子子模式又又分为若若干基元元,通过过对基元元的识别别,进而而识别子子模式,最最终识别别该复杂杂模式。正正如英文文句子由由一些短短语,短短语又由由单词,单单词又由由字母构构成一样样。用一一组模式式基元和和它们的的组成来来描述模模式的结结构的语语言,称称为模式式描述语语言。支支配基元元组成模模式的规规则称为为文法。当当每个基基元被识识别后,利利用句法
4、法分析就就可以作作出整个个的模式式识别。即即以这个个句子是是否符合合某特定定文法,以以判别它它是否属属于某一一类别。这这就是句句法模式式识别的的基本思思想。 句法模模式识别别系统主主要由预预处理、基基元提取取、句法法分析和和文法推推断等几几部分组组成。由由预处理理分割的的模式,经经基元提提取形成成描述模模式的基基元串(即即字符串串)。句句法分析析根据文文法推理理所推断断的文法法,判决决有序字字符串所所描述的的模式类类别,得得到判决决结果。问问题在于于句法分分析所依依据的文文法。不不同的模模式类对对应着不不同的文文法,描描述不同同的目标标。为了了得到于于模式类类相适应应的文法法,类似似于统计计模
5、式识识别的训训练过程程,必须须事先采采集足够够多的训训练模式式样本,经经基元提提取,把把相应的的文法推推断出来来。实际际应用还还有一定定的困难难。 2.1.22统计模模式识别别统计模式识识别是目目前最成成熟也是是应用最最广泛的的方法,它它主要利利用贝叶叶斯决策策规则解解决最优优分类器器问题。统统计决策策理论的的基本思思想就是是在不同同的模式式类中建建立一个个决策边边界,利利用决策策函数把把一个给给定的模模式归入入相应的的模式类类中。统统计模式式识别的的基本模模型如图图2,该该模型主主要包括括两种操操作模型型:训练练和分类类,其中中训练主主要利用用己有样样本完成成对决策策边界的的划分,并并采取了
6、了一定的的学习机机制以保保证基于于样本的的划分是是最优的的;而分分类主要要对输入入的模式式利用其其特征和和训练得得来的决决策函数数而把模模式划分分到相应应模式类类中。统计模式识识别方法法以数学学上的决决策理论论为基础础建立统统计模式式识别模模型。其其基本模模型是:对被研研究图像像进行大大量统计计分析,找找出规律律性的认认识,并并选取出出反映图图像本质质的特征征进行分分类识别别。统计计模式识识别系统统可分为为两种运运行模式式:训练练和分类类。训练练模式中中,预处处理模块块负责将将感兴趣趣的特征征从背景景中分割割出来、去去除噪声声以及进进行其它它操作;特征选选取模块块主要负负责找到到合适的的特征来
7、来表示输输入模式式;分类类器负责责训练分分割特征征空间。在在分类模模式中,被被训练好好的分类类器将输输入模式式根据测测量的特特征分配配到某个个指定的的类。统统计模式式识别组组成如图图2所示示。图2 统计计模式识识别模型型2.1.22.1几几种统计计模式识识别的方方法统计模式识识别根据据采用方方法的不同同可以进进行多种种形式的的分类:通过贝贝叶斯决决策理论论对条件件密度已已知的样样本进行行分类;对于类类条件密密度不明明的情况况,可根根据训练练样本的的类别是是否己知知将分类类问题分分为监督督学习和和非监督督学习两两大类;监督学学习和非非监督学学习又可可根据是是否通过过参数决决策分为为参数估估计和非
8、非参数估估计。统统计模式式识别的的另一种种分类方方法是根根据决策策界是否否直接得得到将其其分为几几何方法法和基于于概率密密度的方方法。几几何方法法经常直直接从优优化一定定的代价价函数构构造决策策界;而而基于概概率密度度的方法法要首先先估计密密度函数数然后构构造分类类函数指指定决策策界。1、几何分分类法 1) 模板板匹配法法它是模式识识别中的的一个最最原始、最基基本的方方法,它它将待识识模式分分别与各各标准模模板进行行匹配,若若某一模模板与待待识模式式的绝大大多数单单元均相相匹配,则则称该模模板与待待识模式式“匹配得得好”,反之之则称“匹配得得不好”,并取取匹配最最好的作作为识别别结果。 2)距
9、离分分类法 距离是一种种重要的的相似性性度量,通通常认为为空间中中两点距距离越近近,表示示实际上上两样本本越相似似。大约约有十余余种作为为相似性性度量的的距离函函数,其其中使用用最广泛泛的是欧欧氏距离离。它是是使用最最为广泛泛的方法法,常用用的有平平均样本本法、平平均距离离法、最最近邻法法和近邻法法。 3)线性判判别函数数 和上述的方方法不同同,判决决函数法法是以判判决边界界的函数数形式的的假定为为其特性性的,而而上述的的方法都都是以所所考虑的的分布的的假定为为其特性性的。假假如我们们有理由由相信一一个线性性判决边边界取成成: 是合适的话话,那么么剩下的的问题就就是要确确定它的的权系数数。权系
10、系数可通通过感知知器算法法或最小小平方误误差算法法来实现现。但作作为一条条规则,应应用此方方法必须须注意两两点;第第一就是是方法的的可适性性问题,第第二就是是应用判判决函数数后的误误差准则则。 4)非线性性判别函函数 线性判决函函数的特特点是简简单易行行,实际际应用中中许多问问题往往往是非线线性的,一一种处理理的办法法将非线线性函数数转换为为线性判判决函数数,所以以又称为为广义线线性判决决函数。另另一种方方法借助助电场的的概念,引引入非线线性的势势函数,它它经过训训练后即即可用来来解决模模式的分分类问题题。 2 概率率分类法法 几几何分类类法是以以模式类类几何可可分为前前提条件件的,在在某些分
11、分类问题题中这种种条件能能得到满满足,但但这种条条件并不不经常能能得到满满足,模模式的分分布常常常不是几几何可分分的,即即在同一一区域中中可能出出现不同同的模式式,这时时,必须须借助概概率统计计这一数数学工具具。可以以说,概概率分类类法的基基石是贝贝叶斯决决策理论论。 设设有R类类样本,分分别为ww1, w2 , , wR,若每类类的先验验概率为为P(wwii), ii = 1,2 ,3,R,对对于一随随机矢量量,每每类的条条件概率率为(又又称类概概率密度度)P(X/WWii),则根根据Baayess公式,后后验概率率为:从后验概率率出发,有有Bayyes法法则: 2.1.22.2朴朴素贝叶叶
12、斯分类类器朴素贝叶斯斯分类是是一种十十分简单单的分类类算法,叫叫它朴素素贝叶斯斯分类是是因为这这种方法法的思想想真的很很朴素,朴朴素贝叶叶斯的思思想基础础是这样样的:对对于给出出的待分分类项,求求解在此此项出现现的条件件下各个个类别出出现的概概率,哪哪个最大大,就认认为此待待分类项项属于哪哪个类别别。通俗俗来说,就就好比这这么个道道理,你你在街上上看到一一个黑人人,我问问你你猜猜这哥们们哪里来来的,你你十有八八九猜非非洲。为为什么呢呢?因为为黑人中非非洲人的的比率最最高,当当然人家家也可能能是美洲洲人或亚亚洲人,但但在没有有其它可可用信息息下,我我们会选选择条件件概率最最大的类类别,这这就是朴
13、朴素贝叶叶斯的思思想基础础。朴素贝叶斯斯分类的的工作过过程如下下:(1)每个个数据样样本用一一个n维维特征向向量表示示,分别别描述对对n个属属性A11,A2,An样本的的n个度度量。(2)假定定有m个个类C11,C2,Cm。给定定一个未未知的数数据样本本X(即即没有类类标号),分分类法将将预测XX属于具具有最高高后验概概率(条条件X下下)的类类。即是是说,朴朴素贝叶叶斯分类类将未知知的样本本分配给给类Cii,当且且仅当 这样,最大大化。其其最大的的类Cii称为最最大后验验假定。根根据贝叶叶斯定理理, (3)由于于P(XX)对于于所有类类为常数数,只需需要最大大即可。如如果类的的先验概概率未知知
14、,则通通常假定定这些类类是等概概率的,即即P(CC1)=PP(C22)=P(Cm)。并并据此只只对最大大化。否否则,最最大化。注注意,类类的先验验概率可可以用计计算其中中si是类CCi中的训训练样本本数,而而s是训训练样本本总数。(4)给定定具有许许多属性性的数据据集,计计算的开开销可能能非常大大。为降降低计算算的开销销,可以以做类条条件独立立的朴素素假定。给给定样本本的类标标号,假假定属性性值相互互条件独独立,即即在属性性间,不不存在依依赖关系系。这样样, (77.8)概率,可以由由训练样样本估值值,其中中(a)如果果Ak是分类类属性,则则,其中中sikk是在属属性Akk上具有有值xkk的类
15、CCi的样本本数,而而si是Ci中的训训练样本本数。(b)如果果Ak是连续续值属性性,则通通常假定定该属性性服从高高斯分布布,因而而, (7.9)其中,给定定类Cii的训练练样本属属性Akk的值,是是属性AAk的高斯斯密度函函数,而而分别为为平均值值和标准准差。(5)为对对未知样样本X分分类,对对每个类类Ci,计算算。样本本X被指指派到类类Ci,当且且仅当换言之,XX被指派派到其最最大的类类Ci。整个朴素贝贝叶斯分分类分为为三个阶阶段: 第第一阶段段准准备工作作阶段,这这个阶段段的任务务是为朴朴素贝叶叶斯分类类做必要要的准备备,主要要工作是是根据具具体情况况确定特特征属性性,并对对每个特特征属
16、性性进行适适当划分分,然后后由人工工对一部部分待分分类项进进行分类类,形成成训练样样本集合合。这一一阶段的的输入是是所有待待分类数数据,输输出是特特征属性性和训练练样本。这这一阶段段是整个个朴素贝贝叶斯分分类中唯唯一需要要人工完完成的阶阶段,其其质量对对整个过过程将有有重要影影响,分分类器的的质量很很大程度度上由特特征属性性、特征征属性划划分及训训练样本本质量决决定。 第第二阶段段分分类器训训练阶段段,这个个阶段的的任务就就是生成成分类器器,主要要工作是是计算每每个类别别在训练练样本中中的出现现频率及及每个特特征属性性划分对对每个类类别的条条件概率率估计,并并将结果果记录。其其输入是是特征属属
17、性和训训练样本本,输出出是分类类器。这这一阶段段是机械械性阶段段,根据据前面讨讨论的公公式可以以由程序序自动计计算完成成。 第第三阶段段应应用阶段段。这个个阶段的的任务是是使用分分类器对对待分类类项进行行分类,其其输入是是分类器器和待分分类项,输输出是待待分类项项与类别别的映射射关系。这这一阶段段也是机机械性阶阶段,由由程序完完成。半朴素贝叶叶斯分类类模型(SNBBC)为了突破朴朴素贝叶叶斯分类类器的独独立性假假设条件件的限制制,除了了上述“提提升”等等方法之之外,还还可以通通过改变变其结构构假设的的方式来来达到目目的,为为此有人人提出了了半朴素素贝叶斯斯分类(SNBBG SSemii-Naa
18、ivee Baayessiann cllasssifiier)的构想想。半朴素贝叶叶斯分类类模型对对朴素贝贝叶斯分分类模型型的结构构进行了了扩展,其其目的是是为了突突破朴素素贝叶斯斯分类模模型特征征属性间间独立性性假设限限制,提提高分类类性能。目目前半朴朴素贝叶叶斯分类类模型学学习的关关键是如如何有效效组合特特片属性性。条件件互信息息度量半半朴素贝贝叶斯分分类学习习算法可可以解决决目前一一此学习习算法中中存在的的效率小小高及部部分组合合意义不不大的问问题。SSNBCC的结构构比NBBC紧凑凑,在SSNBCC的模型型构建过过程中,依依照一定定的标准准将关联联程度较较大的基基本属性性(即NNBC中
19、中的特征征属性)合并在在一起构构成“组组合属性性”(也也称之为为“大属性性”)。逻逻辑上,SSNBCC中的组组合属性性与NBBC中的的基本属属性没有有根本性性差别,SSNBCC的各个个组合属属性之间间也是相相对于类类别属性性相互独独立的。图图是SNNBC的的模型示示意图。这类模型通通过将依依赖性强强的基本本属性结结合在一一起构建建新的模模型,这这样可以以部分屏屏蔽NBBC中独独立性假假设对分分类的负负面作用用。但从从名称可可以看出出,SNNBC依依然属于于朴素贝贝叶斯分分类的范范畴。这这是因为为除了结结构上的的差别之之外,计计算推导导过程与与NBCC无异。半朴素贝叶叶斯分类类结构示示意图2.1
20、.22.3图图像金字字塔图像金字塔塔是以多多分辨率率来解释释图像的的一种结结构。119877年,在在一种全全新而有有效的信信号处理理与分析析方法,即即多分辨辨率理论论中,小小波首次次作为分分析基础础出现了了。多分分辨率理理论将多多种学科科的技术术有效地地统一在在一起,如如信号处处理的子子带编码码、数字字语音识识别的积积分镜像像过滤以以及金字字塔图像像处理。正正如其名名字所表表达的,多多分辨率率理论与与多种分分辨率下下的信号号(或图图像)表表示和分分析有关关。其优优势很明明显,某某种分辨辨率下无无法发现现的特性性在另一一种分辨辨率下将将很容易易被发现现。图像金字塔塔是结合合降采样样操作和和平滑操
21、操作的一一种图像像表示方方式。它它的一个个很大的的好处是是,自下下而上每每一层的的像素数数都不断断减少,这这会大大大减少计计算量;而缺点点是自下下而上金金字塔的的量化变变得越来来越粗糙糙,而且且速度很很快。高斯金字塔塔里有两两个概念念:组(OOctaave)和和层(LLeveel或IInteervaal),每每组里有有若干层层。高斯斯金字塔塔的构造造是这样样的,第第一组的的第一层层为原图图像,然然后将图图像做一一次高斯斯平滑(高高斯卷积积、高斯斯模糊),高高斯平滑滑里有一一个参数数,然后后将乘一个个比例系系数k作作为新的的平滑因因子来平平滑第一一组第二二层得到到第三层层。重复复若干次次,得到到
22、L层他他们分别别对应的的平滑参参数为:0,k,k22,。然然后将最最后一幅幅图像做做比例因因此为22的降采采样得到到第二组组的第一一层,然然后对第第二组的的第一层层做参数数是的高斯斯平滑,对对第二层层做k的平滑滑得到第第三层,以以此类推推。每组组对应的的平滑因因子是一一样的,这这样反复复形成了了O组LL层,组组建成高高斯金字字塔。2.1.33模糊模模式识别别 模模糊模式式识别的的理论基基础是220世纪纪60年年代诞生生的模糊糊数学,它它根据人人对事物物识别的的思维逻逻辑,结结合人类类大脑识识别事物物的特点点,将计计算机中中常用的的二值逻逻辑转向向连续逻逻辑。在在图像识识别领域域应用时时该方法法
23、可以简简化图像像识别系系统,并并具有实实用、可可靠等特特点。 模模式识别别是一门门边缘学学科,它它和许多多技术学学科有着着密切的的联系,它它本身就就是人工工智能的的重要组组成部分分,因此此,从本本质上来来说,模模式识别别所要讨讨论的核核心问题题,就是是如何使使机器能能模拟人人脑的思思维方法法,来对对客观事事物进行行有效的的识别和和分类。一一方面现现有的广广为运用用的统计计模式识识别方法法与人脑脑进行模模式识别别相比,其其差别还还很大,另另一方面面待识别别的客观观事物又又往往具具有不同同程度的的模糊性性。 不不少学者者试图运运用模糊糊数学的的方法来来解决模模式识别别问题,形形成一个个专门的的研究
24、领领域-模模糊模式式识别(Fuzzzy Pattterrn RRecoogniitioon)。比比较成熟熟的理论论和方法法有最大大来属原原则、基基于模糊糊等价关关系的模模式分类类、基于于模糊相相似关系系的模式式分类和和模糊聚聚类,其其中模糊糊聚类方方法的研研究和应应用尤为为成功和和广泛。目目前,模模糊模式式识别方方法已广广泛应用用图形识识别、染染色体和和白血球球识别、图图象目标标的形状状分析、手手写体文文字识别别等,但但其中也也遇到不不少困难难,其中中一个典典型的例例子就是是隶属函函数的确确定往往往带有经经验色彩彩。 应应用模糊糊方法进进行图像像识别的的关键是是确定某某一类别别的隶属属函数,而
25、而各类的的统计指指标则要要由样本本像元的的灰度值值和样本本像元的的隶属函函数的值值即隶属属度共同同决定。隶隶属度表表示对象象隶属某某一类的的程度。2.1.44神经网网络模式式识别 神神经网络络的研究究始于220世纪纪40年年代,上上世纪880年代代开始在在各国广广泛兴起起,神经经网络模模式识别别源于对对动物神神经系统统的研究究,通过过采用硬硬件或软软件的方方法,建建立了许许多以大大量处理理单元为为结点,各各单元通通过一定定的模式式实现互互联的拓拓扑网络络。该网网络通过过一定的的机制,能能够模仿仿人的神神经系统统的结构构和功能能。神经网络是是一种全全新的模模式识别别技术,它它具有以以下几个个方面的的特点:(1)神经网网络具有有分布式式存储信信息的特特点。(2)神神经元能能够独立立运算和和处理收收到的信信息,即即系统能能够并行行处理输输入的信信息。(3)具具有自组组织、自自学习的的能力。