《基于区域合并的纹理图像分割—MSRM算法的MATLAB实现精品资料.doc》由会员分享,可在线阅读,更多相关《基于区域合并的纹理图像分割—MSRM算法的MATLAB实现精品资料.doc(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、武汉科技大学本科毕业设计本科毕业设计题目:基于区域合并的纹理图像分割MSRM算法的MATLAB实现学 院:信息科学与工程学院专 业:电子信息工程学 号:200704135150学生姓名:张琦指导教师:郑庆庆日 期:2011/5/30摘 要图像分割是图像分析及计算机视觉系统中的重要环节,是图像处理研究中的一个基本难题。图像分割是由图像处理到图像分析的关键步骤,只有在图像分割的基础上才能对目标进行特征提取、参数测量和识别,使得更高层的图像分析和理解成为可能,图像分割质量的好坏直接影响后续图像处理的效果。因此,可以说图像分割是图像处理中最为重要的环节。基于区域的图像分割方法,将图像按内容划分成许多区
2、域。虽然存在过分割,但是可以通过研究改进算法减少过分割或选择有效的后处理算法得到有用的结果。例如,在Mean Shift和Watershed这两种图像分割算法中,一方面可以研究各种减少过分割的改进算法。另一方面,也可以采用有效的预处理,去除噪音,使图像适宜于Watershed或Mean Shift算法分割。MSRM是基于最大相似度的区域合并算法,该算法简单有效,不需要设定区域合并的阈值,且对单目标和多目标图像都能正确分割。本设计在提取了图像的颜色特征和纹理特征之后,计算相邻区域的相似度,在人工交互信息的指导下,基于最大相似度准则逐步对初始过分割区域进行合并,分离出图像中的目标和背景。关键词:
3、MSRM;区域合并; 交互式图像分割;算法;纹理图像AbstractImage segmentation is the important elements of image analysis and computer vision systems ,and it is a fundamentalproblem in image processing。 Image segmentation is a key step that from image processing to the image analysis。Only on the basis of image segmentation
4、to object feature extraction, parameter measurement and recognition,which make it possible to analysis and understanding of the higher-level image, and the quality of image segmentation directly affects the effect ofsubsequent image processing. Therefore, we conclude that image segmentation is the m
5、ost important part of image processing.Region-based image segmentation method is divided into many regions according to the contents of the image。Although there is over-segmentation,studing improved algorithm can reduce the over-segmentation or choosing an effective post-processing algorithms are us
6、eful results. For example, in both Mean Shiftt and Watershed image segmentation algorithm, One can study a variety of improved algorithm to reduce over-segmentation, On the other hand, effective pretreatment can also be used to remove noise, and make the image suitable for Mean Shiftt and Watershed
7、segmentation algorithm.MSRM is a algorithm which based on the maximum similarity of the region merging, the proposed algorithm is efficient and effective, it does not require a preset threshold and can successfully extract the single objective and multi-target image from complex scenes . In this des
8、ign, calculate the similarity of adjacent regions afte the extration of image color features and texture features, under the guidance of interaction information ,a maximal similarity based region merging mechanism was proposed to gradually merged the initial over-segmentation of regions. Then separa
9、ted the target and background from image.Keywords: MSRM; Region merging; Interactive Image Segmentation; Algorithm; Texture image目 录1 绪论11.1 研究的背景和意义11.2 内容与组织结构12 图像分割技术研究综述32.1 引言32.2 图像分割的概念和分类32.3 基于阈值的图像分割 42.4 基于间断检测的图像分割42.5 基于区域的分割42.5.1 基于区域生长的分割52.5.1 基于分裂合并的分割62.5.1 基于聚类的分割72.5.1 基于形态学的分割
10、72.6 本章小结73 基于最大相似度的交互式区域合并算法的研究83.1 引言83.2 区域表示和相似性度量93.3 目标和背景标记93.4 基于最大相似度的区域合并机制103.5 区域合并算法113.6 收敛性分析133.7 本章小结144 图像分割系统设计及实验结果154.1 引言154.2 图像分割系统154.3 实验结果与分析154.3.1 实验结果154.3.2 鲁棒性分析164.3.3 分割效率分析194.3.4 结论20结 束 语21参考文献22致 谢24471 绪论1.1 研究的背景和意义计算机视觉是通过计算机模拟人类视觉行为的一门学科,其任务为对输入的图像(序列)数据自动进行
11、分析和解释。根据数据的组织形式,计算机视觉可划分为四个层次。最底层是原始的目标或场景,通过信号处理和数字化,得到对应图像的数字化表示形式;中间层则借助各种各样的算法,提取图像的各种特征,在各层之间建立联系;最后顶层通过模式识别方法,进行图像理解。视觉处理方法可分为两类:低级的图像处理方法和高层的图像理解方法。前者不需要预先知道图像的内容,通常包括图像压缩、图像恢复、图像分割、边界检测等方法,为高层的图像理解提供支持。而后者是根据目标的相关知识及一些实现方法,基于低级阶段获取的图像特征来模拟人的视觉和做决策的过程,通常包括目标识别、图像理解、3D视觉和目标运动分析等。随着信息时代的来临,越来越多
12、的各种信息充斥着人们的生活,人们渴望利用计算机来处理繁多的信息。而科学研究表明,人类获取的信息中有 75左右来自于自身的视觉,即大部分信息为图像图形信息。图像信息相对于其他类型的信息来说,最大的优势在于信息量大、直观、形象、易于理解等特点。因此,数字图像分割技术为越来越多学者所重视,正逐渐成为网络信息时代一个新的研究热点1。 图像分割23是图像分析及视觉系统中的重要环节,是图像处理研究中的一个基本难题。图像分割是由图像处理到图像分析的关键步骤,只有在图像分割的基础上才能对目标进行特征提取、参数测量和识别,使得更高层的图像分析和理解成为可能,图像分割质量的好坏直接影响后续图像处理的效果。因此,可
13、以说图像分割是图像处理中最为重要的环节。纹理是图像的一个重要特征。以纹理特性为主导的图像称为纹理图像4,纹理图像是图像的重要组成部分,通常运用各种观测系统获得的图像大多是纹理型的,在航空航天遥测领域中,各种航空、卫星遥感图像是对地面宏观大范围的考察,这类图像大多是纹理型的,通过对这些图像的分析可获得地质状况、土地利用、植被长势等一系列信息。纹理分析在材料科学的微结构定量分析、海洋学研究及石油勘探中都有广泛的应用,因此基于纹理的图像分割具有重要的理论意义和广阔的应用前景。直到今天,纹理图像分割是图像分割中的一个经典难题。尽管人们在纹理图像分割方面已取得了大量的研究成果,但由于纹理图像的复杂性和缺
14、乏一个统一的图像分割理论框架,目前尚无提出通用的分割理论,现已提出的算法大都是针对具体问题。纹理分割问题仍然是图像处理和机器视觉领域中一个非常艰巨的和富有挑战的课题。综上所述,采用自适应的方法将进一步推动纹理图像分割技术的发展,提高纹理图像的分割质量和效率。本文选择基于区域合并的纹理图像分割算法MSRM算法作为研究课题,对于改进图像分割技术,丰富图像分割方案,提高数字图像分割系统的性能具有一定的理论价值和现实意义。 1.2 内容与组织结构第一章介绍了数字图像分割技术起源、发展,给出了其描述性定义;指明了纹理图像分割技术是图像处理和图像分析关键所在,是本文的研究重点;最后概述了本文的主要内容及结
15、构。第二章对数字图像分割技术重要基础性概念及相关的研究进行了综述,分类介绍了阈值分割、间断检测分割、区域分割等图像分割技术,重点介绍了与本文研究相关的区域分割算法。 第三章首先描述了基于最大相似度的区域合并算法MSRM算法的背景和由来,接着进一步详细阐述该算法,并指明MSRM算法以Mean Shift算法的分割结果作为基础;验证了图像分割算法的收敛性。 第四章根据提出的MSRM算法,设计出一个自适应图像分割系统,运用Matlab7.10工具,通过实验和仿真验证的该解决方案具有自适应和高效的特点。 2 图像分割技术研究综述2.1 引言虽然图像分割技术是隶属于图像处理领域的一个分支学科, 但是由于
16、图像分割技术涉及的学科领域比较广泛,更应该将其视为一个交叉性学科。因此学者们看待该问题的研究角度和出发点各不相同,也就给出了较多的模型和相关的概念。这一章,将按照图像分割技术的技术特点和原理,对三种主要类型图像分割技术的相关概念和典型的解决方案进行详细的评述。 2.2 图像分割的概念和分类图像分割是图像处理技术的经典难题之一, 也是图像分析和模式识别等高级图像处理操作的流程中的关键步骤, 图像的分割结果直接决定了后期图像处理的效果和质量。所谓图像分割是指将图像中具有特殊含义的区域分割开,且这些区域互相不重叠, 同时每个区域都满足特定的区域一致性条件。 从工程实现的角度,图像分割又可以定义为将图
17、像划分成互不相交(不重叠)区域的过程。从集合论的角度出发,文献1给出了一种较通用的图像分割描述性定义。定义 1 令表示整个待分割图像区域,从而可以将图像分割看作将划分为n个满足以下条件的子区域,的过程: (1) ,且是连通的; (2) 对所有的 和,且,有; (3) 对于,; (4) 对于,有。 其中,是定义在区域内所有点上的逻辑谓词,表示空集。 条件(1)说明分割必须是完全的(即每个像素必须属于一个子区域),且子区域自身必须是连通的;条件(2)说明各个分割区域之间相互不重叠;条件(3)说明同一个分割区域中的像素具有相同的属性(如具有相同的灰度值) ;条件(4)说明不同分割区域 和 对于谓词是
18、不同的。 由于图像分割技术应用广泛且与其他学科(如光学、统计学、生物学等)联系紧密,所以图像分割的解决方案和思路呈现出多样化的趋势,并激发了越来越多学者的研究兴趣, 使得对图像分割技术的研究在图像处理领域始终保持着热点地位。在大量关于图像分割技术的科技文献中,己经提出了相当丰富的分割方法和系统的解决方案,尤其是近20年来出现的图像分割方法,不仅包括对原有方法的继承和改进,还涌现出一些新思路、新方法,如基于马尔科夫随机场模型的图像分割56、小波分形的图像分割7、模糊聚类89、基于人工神经网络的图像分割方法10等。图像分割方法一般是基于局部像素点的两个基本特性:不连续性和相似性。按照该特性可以将这
19、些已有的图像分割方法归为三类:基于阈值的分割方法、基于间断检测的分割方法、基于区域的分割方法。此外,还有一些比较特殊的图像分割方法,比如混合几种基本分割方法的复合图像分割方案,引入待分割图像先验知识的智能图像分割方案,用于视频特征提取的时域图像分割方案等等。接下来,本章将按照以上的分类方法对图像分割技术进行综述。由于本文着重于基于区域合并的纹理图像分割,故将重点介绍基于区域合并的图像分割,以便为下一步的研究工作提供指导。 2.3 基于阈值的图像分割阈值图像分割又称为门限图像分割,其原理简单、易于实现,是一类被广泛应用的图像分割方法, 其历史可以追溯到上个世纪60年代。 早期的阈值分割方法,主要
20、是围绕灰度图像展开研究的,后来被部分学者推广到彩色图像分割技术中,如文献11提出的一种用于彩色图像分割的多维直方图阈值方法。近年来,更多的学者倾向于将阈值分割方法与其他的图像分割方法结合起来使用。如文献12中运用模糊理论确定最优阈值,文献13将神经网络方法与传统的阈值分割技术结合起来,获得最优阈值,解决了免疫组织化学中的细胞分割问题,等等。 2.4 基于间断检测的图像分割大部分情况下,对于自然界中的图像而言,其目标与背景之间边界部分的色彩、灰度都是不连续分布的,即边界两边像素的灰度级存在明显的跳变。这就是基于间断检测的图像分割技术的前提假设, 基于这种不连续性的假设所考察对象的不同,可将该类分
21、割技术分为三个主要类型:基于点的检测、基于线的检测、基于边缘的检测。 2.5 基于区域的图像分割无论是图像阈值分割方法还是间断检测分割方法,都没有考虑目标或背景内部像素间的信息关联性,而这一特性在机器视觉中却是尤为重要的。基于区域的图像分割方法正是从目标和背景内部的像素间相似度角度出发,面向像素对图像进行分割的,具有前两大类方法无法比拟的优势。文献14对数字图像像素的概念及特性进行了全面的分析。按照处理图像的方向性,基于区域的分割算法可以分为区域生长和分裂合并两种类型。此外,还有一些对这两类分割方法的推广和改进,如形态学分割方法、聚类分割方法等。 2.5.1 基于区域生长的分割区域生长分割算法
22、的基本思想:将图像中具有相似性质的像素整合在一起构成一个区域。在生成每个区域的过程中都要设定一个用于生长的种子像素,根据不同类型的图像给定生长准则,来判断种子周围的像素点是否与种子像素之间具有相似性,即是否可生长。如果可生长,则把该像素加入到区域中,并置其为新的种子像素,进行迭代。具体步骤如下:(1)对每个需要分割的区域找一个种子像素作为生长的起点。(2)将种子像素周围邻域中与种子像素具有相同或相似性质的像素合并到这一区域中。(3)将这些新像素当作新的种子像素继续进行上面的过程,直到再没有满足条件的像素被包括进来。在实际应用区域生长法时需要解决三个问题:(1)选择或确定一组能正确代表所需区域的
23、种子像素。(2)确定在生长过程中能将相邻像素包括进来的准则。(3)制定让生长过程停止的条件或规则。种子像素的选取常可借助具体问题的特点进行,利用迭代的方法从大到小逐步收缩是一种典型的方法。生长准则的选取不仅依赖于具体问题本身,也和所用图像数据的种类有关。一般生长过程在进行到再没有满足生长准则需要的像素时停止。由于相似性通常是用统计的方法确定的,所以基于区域生长的分割算法对噪声不敏感。但是,区域生长分割算法的问题在于:种子像素点需要由操作人员按照分割需求来设定,对于复杂图像的处理,区域生长分割算法的效率会大大降低;而且分割效果依赖于种子点的选择及生长顺序。对此,文献15提出了一种通过计算种子点附
24、近邻域统计信息,自适应改变生长标准参数的算法。导致基于区域生长的分割算法效率较低的另一个原因是算法的串行性。对此,文献16研究并提出了并行性区域生长分割算法。 2.5.2 基于分裂合并的分割分裂合并算法的基本思想:对整个图像分裂得到所有的分割区域,然后按照一定的规则对这些区域进行合并。该方法的重点是指定分裂、合并的准则,并考虑处理的精度。通常的作法是用网格简单地对原图像进行分裂操作,网格的多少取决于希望获得的分割精度; 通过比较各个分裂区域的灰度值均值和方差等统计量,来确定分裂区域的一致性。 整个分裂合并的过程如下: (1)对谓词,如果,就把区域 分裂成4个象限子区域; (2)如果相邻区域和满
25、足,则对这两个区域进行合并; (3)如果无法进行分裂或合并操作时,结束。 基于分裂合并的分割算法同样是基于统计学方法的,所以对噪声也不敏感。但是区域分裂技术的固有缺点是可能会使边界被破坏,且算法在精度与时间复杂度上存在冲突,需要找到一个均衡点,但这往往是很难的。 2.5.3 基于聚类的分割图像的分割问题可看成是像素分类问题, 所以可以通过使用特征空间聚类算法实现。特征空间聚类分割将图像的所有像素都一一映射在特征空间的每个点上,对特征空间进行分割, 最后再次通过映射关系将分割结果定位在原始图像上,从而实现了图像目标的分割。该过程不需要训练样本,是一种无监督、迭代式的统计分割过程。在基于特征空间聚
26、类的算法中,K-均值聚类17、模糊C-均值聚类(FCM)等算法是最常用的聚类算法。 K-均值聚类算法先选取K个初始类均值,然后将每个像素归入均值离它最近的类,并计算新的类均值,迭代执行前面的步骤直到新旧类均值之差小于某一阈值。模糊聚类的思想Dunn首先提出,是对K-均值聚类算法的推广。其基本的思路为: 将由个维数为的样本组成的数据集分为c类,则模糊隶属度矩阵表示,并满足以下条件:(1);(2);(3)。那么,模糊-均值聚类就可以通过最小化关于隶属度矩阵和聚类中心集合的目标函数并繁复迭代来实现。但是,该方法没有考虑图像各个像素之间的空间几何分布特征,对噪声和不均匀灰度敏感。 2.5.4 基于形态
27、学的分割近年来,数学形态学已发展为一种新型的数字图像处理方法和理论,在边缘检测和图像分割中得到了广泛的研究和应用。它的基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。利用膨胀、腐蚀、开启和闭合四个基本运算进行推导和组合,可以产生各种形态学实用算法,其中结构元素的选取很重要。腐蚀和膨胀对于灰度变化较明显的边缘作用很大,可用来构造基本的形态学边缘检测算子(形态学梯度)18。 2.6 本章小结比较分析上述各种类型的图像分割技术,可以发现: 阈值图像分割技术是最简单的一类分割方案,其计算量小、易于实现,但是在对非理想边缘以及复杂灰度分布图像的分割时不能得到有
28、效的分割结果,甚至会导致错误分割。 基于间断检测的分割技术比较适用于对纹理图像的分割,但是需要根据不同的图像设置不同的检测模板,且该类算法普遍对噪声敏感。尽管采用 LoG,Wavelets 等多尺度方法对其进行改进,降低对噪声的敏感程度,但却导致系统的计算复杂度大大增加。而且,由于边缘检测分割的结果是非闭合的,还需额外考虑多尺度分割结果的融合问题。 基于区域的分割方案,考虑到了图像像素之间的相似性和连通性,这正是前两类图像分割方案所不具备的。所以,在图像信息向着高清晰度发展的趋势下,选MSRM分割算法对图像进行分割处理是非常适合的。而且,MSRM算法的另一个重要特性就是易于并行实现,这一特点也
29、是非常复合现今对图像分割技术的实时性、高效性要求的。 3 基于区域合并的纹理图像分割算法的研究3.1 引言基于区域的图像分割方法,将图像按内容划分成许多区域。虽然存在过分割,但是可以通过研究改进算法减少过分割或选择有效的后处理算法得到有用的结果。例如,在Mean Shift19和Watershed20这两种图像分割算法中,一方面可以研究各种减少过分割的改进算法。另一方面,也可以采用有效的预处理,去除噪音,使图像适宜于Watershed或Mean Shift算法分割。虽然有很多图像分割方法致力于解决图像分割问题,它们在一些特定的对象中能取得较好的结果。但是,总的来说,图像,特别是彩色图像包含着复
30、杂的纹理和颜色特征,使得全自动图像分割几乎成为不可能的任务。因此,一些结合用户输入或先验信息的半自动图像分割方法,即交互式图像处理21,成为近年来研究的热点。如经典的ACM方法,实际上也是一种半自动图像分割算法,适当地选择初始曲线,是得到好的分割结果的必要条件;基于标记驱动的Watershed图像分割方法22,它结合用户的输入信息,提高分割结果;在Graph Cut方法中,用户的交互式信息也是影响算法的分割结果至关重要的因素。这些交互式图像分割算法通常是以像素为处理单位,但是,它们的一些基本思想显然也适用于基于区域的处理,从而能够改进分割结果。虽然,Mean Shift和Watershed等算
31、法通常存在着过分割,但是它们得到了一个较好的初始分割结果,即每个区域都包含着目标或背景的一些特征,为后续区域合并处理提供了一个基础。但是,因为目标和背景通常呈现复杂的特征,传统的基于固定阈值的合并方法很难得到有效的结果,因此需要研究新的算法解决复杂条件下的区域合并。本章的研究对象是彩色(自然)图像的分割问题。将以Mean Shilt算法的分割结果作为基础,提出一种新的交互式区域台并算法,来提取自然图像中的目标。本文所使用Mean Shift分割软件是EDISON System23它是个开放的Mean Shift分割软件,界面友好,功能完善,是研究Mean Shift算法很好的平台。图3.1展示
32、了分割软件的一个实例。其中(a)为原始图像,(b)为EDISON System分割后得到的包含很多小区域的结果。图3.1EDISON System分割的例子3.2 区域的表示和相似性度量Mean Shift算法一般将图像分割成一些区域,每个区域具有一定的特征。本文采用RGB颜色空间表示每个区域,当然,其它颜色空间,如HsI和Lab等,也可用于对区域建模。将RGB颜色空间量化为16x16x16=4096箱格,然后计算每个区域的规范化直方图。为了度量区域之间的相似性选择Bhatlacha系数测量区域R和Q的相似度: 3.1式中,和分别表示区域R和Q的直方图。上标u表示直方图的第u个箱格。3.3 目
33、标和背景的标记在交互式图像分割,用户需要指定目标和背景的概念。用户可以在图像上通过绘制标记,如直线,曲线和笔划等来输入上互动信息。含有目标标记像素的区域因此被称为目标标记区域,而含有背景标记像素的区域被称为背景标记区域。图3.2(b)显示了用简单的线条标记目标和背景的例子。我们用绿色标记来标示目标而使用红色标记来表示对象的背景。请注意,通常只有一小部分的目标区域和背景区域会被用户标记。实际上,用户的必要输入越少,交互式算法就越方便越强大。图3.2 (a)初始分割。(b)由用户交互式的信息输入。绿线是目标标记和红线是背景标记。 (c)区域分割的结果。 目标标记完后,每个区域将被标记为三种类型的地
34、区之一:目标标记区域,背景标记区域和未标记的区域。要完全提取物体轮廓,我们需要将每个未标记的区域自动正确的标记为目标区域或背景区域。为了方便的后续讨论,我们分别用和表示目标标记区域集和背景标记区域集,用表示未标记区域集。3.4基于最大相似度的区域合并机制经过目标/背景的标记后,准确地从背景中提的目标轮廓仍然是一个具有挑战性的问题,因为用户只指示了一小部分目标/背景的特征。传统的方法中,只有邻近区域的相似性超过预设的阈值24才将两个区域合并。这些方法在自适应阈值选取上存在困难。一个过大的阈值将导致目标的区域的不完全合并,而过小的阈值可以很容易造成过合并,即一些目标区域被合并为背景区域。此外,也很
35、难判断何时该停止区域合并进程。 目标和背景的标记分别提供了对象和背景一些关键特征。在于基于标记控制的分水岭分割算法中,标记是算法的种子和出发点。类似的,提出的区域合并方法也将从初始标记区域开始,然后所有未标记区域将逐渐标识为目标区域或背景区域。这个懒惰的方法提出了对齐抠出方法25 ,它结合了基于分水岭初始分割的图形切割,这实际上是一个采用最大流算法的区域合并方法。在本论文中,我们提出了一种自适应地基于极大的相似性的合并机制,以辨别在目标和背景标记指导下所有未标记区域。设表示的一个相邻区域,表示的所有相邻区域的集合。所以与它所有邻域相似性表示为,显然。如果和的相似性为中最大的,我们就将和合并。合
36、并规则定义如下: 若,则合并与。 3.2 合并规则(2)非常简单,但它确立了该区域合并进程的基础。(2)一个重要的优点是它避免了合并控制中相似性阈值的预置。虽然最值运算操作对异常值敏感 ,但我们经验发现算法工作良好。 这主要是因为,直方图是对本地区全局描述,它具有很强的噪音和很小的变化。 但是,标记区域仅覆盖一部分的目标和背景,那些目标和背景中的非标记区域也应当被自动识别并正确标记。总的来说,标记区域包含了相应的主要特征,因此,未标记的目标区域与目标标记区域,以及未标记的背景区域与背景标记区域有着更高的自相似度。所以通常情况下,非标记的目标区域不会与背景区域相合并。类似地,未标记的背景区域同样
37、不会与目标区域相合并。 3.5 区域合并算法基于最大相似度的区域合并算法(Maximal Similarity based Region Merging,简称MSRM),分为两个迭代地执行的阶段,直到没有新的区域合并发生。合并策略是尽可能合并背景区域,而保持前景区域不被合并。一旦合并完所有的背景区域,等价于提取了目标。对每一个区域,确定其邻域集合。对每一个,如果,求其相应的邻域集合,显然。然后计算和中的每一个区域的相似度。如果和,满足下式:那么和,合并成一个区域,新的区域将和B有相同的标记,即:否则,和将不台并。以上的过程迭代进行。在每一次迭代中,集合和将被更新其中,膨胀、收缩。当所有背景标记
38、找不到新的合并对象时,迭代结束。经过第一阶段,部分属于背景的区域互相合并。但是,仍有一些背景区域因为彼此间具有更大的相似度因此它们不能和背景标记区域合并。第一阶段的合并结果如图3.3(a)所示。可以看出,经过第一阶段后,大多数属于背景的区域己被合并,但仍有一些未标记的背景区域未和背景标记区域合并。为了完成目标提取,第二阶段将以第一阶段剩下的未标记区域N为处理对象,其中包含部分目标特征,同时也包含部分背景特征。未标记区域在最大相似度规则的指导下互相融合,即目标部分互相融合,背景部分互相融合。经过第一阶段台并之后,对每一个未标记区域(属于目标或背景) ,构成它的邻域集合,-接着,对每一个,如果其满
39、足和,构成它的邻域集台。那么。计算和中每一个区域的相似度。如果P和,满足下式:那么将P与H,合并成一个区域否则,它们不能合并。以上过程迭代至未标记区域中不再发生合并为止。图3.3(b)表明,经过第二阶段的合并之后,一些未标记目标区域和未标记背景区域分别互相融合。接着,重复地执行第一阶段和第二阶段,直到没有新的合并发生。最后,每个区域被标记成两类:目标或背景,图3.3(d)显示了最终提取的目标。在绝大部分实验中,算法将在2-3个回合结束。图3.3 区域合并过程(a)第一回合第一阶段(b)第一回合第二阶段(c)第二回合第一阶段(d)第二回合第二阶段MSRM算法 输入:初始均值漂移分割结果。输出:最
40、后的分割图。当处于最后循环的区域合并中,第1阶段。将未标记区域N与背景标记区域合并。输入:初始分割结果或第二个阶段的合并结果。 (1-1)对于每个区域,构成其邻域集合。(1-2)对于每个且,构成其邻域集合。(1-3)计算,如果,那么。否则B和不合并。(1-4)更新和N。 (1-5)如果的地区无法找到新的合并对象,第一阶段合并结束。否则,返回到(1-1)。 第2阶段。自适应地合并未标记区域。输入:第一阶段合并的结果。 (2-1)对于每个区域,构成其邻域集。(2-2)对于每个,且,构成其邻域集合,显然。(2-3)计算。如果,那么,否则,P与不再合并。(2-4)更新N。(2-5)如果在区域N无法找到
41、新的区域合并,第二阶段停止。否则返回到(2-1)。 结束3.6 收敛性分析该MSRM算法是一个迭代的方法。它逐步将未标记背景区域N分配到,然后把所有剩下的区域分配到。可以很容易地看出该方法收敛。我们有以下定理。 定理1 2.4节中的MSRM算法收敛,即所有的N区域经过若干迭代会被标记为目标或着背景。证明如下:如果在第一个阶段,一个未标记区域在其邻域中有最大相似度区域B(),那么P与B合并,即。如果和P有最大相似度的区域B在目标标记区域中,那么P将保留。如果P和另一个未标记区域P( PN)有最大相似度,那么P与P将在第二阶段合并即P= P P。根据以上分析,在迭代的下一个回合,P将与或其与另一个
42、未标记区域P合并,或仍保持不变。如果在某次选代后任一个未标记区域P在或N中找不到相应的合并对象,算法将停止。从上面过程可以看出,随着合并的进行,来标记区域中的一部分与目标标记区域合并,一部分将与背景标记区域台并,因此未标记区域N的个数将会逐渐减少。一旦N停止减少,整个算法将停止,N中所有剩下的区域将被标记为。因此,N中所有的区域全部被标记,算法收敛。3.7 本章小结本章首先提出对彩色图像进行分割的算法,将以Mean Shift算法的分割结果作为基础,提出一种新的交互式区域台并算法,来提取自然图像中的目标。接着对MSRM算法的背景知识做了介绍,即区域的表示和相似度的度量,以及标记的划分等。然后详
43、细描述基于最大相似度的区域合并算法,MSRM分为两个迭代地执行的阶段,直到没有新的区域合并发生。合并策略是尽可能合并背景区域,而保持前景区域不被合并。一旦合并完所有的背景区域,等价于提取了目标。最后本章指出了算法的收敛性,并进行了证明。4 系统设计及实验结果4.1 引言MATLAB是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。本文采用MATLA7.10完成系统设计。4.2 图像分割系统为了验证本文的算法,本文设
44、计了一个自适应图像分割系统,该系统由3个模块组成,预处理模块、标记模块、和区域合并模块。该系统的总体框架如图所示, 图像分割系统预处理模块标记模块区域合并模块图4.1 图像分割系统框架预处理模块的功能是:将原始的图片进行初始分割,这里采用的Mean Shift算法,初始分割后保存的文件名为imagename_IniSeg.png。由于本文着重于区域合并算法,这里采用EDISON System23,它基于边缘信息对Mean Shift方法进行了扩展,区域性更好,可以识别微弱边缘。标记模块的功能是:根据用户鼠标动作所完成的输入,在初始分割后的图像上做好相关的标记。其中目标标记为绿色,背景标记为红色
45、。区域合并模块是本文的核心部分,其功能是:根据目标和背景的标记结果和初始分割得到的小区域,按最大相似度规则进行合并,最后提取目标的轮廓。4.3 实验结果与分析通过一些有代表性的例子测试提出的算法,然后进行鲁棒性分析以及介绍可能失败的情况,最后分析了提出算法的局限性。4.3.1 实验结果MSRM算法本质上是一个自适应区域合并方法。当用户输入交互式信息之后,算法将自动地进行区域合并,将区域标记为目标或背景区域。图4.2显示了从天空背景中提取飞机的例子。图4.2(a)表示Mean Shift分割结果及交互式信息,其中绿色的标记表示目标,红色的表示背景,标记区域仅覆盖了目标和背景的一部分。算法效率很高
46、,只需很少的标记,经过两阶段的区域合并之后,图4.2(d)显示,目标被成功地提取。图4.3为从复杂背景中提取一双鞋子。图4.3(a)显示,Mean Shift分割存在严重的过分割。目标相对位于图像的中央,但是背景区域的颜色差异很大,而且目标和背景有混叠。图4.3(b)显示,MSRM算法仍成功地从背景中提取目标。该算法方法可容易推广到多目标提取,图4.3显示了一个例子。在图4.3中,目标是提取草原场景中的若干只幼狮。几只狮子的体色和背景类似,该算法仍然能使用几个简单的标记,成功地将它们与背景分离。图4.2区域合并过程 (a)到(d)显示了图像分割的过程图4.3从复杂背景中提取一双鞋子图4.4 一
47、个多目标提取例子4.3.2 鲁棒性分析和失败情况MSRM算法是一种交互式的图像分割方法,需要由用户输入标记。因此,用户输入的标记一定程度上会影响分割结果。根据大量的实验,发现只要标记能够覆盖目标的主要特征, MSRM通常能够可靠地提取目标。图4.5的第七行图像是从复杂的背景中提取一只天鹅,MSRM算法执行效果非常好。图4.5(b)显示,用更少的标记,仍可以提取天鹅的基本轮廓。图4.5用两种不同的标记提取目标得到了相同的结果。但是,当阴影出现、目标和背景间存在着模糊区域或对比度较低时,MSRM算法分割性能会有所下降。例如,在图4.6中,人物目标和鲜艳的背景比较相似,在一些区域,提出算法的分割结果将目标的一部分划分为背景。其次,提出的算法以Mean Shift算法的分割结果作为基础,因此,如果Mean