《数字图像修复算法的研究大学本科毕业论文.doc》由会员分享,可在线阅读,更多相关《数字图像修复算法的研究大学本科毕业论文.doc(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数字图像修复算法的研究目录引言 3 1数字图像修复的概况61.1图像修复的研究背景与意义61.2图像修复算法的国内外研究现状82图像修复理论122.1认知心理学格式塔理论与图像修复122.2图像修复的三大原则142.3图像修复效果的评判标准153 经典算法介绍173.1基于SOM网络的图像修复173.2基于纹理合成的图像修复224基于TV模型的数字图像修复314.1TV修复模型的介绍314.2 TV修复模型的基本原理334.3 TV修复模型算法的数值实现354.4实验结果与分析40结论47致 谢48参考文献50附录1 源程序清单52 沈阳大学毕业设计(论文) 摘要对图像的损坏或缺失区域进行修复
2、在数字图像处理领域是一个重要课题。同样在信号处理、计算机视觉和计算机图形学也是一个热点问题,主要任务是让计算机自动按照人眼视觉特点,根据图像破损区周边的信息来修复指定的破损区。数字图像修复是对图像中信息缺损的区域进行的修复,其主要目标是修复有信息缺失的部分,并使人们没有办法发觉图像曾经破损或者已经被修复。在该领域的研究,国外的发展要比国内的发展好的非常多。为了提高受损数字图像的修复质量,将整体变分模型用在图像修复中。本文阐述了全变分修复模型的原理数的实现算法。基于Matlab编程软件对修复过程仿真的实现,克服了直接求出偏微分方程的难题。仿真实验结果证明,这种算法收敛快、修复图像的视觉质量也非常
3、好,特别适合线状裂痕的图像修复。随着迭代次数的增长,被修补区域贴近原图的质量,当破损区域较小而且受损区域灰度梯度不大的时侯,不会出现明显的修复痕迹。关键词:破损图像;全变分;算法收敛;数字图像修复;偏微分方程AbstractReconstruction of missing or damaged regions of images, known as inpainting or retouching is a very important topic in image processing and a hot spot in signal processing, computer vision
4、 and computer praphics. Its main work is to make a computer automatically inpaint appointed damaged region in a digital image according to the information of the regions around the damaged regions and characteristics of human vision.Image restoration is to repair the damaged area of the image, its m
5、ain task is to repair the part of information deletion, and make people have no way to find the damaged images have been repaired. In the field of research, the development of foreign is better than the development of the domestic. In order to improve the inpainting quality of the damaged image, the
6、 TV model is used for image restoration. TV model are introduced in this algorithm, and the application of model. The TV model theory, structure and numerical algorithm are introduced. The process of repairing is programmed based on matlab software, overcomes the problem of partial differential equa
7、tions directly. Simulation experiment results show that this algorithm converges fast, the repair quality is very good, especially suitable for image restoration of the linear cracks. As the growth of the number of iterations, the repaired area is close to the original image quality, when the damage
8、d area is small and the damaged area is small and the damage area gray gradient is not big, it cannot appear obvious trace.Keywords: damaged image;total variation;algorithm convergence;digital image inpainting; partial differential equation.引言随着Internet的讯速发展,信息爆炸式增加,信息负荷问题变的越来越厉害。信息的更新速率也变得越来越高了,在大量
9、而又广泛的信息里要想查找信息就难如登天。那是因为搜索引擎的顺势的原因,却能够在很大程度上适应搜索信息的需求。伴着Internet的搜索引擎的日趋庞大和深入的发展,进一步突显出大量信息和日益增长的所需信息能力的矛盾。所以,怎样从中获取一定的内容知识和信息成为难以解决的一种困扰。对于互联网时代大量杂乱的信息,文本挖掘技术对于深层次综合利用信息和智能高效地处理有着非常重要的作用。国际有很多的国家得到文本挖掘技术,来期待对“堆积如山”的信息进行大量的过滤,开发和利用,提取发现有价值的知识。为了可以长久的保存珍贵的文物图画、老旧照片和难得的电影视频等,一般都会采用计算机扫描技术把它的信息储存到计算机中,
10、但是这样的过程中,不可避免把折痕、污点或者划痕等情况一起带到图像中来,所以为了确保获得的图像信息的视觉效果,要求将破损的数字图像修复完整。在计算机视觉领域和计算机图形学等领域数字图像修复技术现在发展成为一个研究热点,并在医要、工业、影像等领域获得了愈来愈广泛的应用。数字图像修复技术理所应当地成为一个好的选择。因为它不仅可以反复修理,直到用户满意的数码图像的视觉效果,而且没有损害原始图像的风险。图像修复是图像处理的一个重要组成环节,主要是使用某种方法来修复图像的划痕和缺陷,或将指定的对象从图像和文本中删除,以达到预期的目的。经过计算机应用一定的算法对图形图像进行处理的技术把它叫做数字图像。数字图
11、像的处理是讨论“图像信息的变换、显示、选取、传送、储存、综合与理解”的一门新兴的学科。按照不同的抽象程度,图像的处理又可以分作以下几个阶段:图像分析、图像的理解和狭义图像的处理。图像中缺失或者破坏的部分根据图像修复技术1,通过没有被破损的图像信息,按照特定的规则填补,使填补后的图像接近或达到原始图像的良好视觉效果。破损的珍贵作品要经过图像修复有效的数字化,并除去图像中的文字或者其他不期望的对象;也可以用于视频的点播,改善网络中取舍或者破损的视频信息的视觉效果。图像修复使用一些特定的算法主要针对产生划痕和缺陷破碎的图像进行修复,或者从图像中删除文字和制定对象的方法,以达到特定的目的。数字图像修复
12、是一种新兴技术,伴着计算机硬件的快速发展,数字图像的及时处理已成为可能,随着数字图像修复的多种算法的出现,使得其处理越来越便捷,能更好的被使用。数字图像处理技术到目前为止已经在各个领域上都有了比较普遍的应用。图像处理的信息量非常大,要求处理速度也比较高。MATLAB强大的图形展示和运算功能,使图像被处理得更加的简单和直观。本文主要介绍了TV模型对数字图像修复的贡献,TV模型的算法2和运行方法,为了实现该功能主要使用MATLAB软件。MathWorks公司推出的MATLAB软件是学习数理知识的好帮手。应用MATLAB友好的界面和丰富、实用、高效的指令及模块,能够使人很快地认识、理解图像处理的相关
13、概念,逐渐的掌握图像信号处理的基本方法,进而能够解决相关的工程和科研中的问题。MATLAB是一款主要用来数值计算和图像处理的软件工具。由于采用了矩阵的方式来存储数据,所以在图像处理领域才能发挥速度快,效率高等优点。它拥有许多功能强大的工具箱,用户能够借助这种工具箱很方便的进行处理工作和图像分析。另外,和其它软件相比, MATLAB不仅有对于图像处理的针对性,而且还有代码简洁的特点。正是因为上述情况,本文的算法用MATLAB来实现,并且能取得不错的效果。1数字图像修复的概况1.1图像修复的研究背景与意义 今天世界日益数字化,很多珍贵经典电影、文物图画、档案照片或图片等,可以通过扫描技术存储到计算
14、机中,来便于长期保存。但是或多或少有折痕、划痕、污渍等,假如手工修补就要求靠专业人士,势必耗费很多的人力物力和财力。面临这种的情况下,自动的图像修复技术就是一个较理想的选择。自动图像修复技术可以不断的修改直到达到满意的视觉效果,这样的修复方式不会对原有作品造成毁坏的风险。有的图像和拍摄电影的影片,需要删除图像和胶片中多余的文字和特定事物等,一般图像中损失的部分会用背景相似部分去填充修复,这也是图像修复的重要课题。数字图像修复最早发源于欧洲文艺复兴时期是一项非常古老的艺术。在图像处理中图像修复技术是一个重要的组成部分。当时,为了弥补美术作品中缺失或被损坏的现象,保持作品的整体质量。因为人类拥有丰
15、富的想象力,所以运用各种手段来填补裂缝、划痕,尽量恢复作品原貌。那个时期的处理对象还不是数字图像,没有备份,没有撤销,完全是在原作实体上进行手工操作,因此才要求由经验丰富的专业技术人员来修复,而且因为处理过程的不可逆性,使得少量的疏漏都会让珍贵的艺术瑰宝得到深程度的损坏,因为技术限制了这种处理方式,所以具有相当高的风险。图像修复是根据图像中损坏或遗失的部分,采用未破损区域的信息,根据特定的修复方法对破损的部分进行修复,来达到满意的视觉效果。这是一项古老的艺术,一系列手工技术组成了原始的图像修复,用来对图像做出让人轻易不能察觉的修复。早在文艺复兴时期,对于很多受损的中世纪珍贵的艺术品,手工修复艺
16、术家就是经过观察艺术品的原始风格和寓意,依据主观判断进行修复裂缝,恢复画面的完整性,这种工作叫做修补或润饰。这种最古老的图像修补方法完全采用人工修复的办法,由修补人员手工完成,一个人的经验和熟练程度决定能否完善的修复图像,存在主观、费时、低效、不可恢复、高风险等缺点。数字图像修复技术是现代计算机图形学和机器学中非常重要的一个研究热点,在虚拟现实、文物的保护、影视制作、特定对象方向移除、视频错误隐藏修改、超分辨率分析图像、图像压缩等领域具有很大的应用价值。 20 世纪 60 年代,伴随着电子技术、计算机技术的快速发展,数字图像处理的技术得到快速发展。20 世纪后期,有不少人开始尝试采用计算机来自
17、动完成图像修复,这种人和机械共同合作的工作,与手工修补方法相比,自由度更大,它不要求对原来的作品进行不可重复的处理,因此不存在风险、并且安全可靠,具有较高的实用价值。为了保证图像信息的完整性,要求对这些受损图像进行补充修复。目前,虽然也出现如photoshop、光影魔术手等处理软件,但这样的软件工作起来机械,处理范围小,只对几何位置、图片尺寸、色彩平衡等多项功能进行调整及添加特效,却不能进行修补。随着数字技术的不断发展和进步,数字图像修复技术不断成熟,这种技术被应用到数码摄像机、扫描仪、可收发图像的移动电话、数码相机以及数字电视等数字产品中存在大量的应用。主要的应用有:对原来图片就有划痕或有损
18、坏的图片扫描后得到的图像,为了某些确定的目的来删除数字图像上的目标或文字后留下的图像空白区。在数字图像的压缩、处理、传输、获取、和解压缩过程中,修补因信息丢失而所留下的信息缺损区等。数字图像处理中的一项新兴而重要的课题就是图像修复技术,在图像处理中的很多领域将具有更加深刻的意义,待到算法成熟,一定会植入到图像处理软件中。 一般图像修复技术主要被运用于以下几个方面3: (1) 为了特定目的移走图像中的对象。为了图像更容易的理解,通常需要把图像中的文字等障碍删除,使得图像更加清楚明了,更便于进一步的处理。此外,由于政治、军事等目的要求将图像中的部分文字、部分图像进行隐藏。(2) 在视频领域,能够通
19、过图像修复技术消除照片中的红眼现象。全景图像在不连续拍摄的数张照片在拼接,可使用图像修复技术修补相邻照片的一样部分。(3) 修复破损的珍贵美术作品、老照片、影视资料等。 (4) 影视特技的制作。在电影视频作品的制作过程中,有时要将一些多余的目标移走以达到特定的视觉效果,这在文化传播、影视创作等方面发挥着举足轻重的作用。由此可知,图像修复在科技研究和日常生活中都发挥着十分重要的作用,并且随着计算机硬件和软件技术的发展,其应用的范围也将越来越广泛,对质量的需求越来越高。因此越来越多的科学研究者非常关注图像修复技术的研究,更加高科技的图像修复技术的研究具有十分重要的意义。 1.2图像修复算法的国内外
20、研究现状 图像复原问题包括图像恢复和图像修复。图像恢复一般研究图像的反模糊、去噪以及盲恢复等。图像修复问题以及修复技术都具有一定的类似性,可是在实质上却具有非常大的区别。在获取图像的过程中,由于运动、噪声、模糊、抖动和对焦等原因降低了图像的效果。通常图像恢复问题是经过先建立退化模型,再采用逆退化的办法来处理相似的问题。有些退化图像也都在一定程度上含有图像的真实信息,可以为修复过程提供重要的信息,不然,逆过程根本没有办法实现。在一些情况下,图像甚至能够完全恢复原样。但在修复图像过程中,由于信息可能完全丢失在待修复范围内,只有根据周围信息对待修复区域的物体进行推断、估计填充,使它在视觉上可以达到完
21、整。也就是说,图像修复技术难以获得图像的真实性以达到预期效果,最多能从视觉心理学规律等角度给出一些合理的解释来满足人们,修复的结果也会具有不确定性。因此,尽管图像修复中的一些想法和方法值得借鉴,但是对于图像修复问题来说仍不能从本质上完成缺失信息的复原。目前有很多图像处理的软件,也可以对受损图像进行有效的修复以及对数字图像进行专业的效果处理,不过这样的方法对专业技术人员要求非常高,如在实际操作中必须严格区别出待修复的部分,而且还要注意要填充的颜色、格式和纹理的效果,然后通过复杂的手工处理后最终才完成。这种图像修复方法,主观性比较强,不同的用户对待同一幅图像所处理的效果也可能不同。最近几年来,在数
22、字图像修复领域,国内的研究者和国外的研究者各分别在不同的研究领域出发提出了大量卓有成效的算法。此外,对于实时性要求也非常高、运算量非常大的图像处理,PC机就难以胜任。数字信号处理专用的芯片一般为DSP,具有速度快、数学运算精度高等特点,能够达到要求运算量大、实时性强的特点。所以,采用快速速DSP芯片工程实现先进的图像修复算法,就能够将复杂的手工制作过程转换成自动修复,并适合含有很多数据运算并且对实时性要求高的应用,使得不管是视频图像的修复还是平面的图像修复变得更加快捷和准确。事实上,图像修复是依靠已知的信息来推断出缺损的未知信息。然而,在数学的角度上看,其实存在一个病态问题就是数字图像的修复,
23、因为没有大量的信息可以确保能唯一正确地修复被损坏的区域。总结起来,其中具有代表性的大致可划分两类:基于纹理合成的图像修复算法和基于非纹理的图像修复算法。 图像修复技术是依据非纹理结构,一般用在修复小尺度破损的数字图像修复技术。这个技术最早产生在 BSCB 模型中,主要思想是根据待修复区域的边缘信息,采用一种由粗到精的办法来评估等照度线的方向,并引用传播机制将这些信息传播到待修复的区域内,实际上这是一种基于偏微分方程的图像修复的算法。这种算法还包括 Chan-Shen的曲率驱动扩散的修复模型(CDD)模型。另一类是基于几何图像模型的变分修补技术,这种算法是经过建立图像的数据模型和先验模型,将待修
24、复问题转换为一个泛函求极值的变分问题,典型的代表有:Mumford-shah 模型、TV模型、Eulers elastica 模型、Mumford-shah-Euler 模型等。在1987年,因为Osher 和 Sethian 提出的界面演化水平集方法的启发,Alexandru Telea 也提出了一种快速行进算法用来进行图像进行修复,各点的插值顺序由模拟缺损区域边缘的演化方法来进行确定。该算法的特点有修复速度快,是一种实时的处理算法。 另外一种技术是基于纹理合成的图像修复技术,主要是用来修复大块缺失信息的图像,仿真并生成局部纹理进行填充是这个方法的核心思想。纹理合成的方法有这两个形式:一种是
25、基于图像分解的修复技术,主要功能是将图像分解成纹理部分以及结构部分,其中的结构部分采用修补算法修复,纹理部分采用纹理合成方的法来进行填充,例如,Bertalmio 等是最先用全变分最小化将图像结构的部分给提取出来,再用一个震动函数来对纹理部分进行建模,分解完图像之后,用BSCS模型来对结构部分进行修补,同样的纹理部分要用非参数采样纹理的方法来进行填充,两个部分修补结果叠加就能够得到修补后图像。最近几年来也产生了其他的图像分解办法,例如把图像分解为高频成分与低频成分就是采用离散小波变换的办法,把图像中不同频率的部分分别来进行修补。图像的低频部分依靠采用中值滤波还有基于曲率扩散的方法相结合进行修复
26、;对于高频图像的数据先进行分块,再用线性拟合来求导出每一块的方向,最后依据方向信息来进行修复。高频系数和低频系数依靠DCT 变换来进行处理,经过反变换后就能够将图像分解成:纹理层、卡通层、边缘层、。边缘层和卡通层是采用自适应偏心算子来修补的,纹理层是利用纹理合成的算法进行修复。 另外一种是依据样例的纹理合成方法,从待修补区域的边界选择一个像素点是它主要的思想,把这个点当做中心,根据图像的纹理特征,选择大小适合的纹理块,最后在待修复的区域周围,搜寻匹配的纹理块来代替这个纹理块。其中 Criminisi 等人提出的算法以其准确性和实现简单得到了人们的认可,是这类算法中的典型。2图像修复理论 2.1
27、认知心理学格式塔理论与图像修复 对图像受损区域给予填充的过程就是图像修复,这样做是为了使观察者没有办法感觉到图像已被修复或曾经损坏。人类认知心理学的研究影响着图像修复工作,特别是格式塔理论。格式塔理论定论知觉是有一定的组织规律,但是对于图形,知觉并不是各组件的简单叠加,而是各组件的正确有机结合。一个图形是作为一个有机的整体才能被知觉,各组件是会有一定的联系。人脑则根据经验,找出各部分间的组合,从而构造出有机整体。格式塔理论根据人类的知觉组织特性,提出了非常著名的格式塔组织律:4 (1)背景与图形:在特定的环境下,有些个体较明显从而形成图形,而有些个体隐退到陪衬地位继而作为背景。背景与图形的不同
28、之处越多,图形变得就会越明显,因此作为人类的知觉对象。 (2)连续性和接近性:和空间距离相比较短或是相似的组件,很轻易的就会被看作整体。 (3)相似性:如果各组件距离相等,但是颜色却不相同,那么颜色相近的组件就会被当成一个整体。 (4)同一个方向的运动:每个组件,如果其类方向的移动,则这几个作同类方向移动的组件就可以合并当做一个新的整体。 (5)闭合倾向和完整:互相相属的组件,通常倾向于组合为整体,相反,彼此不互相属于的组件,容易被分开。中间三角形都没有一个边,但因为闭合倾向和完整,知觉更倾向于将它看作是三个完整的黑色圆圈上叠放着一个白色的三角形。如此,如果明显有一个缺口,严格数学意义上来说是
29、不能构成椭圆,但人类知觉仍将其看做为椭圆。 从格式塔理论来看,图像修复工作是视觉认知的过程,通过先验知识,在知觉心理组织特性的指引下,适宜地重构出图像待修复区域的信息。格式塔规律对数字图像修复具有非常重要的指导意义,所以在算法设计中,要尽量依照人类的知觉组织特性,才能获得与视觉特性符合的修补结果。但是根据现在的图像修复算法来说,属知觉组织的相似性和连续性、接近性应用最普遍。当然,现在对知觉心理学的研究还不够完善,也有许多问题需要解决,因此数字图像修复仍处于低层次算法研究之中。 观测的数据如果有微乎其微的变化就会导致其解产生很大的差异,而问题的错误通常的体现为问题的解并非是持续依赖于所观测的数据
30、。只有当问题的解是独一无二的,并且是真实的,而且与观测数据一一对应,则这就是一个良态的问题。如若不然,则为病态的。打个比方,图像恢复是图像降析的逆过程,而后者可用图像与模糊核的卷积来体现,导致图像复原变为反卷积问题。实际上该过程不能逆转,之所以这样,是由于降析过程造成一些信息的流失。因此图像复原是一个病态的问题。在求解的过程中,必须将先验模型加进去。同时图形的修复仍为病态问题,图像破损尽量的用数学公式去表示,是一个物理性的过程。如果图像缺失了部分信息,那么图像破损失去了整个信息,缺损区域所有数据都丢了,所以其为不可逆转的过程。上述可说明,不同的先验模型将出现不一样的解。如果破损部分是局部的范围
31、,且能由外部的构造大概猜测出内部构造,那么个模型修复效果相差无几,同样是病态的表现。若破损区的破损部分很大,构造很复杂,对其的修读也具有更多的主观判断的空间,在这种情况下,只要能和已知的数据在边界上一致的话,则会形成一个不错的修复效果,这就展现出了越发厉害地病态性。2.2图像修复的三大原则 理论上,图像的修复是一个根据已知区域的信息来对缺损的区域进行插值的过程。然而,贝叶斯认为,图像的修复问题可以视为最优估计数据丢失区域的数据的问题。图像函数是非常复杂的,不能将图像的修复视为是简单的函数插值,更不能视为一个边界值问题。对多数图像来说,虽然其函数通常含有非常丰富的统计信息,可是却要比普遍的随机域
32、的简单采样复杂得多。传统的傅立叶变换以及线性小波分析方法中,图像被认为是存在于二维空间中的。可是在各向异性扩散的尺度空间理论中,图像却被看作是在有界变差函数空间中。对于合成图片来说,分段的光滑函数是其较优的近似函数,并且容易实现。然而,由于图像具有非平稳性,图像修复工作在一段时间内仍具有很大的挑战。 在经典的近似原理中,平滑修复允许对修复的精确度严格研究。然而,在多数应用当中,上述模型却并不适用,这是因为许多图像不仅包括了边缘或纹理等非光滑的因素,这也是函数模型非平滑的决定因素;而且图像中通常包含噪声。在手工修复的过程中,人类的认知却可以轻松解决这一问题,因而在建模的时猴,希望可以模仿手工修复
33、的机制,来建立一个可以信赖的低层修复模型。由于被遮挡的区域中,物体连接的方式仅凭借可见的部分进行猜测。因此,通过最佳猜测原理来建立修复模型十分恰当。通过以上的讨论,得出以下三个原则是为图像建立的修复模型的最好原则: 首先,模型必须是局部的。模型不用是全局信息,待修复区域的信息通过修复区域周围已有的信息来决定。由于有的图像需要先验知识或模式识别等才能修复,所以其修复需要基于人类视觉从对称的角度或者依靠先验知识来进行。 其次,模型必须能够对破损的狭窄的光滑边缘进行修复。在图像修复过程中,应当更加关心边缘,基于人眼对边缘相当的敏感,所以边缘对于目标的辨识和图像修复是很重要的。 最后,模型对噪声具有一
34、定的鲁棒性是非常重要的 。对人类视觉来说,当噪声低于一合理的层次的时候,从被噪声污染的图像中提取出对有用的信息并将其填充到要修复的区域是简单易行的,然后算法的抗干扰能力对在噪声比较严重时候非常重要。 2.3图像修复效果的评判标准 近年来对图像质量评价的方法研究是图像信息工程的基础技术之一。所有图像处理方法都要求有一个合适的图像质量来作为评价的标准。图像质量的定义具有两个不同的属性,其一是图像的逼真度,另一个则是图像的可理解度。这里的逼真度是描述被评价的对象和标准的对象两者之间的偏离程度;而可理解度却是图像向机器或人类提供信息的一种能力。 如下两方面的评价是对图像修复的最好评价,其一是对修复图像
35、自身的评价,另外则是算法运行所需时间的度量。算法的运行时间就是对算法效率的评估,容易被量化。然而对于修复结果的质量的评价,现在却没有统一的合适的标准。可是在实际运用图像修复的时候,通常没有图像参考作为标准,逼真度更毋庸置疑。鉴于修复工作的特殊性,从主观和客观两个角度来对修复图像进行评价5。 (1)主观评价方法:图像修复的目的是为了最终得到“完整”而“合理”的图像,“完整”且“合理”均从观察者主观的感觉而来。主观评价方法通常是观察者根据所评估的图像来评判。观察者能够对“合理”和“完整”提出一系列评判的标准并且定义其评价尺度,并根据评价的尺度进行评判。主观评价方法在一定程度上却要依赖于观察者的主观
36、知觉,不同的观察者对同一修复图像的评判也有不同的见解。 (2)客观的评价方法:评判者主观感受对主观评价方法有着明显的影响,不同的评判者对同一类图像的评价也不尽相同。然而实际生活中,通常无法获取原图像,因此无法比较修复图像和原图像。可是可以通过假设拥有原始图像的拷贝两份,其中一份损受,那么就可以通过设计的修复算法对其进行修复,目的是使修复后的结果与另一份完好的拷贝图像尽可能的相似。然而在此前提下,还可以通过峰值信噪比 PSNR来评价修复算法的优劣。但是,对于修复图像,单用 PSNR 却会出现如下的情况:PSNR 很高,可主观修复效果却并不很好,修复图像不“合理”或不“完整”;或 PSNR 较低,
37、主观修复效果反而却很好。 综上所述,一个好的修复算法,首先给人的主观视觉感觉的要“完整”且“合理”,也就是说修复算法产生的修复结果符合人眼的视觉特性才是一种好的算法;其次,在前面条件的基础上,希望 PSNR 值尽可能高;最后,相同的条件下,算法的运行时间应尽可能的短。 3 经典算法介绍3.1基于SOM网络的图像修复在神经细胞模型中存在一种细胞聚类的功能柱。几个细胞聚合而成而且接受外界的刺激后,它的功能柱会自动的形成。相同功能的细胞在一个功能柱中,这种现象存在于SOM网络模型6生物细胞中并且还有所反应。SOM网络中会接受外界不同的样本,刚开始接受样本引起输出兴奋的位置也是很不相同的,一些输出群会
38、在网络的自我组织中慢慢形成,接受样本的的不同分布表示出来,但是却能真是的反映接受样本的图形分布特征,所以SOM网络通常被称做特性图。SOM网络是接受样本并且通过竞争和学习以后,就会有所改变功能相同的输入就会比较靠近,不同的就会离得比较远,这样就会将一些无规则的接受样本自动排列起来,在彼此的连接和调整过程之后,使权的分布与输入域就可以逐渐的变小,这样就会使区域的划分越来越明显。在这种情况下,开始向SOM网络中输入不同的样本,而且无论样本是多少维的,低维的数据空间的某个区域上都会接受到所对应的投影。数据压缩就是这种形式完成的。同时,在高维空间也是如此,接近样本的时候也会出现和低维空间中的投影也比较
39、接近,这样较多的信息的信息就会在空间样本中展现出来。遗憾的是,网络在高维映射到低维时会发生一定的畸形改变,而且压缩比越大,畸变越大;另外网络要求的输入神经元数很大,因而SOM网络比其他人工神经网络(比如BP网络)的规模要大。而其他的概率密度分布就比较相似。所以SOM网络可以检测样本,在样本排序、样本分类以及样本检测方面都有广泛的运用。这样看来就可以说,SOM网络的权矢量收敛到所体现的输入矢量的平均值,而且它证明了输入数据的统计特点。再深层的说,假如说普通的竞争学习网络可以训练辨别出输入矢量的点特性,那么在线上或平面上的分布特征在SOM网络完全能够表现出来输入矢量的关系。当随机样本输入到SOM网
40、络时,如果样本非常多的时候,那么输入随机样本的概率密度分布就会接近在权值上的分布,这种分布在输出神经元上也会反映出来,在输出空间的某一个区域都会集中即概率大的样本,如果输入的样本有其他的分布类型,那么输出空间的各个不同的区域就会根据其自己概率分布集中到该区域。同一类的样本都会在一个区域。SOM神经网络在聚类方面如下几个优点7:(1)不用用户指定聚类的数目,网络通过学习过程自适应地来确定聚类的数目;(2)由于他采用“胜者全得”的学习方法所以对噪音数据无敏感;(3)可视化非常强的优点;它采用的邻域学习策略可以使数据由高维映射到低维时保持它拓扑结构不改变,输出层神经元连接权的矢量的空间分布可以正确地
41、反应输入模式的空间概率的分布;因此,SOM网络输入模式的类别特征会广泛被学习,并且在原始空间中的拓扑结构特征和概率分布同样可以学习到输入模式的很多优点,进而具备了可视化的优点。这种学习方法现在发展的还是不够成熟,由于有很多的不足阻碍着传统SOM网络在文本聚类领域中的应用和发展:(1)用户需要提前给出网络输出层结点的初始的结构;在原始数据空间中的输出层结点的初始拓扑结构和输入模式结构相同的时候,网络才能发挥出它最佳的学习效果。可是因为文本数据高维性的原因,人们很难预先给出和原始数据空间中相类似的网络输出层拓扑结构。(2)在网络训练时,有的输出层神经元的连接权值和输入模式相差悬殊,一直无法获胜,称
42、之为“死神经元”;由于死神经元权值得不到任何学习训练,所以进文本聚类的粒度和识别的精度就会受到很大的影响。反之有些神经元由于获胜次数过多,过度利用神经元的问题就出现了,同样会影响网络的学习效果。(3)聚类速度受网络输出层神经元连接权的初始值受到影响;由于高维性的文本数据,导致网络学习一次花费的时间较长。输出层神经元连接权的初始值却是随机确定的,所以收敛的学习次数过多,就会影响文本聚类的速度。本文介绍了一种基于SOM的图像分层技术,将图像分成若干部分,每一部分处在一个图层中,然后对于分层图像进行修复。对于分层图像,基本上有两种修复途径,分别是以信息扩散为主的的扩散式修复,另一种类似于纹理合成的填
43、充式修复。许多不同的物体或是区域都会存在一幅图像,都是待处理对象。从而一幅图像就可以看做由许多个不同对象所组成。而图像分层的目的就是尽可能的让一幅图像中的各不同对象处在各不同的图层当中。这样做有两个优点,一是可以尽量使用图像中已有的和需要修补的缺损部分本来有关系的图像信息来修补这个破损部分;二是由各个不同目标之间的分界线来确认图像的结构信息,再优先修补,来以尽量确保修复区域的完整性。本文中,选择8bit的RGB空间当做图像的色彩空间。在一幅RGB图像中由红(R)、绿(G)、蓝(B)三个颜色的亮度值来决定每一个像素的颜色的,因此每一个像素的色值都能用一个三维向量表示,如图1所示。图1 RGB向量
44、图一幅RGB图像可以看做是一个MN3的矩阵,或者是一个由三幅狄度图像构成的,当在彩色的监视器红、绿、蓝的输入端存在一个像素时,就会在屏幕上产生一幅彩色的图像。它的亮度值的取值范围依靠每个颜色分量的数据类型来决定。因此这种情况下选择8bit的数据类型,所以每一种颜色分量的取值区域是0,255。因为一幅彩色图像的任何一个像素都能看做是一个三维的向量,所以一个有三个输入单元的SOM网络可以将一幅图像的全部像素进行聚类,就把一幅彩色的图像划分为若干层。图2是就是一个SOM网络的示意图。图2 用于图像分层的SOM网络示意图原图像所分的层数由SOM中输出神经元的个数来决定的。通常来说,原图像会被分为几层依
45、靠构造的SOM网络有多少个输出神经元来决定的。但是通过原理会不难发现,有时会出现浪费的现象,因为在SOM网络中设置的输出神经元的个数过多,有的神经元就可能会一直不曾被激励。还有一种现象就是当图像的分层数较多时,原图像被分割的太多破碎和零散,一则不利于判断缺损点所在的层面,另外搜寻有效的结构信息也非常麻烦。另外当所分层数特别少的时候,则起不了分层所需要达到的预期效果,对于扩散式修补就可能有一些的弊端,会出现粗糙的现象,而对于填充式修复那么会产生别的影响,比如会产生许多没有被发现的有效结构。从理论效果上分析,用于扩散式修复时,需要分的层数可能会多一点,比如610层;但是填充修复,分层的目的是为了寻
46、找有效的结构信息,所以没有必要分的太多,通常将SOM的输出神经元设为34个的效果更好。当把原彩色图像中所有未破损像素的三维向量都依次输入该SOM网络后,原图像就被分解为4层,可以看到原图像中的不同对象都被大致分开了。每个破损像素可能只可以划分到一个图层中,并且得到修补。在修复的过程中,首先要用纯白在待修复的图像中标记出待修复的区域来利于计算机的识别。效果评价的依据依靠峰值信噪比(PSNR),PSNR的公式8为: (3-1)其中,为第i个像素在原图中的色值;为第i个像素在修复后图中的色值;Framesize是帧尺寸。PSNR的单位是分贝(dB),值越大,说明修复后的图像与原完好图像之间的差异越小
47、,反之则越大。所以,原未破损图像的PSNR值是正无穷,而破损图像的PSNR最小。3.2基于纹理合成的图像修复纹理合成的技术的发展史9:自1950年Gibson提出纹理概念后,纹理合成技术的发展经历如下几个阶段:首先是纹理映射时期。因为这个技术没有特征提取和模型优化,只是把样图直接匹配到目标表面,所以可以视为是简化的基于样图的纹理合成。作为应用于真实感图形研制中的一项常用技术纹理映射,首先由Catmull提出,其对象是减少或避免拼贴引起的扭曲和接缝。后来在此基础上又提出了更多的改进算法。其次是过程纹理的合成时期。过程纹理合成就是经过对物理生成过程的仿真的步骤,直接就能在曲面上生成纹理,例如云雾、木纹、毛发等,以至于避免了纹理映射产生的失真。虽然这个技术没有直接利用样图,但是在构造物理仿真模型时也要求深刻认识样图纹理的物理特性,再依靠这个认识构造对应的物理仿真模型,因为这个技术隐含了特征的提取,并且加强了模型的构造和优化,所和基于样图的纹理合成是非常相似的。过程纹理具有如下特点:(1)表示的过程纹理是非常紧凑的。过程纹理的大小通常只是几千个字节,但是普通的纹理图像只含有几兆的字节。(2)过程纹理的表示特点是无固定的分辨率。在很多的情况下,不管是在多么邻近的区域观察,都能提供高度清晰的纹理图像,这也就说过程纹理能够提供任何高分辨率的图像。(3)过程纹理表示的区域不是固