《图像二值化中阈值选取方法的研究_毕业论文(37页).doc》由会员分享,可在线阅读,更多相关《图像二值化中阈值选取方法的研究_毕业论文(37页).doc(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-图像二值化中阈值选取方法的研究_毕业论文-第 30 页南京师范大学泰州学院毕 业 论 文题 目图像二值化中阈值选取方法的研究学生姓名霍良学 号09090628专 业电子信息工程班 级信工院0906指导教师焦蓬蓬2013 年 4 月摘要在人类获取的信息中,视觉信息约占60%,听觉约占20%,其它约占20%。由此可见,视觉信息对人类非常重要。同时,图像是人类获取视觉信息的主要途径。图像二值化是图像预处理中的一项重要技术,在模式识别、光学字符识别、医学成像等方面都有重要应用。论文介绍了图像及数字图像处理技术的一些概念和相关知识,对Matlab7.0 软件的发展和软件在图像处理中的应用做了简要介绍,
2、还介绍了灰度图像二值化方法以及利用Matlab7.0软件工具进行算法的实现。课题重点实现了图像分割技术中灰度图像二值化方法,如Otsu算法、Bernsen算法,并对这些算法运行的实验结果进行分析与比较。 关键词:图像处理,二值化,Matlab,Otsu算法,Bernsen算法AbstractHuman beings obtain a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore
3、, the visual information is very important for human beings. Moreover, the images are the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image pre-processing, is widely-employed in pattern recognition, optical character recognition, medical
4、imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced; then, the development of Matlab7.0 and its application in image processing briefly introduced; in addition, the method of grayscale image binarization and how to implement
5、these algorithms based on Matlab7.0 are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and compares the experimental results of the above algorithms. Key words: Image process
6、ing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm目 录摘要IAbstractII目 录III第一章 绪 论11.1 图像与数字图像11.2 数字图像处理技术内容与发展现状21.3 灰度图像二值化原理及意义5第二章 软件工具MATLAB62.1 MATLAB概述62.2 MATLAB的工作环境62.3 MATLAB图像处理工具箱82.4 工具箱实现的常用功能9第三章 图像二值化方法113.1 课题研究对象113.2 二值化方法研究动态143.3 全局阈值法183.4 局部阈值法19第四章 Otsu方法和Bernsen方法20
7、4.1 Otsu算法分析204.2 Otsu方法流程图224.3 Bernsen算法分析234.4 Bernsen方法流程图23第五章 Otsu方法和Bernsen方法实验比较255.1 Otsu方法实验结果分析255.2 Bernsen方法实验结果分析275.3 0tsu方法和Bernsen方法实验结果比较295.4 结论30参考文献31致谢31第一章 绪 论1.1 图像与数字图像图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。据统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约
8、占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。 通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。但就其本质来说,可以将图像分为以下两大类。模拟图像。包括光学图像、照相图像、电视图像等。比如人在显微镜下看到的图像就是一幅光学模拟图像。对模拟图像的处理速度快,但精度和灵活性差,不易查找和判断。数字图像。数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够
9、辨识的点阵图像。在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。因此,数字图像实际上就是被量化的二维采样数组。一幅数字图像都是由若干个数据点组成的,每个数据点称为像素(pixel)。比如一幅128400,就是指该图像是由水平方向上128列像素和垂直方向上400行像素组成的矩形图。每一个像素具有自己的属性,如颜色(color)、灰度(gray scale)等,颜色和灰度是决定一幅图像表现的关键因素。其中颜色量化等级包括单色、四色、16色、128色、24位真彩色等,量化等级越高,则量化误差越小,图像的颜色表现力越强。同样,灰度是单色图像中像素亮度的表征,量化等级越
10、高,表现力越强。但是随着量化等级的增加,数据量将大大增加,使得图像处理的计算量和复杂度相应的增加。与模拟图像相比,数字图像具有以下显著优点:(1) 精度高。目前的计算机技术可以将一幅模拟图像数字化为任意的二维数组,即数字图像可以由无限个像素组成,每个像素的亮度可以量化为12位(即4096个灰度级),这样的精度是数字图像处理与彩色照片的效果相差无几。(2) 处理方便。数字图像在本质上是一组数据,所以可以用计算机对他进行任意方式的修改,如放大、缩小、改变颜色、复制和删除某一部分等。(3) 重复性好。模拟图像,如照片,即便是使用非常好的底片和相纸,也会随着时间的流逝而褪色、发黄,而数字图像可以存储在
11、光盘中,上百年后再用计算机重现也不会有丝毫的改变。1.2 数字图像处理技术内容与发展现状数字图像处理就是采用一定的算法对数字图像进行处理,以获得人眼视觉或者某种接受系统所需要的图像处理过程。图像处理的基础是数字,主要任务是进行各种算法设计和算法实现。目前,图像处理技术已经在许多不同的应用领域中得到重视,并取得了巨大成就。根据应用领域要求的不同,数字图像处理技术可以分为许多分支技术。重要的分支技术有:(1) 图像变换。图像阵列很大时,若直接在空域中处理,计算量将很大。为此,通常采用各种图像变换方法,如傅立叶变换、沃尔什变换、离散余弦变换、小波变换等间接处理技术,将空域处理转换到变换域处理,这样可
12、以有效地减少计算量,提高处理性能。(2) 图像增强与复原。主要目的是增强图像中的有用信息,削弱干扰和噪声,使图像更加清晰,或者将其转换为更适合人或机器分析的形式。图像增强并不是要求真实地反映原始图像,而图像复原则要求尽量消除或减少获取图像过程中所产生的某些退化,使图像能够反映原始图像的真实面貌。(3) 图像压缩编码。在满足一定保真度条件下,对图像信息进行编码,可以压缩图像信息量,简化图像的边式,从而大大压缩图像描述的数据量,以便存储和传输;图像压缩在不同应用背景下可以采用不失真压缩和失真压缩。(4) 图像分割。图像分割是数字图像处理中的关键技术之一,是为了将图像中有意义的特征提取出来。它是进一
13、步进行图像识别、分析和理解的基础。图像的有意义特征包括图像的边缘、区域等。(5) 图像分析。对图像中的不同对象进行分割、分类、识别、描述和解释。(6) 图像识别。图像识别属于模式识别的范畴,其主要内容是在图像经过某些预处理(增强、复原、压缩)后,进行图像分割和提取,从而进行判别分类。图像分类常用的经典识别方法有统计模式分类和句法模式分类。近年来,新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中越来越受到重视。(7) 图像隐藏。是指媒体信息的相互隐藏,常见的有数字水印和图像的信息伪装等。以上图像处理内容也并非孤立存在的,往往相互联系,而一个实用的图像处理系统通常需要将几种图像处理技术结
14、合起来,才能得到所需要的结果。例如,图像变换是图像编码技术的基础,而图像增强与复原一般又是图像处理的最终目的,也可以作为进一步图像处理工作的准备;通过图像分割得到的图像特征既可以作为最后结果,也可以作为下一步图像分析的基础。不同的图像处理技术应用与不同的领域,发展出不同的分支学科,如遥感图像处理、医学图像处理等,其他如计算机图形学、模式识别、人工智能和机器人视觉等学科领域也与图像处理有着密切的关系。图像处理技术的发展大致经历了初创期、发展期、普及期和实用化期4个阶段。初创期开始于20世纪60年代,当时的图像采用像素型光栅进行少秒显示,大多采用中、大型机对其处理。在这一时期,由于图像存储成本高、
15、处理设备昂贵,其应用面很窄。进入20世纪70年代的发展期,开始大量采用中、小型机进行处理,图像处理也逐渐改用光栅扫描方式,特别是CT和卫星遥感图像的出现,对图像处理技术的发展起到了很好的推动作用。到了20世纪80年代,图像处理技术进入普及期,此时的微机已经能够担当起图形图像处理的任务。超大规模集成电路(Very Large Scale Integration, VLSI)的出现更使处理速度大大提高,设备造价也进一步降低,极大地促进了图形图像系统的普及和应用。20世纪90年代是图像处理技术的实用化时期,图像处理的信息量巨大,对处理速度的要求极高。针对现有的实际应用,数字图像处理具有以下特点。(1
16、) 信息量大,要求处理速度比较快。目前,数字图像处理的信息大多是二维信息,处理信息量很大。比如一幅128128低分辨率的黑白图像,要求64Kbit的数据量;对高分辨率彩色512512图像,则要求128Kbit数据量;如果要处理30帧/s的视频图像,则每秒要求处理500Kbit22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。(2) 占用频带较宽。与语音信息相比,数字图像占用的频带要大几个数量级。如电视图像的带宽约56MHz,而语音带宽仅为4KHz左右。所以数字图像在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本高,且对频带压缩技术提出了更高的要求。(3)
17、数字图像中各个像素间的相关性强,压缩潜力大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上。一般而言,相邻两帧之间的相关性比帧内相关性还要大。(4) 图像质量评价受主观因素影响。数字图像处理后的图像一般需要给人观察和评价,而人的视觉系统很复杂,受环境条件、视觉性能、人的情绪、爱好以及知识状况影响很大,因此评价结果受人的主观因素影响较大。为此,如何客观评价图像质量还有待进一步深入的研究。另外,计算机视觉是模仿人的视觉,人类的感知原理必然严重影响计算机视觉的研究。(5) 图像处理技术综合性强。数字图像处理技术中设计的
18、基础知识和专业技术相当广泛,通常涉及通信技术、计算机技术、电子技术、电视技术以及更多的数学、物理等方面的基础知识。例如,图像编码的理论基础是信息论和抽象数学的结合,而图像识别则需要掌握随机过程和信号处理方面的知识。此外,不少课题还需要更加专业的知识,如小波变换、神经网络、分形理论等。另外,图像处理是一门应用性很强的学问,必须与计算机技术的发展相适应。随着电子技术和计算机技术的不断提高和普及,数字图像处理技术进入高速发展时期。1.3 灰度图像二值化原理及意义灰度图像是指只含亮度信息,不含色彩信息的图像。将彩色图像转化成为灰度图像的过程称为图像的灰度化处理。彩色图像中的每个像素的颜色有R、G、B三
19、个分量决定,而每个分量有255种值可取,这样一个像素点可以有1600多万的颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,一个像素点的变化范围为255种,所以在数字图像处理中一般先将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。灰度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。图像的灰度化处理可先求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量。图像的二值化处理就是将图像上的点的灰度置为0或1,也就是使整个图像呈现出明显的黑白效果。即将128个亮度等级的灰度图像通过适当的阈值选取而
20、获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中,二值化图像占有非常重要的地位,特别是在实用的图像处理中,以二值图像处理实现而构成的系统是很多的,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像,这样子有利于再对图像做进一步处理时,图像的集合性质只与像素的值为0或1的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。二值图像在图像分析中应用非常广泛,二值图像就是指只有两个灰度级的图像,二值图像具有存储空间小,处理速度快,可以方便地对图像进行布尔逻辑运算等特点。更重要的是,在二值图像的基础上,还可以进一步对图像处理,获得该图像的一些几
21、何特征或者其他更多特征。第二章 软件工具MATLAB2.1 MATLAB概述MATLAB是Matrix Laboratory的缩写,是由美国MathWorks公司推出的计算机软件,经过多年的逐步发展与不断完善,现已成为国际公认的最优秀的科学计算与数学应用软件之一,是近几年来在国内外广泛流行的一种可视化科学计算软件。它集数值分析,矩阵运算,信号处理和图形显示于一体,构成了一个方便的,界面友好的用户环境,而且还具有可扩展性特征。MathWorks公司针对不同领域的应用,推出了信号处理,控制系统,神经网络,图像处理,小波分析,鲁棒控制,非线性系统控制设计,系统辨识,优化设计,统计分析等30多个具有专
22、门功能的工具箱,这些工具箱是由该领域内的学术水平较高的专家编写的,无需用户自己编写所用的专业基础程序,可直接对工具箱进行运用。同时,工具箱内的函数源程序也是开放性的,多为M文件,用户可以查看这些文件的代码并进行更改,MALAB支持用户对其函数进行二次开发,用户的应用程序也可以作为新的函数添加到相应的工具箱中。MATLAB中的数字图像是以矩阵形式表示的,这意味着MATLAB强大的矩阵运算能力用于图像处理非常有利,矩阵运算的语法对MATLAB中的数字图像同样适用。2.2 MATLAB的工作环境MATLAB的工作环境简单明了,易于操作,使用的MATLAB软件一般是6.x版本。其工作环境包括五个部分:
23、命令窗口(Command Window),MATLAB的主窗口用户可以直接在此窗口输入命令,系统将自动显示信息;启动平台(Launch Pad),当用户需要启动某个工具箱的应用程序时,可以在启动平台中实现。工作空间(Workspace),MATLAB工作空间作为一个独立的窗口,其操作相当方便。它包含着用户已建立的变量,而且变量在工作空间中是以矩阵的形式存储;命令历史记录(Command History),主要显示在命令中已执行过的命令;当前路径窗口(Current Directory),主要显示当前工作在什么路径下进行,包括M文件的打开路径,双击M文件名打开该文件进行编辑。如图2.1所示。图2
24、.1 MATLAB6.X论文中使用的MATLAB软件为7.0版本,如图2.2所示。图2.2 MATLAB7.0MATLAB7.0针对编程环境、代码效率、数据可视化、数学计算、文件I/O操作等方面都有进行不断升级、增加了新功能。为此、相对于以前的版本,也具有一些新的特性。就其开发环境方面来说:(1) 重新设计的桌面环境,针对多文档界面提供了简便的管理和访问方法,允许用户自定义桌面外貌,创建常用命令的快捷方式。(2) 增强数组编辑器(Array Editor)和工作空间浏览器(Workspace Browser)功能,用于数据的显示、编辑和处理。(3) 在当前目录浏览器(Current Direc
25、tory Browser)工具中,增加了代码效率分析、覆盖度的分析等功能。(4) 增加了M-Lint编码分析,能辅助用户完成程序性能分析,提高程序执行效率。(5) 对M文件编辑器(M-Editor)进行了功能增强,可以支持多种格式的源代码文件可视化编辑,如C/C+、HTML、Java等。2.3 MATLAB图像处理工具箱数字图像处理工具箱函数包括以下15类:(1) 图像显示函数;(2) 图像文件输入、输出函数;(3) 图像几何操作函数;(4) 图像像素值及统计函数;(5) 图像分析函数;(6) 图像增强函数;(7) 线性滤波函数;(8) 二维线性滤波器设计函数;(9) 图像变换函数;(10)
26、图像邻域及块操作函数;(11) 二值图像操作函数;(12) 基于区域的图像处理函数;(13) 颜色图操作函数;(14) 颜色空间转换函数;(15) 图像类型和类型转换函数。MATLAB图像处理工具箱支持四种图像类型,分别为真彩色图像、索引图像、灰度图像、二值图像,由于有的函数对图像类型有限制,这四种类型可以用工具箱的类型转换函数相互转换。MATLAB可操作的图像文件包括BMP、HDF、JPEG、PCX、TIFF、XWD等格式。2.4 工具箱实现的常用功能就图像处理的基本过程讨论工具箱所实现的常用功能。(1) 常用图像操作:图像的读写与显示操作:用imread()读取图像,imwrite()输出
27、图像,把图像显示于屏幕有imshow(),image()等函数。imcrop()对图像进行剪裁,图像的插值缩放可用imresize()函数实现,旋转用imrotate()实现。(2) 图像增强功能:图像增强是数字图像处理过程中常用的一种方法,目的是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合于人眼观察和机器自动分析的形式。常用的图像增强方法有以下几种:灰度直方图均衡化。均匀量化的自然图像的灰度直方图通常在低灰度区间上频率较大,低的图像中较暗区域中细节看不清楚,采用直方图修整可使原图灰度集中的区域拉开或使灰度分布均匀,从而增大反差,使图像的细节清晰,达到增强目的。直方图均衡化可用h
28、isteq()函数实现。 灰度变换法。照片或电子方法得到的图像,常表现出低对比度即整个图像较亮或较暗,为此需要对图像中的每一像素的灰度级进行标度变换,扩大图像灰度范围,以达到改善图像质量的目的。这一灰度调整过程可用imadjust()函数实现平滑与锐化滤波。平滑技术用于平滑图像中的噪声,基本采用在空间域上的求平均值或中值,或在频域上采取低通滤波。因在灰度连续变化的图像中,我们通常认为与相邻像素灰度相差很大的突变点为噪声点,灰度突变代表了一种高频分量,低通滤波则可以削弱图像的高频成分,平滑了图像信号,但也可能使图像目标区域的边界变得模糊。而锐化技术采用的是频域上的高通滤波方法,通过增强高频成分而
29、减少图像中的模糊,特别是模糊的边缘部分得到了增强,但同时也放大了图像的噪声。在MATLAB中,各种滤波方法都是在空间域中通过不同的军纪模板即滤波算子实现,可用fspecial()函数创建预定义的滤波算子,然后用filter2()或conv2()函数在实现卷积运算的基础上进行滤波。(3) 边缘检测和图像分割功能边缘检测是一种重要的区域处理方法,边缘是所要提取目标和背景的分界线,提取出边缘才能将目标和背景区分开来。如果一个像素落在边界上,那么它的邻域将成为一个灰度级变化的带。对这种变化最有用的两个特征就是灰度的变化率和方向。边缘检测算子可以检查每个像素的邻域并对灰度变化率进行量化,也包括对方向的确
30、定,其中大多数是基于方向倒数掩模求卷积的方法。MATLAB工具箱提供的edge()函数可针对sobel算子、prewitt算子、Roberts算子、log算子和canny算子实现边缘检测的功能。基于灰度的图像分割方法也可以用简单的MATLAB代码实现。(4) 图像变换功能图像变换技术是图像处理的重要工具,常运用于图像压缩、滤波、编码和后续的特征抽取或信息分析过程。MATLAB工具箱提供了常用的变换函数,如fft2()与ifft2()函数分别实现二维快速傅立叶变换与其逆变换,dct2()与idct2()函数实现二维离散余弦变换与其逆变换,Radon()与iradon()函数实现Radon变换与逆
31、Radon变换。除以上基本图像处理功能,MATLAB还提供了如二值图像的膨胀运算dilate()函数、腐蚀运算erode()函数等基本数学形态学与二值图像的操作函数。第三章 图像二值化方法3.1 课题研究对象论文主要研究BMP格式的灰度图像文件。BMP(Bitmap Picture)文件格式是Windows系统交换图形、图像数据的一种标准格式。BMP图像的数据由四个部分组成,如表3.1所示。表3.1 BMP图像文件结构文件部分属 性说 明BITMAPFILEHEADER(位图文件头)bfType文件类型,必须是0x424D,即字符串 “BM”bfSize指定文件大小,包括这14个字节bfRes
32、ervered1保留字,不用考虑bfReservered2保留字,不用考虑bfOffBits从文件头到实际位图数据的偏移字节数BITMAPINFOHEADER(位图信息头)biSize该结构长度,为40biWidth图像的宽度,单位是像素biHeight图像的高度,单位是像素biplanes位平面数,必须是1,不用考虑biBitCount指定颜色位数,1为二值,4为16色,8为128色,16,24、32为真彩色biCompression指定是否压缩,有效的值为BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDSbiSizeImage实际的位图数据占用的字节数biXPelsPe
33、rMeter目标设备水平分辨率,单位是每米的像素数biYPelsPerMeter目标设备垂直分辨率,单位是每米的像素数biClrUsed实际使用的颜色数,若该值为0,则使用颜色数为2的biBitCount次方种biClrImportant图像中重要的颜色数,若该值为0,则所有的颜色都是重要的Palette(调色板)rgbBlue该颜色的蓝色分量rgbGreen该颜色的绿色分量rgbRed该颜色的红色分量rgbReserved保留字ImageData(位图数据)按像素按行优先顺序排序,每一行的字节数必须是4的整倍数第一部分为位图文件头BITMAPFILEHEADER,它是个结构体,其定义如下:t
34、ypedef struct tagBITMAPFILEHEADER WORD bfType;DWORD bfSize;WORD bfReserved1;WORD bfReserved2;DWORD bfOffBits; BITMAPFILEHEADER;这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。第二部分为位图信息头BITMAPINFOHEADER,也是一个结构,其定义如下: typedef struct tagBITMAPINFOHEADER DWORD biSize; LONG biWidth;LONG biHeight;
35、WORDbiPlanes;WORD biBitCount; DWORD biCompression; DWORDbiSizeImage;LONG biXPelsPerMeter;LONG biYPelsPerMeter;DWORD biClrUsed;DWORD biClrImportant; BITMAPINFOHEADER;这个结构的长度是固定的,为40个字节(LONG为32位二进制整数)。其中,biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,这都是一些Windows定义好的常量。由于RLE4和RLE8的压缩格式用的不多,一般仅讨
36、论biCompression的有效值为BI_RGB,即不压缩的情况。第三部分为调色板(Palette),当然,这里是对那些需要调色板的位图文件而言的。真彩色图像是不需要调色板的,BITMAPINFOHEADER后直接是位图数据。调色板实际上是一个数组,共有biClrUsed个元素(如果该值为零,则有2的biBitCount次方个元素)。数组中每个元素的类型是一个RGBQUAD结构,占4个字节,其定义如下:typedef struct tagRGBQUAD BYTE rgbBlue;BYTE rgbGreen;BYTE rgbRed;BYTE rgbReserved; RGBQUAD;第四部分就
37、是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。下面就2色、16色、128色和真彩色位图分别介绍。对于2色位图,用1位就可以表示该像素的颜色(一般0表示黑色,1表示白色),所以一个字节可以表示8个像素。对于16色位图,用4位就可以表示一个像素的颜色,所以一个字节可以表示2个像素。对于128色位图,一个字节刚好可以表示1个像素。下面有两点值得注意:(1) 每一行的字节数必须是4的整倍数,如果不是,则需要补齐。(2) BMP文件的数据存放是从下到上,从左到右的,也就是说,从文件中最先读到的是图像最下面的一行的左边的第
38、一个像素,然后是左边的第二个像素,接下来是倒数第二行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面的最右边的一个像素。DIB(Device Independent Bitmap)图像格式是设备无关位图文件,描述图像能力基本与BMP相同,并且能够运行多种硬件平台,只是文件格式较大。3.2 二值化方法研究动态作为一种高效智能的人机交互手段,身份证的快速识别技术可以广泛的应用于公民身份核查、暂住人口调查、旅店业登记核查、罪犯追逃等公安业务当中,大大提高了工作人员的录入速度,减少了用户的等待时间,提高了工作效率。由于身份证图像背景复杂,由激光防伪阴影网格线及各种版面噪声构成;且因激光防伪
39、标志和打印条件的千差万别,再加上身份证图像质量偏差,给身份证的字符识别带来了很大的困难。必须经过预处理,除去大量的噪声信号,才能更好的进行字符的定位、分割,以及识别。而二值化是预处理中非常重要的一步,也是最为关键的一步,它直接影响到OCR 系统的性能。研究者在分析和讨论了多种图像二值化的优缺点后,在吸取各种方法优点的基础上,提出了一种新的身份证扫描图像的二值化方法嵌入式多阈值动态自适应的二值化方法。图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。在颗粒分析、模式识别技术、光学字符识别(OCR)、医学数据可视化中的切片配准等应用中,图像二值化是它们进行数据预处理的重要技术
40、。由于图像二值化过程将会损失原图像的许多有用信息,因此在进行二值化预处理过程中,能否保留原图的主要特征非常关键。在不同的应用中,图像二值化时阈值的选择是不同的。因此,自适应图像阈值的选取方法非常值得研究。研究者对图像二值化方法进行了讨论,在此基础上提出了一个新的图像二值化算法。该算法基于数学形态学理论,较好地保留了图像二值化时原图的边缘特征。激光雕刻中图像处理的二值化处理激光雕刻是近十几年随着激光技术的发展而产生的一种新的雕刻技术,它与计算机图形学、图像处理等学科的结合,应用在各种材料上进行文字、图案加工。如何能得到光滑且能真实反映原图像的雕刻图像是其中的主要问题,但是激光器的开关只有两种状态
41、,因此,图像的二值化处理就成为了关键性技术,其中阈值的选取是决定二值化图像好坏的因素。现实世界中黑白二值图像很少用,大多数图像都是灰度图像或是彩色图像。要使这些图像适用于激光雕刻中,就需要对其进行二值化处理,研究者针对激光雕刻总结了适用于雕刻的二值化处理方法,然而没有一种方法适合于所有图像雕刻的,因而实际中要选择一种合适的二值化处理方法,使得得到的二值图像效果最好。在信息社会中人的身份识别得到广泛关注。指纹识别技术除了在传统的法律公安上得到应用之外,还有更广阔的应用前景,如计算机用户的确认、访问网络资源的口令、银行ATM 机和信用卡的使用、各类智能IC 卡的双重确认,以及雇员证明、海关身份鉴定
42、、家用电子门锁等一个完整的自动指纹识别系统(AFIS) 包括指纹采集、指纹图像预处理、指纹特征提取和比对等几个模块。在自动指纹识别系统中,指纹图像的预处理是正确进行特征提取、比对等操作的基础,而二值化是指纹图像预处理中必不可少的一步。目前,国内外学者在这方面已经做了大量的工作,常用的二值化方法有固定阈值法、自适应阈值法、局部自适应阈值法等。由于指纹图像是一种方向性很强的图像,这些方法仅仅利用了指纹图像的灰度信息,而忽略了指纹图像的方向信息,因此这些方法对指纹图像的二值化效果并不十分理想。尔后提出了一种改进的二值化方法:利用梯度法求取块方向图,将其量化成8个标准方向,以块方向代替点方向并利用灰度
43、信息对指纹图像进行二值化。最后将该方法和局部自适应阈值二值化方法及改进前的方法进行比较,可以发现:采用该方法二值化效果有了明显提高,对于不同质量的指纹图像有着令人满意的处理效果。结合Canny 算子的图像二值化方法,对经典的二值化方法Otsu 算法和Bernsen 算法中存在的缺点进行了分析后提出图像二值化方法,该方法综合考虑了边缘信息和灰度信息,通过边缘附近种子点在高阈值二值化图像中的填充和低阈值图像对它的修补而得到二值化结果图像,较好地解决了经典二值化方法中存在的抗噪能力差、边缘粗糙、伪影现象等缺点,实验结果证明,该方法能够较好地解决低对比度图像和目标像素灰度不均匀图像的二值化问题。采用信
44、号匹配的支票图像二值化提出了一种基于信号匹配的低信噪比图像的信号提取方法,解决类似支票日期域的这种既有复杂背景,又有印章噪声干扰的图像二值化问题。这种二值化方法完全不同于传统的方法,它从信号处理的角度出发,利用了部分先验知识和理想状态下的投影轮廓信号,再通过用不同阈值分割的投影信号与之匹配,匹配度最大时的阈值即为图像分割的最佳阈值。 本方法比其他的传统的二值化方法更具有自适应性和鲁棒性,通过大量的实验数据,以及与常用的其他算法进行的比较得到了验证。基于灰度的车牌图像二值化算法不均匀光照下的图像二值化是数字图像处理中的一个难题,汽车牌照自动识别系统工作在复杂的光照环境下,经常会出现车牌光照不均的
45、现象,给图像二值化带来困难。为此,研究者提出一种解决办法,首先使用同态滤波去掉车牌图像的不均匀光照的影响,然后使用改进的Bernsen 算法对车牌图像进行二值化。实验表明,使用该算法能有效地克服不均匀光照的影响,二值化效果良好,车牌识别率得到显著的提高;针对常用车牌识别二值化算法存在的问题,提出了基于分形维数的二值化的方法。根据分形维数反映图像复杂程度的定义,通过计算两次突变的分维数,来确定图像的灰度值范围,并利用该灰度值范围确定阈值。并通过实验,表明利用分形维数所得到的阈值进行二值化处理较传统方法有较大改进,且该方法解决了在自然光和不同光照背景下对车牌识别的干扰问题,也可以从复杂背景中提取出
46、倾斜的车牌;偏白或泛白背景的车牌图像二值化方法,在车辆牌照识别系统中,由于摄像机畸变、动态范围太窄、车辆牌照被污染等原因,灰度化的车辆牌照图像背景变得模糊,接近于字体的灰度或者动态范围不高,使得前景字体跟背景难以分开。该文采用高帽与低帽形态滤波增强车牌图像中的字体,去除背景对图像的影响,使用基于迭代的图像分块二值化算法进行二值化。实验表明,该算法可有效克服偏暗或泛白背景的影响,二值化效果良好。基于自组织特征映射(SOFM)神经网络的图像融合二值化方法介绍了SOFM 神经网络的特点及学习算法,根据SOFM 的聚类确定图像第一阈值作为循环迭代的初始值,对整幅图像进行循环迭代得到第二阈值,使用第二阈
47、值对原始图像进行二值化,得到第一幅待融合图像;通过改进的Bernsen方法对原始图像进行二值化,得到第二幅待融合图像;最后根据图像灰度值选小的原则作为图像融合方法,得到最终的二值化图像。该方法既能有效地消除伪影,又能较好地分离字符和文字。模拟实验结果表明,该方法的二值化效果明显优于Bernsen方法和Otsu方法,且具有良好的适应性。基于贝叶斯算法的二值化算法。针对在图像二值化过程中动态选取阈值难的问题,在分析了全局阈值法和局部阈值法各自优缺点的基础上。提出了一种基于贝叶斯算法的全局阈值法和局部阈值法相结合的二值化方法。经实验证明,该方法既能够有效地消除光照不均匀对图像的影响,较好地保留目标图像的细节,又能够有效地消除伪影,提高处理速度。在模式识别中,二值化效果的好坏直接影响着识别效果,首先通过改进的Bernsen方法对原始图像进行二值化,得到第一幅源图像;然后根据自组织神经网络计算阈值,对图像进行二值化,得到第二幅源图像;再根据灰度值最小的原则作为图像融合方法,得到最终的二值化图像,最后给出模拟实验,实验结果表明该方法是有效的。提出了一种新的图像二值化方法。图像的带参数的二值化方法。该方法不仅在实现传统的黑白二值化