《基于PCA的人脸识别算法实现毕业论文(61页).doc》由会员分享,可在线阅读,更多相关《基于PCA的人脸识别算法实现毕业论文(61页).doc(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-基于PCA的人脸识别算法实现毕业论文-第 52 页毕业设计(论文)设计(论文)题目:基于PCA的人脸识别算法实现毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计
2、(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学
3、位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日摘 要随着科技的发展,人类社会的进步,传统身份识别由于容易遗失,容易被破解已不能起到身份识别作用。人们需要更加安全可靠的身份识别技术。而生物特征的独一无二,不易丢失和被复制的特性很好满足了身份识别的需要。同时随着计算机科学技术和生物医
4、学的发展使得利用生物特征识别成为了可能。在生物特征识别领域,由于人脸识别的操作快速简单,结果直观,准确可靠,不需要人的配合等优点已成为人们关注的焦点。主成分分析(PCA)通过提取高维度的人脸图像的主元,使得图像在低维度空间中被处理来降低了图像处理的难度。由于其有效的解决了图像空间维数过高的问题,已经成为人脸识别领域非常重要的理论。本文研究的就是基于PCA的人脸识别算法的实现。本文按照完整人脸识别流程来分析基于PCA的人脸识别算法实现的性能。首先使用常用的人脸图像的获取方法获取人脸图像。本文为了更好的分析基于PCA人脸识别系统的性能选用了Essex人脸数据库。接下来是人脸图像预处理方法。由于Es
5、sex人脸图像质量较好,而且已经做过相应的预处理,所以本文试验中只使用灰度处理。接着使用PCA提取人脸特征,使用奇异值分解定理计算协方差矩阵的特征值和特征向量以及使用最近邻法分类器欧几里得距离来进行人脸判别分类。在实验中我们发现基于PCA的人脸识别系统的识别率很高,而且具有一定鲁棒性,所以基于PCA的人脸识别算法的实现的研究还是有意义。【关键词】人脸识别 PCA算法 奇异值分解定理 欧几里得距离ABSTRACTWith the development of science and technology, the progress of human society, the traditiona
6、l identification is easy to lose, easy to be cracked and it has not play an identifiable role. People need a more secure and reliable identification technology. Biometric is unique, easy to lose and replication characteristics of good meet the needs of the identification. With the development of com
7、puter science and technology and biomedical makes use of biometric identification has become possible. In the field of biometric identification, face recognition with the advantages of operation is fast and simple, the results are intuitive, accurate and reliable,do not need co-ordination, has becom
8、e the focus of attention. The principal component analysis (PCA) to extract high dimensional face image of the main element, making the images are processed in low-dimensional space and it reduces the difficulty of image processing. PCA solves effectively the problem of high dimension image space an
9、d it has become a very important theory in face recognition field. This paper is in this context of writing from. In accordance with the full recognition process to analyze the performance of PCA-based face recognition algorithm. The first to use the method of access to commonly used face images for
10、 face images. In order to better analysis is based on the performance of the PCA face recognition system selected Essex face database. Next is the face image preprocessing methods. Essex face image quality is better, and have done the appropriate pretreatment, using only gray-scale processing of thi
11、s trial. Then use the PCA for face feature extraction using singular value decomposition theorem to calculate the covariance matrix of the eigenvalues and eigenvectors, and use the Euclidean distance of the nearest neighbor classifier to the classification of human face discrimination. In the experi
12、ment, we found that a high recognition rate of the PCA-based face recognition system, but with a certain robustness, the PCA-based face recognition algorithm to achieve meaningful.【Key words】face recognition PCA algorithm SVD Euclidean distance目 录前 言1第一章 人脸识别系统概述2第一节 人脸识别的研究概况2第二节 人脸识别的发展趋势3一、多数据融合与
13、方法综合4二、动态跟踪人脸识别系统4三、基于小波神经网络的人脸识别4四、三维人脸识别4五、适应各种复杂背景的人脸分割技术4六、全自动人脸识别技术4第三节 人脸识别技术的主要难点4一、复杂条件下人脸的检测和关键点定位5二、光照问题5三、资态问题5四、表情问题5五、遮挡问题5第四节 人脸识别流程5一、人脸图像采集6二、预处理6三、特征提取6第五节 本章小结7第二章 人脸图像的获取9第一节 人脸图像获取9第二节 人脸分割9第三节 人脸数据库10第四节 本章小结11第三章 人脸图像的预处理12第一节 人脸图像格式12一、JPEG格式12二、JPEG2000格式12三、BMP格式13四、GIF格式13五
14、、PNG格式13第二节 人脸图像常用预处理方法14一、灰度变化14二、二值化15三、直方图均衡15四、图像滤波15五、图像锐化17六、图像归一化18第三节 本章小结19第四章 人脸识别20第一节 主成分分析基本理论20一、什么是主成分分析?20二、例子20三、基变换21四、方差23五、PCA求解:特征根分解27六、PCA的假设28七、总结:28八、在计算机视觉领域的应用30第二节 基于PCA人脸识别算法的实现31一、创建数据库32二、计算特征脸32三、人脸识别34第三节 本章小结36结 论37致 谢38参考文献39附 录40一、英文原文40二、英文翻译53三、源程序64前 言随着社会和科技的发
15、展,社会步伐的加快,人们对高效可靠的身份识别需求日益强烈。各种技术在科研和实际中都受到了很大的重视和发展。由于生物特征内在的稳定性和唯一性使其成为了作为身份识别的理想依据。人脸特征作为典型的生物特征外,还有隐蔽性好,易于被用户接受,不需要人的配合等优点。现已成为了身份识别领域研究的热点。PCA算法通过降低维度,提取主元素,减少了数据冗余,解决了图像纬度太高无法处理或处理很慢的特点,同时保持了原始图像的绝大部分信息。在人脸识别领域,很多先进的识别算法都是在其基础上的改进。所以研究基于PCA的人脸识别算法实现具有重要的理论和使用价值。本文主要介绍基于PCA的人脸识别算法的实现,除第一章外,其余内容
16、按照人脸识别的流程可分为人脸图像获取,人脸图像预处理,人脸特征提取和特征匹配四个部分。具体安排如下:第一章主要介绍人脸识别的研究现状,人脸识别技术的主要难点及人脸识别流程。第二章主要介绍常用的人脸图像获取方法和人脸图像数据库。第三章主要介绍常用的人脸图像预处理方法。第四章主要介绍PCA算法,SVD定理,如何通过PCA和SVD提取人脸特征及如何使用最近邻法分类器欧几里得距离来进行判别分类。第一章 人脸识别系统概述第一节 人脸识别的研究概况人脸识别的研究起源比较早,Galton 在1888年和1910年就已在Nature杂志发表两篇关于如何使用人脸进行身份识别的论文。在他的文章,他使用一组数字表示
17、相异的人脸侧面特征,同时还对人类本身的人脸识别能进行了研究分析。自动人脸的研究历史相对比较短,到现在不过五十多年的时间。不过1990年以来,才得到了长足的进步。现在,已变成计算机视觉领域的一个焦点,很多著名的大学和IT公司都有研究组在从事这发面的研究。对于人脸识别的研究历史可分为三个阶段:第一阶段(1964-1990)这个阶段主要采取的技术是基于人脸几何结构的。研究的重点主要在剪影上。研究人员做了大量关于如何提取面部剪影曲线的结构特征的研究。这个阶段属于人脸识别的初级阶段,突出的研究成果不多,也没有获得的实际应用。第二阶段(1991-1997)这个阶段虽然时间相对较短,但是硕果累累,出现了若干
18、具有代表性的算法和几个商业化的人脸识别系统,如Identix(原为Visionics)公司的FaceIt系统。这个时期最具盛名的人脸识别方法是MIT媒体实验室的Turk和Pentland提出的的“特征脸”方法。后来很多人脸识别技术都与特征脸有关,现在特征脸已与归一化的协相关量方法一起成为了人脸识别性能测试的基准算法。这个时期的主要成果有:1992年左右,Brunelli和Poggio做了一个基于结构特征的方法和基于模板匹配的方法性能对比的实验,并得出了模块匹配的方法优于基于特征的方法的结论。这个结论和特征脸的共同作用,基本上停止了纯粹基于结构特征人脸识别的研究,并且很大的促进了基于表观的线性子
19、空间建模和基于统计模式识别技术的发展,使其逐渐成为主流技术。Belhumeur等人的Fisherface方法也是此阶段一个重要的成果。该方法目前依然是主流人脸识别方法中的一种,产生了很多变种,比如子空间判别模型等。其先使用PCA即特征脸对人脸图像表现特征进行降维,并使用线性判别分析方法对降维后的主成分进行变换以获得“尽量大的类间散度和尽量小的类内散度”。弹性匹配技术1为另一个重要方法。它用一个属性图来描述人脸:属性的顶点代表面部关键特征点,它的属性为相应特征点处的多分辨率,多方向局部特征Gabor变换2,称为Jet;边的属性为不同特征点间的几何关系。对于输入的图像,其通过一种优化搜索策略来定位
20、预先定位的若干面部关键特征点,同时提取它们的Jet特征,得到输入人脸图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。弹性匹配方法的优点是既保留了面部的全局结构特征,也对人脸关键局部特征进行了建模。局部特征分析由Atick等提出。其在本质上是基于统计的低维对象描述方法,与PCA相比,局部特征分析在全局主成分分析的基础上提取的是局部特征。它既保留了全局拓扑信息,有提取了局部特征,使其具有了更好的描述和识别能力。局部特征分析技术已商业化为著名FaceIt系统。柔性模型,包括主动形状模型和主动外观模型。它是人脸建模方面的一个新的进步。其主要将人脸描述为2D形状和纹理两个分离的部分,
21、分别用PCA建模,然后再通过PCA3,4,5将两者合成来对人脸建模。柔性模型具有良好的人脸合成能力,可以使用基于合成的图像分析技术对人脸图像进行特征提取和建模。这个阶段所提出的算法在理想图像采集条件,人员配合,中小规模正面人脸数据库上达到了非常好的性能。,也诞生几个著名的人脸识别系统。第三阶段(1998年现在)这个时期关于人脸识别的研究非常热门。有大量的研究人员从事这方面的研究。主要针对的是主流的人脸识别技术在采集条件不理想和用户不配合下鲁棒性差的问题。光照和姿态问题成为了研究焦点。这个时期主要成果有:Georghiades等人基于光照锤模型的多姿态,多光照条件人脸识别方法。Blanz和Vet
22、ter等人基于3D变形模型的多姿态,多光照的人脸识别方法。Shashua等人基于上图像的人脸图像识别与绘制技术6,7。总体而言,目前非理想成像条件下(尤其是光照和姿态),对象不配合,大规模人脸数据库上的人脸识别已逐渐成为研究的重点。而非线性建模方法,统计学习理论,基于Boosting的学习技术,基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。从整个人脸识别的研究历史来看,基于PCA的特征脸8,9识别方法占据了非常重要的地位,也对后来的人脸识别技术产生甚远的影响。在后来很多的人脸识别技术,我们或多或少都会发现它的影子。人脸图像维数都很高,PCA方法不但很好表征人脸而且通过去除相
23、关性,减少冗余,解决了在人脸识别过程中图像为数过高的问题。并且随着现代社会的发展,快速人脸识别的需求越来越大。所以研究基于PCA的人脸识别算法的实现还是有实际意义,本文也就在这样的背景下写作而成。第二节 人脸识别的发展趋势人脸识别至今虽然取得了丰硕的研究成果,但是还有很多问题需要解决。人脸识别的难度在于:人脸是非刚性物体,并且会随着年龄的增长而改变,特征难以完全描述;人脸常常有许多遮挡物,如:眼镜,帽子等;环境的光照和人脸的姿态等。人脸识别的未来主要的发展趋势如下:一、多数据融合与方法综合人脸识别技术经过这几十年的发展,已取得非常不错的成果。但是各种技术和方法都有自己不同的适应环境和各自的特点
24、。如何使用数据融合理论,将不同的方法综合起来,相互补充,来取得较好的人脸识别效果,便成为人们的研究热点之一。二、动态跟踪人脸识别系统目前的静态人脸识别技术只能满足一般身份识别场合如门禁系统,考勤系统等,无法进行人脸的动态跟踪与识别。随着现在社会的发展,目前对动态人脸的跟踪与识别的需求越来越大,尤其是在一些安全领域。三、基于小波神经网络的人脸识别小波自提出以来,其理论和应用得到了长足的发展。它被认为是傅里叶分析的突破性的发展。随着神经网络的理论研究的深入,与小波,混沌,模糊集等非线性理论相结合已成为一个非常重要的发展方向。小波变换具有时频特性和变焦特性,神经网络具有自学习,自适应,鲁棒性,容错性
25、和推广能力。如果能结合两者的优势,将会取得人脸识别不错的效果。四、三维人脸识别 目前许多人脸识别成果是建立在二维人脸基础上的,而实际的人脸是三维的。三维人脸相比较于二维图像提供了更加完整的人脸信息。随着现在三维人脸采集技术的逐步发展,如何利用三维人脸进行人脸识别已成为一个新的研究热点。五、适应各种复杂背景的人脸分割技术现在在复杂背景下的人脸分割已经取得了一定的成果,如弹性匹配,但检测速度和效果还无法令人满意。在复杂背景下快速有效检测和分割人脸技术还需进一步的研究。六、全自动人脸识别技术全自动人脸识别技术目前还处于初级研究阶段,识别效果和速度离实际的要求还相差甚远。具体原因是人脸是非刚体,无法得
26、到准确完整的描述人脸特征。如何有效的表达人脸特征将是其研究的重点。第三节 人脸识别技术的主要难点目前的人脸识别技术在人员配合,较理想采集条件下可以取得比较满意的结果。但在人员不配合,采集条件不理想下,系统的性能陡然下降。目前的主要的难点为:一、复杂条件下人脸的检测和关键点定位人脸检测和关键点定位为实际人脸识别系统的前端处理模块,此模块直接影响着人脸识别系统的性能。目前大多数特征定位算法的精度都会随着光照,姿态等变化而快速下降。复杂条件下的人脸检测与关键点定位是目前人脸识别急需解决的问题之一。二、光照问题关照问题是计算机视觉存在已久的问题,尤其在人脸识别中表现得更加明显。但目前为止光照处理技术远
27、未达到实用的程度,还需要深入的研究。三、资态问题对于姿态的研究相对不多,现在人脸识别算法主要以正面或准正面姿态。当人脸姿态俯仰或左右比较大时,人脸识别的识别率骤降。如何提高人脸识别系统对姿态的鲁棒性是人脸识别中一个具有挑战性的任务。四、表情问题表情识别是生物特征识别的中的一种,是人机交互不可或缺的部分。表情是复杂的面部肌肉运动,每个表情都是几十块面部肌肉共同运动的结果,很难用精确的数学模型来表示这些肌肉的运动。面部表情的变化为面部特征点的运动。由于目前的计算机技术的限制,计算机还不能准确的定位这些面部特征点,也无法辨别面部肌肉的运动。而且,同一种表情在不同的人上也会有不同的表现形式。并且同一个
28、人的不同表情之间也没有明确的界限。以上这些决定计算机很难用统一的标准来识别人的面部表情。五、遮挡问题对于非配合情况下,采集到的人脸图像一般都不是完整的,这会影响人脸特征提取与识别,可能还会导致人脸检测算法的失效。如何有效地排除遮挡物的影响有着非常重要的意义,如在监控环境下。以上列举了部分主要的技术难点,其他难点由于本文的讨论不会涉及,所以不会再一一列举。本文的实验是在人脸图像正面姿态,光照正常,表情正常,部分面部图像有小范围遮挡的情况下进行的。这样做的目的只是让我们的工作重心集中在分析PCA 人脸识别算法性能上。第四节 人脸识别流程图1.1 人脸识别系统处理流程一、人脸图像采集采集人脸图像是通
29、过传感器采集人脸图像,并将其转换为计算机可以处理的数字信号。这是人脸识别的第一步。在采集人脸图像时,要注意用户人脸姿态,脸部有无遮挡,周围光照是否满足要求及设备采集图像的质量是否能满足要求。二、预处理预处理是为了除去噪声和对测量仪器或其他因素对人脸图像造成退化现象进行复原。从传感器采集到图像除了包含人脸特征信息,还包含背景信息,所以必须从原始人脸图像分割出我们要处理的部分。如何分割就需要定位和分割算法。他们一般以人脸图像在图像结构和人脸信号分布的先验知识为依据。常用的人脸预处理有人脸图像灰度化,人脸图像二值化,人脸图像归一化,直方图修正,图像滤波和图像锐化。三、特征提取特征提取就是计算机通过提
30、取人脸图像中能够凸显个性化差异的的本质特征,进而来实现身份识别。本文讲解如何使用PCA算法提取人脸特征,进而实现人脸识别。特征主要包括三种类型:物理特征,结构特征和数学特征。由于物理特征和结构特征容易被察觉,触觉以及其他感觉器官所感知,所以人类常常是利用这些特征来对对象进行识别。对于计算机而言,模拟人类的感觉器官是很难实现的,但计算机在处理数学特征的能力上要比人类强得多,因此我们通过诸如协方差矩阵,统计平均值和相关系数等数学特征来构建人脸识别系统。特征提取和选择的根本任务就是从许多特征中找出那些最有效的特征。在样本数不是很多的情况下,可以利用这些特征进行分类器的设计,但是在大多数情况下,由于测
31、量空间的维数很高,不能直接进行分类器的设计。因此,如何把高维测量空间压缩到低维特征空间,以便有效的设计分类器,便成为了一个值得思考的问题。为了获得有效的特征,一般需要经过特征形成,特征提取和特征选择等步骤。1. 特征形成特征形成是根据被识别对象产生出一组基本特征的过程,当被识别的对象是波形或数字图像时,这些特征可以通过计算得来;当被识别对象是实物或某种过程时,这些特征可以用仪表或传感器测量来得到。通过上面方法获得特征被称为原始特征。2. 特征提取原始数据组成的空间被称为测量空间。由于测量空间的维数一般都很高,不易设计分类器,所以在分类器设计之前,需要从测量空间变换到维数很少的特征空间,由特征向
32、量表示。通过映射或变换方法用低纬空间来表示样本的过程被称为特征提取。映射后的特征称为二次特征,它们是原始特征的某种组合,通常是线性组合。3. 特征选择从一组特征中挑出一些最有效的特征从而达到降低特征空间维数目的的过程称为特征选择。由于在许多实际问题中常常不容易找到那些最重要的特征,或者由于条件限制而不能对这些重要特征进行测量。从而使得特征选择和特征提取的任务复杂化。特征提取和特征选择在有些情况下并不是截然分开的,因为从一定意义上来讲,二者都是要达到对数据进行降维的目的,只是实现的途径不同。特征提取是通过某种变换的方法组合原有的高维特征,从而得到一组低维的特征。而特征选择是根据专家的检验知识或评
33、价准则来挑选对分类最有影响的特征。比如可以先将原始特征空间映射到维数较低的空间,在这个空间中在进一步选择特征来进一步降低维度;也可以先去除那些明显不含有分类信息的特征,而后再进行映射以降低维度。四、特征匹配特征匹配是计算两个人脸图像特征样本的特征模块间的相似度即将采集到的人脸图像的特征模版与系统中已存储的特征模版进行比对,并输出最佳匹配对象。在本文主要讲解使用最近邻法分类器欧几里得距离来判别人脸图像,在实际广泛使用的还有基于SVM即支持向量机,基于神经网络和图匹配的方法。第五节 本章小结本章由人脸识别的研究背景,人脸识别技术的主要难点,人脸识别的发展趋势和人脸识别流程四个小节构成。在人脸识别的
34、研究概况小节主要讲解人脸识别的研究概况及基于PCA人脸识别算法实现的研究意义。在人脸识别的发展趋势小节主要讲解人脸识别技术未来的走向。在人脸识别技术的主要难点小节主要讲解人脸识别的主要技术难点及本文是在什么样的条件进行试验的。人脸识别小节讲解本文人脸识别的流程。第二章 人脸图像的获取第一节 人脸图像获取随着计算机科技和微电子的发展,现在人脸图像采集设备也越来越多。常用的采集设备有数码相机,数码摄影机等。但是采集设备成像原理各异,有些设备对某类人脸图像的采集效果比较好,进而人脸识别率高,对不同类的人脸图像采集效果差,进而人脸识别率低。不过随着现在科技的发展,这个问题已基本上被解决。另外,人脸图像
35、采集的形式不同也会影响识别率。人脸图像的采集形式主要有两种:一为静态人脸图像,二位动态人脸图像。静态人脸图像的采集相对比较简单,用数码相机即可获取。动态人脸图像相比静态人脸图像获取难度较大,但其更加贴近实际需求,应用场合更加广阔。动态人脸图像相比于静态人脸图提供了更加客观的信息量。但同时也带了问题,动态人脸图像序列里的某一幅图像可能会产生瞬间模糊,这将会影响其识别率。上述问题是由人脸的多变性产生的。对于动态人脸图像要考虑如何在序列中提取清晰的图像又不丢失局部信息。同时建立人脸图像间的相关性是有必要的,可以有效的提高识别率。在实际中,要采用何种人脸采集形式要取决于应用的需求和场合。一般而言,动态
36、人脸图像采集应用于特殊场合,如犯罪识别过程,而静态人脸图像采集应用于普通的安全场合。对于静态人脸图像采集要注意要确保人脸表情正常,姿态无倾斜,光线尽量均匀,并且要对周围的光源做必要的处理,避免受到周围强光和不均匀异色光的干扰。采集完成后要对每个对象的图像做必要的审核,剔除掉不符合要求的人脸图像。第二节 人脸分割人脸识别是通过对人脸进行精确定位,并从图像中提取人脸区域。人脸分割属于图像分割,是人脸识别系统中不可缺少的一环。要对人脸进行识别一般需要将人脸区域从采集到的图像中分离出来。人脸分割比较经典的方法有数据驱动和模型驱动。数据驱动方法直接对图像进行处理,不依赖于先验知识。其包含有基于边缘检测的
37、方法,基于阀值的方法和基于区域增长的方法。基于模型的方法需要先验知识。其包含有活动轮廓模型等。采集到图像中人脸区域颜色和纹理变化较大,因此如果要实现精确分割,只利用图像的数据信息是不够的,所以实际中基于模型的方法使用的比较多。基于边缘的分割方法需要两个步骤,分别为边缘检测和边缘连接。该方法先提取边缘后再进行边界连接,得到分割轮廓。但是这个方法也存在问题,实际中由于噪声的图像的影响,常常会检测到假的边缘,从而导致错误的分割。基于阀值的方法是使用采集到图像的灰度直方图计算出分割阀值,又可以分为全局阀值方法和局部阀值方法。全局阀值方法是使用整个图像的灰度信息,来得到用于分割的阀值。局部阀值方法是图像
38、不同区域得到对应不同区域的阀值即一个阀值对应图像的一个子区域。在实际中,由于噪声等因素的影响,直方图经常不能有明显的峰值出现,这是选择阀值并不合理,它是由阀值分割的特点决定的。此方法只考虑了图像的灰度信息,抛弃了图像的其他信息。对于灰度差不明显的图像,得不到令人满意的结果。基于区域增长的方法是将含有相似性质的像素集合起来形成一个新的区域。首先把图像分割成较小的区域,有可能非常小,甚至可能是一个像素。在每个子区域中,对经过适当定义能反映一个物体内成员隶属度的性质进行计算,每个子区域会用一组参数来表示该区域。然后对相邻区域所有边界进行分析,若便捷信息强,则边界不变,若边界信息弱,则消除个边界并合并
39、相应的邻域。它是一个迭代过程,每一步重新计算边界信息,若没有区域合并,迭代完成,图像分割完成。该方法开销较大,但可以使用图像的相关性质进行边界定位。该方法当前研究的区别在于区域性质差异上。基于模型的方法,都是通过引入统计信息来得到高鲁棒性。其中活动轮廓模型是使用在图像上的一条动态曲线,在内力曲线本身新的表现和外力图像信息的表现共同作用下趋于对象的轮廓。模型方法具有丰富的先验知识,在实际中具有很好的适应性和鲁棒性。目标分割与识别通过将目标集合和统计信息表示为模型,是其成为目标的搜索匹配或监督分类。第三节 人脸数据库人脸数据库是人脸识别研究,开发和评测不可缺少的。每个人脸识别系统都需要一个人脸数据
40、库。人脸图像数据库的设计对人脸识别系统的识别率有着非常大影响。设计一个在所有变化情况下都能正确识别的系统是非常困难的,而且也没有必要。所有人脸识别系统都是在一定的约束条件进行的。所以有必要建立满足不同需要的人脸数据库。常用人脸数据库如下:国外人脸数据库的有FERET人脸数据库, MIT人脸数据库,YALE人脸数据库,PIE人脸数据库,ORL人脸数据库,AR人脸数据库和Essex人脸数据库。FERET人脸数据库是人脸识别中最常用的数据库,包含多姿态和多光照的人脸灰度图像,但其多为西方人脸图像,每个人的人脸图像变化较少。MIT人脸数据库有麻省理工大学媒体实验室建立,由16位志愿者的2592副多姿态
41、,多光照和不同大小的图像组成。PIE人脸数据库有卡内基梅隆大学建立,由68位志愿者的41368副不同姿态,多光照和不同表情的图像组成。ORL人脸数据库由剑桥大学AT&T实验室建立由40位志愿者的400幅图像组成,其中部分志愿者的图像还有姿态,表情和光照的变化。由于其人脸变化模式较少,现已很少使用。AR人脸数据库为西班牙巴塞罗那计算机视觉中心建立,由116人的3228幅图像构成。采集是在严格控制摄像机参数,光照变化,摄像机距离等条件下进行的。Essex人脸数据库是英国埃塞克斯大学的人脸数据库。任何人都可以下载它的人脸数据库,但是你不能发布,打印,销售或发行这些图像。这个人脸数据库由Libor S
42、peacek博士主持的计算机视觉研究项目在维护。这个数据库由faces94,faces95,faces96,grimace四个库组成。这样做的目的是为了增加难度。Faces96和grimace是这个数据库最难识别的。它们的背景和比例是变化的,人脸表情是极度变化的。英国埃塞克斯大学计算机视觉研究项目鼓励研究者公布使用这个数据库取得人脸识别结果。我们在本文采用的是它的face94数据库。faces94数据库中人脸图像是在受试者坐在距离相机固定位置,并要求讲话的情况下采集而成。讲话的目的是为了采集面部表情的变化。每个图像的大小为180*200,图像的背景是蓝色的。有轻微的姿态变换,无光照变换。国内人
43、脸数据库有中科院计算技术研究所银晨科技面向识别联合实验室建立的CASPEAL人脸数据库。该数据库是基于目前的人脸数据库大多都较小或图像变化因素单一,人脸图像的多为西方人,其面部特征与东方人存在一定的差别,需要建立一个大规模,多因素的东方人脸数据库的需求建立的,共采集了1040位志愿者(595名男性,445名女性)的99450幅图像。该数据库根据不同的变化因素又分为7种模式子库。这7种变化因素为姿态,表情,饰物,光照,背景,距离和时间跨度,其中以姿态,表情,饰物和光照为主,故称为PEAL(pose,expression,accessory和lighting的简写)。CASEPEALR1为CASE
44、PEAL的共享版,可以提供给研究人员用以研究使用。其中研究人员指的是研究生导师或其他固定职位的研究员,不包括学生。第四节 本章小结本章主要介绍人脸图像获取,人脸分割和人脸数据库。在人脸图像获取和人脸分割两个小节中主要介绍常用的人脸获取方法及获取人脸原始图像后如何分割出我们需要部分的方法,也为后面人脸图像数据库打下了基础。在人脸数据库一节中,主要介绍了常用的人脸数据库及本文的实验是在Essex人脸数据库中我们选择出来的子库中进行的。这样做的目的是我们的工作中心集中在核心人脸识别算法的性能研究上。第三章 人脸图像的预处理第一节 人脸图像格式在计算机中任何信息都是以文件的形式存储,图像信息也不例外,
45、它经过采样,量化和编码后以图像文件进行存储,所以在人脸识别之前有必要介绍图像文件格式。图像的文件格式很多,本节只介绍本文常用的几种图像格式。一、JPEG格式JPEG文件格式是常用的图像文件格式。它是由联合照片专家组(Joint Photographic Experts Group)开发的,并且命名为“ISO10918-1”,JPEG仅仅是一种俗称而已。JPEG文件以.jpg或.jpeg为扩展名,其压缩技术非常先进。JPEG使用有损压缩方法去除冗余图像和彩色数据,获得了较高的压缩率,同时还可以给人丰富生动的视觉感受,即可以使用最小的磁盘存储较好的图像质量。它是一种灵活的格式,可以调节图像质量,允
46、许使用不同压缩比例压缩文件。由于JPEG优异的品质和杰出的表现,它的应用也非常广泛,特别是在网络和光盘读物上,肯定都能找到它的影子。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。二、JPEG2000格式JPEG2000是基于小波变换的图像压缩标准,同样由联合照片专家组(Joint Photographic Experts Group)开发和维护。JPEG2000通常被认为是未来取代JPEG(基于离散余弦变换)的下一代图像压缩标准。JPEG2000
47、文件的扩展名为jp2。JPEG2000压缩率比JPEG高约30%左右,同时支持有损和无损压缩,而且不会产生原先的基于离散余弦变换的JPEG标准的块状模糊瑕疵。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。此外,JPEG2000还支持所谓的感兴趣区域 特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是基于感兴趣区域的编码方案所采取的压缩策略。其优点在于它结合了接收方对压缩的主观需求,实现了交互式压缩。而接收方随着观察,常常会有新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。三、BMP格式BMP(Bitmap-File)图形文件是Windows采用的图形文件格式,在Windows环境下运行的所有图象处理软件都支持BMP