《基于稀疏表示的人脸识别算法研究.doc》由会员分享,可在线阅读,更多相关《基于稀疏表示的人脸识别算法研究.doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、目录1 绪论21.1 背景及意义21.2 发展状况22 人脸识别32.1 人脸识别概念32.2 影响因素及相应解决方法42.2.1 光照问题42.2.2 姿态问题42.2.3 数据库大小问题42.2.4 遮挡、年龄、表情等问题43 稀疏表示53.1 稀疏表示的意义53.2 稀疏表示的概念54 基于稀疏表示的人脸识别64.1 基于稀疏表示的人脸识别原理64.2 基于稀疏表示的人脸识别算法84.2.1 正交匹配追踪算法83.2.2 快速正交匹配追踪85 实验结果与分析95.1 有表情变化的实验105.2 不同光照条件的实验106 结束语11基于稀疏表示的人脸识别算法研究摘要: 稀疏表示的数学实质就
2、是在超完备字典下对给定信号的线性分解。本文研究了一种基于稀疏表示的正交匹配追踪(orthogonal marching pursuit,简称OMP)算法,递归的对所选原子集合进行正交化,并且利用矩阵cholesky分解简化迭代过程中矩阵求逆的计算。在人脸识别的实际应用中,利用实验样本构建冗余字典,将待检测样本表示成试验样本的线性组合。通过在不同人脸库上的实验证明了该算法的有效性。关键字: 稀疏表示; 稀疏编码; 人脸识别; 正交匹配追踪 ABSTRACT1 绪论 1.1 背景及意义 随着科技的迅猛发展,人类社会已经进入信息时代,信息安全问题日益得到高度重视。钥匙、密码、证件等传统形式的身份认证
3、技术已经远远不能完全满足现代社会中对信息安全有高质量要求的部门的需要。因此,新一代的身份认证技术应运而生。 人的生物特征具有唯一性、稳定性等多种优点,已逐渐成为新一代的身份认证技术的主要依据。在众多的基于生物特征的身份识别技术中,人脸识别技术因其自然性、友好性等显著优势而受到广泛关注,目前已经被应用到模式识别、人工智能、计算机视觉、认知科学等多个领域中。然而,由于人脸图像易受到光照、姿态、遮挡和表情等多种因素的影响 ,识别效果也易受图像数据库大小的干扰,计算机智能识别课题的研究仍然具有较高的挑战性。目前一些学者将稀疏表示用于人脸识别,得到了国内外学者的广泛关注,其基本思想是将待分类图像表示为以
4、训练图像本身作为基原子的字典的稀疏线性组合。1.2 发展状况 1888年,Nature上发表了第一篇利用人脸进行身份识别的文章,由此开启了近代对人脸识别技术的研究。1965年,Chan和Bledsoe共同创建了世界上第一个自动人脸识别系统。随着计算机技术的迅猛发展和相关理论的日益成熟,人脸识别技术的到了快速的发展与广泛的应用,其发展过程大致可以划分为以下三个阶段: 起步阶段 早期人脸识别技术主要利用人脸的几何结构特性(Geometric Feature Based)以及它们之间的角度、距离和区域形状等参数作为识别依据。在这一阶段,很多参数的测定需要人工标定,因此只能称之为半自动人脸识别系统,但
5、是这种方法的提出为后续其他方法的提出提供了理论参考。 发展阶段90年代初,研究人员发现人脸图像之间存在很强的相关性,人脸图像本身只是高维图像空间中的一个子空间,若直接使用,会因维数过高而产生“维数灾难”等问题。因此,各种降维方法陆续产生。本阶段主要产生了线性判别分析(Linear Disriminant Analysis,简称LDA)算法、主成分分析(principal component analysis,简称PCA)算法以及统计模式识别方法等多种算法。攻坚阶段 进入二十一世纪,人脸识别技术进入攻坚阶段。在前两个阶段的发展过程中,人脸识别技术已经积累了丰富的理论和大量的算法,基本能够解决可控
6、条件下的身份识别问题。但是,非理想条件、大规模人脸数据库等问题下的人脸识别仍有待解决。针对这些问题,产生了等距离映射(Isometrical Mapping,简称ISOMAP)、局部线性嵌入(Locally Linear Embedding,简称LLE)、最大方差展开(Maximum Variance Unfolding ,简称MUV)等多种方法,基于稀疏表示的人脸识别方法也生在这一阶段脱颖而出。 2 人脸识别 2.1 人脸识别概念 人脸识别就是利用人脸的生物特征对身份进行判别,这些生物特征可分为眼、鼻、嘴的几何形状或关系等外部特征以及人脸的结构关系等内部特征两个方面。2.2 影响因素及相应解
7、决方法 2.2.1 光照问题 人脸识别系统的性能与人脸识别算法的设计以及人脸图像的质量等有密切的关系。在影响人脸图像质量的众多因素之中,光照问题不容忽视。一般将人脸识别中处理光照问题的方法分为三类:基于图像处理技术的方法;基于子空间的方法;基于光照不变特征提取算法。基于图像处理技术的方法主要从图像本身出发,利用对光照变化不敏感或无变化的特征进行图像处理。基于子空间的方法原理是同一物体在不同光照下的图像属于一个低维度的线性子空间,通过寻求与输入图像最为接近的子空间进行识别。基于光照不变特征提取方法的算法可以分为传统光照不变特征提取和基于人脸反射系数的光照不变特征提取两大类。 2.2.2 姿态问题
8、 姿态问题同样也是人脸识别中亟待解决的一个难点。目前多数的人脸识别算法仅适用于正面或准正面的人脸图像条件下的人脸识别,对于其他姿态下的人脸图像,识别率相对较低。针对这一问题,目前已经提出了局部线性回归(Locally Linear Regression,简称LLR)算法、基于神经网络的方法和光度立体分析等方法。 2.2.3 数据库大小问题 在人脸识别技术中,人脸图像数据库的大小存在两种极端情况:人脸图像数据库过大;单样本或少样本人脸数据库。如果人脸图像数据库过大,则对相关算法的运算速度要求较高,如果人脸图像数据库样本过少,则会影响人脸识别的正确率。针对数据库过大问题,目前主要提出了主成分分析、
9、线性辨别分析和隐马尔可夫模型等方法来提高效率。针对单样本问题,主要的解决方法有样本扩张法、图像增强法和特征子空间扩张法等。 2.2.4 遮挡、年龄、表情等问题 喜怒哀乐,生老病死是所有人类都不可避免的人生成长经历。然而,伴随而来的表情表情年龄、遮挡等问题给自动人脸识别系统的设计增加了很大的难度。目前,针对表情及年龄问题,已提出了基于多分类融合的3D算法、利用三维数据对图像进行重构等方法;针对遮挡问题,也已提出了带遮挡人脸的支持向量机、尺度不变特征变换(Scale Invariant Feature Transform,简称SIFT)、随机非均匀局部Gabor二值模式(Random Nonuni
10、form Local Gabor Binary Pattern,简称RNLGBP)等算法。3 稀疏表示3.1 稀疏表示的意义香农定理表明,模拟信号可以用一定采样频率的周期函数来表示。然而,这种表示方法对信号的分析带来了一些不便。对于压缩问题,希望用较少的系数表示较多的信息;对于识别问题,希望信号的主要特征突出;对于去噪问题,希望将有用信号与噪声进行有效分离。这些应用都有一个共同的特点,就是简化信号的表示(稀疏化)。稀疏表示是压缩感知中的关键理论,数据的稀疏表示,可以从本质上降低数据处理的所需成本,有效提高压缩效率。目前,稀疏表示已经被广泛地用于人脸识别算法中。 与传统的算法相比较,基于稀疏表示
11、的人脸识别算法具有识别率高、鲁棒性强的突出特点。3.2 稀疏表示的概念 研究人员发现,通过使用原子库(过完备冗余函数体系)取代传统完备正交函数集,可有效从原子库中找到具有最佳线性组合的n项原子信号来表示一个给定信号,而这些组合的系数大部分为0或接近于0,即稀疏表示。稀疏表示主要采用稀疏逼近原理即高度非线性逼近原理。对于一个给定集合S=; i=1,2,I ,其元素是张成整个Hilert 空间H=的单位矢量,IM。集合S称为原子库,元素称为原子。对于任意给定的信号fH,预想在S中自适应的选取n个原子对信号做n项逼近: = (1) 其中是的下标集,card()=n , 则B=span(,r )就是由
12、n个原子在原子库S中张成的最佳子集。我们定义逼近误差为: (f,S)= (2) 由于n远小于空间的维数M,所以这种逼近也被称作稀疏逼近。由于原子库存在定的冗余性,知上式存在多组解。稀疏表示的目的就是从中选取解的系数最为稀疏的或使n取值最小的解。这个问题等同于下述问题:Min imize subject to f= (3) 稀疏表示的最初目的是为了以低于香农定理的采样频率表示和压缩信号,事上,在去噪方面,小波变换和平以不变小波也开发出许多有效算法;稀疏表示已成功应用与图像动态范围的压缩,图像卡通和纹理成分的分离等。在这些应用中,算法的性能取决于表示的稀疏性是否忠实于原始信号。4 基于稀疏表示的人
13、脸识别4.1 基于稀疏表示的人脸识别原理图像预处理 训练集图像识别结束 稀疏表示分类特征提取 图像预处理特征提取 图1 基于稀疏表示的人脸识别框图稀疏表示人脸识别算法主要建立在压缩感知理论的基础之上。假设每个用户的注册图像都可以在图像空间中划分出一个相对独立的子空间,且任意一张人脸图像都可以由同一用户自身的注册图像集的线性组合来表示,通过计算计算待检测图像相对于所有注册图像集的稀疏表示系数来揭示该待测试图像所属的用户类别。 设给定的注册图像集A中有i类已标记好的注册用户,其中第k类中含有个样本。则属于第k类的图像集合可以用矩阵=,.,来表示,且每个图像对应于矩阵的一个列向量,m为人脸图像的维数
14、。为了提高效率,现假定每个注册用户的矩阵对应于用于稀疏表示的训练字典。对于任意给定的测试图像y,若其属于某一注册图像集所包含的类别,那么便可以用的线性组合来表示。为便于理解, 现假设第k类中有足够多的训练图像构成矩阵,且待测试图像属于第k类,则可以用具有相同类别属性的第k类训练图像的线性组合近似表示待测试图像,即=+.+ 其中R,j=1,2, (4) 然而,一般情况下的待测试图像所属类别并不知晓,因此用于实验的图像字典是由i类训练图像集的所有样本共同构成的,即:A=,.,=,.,.,., (5) 因此,任意待测试图像y就可以用字典线的性表示,即: Y=Ax (6) 其中x=0,0,,0, ,.
15、,0,0,.,0R 是一个很稀疏的系数矢量。由x就可以获得关于y的类别信息。显然,若mn,易知方程组(6)为过定的,解向量x唯一。但是对于人脸识别问题,经降维处理后的样本构成的方程组是典型欠定的,故解向量x并不唯一。由压缩感知理论和稀疏表示可知,如果向量x足够稀疏,那么稀疏解的个数范数问题可以转化为范数问题,即 = arg min subject to y=Ax (7) 4.2 基于稀疏表示的人脸识别算法4.2.1 正交匹配追踪算法正交匹配追踪算法是稀疏表示的经典算法之一,为求得式(7)提出的问题的最佳逼近解正交匹配追踪算法在每一步的迭代过程中选择和当前迭代残差最相关的原子,将信号正交投影到这
16、些原子张成的空间中,循环计算残差直到满足约束条件(详细步骤见算法一)。注意第5行是贪婪算法选择原子的步骤,第7行是正交投影的步骤。 算法1 正交匹配追踪1. Input:dictionary A,target sparsity K2. Output : sparse representation x3. Init :Set I= , r= y ,x =04. while(stopping criterion not met) do 5. =arg 6. I=(I, ) 7. 8. r =y-9. end while3.2.2 快速正交匹配追踪快速正交匹配追踪算法通过在基本的正交匹配追踪算法中对
17、冗余字典采用Cholesky分解,提高了算法的整体效率。 算法 2 快速正交匹配追踪 1. Input:dictionary A,target sparsity K2. Output : sparse representation x3. Init :Set I= , L= 1 ,r= y ,x =0,=y, m=14. while(stopping criterion not met) do5. =arg 6. if m1 then 7. w=solve for w Lw = a 8. L= 9. end if 10. I=(I, ) 11. = solve for c LLc = 12.
18、r =y- 13. n=n+1 14. end while5 实验结果与分析 为了验证本文所提算法的有效性,本文选择目前比较常用的扩展的Yale B人脸数据库ORL人脸数据库作为实验数据集分别进行识别精度与时间的测试。我们主要关心在不同的光照和不同的表情两种主要因素下的测试结果。ORL人脸数据库含有40个不同人的脸,每个人脸有10张不同表情的图像,总共400张图像。扩展的Yale B是一个比较大的人脸数据库,含有16128张人脸图像,包含了38个不同人脸的64种光照条件下的不同图像。本实验仅从中选取了一个小的子集,但已足够测试本文算法对光照条件的敏感性。5.1 有表情变化的实验本算法随机从OR
19、L人脸库每个人脸的图像中选取不同比重的图像作为训练集,余下的图像做为测试样本,稀疏阈值设置为训练样本数目。表 1 显示的是随着训练样本比重增大识别率的变化情况。总之,在训练样本足够多的情况下测试样本都可以用字典中所属类别的原子的线性组合来表示。 图2 ORL 数据库不同表情变化表1 正交匹配追踪算法应用于ORL数据库训练图像 测试图像 稀疏阈值 识别率(%) 用时(s) 5 5 56 4 6 7 3 7 8 2 85.2 不同光照条件的实验本算法随机从扩展的Yale B数据库的一个子集下每个人脸的图像中选取不同比例的图像作为训练集,余下的图像作为测试样本,稀疏阈值设置为训练样本数目。表2显示的
20、是随着训练样本比重变大识别率的变化情况。从中可以看出,本算法在不同光照条件下表现出较高的识别率。 图2 Yale B 数据库种不同光照条件 表2 正交匹配追踪算法应用于Yale B数据库 训练图像 测试图像 稀疏阈值 识别率(%) 用时(s) 5 5 5 6 4 6 7 3 7 8 2 86 结束语 本文研究了稀疏表示理论并且应用矩阵Cholesky 分解实现正交匹配追踪快速算法,该算法简化了迭代过程中逆矩阵的计算,提高了识别的速度,并在具有表情变化和光照变化的条件下取得了很好的识别率。人脸识别的困难主要在于遮挡、单样本、鲁棒性等的问题。稀疏表示在这些限制下的识别中仍具有很大的发展潜力,有待于
21、进一步研究,这也是目前一个比较热门的研究方向。参考文献1 杨淑莹. 模式识别与智能计算-Matlab技术实现M. 北京: 电子工业出版社. 2011. 41-183.2 杨荣根, 任明武, 杨静宇. 基于稀疏表示的人脸识别算法J. 计算机科学. 2010, 9(37): 267-269.3 张国琰. 基于稀疏表示的人脸识别D. 河北: 河北工业大学工学硕士学位论文. 2012. 1-25.4 李映, 张艳宁, 许星. 基于信号稀疏表示的形态成分分析:进展和展望J. 电子学报. 2009, (1): 146-151.5 平强, 庄连生, 愈能海. 姿态鲁棒的分块稀疏表示人脸识别算法J. 中国科学技术大学学报. 2011, 41(11): 975-981.6 胡正平, 宋淑芬. 基于全局和分离部件融合的双 L1稀疏表示人脸图像法J. 模式识别与人工智能PR AI. 2012, 25(2): 256-261.7 肖良, 戴斌, 方宇强. 基于自组合稀疏表示的鲁棒人脸识别算法J. 中国控制会议. 2012,(31):3853-3857.8 焦李成, 孙强. 多尺度变换域图像的感知与识别:进展和展望J. 计算机学报. 2006, 29(2): 177-193.9 苏煜,山世光,陈熙霖,等 基于全局和局部特征集成的人脸识别J软件学报,2010,21( 8) : 1849 1862.