《基于卷积神经网络的人脸识别方法-陈耀丹.pdf》由会员分享,可在线阅读,更多相关《基于卷积神经网络的人脸识别方法-陈耀丹.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第48卷第2期2016年6月东北师大学报(自然科学版)Journal of Northeast Normal University(Natural Science Edition)V0148 No2June 2016文章编号1000一1832(2016)02一007007DOI1016163jcnki221123n201602016基于卷积神经网络的人脸识别方法陈耀丹,王连明(东北师范大学物理学院,吉林长春130024)摘 要 研究并实现了一种基于卷积神经网络的人脸识别方法该网络由2个卷积层、2个池化层、1个全连接层和1个Softmax回归层组成,它能自动提取人脸特征并进行分类网络通过批量梯度
2、下降法训练特征提取器和分类器,各隐层应用“dropout”方法解决了过拟合问题应用于ORL和AR人脸数据库的人脸识别率分别达到9950和9962,识别单张人脸的时间均小于o05 s,而且对光照差异、面部表情变化、有无遮挡物等干扰具有鲁棒性关键词 人脸识别;卷积神经网络;图像处理;人脸数据库中图分类号TP 3914 学科代码 5202040 文献标志码A0 引言人脸识别作为生物特征识别(虹膜识别、指纹识别、掌纹识别等)技术之一,由于具有成本低、用户易接受、可靠性高等优点,在身份认证、安防监控、人机交互等领域具有广泛的应用前景11目前人脸识别算法大致可分为两类:(1)基于表象(appearance
3、_based)的方法基本思想是将二维的人脸输入转换到另一个空间,然后用统计方法分析人脸模式,例如eigenface2|、fisherface31和SVM4等方法(2)基于特征(feature_based)的方法一般是提取局部或者全局特征,然后送人一个分类器进行人脸识别,例如基于几何特征的识别5和HMM61等方法卷积神经网络是一个受生物视觉启发、以最简化预处理操作为目的的多层感知器的变形,本质是一个前向反馈神经网络卷积神经网络与多层感知器的最大区别是网络前几层由卷积层和池化层交替级联组成,模拟视觉皮层中用于高层次特征提取的简单细胞和复杂细胞交替级联结构卷积层的神经元对前一层输入的一部分区域(称为
4、局部感受野,区域之间有重叠)有响应,提取输入的更高层次特征;池化层的神经元对前一层输入的一部分区域(区域之间无重叠)求平均值或者最大值,抵抗输入的轻微形变或者位移卷积神经网络的后几层一般是若干个全连接层和一个分类器构成的输出层近年来,卷积神经网络已经成功应用于字符识别7、人脸识别8、人体姿态估计91和目标检测1卷积神经网络用于人脸识别是一种基于特征的方法区别于传统的人工特征提取和针对特征的高性能分类器设计,它的优点是通过逐层卷积降维进行特征提取,然后经过多层非线性映射,使网络可以从未经特殊预处理的训练样本中,自动学习形成适合该识别任务的特征提取器和分类器该方法降低了对训练样本的要求,而且网络层
5、数越多,学习到的特征更具有全局性I。eNet一5l】刈是LeCun提出的一个具有高识别率的用于手写数字识别的卷积神经网络本文借鉴I。eNet一5的模型结构,提出6层卷积神经网络用于ORL人脸库和AR人脸库的人脸识别网络前4层由卷积层和池化层交替级联用于特征提取,随后接入一个全连接层,最后一层采用非线性分类能力强的Softmax分类器该6层卷积神经网络采用sigmoid激活函数和固定的学习速率收稿日期 201 5一0517基金项目国家自然科学基金资助项目(z1227008);吉林省科技发展计划项目(20130102028Jc)作者简介陈耀丹(1993一)女,硕士研究生,主要从事模式识别研究;通讯
6、作者:王连明(1 972),男,博士,教授主要从事智能信息处理及嵌入式系统领域研究万方数据第2期 陈耀丹,等:基于卷积神经网络的人脸识别方法 711 6层卷积神经网络模型本文提出的6层卷积神经网络模型由2个卷积层、2个池化层、1个全连接层和1个Softmax回归层组成,如图1所示卷积层和池化层由多个特征图(即二维平面)组成,每个特征图由多个神经元组成,每一层的特征图作为下一层的输人卷积层的特征图可能与前一层的若干特征图建立关系巷杉I【王l 池化J三l 醛积k:2 池化f,;2 令连接l。: nnlaxm J归JZjj警车l !2矗壶人值采样 jj甾积 22最人他米竹 7产连纭图1 6层卷积神经
7、网络模型11卷积层卷积层通过局部连接和权值共享的方法,模拟具有局部感受野的简单细胞,提取一些初级视觉特征的过程局部连接指卷积层上的每个神经元与前一层特征图中固定区域的神经元建立连接;权值共享指同一特征图中的神经元用一组相同的连接强度与前一层局部连接,可以减少网络训练参数上述一组相同的连接强度即为一个特征提取器,在运算过程中表现为一个卷积核,卷积核数值先随机初始化,最后由网络训练确定与LeNet一5相比,考虑到人脸识别比数字识别更复杂,卷积层为了更充分地提取人脸特征进行了以下改进:(1)增加2个卷积层的特征提取器卷积核的数量;(2)卷积层2的特征图与池化层1的全部特征图均建立关系卷积层每个神经元
8、的输入来自于前一层特征图中固定区域的神经元,区域的大小由卷积核大小K,K,决定卷积层1的m张特征图由1张输人图片跟m个可学习的卷积核卷积,加上偏置后,通过激活函数作用得到卷积层2的咒张特征图,由池化层l的m张特征图分别跟咒仇个卷积核卷积,每m个卷积结果结合,再加上偏置,通过激活函数作用得到卷积层操作如图2所示图2卷积层操作该层的数学表达式8为y尹一厂( 叫般,zrl(c+M,r+口)+62) (1)i鸭(p1)_。)K其中:K一(“,u)N2 oMK。,0口K,);K:和K,分别是卷积核的宽度和高度;Z表示当前层数;6;。,是卷积层第歹张特征图上神经元的偏置;M。Hm是与卷积层第歹张特征图建立
9、关系的前一层特征图的集合万方数据72 东北师大学报(自然科学版) 第48卷12池化层池化层模拟复杂细胞是将初级的视觉特征筛选并结合成更高级、抽象的视觉特征的过程,在网络中通过采样实现经过池化层的采样后,输出特征图的数量不变,但是特征图的尺寸会变小,有减少计算复杂度、抵抗微小位移变化的作用本文提出的池化层采用最大值采样,采样大小为22,即把输入的特征图分割成不重叠的22大小的矩形,对每个矩形取最大值,所以输出特征图的长和宽均是输入特征图的一半本文定义池化层中的神经元不具备学习功能,数学表达式为yjD=down(了j卜”) (2)其中down表示最大值采样的函数,该层运算不包含可学习的权值和阈值1
10、3 全连接层为增强网络的非线性映射能力,同时限制网络规模的大小,网络在4个特征提取层提取特征后,接人一个全连接层该层的每一个神经元与前一层的所有神经元互相连接,同层神经元之间不连接数学表达式81为。净厂(z:叫P+) (3)其中:n是前一层的神经元个数;z表示当前层数;叫P是该层神经元J与前一层神经元i的连接强度;6jD是该层神经元J的偏置;,()表示激活函数14 Softmax回归层LeNet一5最后一层是RBF分类器,采用由ASCII码表中的数字作为模板算出的纠错码或者以等概率的方式任选一1和1作为RBF的权值,每个RBF输出单元计算输入特征和参数向量之间的欧式距离但是人脸特征比数字特征更
11、复杂,而且人脸类别多又没有统一的模板,所以网络最后一层采用非线性分类能力强的Softmax回归作为分类器假定可分为是类的m个样本组成训练集(z“,y“),(z旧,y),样本z“R什1,类标y“1,2,志,押是样本维数,Softmax回归假设函数123为P(j,“一1 z“;口) rexp(护z“。姒,)一l i l=1 ; Iexp(啦“) (4)b(y一志1 z;目)j Lexp(酲z)J厂1其中:p(了。一歹I丁。;口)代表样本zo属于第歹类的概率;醪R什1代表模型参量将目,口z,以按行写成矩阵形式口R“计模型的代价函数为)一寻I蚤蚤m“k109嘉| (5)。 纠 。其中:1)为示性函数,
12、若内值为真的表达式,则示性函数值为1;反之,则为o本文通过批量梯度下降法求解使代价函数,(日)最小化时的口2 网络训练21数据预处理ORI。人脸库由40人的400张图片组成,即每人lo张图片,人脸有表情、微小姿态等变化取AR人脸库的一个子集,由男、女各50人组成的2 600张图片,即每人的图片为26张,人脸有表情、遮挡、光照等变化图3是0RL人脸库中人脸样例,图4是AR人脸库中人脸样例图3 0RL人脸库人脸样例瓣溜图4 AR人脸库人脸样例万方数据第2期 陈耀丹,等:基于卷积神经网络的人脸识别方法 73对2个数据库同做以下处理:随机抽取库中90的人脸作为训练集,剩下的10的人脸作为测试集,然后标
13、准化2个集合中的人脸,如图5所示 一同旦型堂堕原图11 2像素92像袭 28像条28像素 28像索2H像素图5人脸标准化过程“minmax”标准化灰度值,即对图片中每个像素点的灰度值标准化为o,1用z和z 7分别表示当前和标准化后的灰度值,min和max分别表示图片中的最小和最大的灰度值,标准化公式为z7一j二里牟 (6)22网络训练算法由于2个人脸库训练样本较多,本文采用的是在实践中收敛速度较快的批量随机梯度下降法对于ORL人脸库的卷积神经网络的训练,批处理块大小为40,动量为o9,学习速率恒为o12;对于AR人脸库的卷积神经网络的训练,批处理块大小为65,动量为o9,学习速率恒为o15每次
14、迭代会遍历训练集的所有批处理块,遍历完一个批处理块更新一次网络参数更新公式为蚍,一e一叩(差) 其中:叫,是当前参数,叫州是更新后的参数,e是动量,叩是学习速率,f黑1是第i个批处理块D。中误。 、a训l,D差对叫i偏导的平均值本文用于0RL人脸库的某个卷积神经网络包含104210104个待训练参数;用于AR人脸库的某个卷积神经网络包含15026610 4个待训练参数针对参数远大于训练样本数量可能导致的过拟合问题,Hinton提出了“dropout”1 3,即在网络训练时以一定的概率p(Op1)将输入层或者隐层的神经元输出置为o,被置为。的神经元不再参与网络的前向传播和误差反向传播,而在测试时
15、,将该输入层或者隐层的神经元输出乘以p作为该层的输出由于每输入一张图片网络中神经元随机被置o,所以就要求隐层神经元必须提取图片中最本质的特征,因此可以用“dropout”来解决过拟合问题3 实验结果本文采用Windows XP下的Matlab 2010a作为实验环境,计算机CPU为33 GHz的Inteli33220,内存为4 GB,2个卷积层中卷积核大小为55,2个采样层采用最大值池化,采样大小为22,激活函数采用sigmoid函数,即,(z)一番 (8)网络权值采用高斯初始化,网络阈值初始化为o,网络的代价函数-厂(口)见公式(5),卷积层、全连接层和Softmax回归层均采用“dropo
16、ut”方法,概率户分别设为o5,o2和056层卷积神经网络模型可简约描述为“俨6一c”,口表示卷积层l有口个卷积核,经过该I:;碍到口张特征图,再经过池化层1采样得到缩小的n张特征图;6表示卷积层2有6口个卷积核,经过该层得到6张特征图,再经过池化层2采样得到缩小的6张特征图;c表示全连接层的神经元个数输出层神经元个数是人脸库的模式类个数本文分别改变全连接层神经元个数c和2个卷积层的特征图数量口和6,找到最适合2人脸库的网络模型31 改变全连接层神经元个数对网络的影响ORI。人脸库的6层卷积神经网络用20一40300,20一40一500,2040一800,20一40一1 100,20一40一1
17、 500模型测试AR人脸库的6层卷积神经网络用20一40800,20一40一1 000,20401 500,20402 000模型测试图6描述ORI。人脸库中每次迭代对应的代价函数J(口)的值,图7描述AR人脸库中每次迭代对应的代价函数,(口)的值图6和7显示各个网络模型从迭代次数为1 900至2 000时基本训练选取迭代次数万方数据74 东北师大学报(自然科学版) 第48卷为2 000时,测量各个模型对于相应人脸库训练集和测试集的正确识别率,结果如表1和2所示迭代次数次 迭代次数次图6 改变全连接层的0RL人脸库的t,(引 图7 改变全连接层的AR人脸库的J(引表1 改变全连接层的ORL人脸
18、库的正确识别率 表2 改变全连接层的AR人脸库的正确识别率 对于0RL人脸库,最佳的卷积神经网络模型为20一40一1 500;对于AR人脸库,最佳的卷积神经网络模型为20一40一2 000增加全连接层神经元个数可以加快网络的训练速度,在一定程度内能提高正确识别率32改变2个卷积层特征图数量对网络的影响ORL人脸库的6层卷积神经网络用10一15一l 500,15151 500,15251 500,20一30一1 500,20一40一1 500模型测试AR人脸库的6层卷积神经网络用15252 000,1530一2 000,20一302 000,20一402 000模型测试图8描述ORL人脸库中每次
19、迭代对应的代价函数J(口)的值,图9描述AR人脸库中每次迭代对应的代价函数J(口)的值同理,选取迭代次数为2 000时,测量各个模型对于相应人脸库训练集和测试集的正确识别率,结果如表3和4所示迭代次数次图8 改变2个卷积层的oRL人脸库的J(D) 图9 改变2个卷积层的AR人脸库的J(8)万方数据第2期 陈耀丹,等:基于卷积神经网络的人脸识别方法 75表4改变2个卷积层的AR人脸库的正确识别率对于oRL人脸库,最佳的卷积神经网络模型为20一401 500;对于AR人脸库,最佳的卷积神经网络模型为20一40一2 ooo适当增加卷积层特征图数量可以提高正确识别率33 20-401 500卷积神经网
20、络模型与其他算法的比较20一401 500的卷积神经网络模型对ORL人脸库全部样本的识别率为9950,20一40一2 000的卷积神经网络模型对AR人脸库全部样本的识别率为9962表5是本文提出的网络与其他算法在ORL库识别率的比较,表6是本文提出的网络与其他算法在AR库识别率的比较可以看出本文提出的网络在2个人脸库上的识别率较好,并且网络抵抗光照差异、面部表情变化、有无遮挡物等干扰的能力较强表5 2040-1 500卷积神经网络模型 表6 20401 500卷积神经网络模型与用于oRL库的其他算法比较 与用于AR库的其他算法比较识别方法 正确识别率Eigenface14Fisherfacel
21、l 4ICA1 42DPCA1 520一40一1 500 CNN975098509375983099504 总结识别方法 正确识别率PCA16 85532DPCA15PCA+GSRC1 7LCKSVD1820一40一2 000 CNN9610971497809962本文提出了一个6层卷积神经网络用于ORL和AR人脸库的人脸识别,对测试样本的识别率分别为9975和9615,对全部样本的识别率分别为9950和9962用于AR人脸库的卷积神经网络对光照差异、面部表情变化、有无遮挡物等干扰具有鲁棒性采用Matlab 2010a作为实验环境,在CPU为33 GHz的Intel i33220,内存为4 G
22、B的计算机上,oRL和AR人脸库的单张人脸识别时间均小于o05 s,识别实时性好,为人脸识别提供一种新思路1234567参 考 文 献陈海霞,崔茜基于Gabor小波和PCA的人脸识别J东北师大学报(自然科学版),2014,46(4):7780孟繁静,王连明视频人脸识别系统中的最佳人脸捕获J东北师大学报(自然科学版),2015,47(3):90一95wANG x,TANG x Dualspace 1inear discri矾mnt analysis for face rec。谢tionccvPR 2004 Proce出ngs of the 2004 IEEEcomputer S0ciety C0
23、nference on computer ViSion and Pattern RecognitiorL Washington:IEEE,2004,2:564569HElsELE B,HO P,POGGl0 TFace recognition with support vector machines:Global versus component-based approachcICCV Z001 ProceedingsE嘧hth IEEE Internationa】Conference on Computer VisionI。os A1amitos:IEEE,2001,2:688694ABAT
24、E A F,NAPPl M,RIccIo D,et a12D and 3D face recognition a surveyJPattern Recognition Letters,2007,28(14):1885一1906NEFIAN A v,HAYEs IlI M HHidden markov models for face recognitionc1998 lEEE International conference onAcoustjcs,Speed and Signal Processing,Washington:IEEE,1998:27212724AHRANJANY S S,RAZ
25、ZAZI F,GHASSEMIAN M HA very high accuracy handwritten character recognition system forFarsiArabic di画ts using convolutional Neural NetworkscTheo“es and App“cations(BIcTA),2010 IEEE Fifth万方数据76 东北师大学报(自然科学版) 第48卷International Conference on BioInspjred ComputingBe订ing:IEEE,20lO:158515928 sYAFEEzA A R,
26、KHAI。lI,HANI M,LIEw s s,et aIconvolutional neural network for face recognition with pose andIllumination VariationJInternational Journal of Engineering&Technology,20146(1):44579 TosHEV A,szEGEDY cDeeppose:Human pose estimation via deep neural networksc2014 IEEE conference onComputer Vision and Patte
27、rn Recognition(CVPR)Los AIamitos:IEEE,2014:1653166010 sERMANET P,EIGEN D,zHANG X,et a10verfeat integrated recognition,localization and detection using convolutionalnetworks口Neural Networks,2003,16(5):55555911 LEcuN Y,BoTTOU L,BENGl0 Y,et a1Gradientbased learning applied to document recognitionJProce
28、edings of theIEEE,1998,86(11):227823241 2 HuANG V ssHADMEHR R,DIEDRIcHsEN JActive learning:learning a motor skill without a coachJJournal ofneurophysiology,2008,100(2):87988713 sRIVAsTAVA s,HINTl0N GKRIzHEVsKY A,et a1Droput:a simple way to prevent neural networks from overfittingJThe Jou皿al of Machi
29、ne Learning Reserch,201415(1):1929195814 YANG M HKernel eigenfaces vskernel fisherfaces:Face recognition using kernel methodsc2013 10th IEEEInternational Conference and Workshops on Automatic Face and Gesture Recognition (FG)Washington:IEEE,2002:0215一021515 YANG J,ZHANG D,FRANGI A F,et a1Two_dimensi
30、onal PcA:a new approach to appearance_based face representation andrecognitionJPattern Analysis and Machine IntelligenceIEEE Transactions on,2004,26(1):13113716 RoLI F,MARcIALls G Lsemisupervised PcAbased face recognition using self-trainingMstructural,syntactic,andStatistical Pattern RecognitionBer
31、lin Heidelberg:Sp“nger,2006:560一5681 7 YANG MzHANG LGabor feature based sparse representation for face recognition with gabor occlusion dictionaryMComputer VisionECCV 20lOBerlin Heidelberg:Springer,2010:44846118 JIANG z,LIN z,DAVIS I。sLearning a disc“minative dictionary for sparse coding via label c
32、onsistent KsVDc2011IEEE Conference on Computer Vision and Pattern Recognition(CVPR)Washington:IEEE,201l:16971704ConVolutional neural network for face recognitionCHEN Yaodan,WANG Lianming(School of Physics,Northeast Normal University,Changchun 130024,China)Abstract:Feature extraction and classificati
33、on are two key steps in face recognitionA convolutionalneural network composed of two convolutional layers,two pooling layers,one full一connection layer andone Softmax regression layer for face recognition is proposedThe neural network can automaticallyextract facial features and classify face,with t
34、rained feature extractors and the classifier using batchgradient descentAnd the network adopts dropout method in hidden layers to avoid the overfittingproblemExperimental results show that proposed network achieves 9950recognition accuracy onORL database and an accuracy of 9962 on AR database,and it can complete onetime facialrecognition in less than 005sIore importantly,the network is robust to illumination variances,facialexpressions and occlusionsKeywords:face recognition;convolutional neural network;image processing;face database(责任编辑:石绍庆)万方数据