人脸识别技术综述
人脸识别技术经历了从心理学和工程学研究到现代计算机视觉的发展过程,在模式识别和图像处理领域取得了显著进展。其核心在于从面部图像中提取个性化特征并识别人脸身份。该技术主要包括四个关键步骤:人脸检测(包括人脸定位、对齐和校准)、人脸校验(基于几何特征、模板匹配和等强度线方法)以及基于统计或神经网络的识别方法。近年来,基于3D建模和混合模型的方法也得到了广泛应用。尽管取得了显著成果,但在复杂光照、表情变化及姿态差异等方面仍面临挑战,并需进一步研究鲁棒性提升及多维度融合技术以提高识别性能与实时性。
1 人脸识别技术概述
近年来,在计算机技术飞速发展的背景下,在模式识别与图像处理领域中,
人脸识别已成为过去三十年间最受关注的研究方向之一。
其主要目标是提取人脸的独特标识性特征信息,
并据此实现身份鉴别。
就其基本功能而言,则涵盖了四个关键组成部分:
人脸检测(Detection):主要任务是通过多样的环境识别出存在的人脸,并完成其定位。
(2) 人脸识别Normalization(归一化):用于校正面部尺寸、亮度和姿态变化的过程。也可称为对齐或归准。其主要操作包括将脸型调整为统一的标准形态。
(3) 人脸识别(Face verification):通过某种方法识别出面部特征,并与数据库内预先存储的人脸特征进行比对,判断这两张脸是否属于同一个人。
人脸识别(Recognition):通过对比系统将输入的面部图像与预先录入的面部数据进行匹配和分析,在此基础上计算并确定最接近匹配的结果,并输出对应的身份信息。
2 人脸识别算法的框架
人脸识别算法描述归类于典型的模式识别问题,在其中主要包括在线匹配和离线学习两个过程(见图1)。

图1 一般人脸识别算法框架
在人脸识别系统中,识别系统的识别能力、算法复杂度以及系统的可扩展性是评价一种特征提取方法的重要考量因素。所提取的特征对最终识别结果具有关键影响。而分类器的最大分辨极限则是衡量各类型别间区分能力的关键指标。由此可见,在进行人脸识别系统的设计时,必须综合考虑目标选择、数据采集与处理以及分类策略等多个环节。
3 人脸识别的发展历史及分类
人脸识别的研究已经有相当长的历史,它的发展大致可以分为四个阶段:
第一阶段:人类早期研究工作的起源可追溯至二十世纪五十年代心理学领域的研究及六十年代工程学领域的研究。
J.S.布鲁纳于1954年出版了专著《人之知觉》,该书在心理学领域具有重要影响;而Bledsoe则于1964年出版了专著《面部识别项目报告》,这标志着工程学领域的首次系统研究。国外学者在这方面开展了大量深入研究:其中一些研究是从感知与心理学的角度探讨识别人脸的机理;例如,在美国德克萨斯大学达拉斯分校的Abdi及其合作伙伴Tool团队(文献[2,3]);以及由斯特灵大学Bruce教授领导的研究团队与格拉斯哥大学Burton教授共同负责的研究项目(文献[3])。此外,在视觉机理方面也有诸多突破性研究:英国Graw及其团队(文献[4,5])与荷兰格oningen大学Petkov及其团队(文献[6])均在此领域取得了重要进展。
第二阶段:关于人脸的机器识别研究开始于二十世纪七十年代。
以Allen 和Parke 为代表的研究者专注于研究识别所需的关键面部特征。他们通过计算机开发出较高精度的人脸灰度图模型。这一阶段显著特点在于其工作流程完全依赖于人工干预而非具备自动识别功能。
第三阶段:人机交互式识别阶段。
Harmon 和 Lesk 采用几何参数来表征正面对的人脸形象;他们通过多维向量来描述面部特征,并构建了基于该表征法的识别系统;另一方面,Kaya 和 Kobayashi 则采用了统计识别方法,并使用欧氏距离作为不同特征间的度量标准;然而,这类方法依赖于操作者的先验知识的应用,并未能完全消除人的干预作用。
第四阶段:20世纪90年代以来,在高性能计算机技术的发展推动下,人脸识别技术取得了重要进展并正式进入机器自动识别的新时代。在基于静态图像或视频流的人脸识别领域中,在国际上已形成了包括以下几种类型在内的主要方法
1)基于几何特征的人脸识别方法
基於幾何特徵的手法可追溯至人臉識別技術的開端 [7]. facial features, particularly the local shape characteristics of eyes, noses, and mouths. facial structure and spatial distribution patterns. 在特徵提取過程中,通常會依赖面部結構的一些先驗資訊. 從识别人臉的角度来看, 所采用的幾何特徵主要基於面部器官形狀及其交互關係形成的特徵向量. 其分量typically consist of Euclidean distances, curvature measures, and angular relationships between specified points on the face.
基于几何特征的识别方法简洁明了,在易懂性上并无明显欠缺;然而缺乏统一性的特征提取标准使其难以形成系统化框架;从图像中提取稳定的特征具有挑战性,并且其可靠性会受到部分场景中的遮挡因素的影响;该方法对大表情或姿态变化不够鲁棒
2)基于相关匹配的方法
基于相关匹配的方法包括模板匹配法和等强度线方法。
① 模板匹配法:Poggio和Brunelli [10]系统性地对了几何特征求取与模板匹配两种人脸识别人工智能算法,并研究表明:以几何特征求取为基础的方法具备快速识别和低内存消耗的优势,在准确率方面,模板匹配法表现更为出色。
②基于等高线的方法:该技术通过灰度图像的不同灰度级别生成一系列不同灰度级别的灰度轮廓作为特征来进行两幅人脸图像间的匹配识别工作。这些不同灰度级别的轮廓信息能够有效捕捉到人脸的关键几何特性(即所谓的凸凹信息)。需要注意的是,在特定条件下(即背景和头发均为黑色),并且只有当背景和头发均为黑色时才能生成符合实际面部形态的高精度等高线;此外,在表面光照均匀的前提下才能保证匹配识别效果的有效性
3)基于子空间方法
常用线性子空间的方法包括固有子空间、鉴别子空间以及独立分量等。除此之外,则有局部特征分析法和因子分析法等多种方法。这些技术进一步发展出混合线性和非线性的拓展应用。
Turk及其团队 [11]开发了一种基于本征脸(Eigenfaces)的方法以实现人脸识别。
考虑到每个本征矢量所呈现的形式与人脸相仿,并将其命名为二阶本征空间 [12]。
Pentland等 [13]则提出了一种分别针对眼、鼻和嘴等特征构建独立子空间的方法,并将其与前面提到的二阶本征空间结合使用以获得更好的识别效果。
Shan等 [14]进一步改进了这一方法学,在识别性能上超越了传统的基于单个维度的空间分析方案。
Albert等 [15]引入了TPCA(Topological PCA)算法作为一种新的特征提取方法,并报告了其较传统PCA方法更高的识别率。
Penev等 [16]则提出了局部特征分析(LFA Local Feature Analysis)的方法,并声称其在识别性能上优于传统的基于单个维度的空间分析方案。
当一个人拥有多张样本图像时,在仅考虑同一类别样本间差异的基础上应用线性判别分析(LDA Linear Discriminant Analysis)可能会导致性能下降。
Belhumeur等 [17]针对这一问题提出了Fisherfaces方法并获得了显著提升的分类准确率。
最后Bartlett等 [18]则采用了独立分量分析(ICA Independent Component Analysis)作为工具并获得了比PCA方法更好的识别效果。
4)基于统计的识别方法
该类方法包括有:KL算法、奇异值分解(SVD)、隐马尔可夫(HMM)法。
在处理二维数据时
隐马尔可夫模型方面,在剑桥大学Samaria与Fallside的研究中[20],他们利用多个样本图像的空间序列数据训练了一个HMM模型;该模型的参数即为特征值,并基于人脸呈现从上至下、从左至右的结构特征描述。随后研究者Samatia等[21]首次将一维(1-D)HMM与二维伪(Pseudo)HMM相结合应用于人脸识别技术。Kohir团队[22]则采用了低频离散余弦变换(DCT)系数作为观测向量以获得良好的识别效果(如图2(a)所示)。Eickeler团队[23]开发了一种基于二维伪HMM的方法来识别经DCT压缩后的JPEG图像中的脸部;而Nefian团队[24]则通过嵌入式HMM实现了识别人脸功能(如图2(b)所示)。后来研究者们又结合了coupled HMM与传统HMM方法,在通过不同模型处理超状态与嵌入状态的基础上构建了混合系统架构[25]。
该方法基于HMM模型具备以下优势:其一可支持人脸的表情变换及显著的头部转动范围;其二具有良好的可扩展性即新增样本无需全部重新训练所有样本;其三表现出较高的准确率能够有效区分不同类别。

(a) (b)
图2 (a) 人脸图像的1-D HMM (b) 嵌入式隐马尔科夫模型
5)基于神经 网络 的方法
Gutta和团队[26]提出了一种混合型神经网络架构,在该研究领域取得了突破性进展。Lawrence等人[27]采用了多层次自组织映射(SOM)技术进行样本分类,并在此基础上实现了高效的模式识别功能。在卷积神经网络(CNN)的基础上进一步发展出一种新型的人脸识别算法框架:Lin等人[28]开发了一种基于概率决策反馈的人脸识别系统;而Demers团队[29]则创新性地提出了主元神经网络模型用于特征提取,并结合自相关神经网络实现降维处理;最后通过一个深度多层感知机(MLP)达到了完整的识别流程;此外Er等人[30]则采用了主成分分析(PCA)与线性判别分析(LDA)相结合的方法,在此基础之上构建了一个基于径向基函数(RBF)的人脸识别系统;值得注意的是Haddadnia等人[31]则开发出一种基于PZMI特征的新一代RBF神经网络模型;这种模型结合了混合学习算法以显著提升了识别性能;总体而言:该类算法的核心优势在于其能够通过学习过程隐式地捕捉数据中的模式和规律:这种特性使其在复杂场景下展现出极强的适应性和鲁棒性。
6)弹性图匹配方法
Lades等报道采用动态链接结构(DLA, Dynamic Link Architecture) [32]的方法识别人脸。该方法采用了动态链接结构(DLA, Dynamic Link Architecture) [32]来识别和分析人类的脸部特征,并将其表示为格状的稀疏图(如图3所示)。

图3 人脸识别的弹性匹配方法
在图3中构建了基于图像位置的Gabor小波分解特征向量模型来表示节点特征,并采用距离向量标记各边属性。研究表明,在该方法下(Wiskott等[33])的人脸识别准确率达到97.3%。研究团队发现,在该模型基础上(Wiskott等[34])进一步优化了系统性能。随后Grudin及其团队则采用分层弹性模型以减少冗余信息存储需求。与此同时Nastar团队提出了一种创新性的方法以进一步优化系统性能具体而言他们将二维人脸图像I(x y)建模为可变形三维网格表(x y I(x y))并将人脸匹配问题转化为曲面匹配问题通过有限分析法实现精确变形度量从而实现了更高识别精度
7)几种混合方法的有效性
(1)K-L投影和奇异值分解(SVD)相融合的分类判别方法。
K-L变换主要涉及计算其对应的特征值和特征向量。
(2)HMM和奇异值分解相融合的分类判别方法。
在本研究中采用奇异值分解方法来进行特征提取技术,在实际应用中通常将一幅图像视为一个N×M维矩阵,并通过计算相应的前k个最大奇异值集合以提取面部识别特征。为了提高算法的有效性,在本研究中我们采用了重叠采样的方法(如图4所示),通过对每个采集到的样本图像生成多个重叠的小块窗口并构建相应的样本集,在此基础上计算每个样本块对应的奇异数组,并经过标准化处理后重新排列这些奇异向量序列。将这些标准化后的奇异数组按顺序整合形成独特的特征向量集合(如文献[38]所述)。

图4 采样窗采样
综合上述 论文中的实验数据表明 [39],如表1:
表1 人脸识别算法比较

8)基于三维模型的方法
该方法通常首先在图像中识别出与通用模型顶点相对应的特征点;随后利用这些特征点来调节通用模型;最终通过纹理映射技术构建出特定人脸的三维模型。研究者Tibbalds [40]依据结构光照明素和立体视觉原理开展相关研究;具体而言;他们通过相机获取多角度的空间信息;并基于这些信息构建了三维表面的几何结构(如图5所示)。

图5展示了三维人脸表面模型的图像;图6则展示了不同姿态及多样化的光照条件下的二维人脸表面模型的合成结果
赵[41]提出了一种新型SSFS(Symmetric Shape-from-Shading)理论以解决诸如人脸这类对称物体的识别问题;该理论结合了基于SSFS方法与一种通用的三维人面模型被用来解决光照变化的问题;通过将SFS方法应用于视图合成技术得以有效处理不同姿态下的人脸表情;实验结果表明针对不同姿态及照明条件下的三维人面模型如图6所示
三维图像有三类建模方案:一种是基于图像特征的分析方案[42、43];另一种是纯粹几何学基础的方法[44];第三种则是基于可变参数模型的方法[45]。其中主要差异体现在:第二种方法要求每次在人脸姿态发生改变时需重新计算各关键点的位置坐标;而第三种方法仅需调整3D变形模型中的相关参数即可实现效果。三维重建系统的整体流程如图7所示

图7 三维建模的系统框图
基于这些技术手段的构建、姿态估计以及匹配算法的选择构成了实现三维人脸识别的核心。随着采用三维图像识别人脸技术的进步和发展,这一领域内的研究重点则转向了基于直线型数据模型的深度学习方法。
4 总结 与展望
该领域的人脸自动识别技术已取得显著进展。尽管科技发展迅速,在实际应用中仍存在诸多挑战。不仅要求实现准确且快速的人脸检测与分割能力,并且需要重点关注与提升以下几方面的性能:包括有效完成变化补偿过程、精确提取 facial features 以及确保分类系统的高识别率等多维度指标。此外,在以下几个方面还需要特别关注与提升
(1) 人脸的局部与整体信息之间的相互作用能够体现出显著的人脸特征描述能力。通过混合模型的方法值得进一步深入研究以更精确地刻画复杂的人脸模式分布。
(2) 多特征融合和多分类器融合的方法也是改善识别性能的一个手段。
(3) 因为人脸具有可变形性, 导致准确的人脸识别仍较为困难. 归因于多种因素的影响. 为了解决这一问题, 在必要时需要研究将人脸特征与指纹、虹膜、语音等多种识别技术相结合的方法.
(4) 3D形变模型能够应对多种变化因素,并展现出显著的应用前景。已有研究显示,在应对各种变化因素时采取模拟或补偿手段能够取得良好成效。三维人脸识别算法的选择尚处于探索阶段,在现有传统识别算法基础上进行优化性能、提升准确率和增强鲁棒性的研究仍需深入推进。
表面纹理识别算法是一种新型的前沿性很强的最新算法 [52],期待我们能够进一步探索并创新性更高的方法。
综上所述,在人脸识别领域存在诸多具有挑战性的技术难题仅凭单一现有方法难以达到令人满意的识别水平。为此需要探索多种解决方案包括将其与其他技术相结合以提升系统性能并优化处理效率同时在减少计算资源消耗的前提下增强系统的稳定性和可靠性。此外还需要深入研究其在嵌入式架构中的实现策略以及探索其实现的实际应用价值这些都是未来值得深入研究的方向。
参考 文献
[1]O'Toole A J, Abdi H, Deffenbacher K A, et al. A low-dimensional encoding of facial features within the higher-dimensional space. Journal of the Optical Society of America A, 1993, 10: 405-411.
[2]张翠萍,苏光大.人脸识别技术综述. 中国 图像图形学报,2000,5(11):885-894
Automated face recognition plus facial expression examination constitutes a review of existing techniques.
该研究团队在《Journal of Cognitive Neuroscience》期刊上发表了关于Eigenfaces方法的研究论文。
该研究团队在《IEEE Transactions on Neural Networks》上发表了题为《Independent Component Analysis for Face Recognition》的研究论文。该方法通过独立成分分析实现了高效的面部识别系统,并在实验中取得了优异的性能指标。
[6] Manjunath B.S., Shekhar C., and Chellappa R. An innovative technique for image feature extraction and its application[J]. Pattern Recognit., 1996, 29(4): 627-640
[7] Cheng Y., Liu K., Yang J., et al.: A method for human face recognition based on the statistical model of small sample size. SPIE Proceedings, Proc. Intell. Robots and Computer Vision X: Algorithms and Techniques, 1991, 1606: 85–95.
Contributed by Nefian A.V., the paper titled "Embedded Bayesian Networks for Face Identification" was presented at the IEEE International Conference on Multimedia and Expo in 2002, Volume 2, pages 133-136.
[9] Guttu S, Wechsler H. Face Identification through the Integration of Multiple Classification Techniques[J]. Pattern Recognition, 1997, 30(4): 539-553
Hybrid Learning Radial Basis Function (RBF) Neural Networks Based on Pseudo Zernike Moments for Human Face Recognition, presented in the proceedings of the 2002 International Joint Conference on Neural Networks, Volume 1, Issue 2, pages 1–6.
The authors, M.Lades, J.C.Vorbruggen, and J.Buhmann, demonstrated an approach for achieving distortion invariant object recognition within the dynamic link architecture. This methodology was implemented to achieve invariance against distortions in object identification through the dynamic linking structure. The study was published in the IEEE Transactions on Computer in 1993, specifically in volume 42, issue 3, covering pages 300 to 311.
[Nastar C 和 Moghaddam B A 合作了研究论文"Flexible Images: Matching 和 Recognition Using Learned Deformations"发表于《Computer Vision and Image Understanding》期刊中。该研究探讨了基于变形图像表示的方法,并提出了新的匹配与识别策略以提高图像理解能力。
[13]羊牧.基于KL投影和奇异值分解相融合人脸识别方法的研究[D].四川大学.2004,5,1
[14]白冬辉.人脸识别技术的研究与应用[D].北方 工业 大学.2006,5
[15]Adam D. Tibbalds. Three-Dimensional Human Face Acquisitions for Recognition [D]. Ph.D., University of Cambridge, 1998.
Wenyi Zhao's work demonstrates highly reliable 3D facial recognition technology, which is based upon robust image analysis.
