人脸图像识别

2024-07-10

人脸图像识别(精选十篇)

人脸图像识别 篇1

关键词:人脸识别,图像识别,识别技术,研究

0 引言

人脸图像识别,主要是利用人脸的分析以及比较,针对其中的相关视觉特征以及相应的信息,进行身份的鉴别,总的来说,人脸图像识别技术和声音识别、指纹识别以及虹膜识别等,都是属于生物特征识别技术的范畴之内。但是,人脸图像识别技术又和其他的生物识别技术有着一定的不同,也有其他的技术所无法比拟的优势,例如,在人脸识别技术当中,不需要干扰人们的正常行为,就可以达到极佳的识别效果,因为人们只需要在摄像机之前以自然的状态停留一段时间,计算机就可以进行快速的身份鉴别,并且准确度较高,这一点优势是其他的生物识别技术所无法比拟的。正因为如此,现今人脸识别技术得到了非常快速的发展,在多个领域当中,都有着广泛的运用,包括安全防护、企业的防护等,下文将针对其中的主要技术,进行深入细致的探究和分析。

1 人脸识别的主要方法

人脸识别的技术方法,有许多种,包括基于几何特征的识别技术、基于神经网络的识别方法、基于匹配的人脸识别技术等,下文将进行着重的阐述,力求帮助相关技术手段在实践操作当中得到更加广泛的运用。

1.1 基于几何特征的人脸识别技术

此种类型的人脸识别技术,其起源于上个世纪九十年代。基于几何特征的人脸识别技术,主要是针对人们的眉毛、眼睛、鼻子、脸以及嘴巴等,分析其形状以及它们之间存在的相应的几何关系,同时将其很好的存储为一个具有特征的图形矢量图,所以,总的来讲,基于几何特征的人脸识别技术,可以归纳为矢量图之间的距离。同时,在相关的识别当中,为了有效的提升识别的效率和质量,运用此种方式针对照片进行相应的预处理,其中的项目包括有二值化、图像的灰度变换、图像的归一等。基于几何特征的人脸识别技术,主要的优势是识别的速度较快并且对于内存的要求比较小,但是,其没有有效的形成一套统一式的特征提取标准。

1.2 基于相关匹配的人脸识别技术

基于相关匹配的人脸识别技术,其主要的识别技术方法包含有等强度的识别线法、各种模板的匹配法等等。在模板的匹配法当中,由于其是一种经典的模式识别就似乎方法,所以,主要是采用归一化互相关的技术,直接的对两个图像之间的匹配程度进行计算,而模板的匹配法当,还需要两个图像之间的相关目标,有着同样的尺度、光照以及取向等,所以需要进行相应的预处理。此种识别技术方法,受到图像的质量以及人脸的遮挡等等相关因素的影响比较小。而等强度线,则主要是利用灰度的图像,进行多级灰度值的相关匹配识别,此种技术,需要在背景以及头发均为黑色的前提之下运用,并且,对于表面的光照等,要求也较高,总的来讲,其限制的因素较多,所以应用的范围也比较小。

1.3 特征脸的识别技术

特征脸的识别技术方法,起源于上个世纪九十年代末人们提出的人脸识别技术理论,其基本的思想,是将相关图像之中的人脸区域,看成是一种随机的向量,同时,根据相关的操作,将图像的统计特征,进行相应的正变交换,即K-L变换,进而获得相关的正交K-L基底,利用此写基底,针对其中的线性组合,可以对人脸的图像进行表达,对人脸进行描述,进而可以进行人脸的识别,同时准确度也较高,此种方式,由于利用到了相关的技术,所以也可以称为基于K-L的变换识别技术方法。针对此种方法,在进行相关的变换之后,其低维的空间之内有较好的人脸表达能力。但是,特征脸的识别技术方法劣势在于对于外部的因素带来的图像影响,无法进行有效的区分,同时,没有很好的考虑到人脸的信息类别,姿势、光照等因素,都会对其识别的准确度造成一定影响,所以,其技术理论在应用当中还存有缺陷。

1.4 基于神经网络的人脸识别技术

基于神经网络的识别技术方法,主要是利用神经网络当中较大量的简单的处理单元,即神经元,来构成相应的复杂系统,将其很好的互联起来,进而解决相应的识别问题。常见的神经网络模型,主要有多层的映射网络、感知器以及RBF网络等等,它们都是从不同的角度针对生物的神经吸引当中不同层次进行相关的模拟以及描述,此种技术方法的识别效率较高,准确度也较强。在早期的人脸识别技术当中,神经网络主要是;来自联想的映射网络,使用来进行人脸的回忆功能。在后期的研究当中,发现其可以等价于输入的矢量交叉矩阵,同时,利用此种技术方法,可以对一组人脸进行分量的分析识别,在相关的操作过程当中,不需要进行较为复杂的信息提取工作,同时,也不需要一套由工作人员来确定的规则,可以根据具有代表性的图像样本,进行自我的学习以及信息量的扩充,具有较强的自适应性,同时,其缺点也同样明显,运算的量较大、训练的时间也较长。

2 基于特征的人脸识别技术

根据上文的详细阐述和分析,可以对现今主要的人脸识别技术方法有着一个详细的了解和掌握,接下来,将针对基于特征的人脸识别技术方法,进行全面的分析和探讨,力求更好的推动此项技术的进步和发展。

2.1 图像的预处理

基于特征的人脸识别技术方法,主要是通过对人脸之上的个正特征信息进行提取,其实现较为简单。首先是图像的预处理。为了更好的提升图像的识别效率,就需要对图像进行相应的处理,处理主要包括有灰度的变换以及二值化。灰度变换主要是为了将图像的灰度从一个比较窄的区域当中,有效的扩展到0~255的整个的灰度定义域之中,其变换的公式如下所示:

运用此公式,针对图像进行二值的转化,同时,采用二次边缘的提取方法,来进行下一步的计算。其实现的方法,G1至G9为3*3的区域,同时,计算得出G5周围的几个点的灰度值之和,并且,按照上述的公式,计算得出结果值,而当G5的中心点灰度值小过于阈值之时,则该中心点是黑点,反之则是白点。具体的图像如下图所示:

同时,在进行人脸图像的预处理当中,还需要注意人脸图像姿态的归一化,以减少任务姿态存有的一定程度的深度偏转现象。一般的,将图片调整至正面视图,并且在图像的旋转当中,还需要注意两眼间的角度,将其作为图片旋转的基准,两眼之间的中点以及鼻尖的角度,则为计算的基准。两眼的中点和鼻尖以及鼻子保持在同一条垂直的直线之上,此图像则为正面视图,如果不再一条垂直线之上,则图像是姿态偏转类型的视图。针对双眼和鼻尖等点,来求出两幅图像之间的仿射变化关系,同时再进行图像的校准,进而补偿由于姿态的深度存有偏转带来的影响。

2.2 图像的特征定位以及特征的提取

针对相关图像进行相应的预处理之后,即可对眉毛、眼睛、嘴以及鼻子等特征的部位进行定位,并且对其图像的信息进行提取。通过对灰度图像进行相关的水平灰度投影以及垂直的投影,可以初步的对人脸进行定位,然后,运用一个和瞳孔的大小相类似的方框,针对整张脸进行搜索,对其中的信息进行提取和分析,而当落在此个方框之内的黑色素达到最大的个数之时,此位置即为眼睛的位置。同时,在准确的对眼睛位置进行定位之后,就可以有效的搜索边缘点,得出眼睛的实际大小情况等。眉毛的位置搜索,也是通过灰度的垂直方位图来进行匹配操作。从人脸的顶点开始,逐渐的向下移动,在每一次的移动当中,在该点的部位放置一条水平的缝条,进而将其相关的垂直灰度,和投影图进行分析和比较,如果两者的比较结果保持一致,并且其位置是处于眼睛的上方,那么就可以判定出此位置即为眉毛的位置。

嘴巴以及鼻子,定位的方法比较类似,当定位鼻子之时,需要从眼睛的垂直位置进行相关的搜索,而当水平方向之上得出的灰度图像素数达到某一最大值之时,则可以确定该位置为鼻子的Y坐标位置,根据计算,即可以得出其X坐标的具体位置。

2.3 识别效果分析

根据上述的分析,可以对特征识别的主要技术方法和操作的流程等,有着明晰的了解和掌握。针对目标进行人脸的识别,并且针对特征的定位以及相关特征信息的提取,还需要从照片当中将得出的信息查找出来。经过多次的实验和应用,使用该种技术方法得出的人脸识别准确率可以达到90%以上,准确度较好。

3 结束语

综上所述,根据对人脸识别技术方法进行详细的分析和阐述,并且着重的对其中主要的技术理论、应用的流程以及根据特征的人脸技术方法进行分析和探讨,力求更好的推动此项技术的进步与发展,为相关技术和事业的前进作出积极的贡献,同时,促进其在更多的领域当中得到更加广泛的运用。

参考文献

[1]王磊洪.浅议人脸图像识别技术的主要方法合格技术理论[J].现代科学,2010.9

[2]周晨为.试论一种基于特征的人脸识别技术方法和在实践操作当中的应用[M].现代计算

[3]机科学技术,2009.3

[4]张振东.浅议人脸识别技术方法的发展和主要的理论依据[M].图像识别技术资讯,2008.7

人脸识别技术解读 篇2

中文名 人脸识别技术 实 质

输入的人脸图象或者视频流 研究领域

热门的计算机技术研究领域 技 术

生物特征识别技术

目录

1基本介绍

2技术原理 ▪ 人脸识别内容 ▪ 人脸的识别过程 3分析算法

4功能模块

▪ 人脸捕获与跟踪功能 ▪ 人脸识别比对 ▪ 人脸的建模与检索 ▪ 真人鉴别功能 ▪ 图像质量检测 5基本方法

6技术细节 7优缺点

▪ 人脸识别优点 ▪ 人脸识别的弱点 8技术应用

9应用前景

1基本介绍编辑

人脸识别技术是基于人的脸部特征,对输入的人脸图象或者视频流.首先判断其是否存在人脸 , 如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息。并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。

生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。2技术原理编辑

人脸识别内容

人脸识别技术包含三个部分:(1)人脸检测 面貌检测是指在动态的场景与复杂的背景中判断是否存在面像,并分离出这种面像。一般有下列几种方法: ①参考模板法

首先设计一个或数个标准人脸的模板,然后计算测试采集的样品与标准模板之间的匹配程度,并通过阈值来判断是否存在人脸;

②人脸规则法

由于人脸具有一定的结构分布特征,所谓人脸规则的方法即提取这些特征生成相应的规则以判断测试样品是否包含人脸;

③样品学习法

这种方法即采用模式识别中人工神经网络的方法,即通过对面像样品集和非面像样品集的学习产生分类器;

④肤色模型法

这种方法是依据面貌肤色在色彩空间中分布相对集中的规律来进行检测。⑤特征子脸法

这种方法是将所有面像集合视为一个面像子空间,并基于检测样品与其在子空间的投影之间的距离判断是否存在面像。

值得提出的是,上述5种方法在实际检测系统中也可综合采用。(2)人脸跟踪

面貌跟踪是指对被检测到的面貌进行动态目标跟踪。具体采用基于模型的方法或基于运动与模型相结合的方法。此外,利用肤色模型跟踪也不失为一种简单而有效的手段。

(3)人脸比对

面貌比对是对被检测到的面貌像进行身份确认或在面像库中进行目标搜索。这实际上就是说,将采样到的面像与库存的面像依次进行比对,并找出最佳的匹配对象。所以,面像的描述决定了面像识别的具体方法与性能。主要采用特征向量与面纹模板两种描述方法:

①特征向量法

该方法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性,然后再计算出它们的几何特征量,而这些特征量形成一描述该面像的特征向量。

②面纹模板法

该方法是在库中存贮若干标准面像模板或面像器官模板,在进行比对时,将采样面像所有象素与库中所有模板采用归一化相关量度量进行匹配。此外,还有采用模式识别的自相关网络或特征与模板相结合的方法。

人脸识别技术的核心实际为“局部人体特征分析”和“图形/神经识别算法。”这种算法是利用人体面部各器官及特征部位的方法。如对应几何关系多数据形成识别参数与数据库中所有的原始参数进行比较、判断与确认。一般要求判断时间低于1秒。人脸的识别过程

一般分三步:

(1)首先建立人脸的面像档案。即用摄像机采集单位人员的人脸的面像文件或取他们的照片形成面像文件,并将这些面像文件生成面纹(Faceprint)编码贮存起来。

(2)获取当前的人体面像。即用摄像机捕捉的当前出入人员的面像,或取照片输入,并将当前的面像文件生成面纹编码。

(3)用当前的面纹编码与档案库存的比对。即将当前的面像的面纹编码与档案库存中的面纹编码进行检索比对。上述的“面纹编码”方式是根据人脸脸部的本质特征和开头来工作的。这种面纹编码可以抵抗光线、皮肤色调、面部毛发、发型、眼镜、表情和姿态的变化,具有强大的可靠性,从而使它可以从百万人中精确地辨认出某个人。人脸的识别过程,利用普通的图像处理设备就能自动、连续、实时地完成。3分析算法编辑

人脸识别技术中被广泛采用的区域特征分析算法,它融合了计算机图

人脸识别

像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征模板。利用已建成的人脸特征模板与被测者的人的面像进行特征分析,根据分析的结果来给出一个相似值。通过这个值即可确定是否为同一人。4功能模块编辑

人脸捕获与跟踪功能

人脸捕获是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中分离出来,并自动地将其保存。人像跟踪是指利用人像捕获技术,当指定的人像在摄像头拍摄的范围内移动时自动地对其进行跟踪。人脸识别比对

人脸识别分核实式和搜索式二种比对模式。核实式是对指将捕获得到的人像或是指定的人像与数据库中已登记的某一对像作比对核实确定其是否为同一人。搜索式的比对是指,从数据库中已登记的所有人像中搜索查找是否有指定的人像存在。

人脸的建模与检索

可以将登记入库的人像数据进行建模提取人脸的特征,并将其生成人脸模板(人脸特征文件)保存到数据库中。在进行人脸搜索时(搜索式),将指定的人像进行建模,再将其与数据库中的所有人的模板相比对识别,最终将根据所比对的相似值列出最相似的人员列表。

真人鉴别功能

系统可以识别得出摄像头前的人是一个真正的人还是一幅照片。以此杜绝使用者用照片作假。此项技术需要使用者作脸部表情的配合动作。

图像质量检测

图像质量的好坏直接影响到识别的效果,图像质量的检测功能能对即将进行比对的照片进行图像质量评估,并给出相应的建议值来辅助识别。5基本方法编辑

人脸识别的方法很多,主要的人脸识别方法有:

(1)几何特征的人脸识别方法:几何特征可以是眼、慧眼人脸识别考勤机 鼻、嘴等的形状和它们之间的几何关系(如相互之间的距离)。这些算法识别速度快,需要的内存小,但识别率较低。

(2)基于特征脸(PCA)的人脸识别方法:特征脸方法是基于KL变换的人脸识别方法,KL变换是图像压缩的一种最优正交变换。高维的图像空间经过KL变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以张成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法的基本思想。这些方法需要较多的训练样本,而且完全是基于图像灰度的统计特性的。目前有一些改进型的特征脸方法。

(3)神经网络的人脸识别方法:神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。这类方法同样需要较多的样本进行训练,而在许多应用中,样本数量是很有限的。

(4)弹性图匹配的人脸识别方法:弹性图匹配法在二维的空间中定义了一种对于通常的人脸变形具有一定的不变性的距离,并采用属性拓扑图来代表人脸,拓扑图的任一顶点均包含一特征向量,用来记录人脸在该顶点位置附近的信息。该方法结合了灰度特性和几何因素,在比对时可以允许图像存在弹性形变,在克服表情变化对识别的影响方面收到了较好的效果,同时对于单个人也不再需要多个样本进行训练。

(5)线段Hausdorff 距离(LHD)的人脸识别方法:心理学的研究表明,人类在识别轮廓图(比如漫画)的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出来的线段图的,它定义的是两个线段集之间的距离,与众不同的是,LHD并不建立不同线段集之间线段的一一对应关系,因此它更能适应线段图之间的微小变化。实验结果表明,LHD在不同光照条件下和不同姿态情况下都有非常出色的表现,但是它在大表情的情况下识别效果不好。

慧眼人脸识别考勤机

(6)支持向量机(SVM)的人脸识别方法:支持向量机是统计模式识别领域的一个新的热点,它试图使得学习机在经验风险和泛化能力上达到一种妥协,从而提高学习机的性能。支持向量机主要解决的是一个2分类问题,它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有较好的识别率,但是它需要大量的训练样本(每类300个),这在实际应用中往往是不现实的。而且支持向量机训练时间长,方法实现复杂,该函数的取法没有统一的理论。6技术细节编辑

一般来说,人脸识别系统包括图像摄取、人脸定位、图像预处理、以及人脸识别(身份确认或者身份查找)。系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸图象或者相应的编码,而其输出则是一系列相似度得分,表明待识别的人脸的身份。

人脸识别的算法可以分类为:

基于人脸特征点的识别算法(Feature-based recognition algorithms)。基于整幅人脸图像的识别算法(Appearance-based recognition algorithms)。

基于模板的识别算法(Template-based recognition algorithms)。利用神经网络进行识别的算法(Recognition algorithms using neural network)。7优缺点编辑

人脸识别优点

相比较其他生物识别技术而言:

非接触的,用户不需要和设备直接接触;

非强制性,被识别的人脸图像信息可以主动获取;

并发性,即实际应用场景下可以进行多个人脸的分拣、判断及识别。

人脸识别的弱点

对周围的光线环境敏感,可能影响识别的准确性; 人体面部的头发、饰物等遮挡物,人脸变老等因素,需要进行人工智能补偿;(如可通过识别人脸的部分关键特性做修正)。8技术应用编辑

1.企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。2.电子护照及身份证。这或许是未来规模最大的应用。在国际民航组织(ICAO)已确定,从 2010年 4月 1日起,其 118个成员国家和地区,人脸识别技术是首推识别模式,该规定已经成为国际标准。美国已经要求和它有出入免签证协议的国家在2006年10月 26日之前必须使用结合了人脸指纹等生物特征的电子护照系统,到 2006年底已经有 50多个国家实现了这样的系统。美国运输安全署(Transportation Security Administration)计划在全美推广一项基于生物特征的国内通旅行证件。欧洲很多国家也在计划或者正在实施类似的计划,用包含生物特征的证件对旅客进行识别和管理[7]。中国的电子护照计划公安部一所正在加紧规划和实施。

3.公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。

4.自助服务。如银行的自动提款机,如果同时应用人脸识别就会避免被他人盗取现金现象的发生。

5.信息安全。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现。如果密码被盗,就无法保证安全。如果使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一。从而大大增加电子商务和电子政务系统的可靠性。9应用前景编辑

生物识别技术被广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。例如,一位储户走进了银行,他既没带银行卡,也没有回忆密码就径直提款,当他在提款机上提款时,一台摄像机对该用户的眼睛扫描,然后迅速而准确地完成了用户身份鉴定,办理完业务。这是美国德克萨斯州联合银行的一个营业部中发生的一个真实的镜头。而该营业部所使用的正是现代生物识别技术中的“虹膜识别系统”。此外,美国“9.11”事件后,反恐怖活动已成为各国政府的共识,加强机场的安全防务十分重要。美国维萨格公司的脸像识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面孔,判断他是不是通缉犯。

随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。

1、企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。

2、电子护照及身份证。这或许是未来规模最大的应用,国际民航组织(ICAO)已确定,从2010年起,其118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。中国的电子护照计划公安部一所正在加紧规划和实施。

3、公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。

4、自助服务。如银行的自动提款机,如果用户卡片和密码被盗,就会被他人冒取现金。如果同时应用人脸识别就会避免这种情况的发生。

5、信息安全。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现,如果密码被盗,就无法保证安全。但是使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一,从而大大增加电子商务和电子政务系统的可靠性。[1]

2012年无锡采用物联网人脸识别技术规范建筑市场。无锡的建筑工地将从6月1日起每天通过物联网技术进行人脸识别,通过考勤管理,确保项目负责人到位,挂靠、层层转包等现象将有望受到限制。

京沪高铁三站将建人脸识别系统,整容也能被识别。铁路部门发布计划表示,将在京沪高铁段的上海虹桥站、天津西站、济南西站这三个站点,建设人脸识别系统工程,以协助公安部门抓捕在逃罪犯。利用这个系统,作案后的犯罪分子,即使整容,也将能够被识别。[2]

读书的好处

1、行万里路,读万卷书。

2、书山有路勤为径,学海无涯苦作舟。

3、读书破万卷,下笔如有神。

4、我所学到的任何有价值的知识都是由自学中得来的。——达尔文

5、少壮不努力,老大徒悲伤。

6、黑发不知勤学早,白首方悔读书迟。——颜真卿

7、宝剑锋从磨砺出,梅花香自苦寒来。

8、读书要三到:心到、眼到、口到

9、玉不琢、不成器,人不学、不知义。

10、一日无书,百事荒废。——陈寿

11、书是人类进步的阶梯。

12、一日不读口生,一日不写手生。

13、我扑在书上,就像饥饿的人扑在面包上。——高尔基

14、书到用时方恨少、事非经过不知难。——陆游

15、读一本好书,就如同和一个高尚的人在交谈——歌德

16、读一切好书,就是和许多高尚的人谈话。——笛卡儿

17、学习永远不晚。——高尔基

18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。——刘向

19、学而不思则惘,思而不学则殆。——孔子

人脸识别在中国 篇3

这款由腾讯开发的人脸识别软件是国内少有的社交产品,从去年底低调发布至今已经有几万次下载,在iTunes商业类软件下载位居前茅。用户将手机切换到人脸识别模式,启动“明星脸识别”功能,慧眼会自动识别照相镜头中的人脸,并将之拍下来;随后,它会在网上寻找与这张脸最相似的明星的脸显示出来,并对服饰、打扮等细节进行点评。而最新版本的搜搜慧眼支持文字识别翻译、人脸识别拍照的同时,还可以把识别结果一键分享到腾讯微博、新浪微博上。未来,条形码、二维码、LOGO识别以及增强现实等更多功能的添加将让拍照识别结果可以在好友间随意分享。

人脸社交

“搜搜慧眼现在做明星脸是为了娱乐,接下来基于脸部的SNS可以把整个人脸包装成独立的产品。”腾讯研究院人机交互中心技术负责人刘海龙说。一年前,腾讯研究院的搜搜慧眼项目是从文字识别翻译开始切入的,后来腾讯的业务部门越来越多地把人脸识别相关的需求反馈过来,慧眼研发小组才意识到人脸才是引爆产品的最佳元素。事实上,作为国内最大的互联网社交平台,腾讯一直在关注识别技术在互联网领域的发展,过去两三年里,腾讯研究院的人机交互中心一直在从事文字、声音、图像识别的研究,而这些技术积累将在合适的时间与需求结合起来,先通过搜搜慧眼这样的产品把技术落地,再用于腾讯现有的独立产品上。

“比如说QQ空间,因为很多用户会上传自己的头像,我们知道现在在国外像谷歌、Facebook都有很多社交人脸识别产品,腾讯作为国内最大的互联网公司,人脸识别技术或早或晚会用上去的。”刘海龙兴奋解释道,“你的脸不仅可以社交,还可以给你美化或者是肖像化,由脸部经过一些变形变成另外一个形象都可以与腾讯现有的QQ秀等产品结合。”

应该说,腾讯从娱乐切入人脸SNS有着得天独厚的优势,人脸识别几乎可以用于QQ、腾讯朋友、游戏等所有社交产品线,比如QQ的人脸认证登录,比如真实面孔美化变形后的游戏人物,再比如在社区好友中做相似人脸,在你的好友链上,比如二度人脉几百个人,两个很像的人进行互动;或者是两个人夫妻指数,甚至是合成一个小孩的面孔……各种人脸的娱乐应用都将成为社区的亮点应用。

“QQ的起家就是从小头像开始,后面实名的需求慢慢多起来以后,照一张图像就跟名片似的,这种需求越来越广,也会越来越自然。”腾讯首席架构师郑全战博士也不掩饰对人脸识别技术应用的看好,但是作为腾讯研究院的掌门人,他更多地考虑的是识别的精确度问题,“人脸识别技术90%的识别率对于互联网应用是不够的,腾讯用户几个亿,千分之一的失败率对用户都会造成不方便,所以对这个技术要求就非常高,我们一直在做积累,到现在基本上已经成熟了,才拿到业务上用了。”

郑全战认为人脸识别还主要是一个工具类应用,腾讯研究院把重点放在登陆相关的研发上。事实上,腾讯研究院的人脸认证登录系统(简称TRFA:Tencent Research Face Authentication)的核心技术也取得了良好进展,即将进入应用阶段。就在采访之前几天,马化腾对这项“人脸识别验证”做出了肯定,并批示为“用途广泛,可支持各线产品,尤其是移动安全产品”,因此,未来QQ用户通过人脸认证登录并享受人脸社交的乐趣并不会太遥远。

人脸识别的安全价值

同样,国内另外一家以技术见长的网络公司网易也很看重人脸识别技术对增强互联网应用的账号安全性的价值,今年网易宣布邮箱将正式引入人脸识别系统。对于网易来说,保证旗下的邮箱4.5亿用户和网易游戏的8000万用户的账号安全是至关重要的。2010年成立的网易的人脸识别研发团队,由网易杭州研究院院长陈刚亲自领衔,目标就是把人脸识别作为网易下一项安全升级措施,对目前的将军令和保密卡进行补充。 “一个网易邮箱用户可以选择在异地登录时要求人脸认证,短时间多次输错密码被锁定进行人脸认证解锁等功能。系统会根据人脸验证结果以判断是否满足用户提出的需求。” 网易杭州研究院副总监汪源表示。

相比娱乐,安全登录系统最主要的就是解决系统的识别率,比如人脸特征点的精确定位、光线处理、人脸归一化、高效的特征提取以及鲁棒的知识算法等。而网易的挑战是,如何集成与完善这些技术以满足互联网应用需求,如何与产品设计相结合以提供最佳的用户交互体验,针对庞大的人脸数据库规模,相似样本的空间近似重叠概率迅速上升,如何保证识别率不会退化。更重要的是,用户由于年龄增长、妆饰、受伤等导致容貌改变,或者由于环境的不同导致光线和亮度不同的情况下,系统依旧保持很高的鲁棒性和精准度,而且通过活体检测技术,系统不易被照片骗过。汪源认为,目前在国际互联网领域,尚无在用户安全方面运用人脸识别系统的先例,网易作为探索者也需要在实际应用中逐渐积累。

汪源还表示,未来网易的所有网络应用都可能考虑采用人脸识别来增强账号安全性,而考虑到人脸识别在社交产品和移动互联网产品上的想象空间极大,网易也会根据市场需求推出新的应用,“可以预见,在很短的时间内,这项技术的应用会取得爆发式的增长。”他说。

地铁车站人员人脸图像识别技术研究 篇4

随着平安城市建设的逐步展开, 大规模的监控系统正在建设。仅仅依靠人工干预从海量的视频数据中挖掘有效信息是远远不够的。银晨科技以此为出发点, 依靠其自身雄厚的科研实力, 推出的人脸识别布控系统, 正是解决这个难题的一把利器。通过人脸识别, 有效解决了海量视频数据如何有效利用的问题;

采用人脸实时检测技术, 可以不引起注意地快速清晰的记录人员的脸部照片, 并进行高精度的存储。比起视频录像, 人脸照片数据量很少但更有效;

查阅照片, 比看录像更快, 更直观。输入目标人员照片信息, 由机器从存储的人脸数据中搜索相似人脸, 最终关联找到对应的录像片段, 这样就大大改善了从海量视频录像中查找需要片段的速度, 降低了人员工作强度, 提高了工作效率。

大量人脸数据的长期保存供利用, 这些都提供给公安系统用户以远远超出普通监控的功效和价值。

本系统内的人脸采集与识别, 到最终预警提示, 非常高效及时。并可以和监控系统实现连动, 提供准确直观的报警信息, 从而为用户提供了快速反应的可能。

1 地铁人脸识别设计

(一) 功能设计

(1) 实时布控, 实时报警。可布控1000个布控对象, 响应迅速, 从采集人脸到报警端显示时间间隔小于1秒。在完全符合银晨施工规范的场景下, 识别率可达到85%以上。但实际应用中, 可能会因为光照或者摄像机安装等原因, 而导致识别率降低。

(2) 人脸数据存储。存储时间由用户自由控制, 根据需要, 用户可以增加磁盘来进行扩展。对于磁盘空间不足时, 可选择最久以前的人脸进行覆盖。

(3) 历史人脸预览。在管理端, 用户可根据时间和采集地点, 查询采集到的人脸, 并可以根据人脸, 调取对应的录像。

(4) 历史人脸检索。在管理端, 根据用户输入的图片, 自动在采集人脸库中进行比对检索, 将结果展现给用户, 并可关联到录像。

(5) 报警连动。通过多种方式的连动, 帮助用户来更快的做出响应。如显示布控对象信息、显示报警人脸、关联录像、播放音频文件、截图等等。

(6) 报警检索。对于确认的报警, 系统将永久性进行存储, 对于未确认的无效报警, 系统将进行定期的删除。系统提供报警检索。

(二) 系统架构设计

整个系统的运作流程如下:用户预先将关注对象 (布控人员) 的照片通过分交分局管理机输入到本系统中。由摄像头采集的视频流通过视频分配器一分为二, 一路进DVR进行录像。一路接入视频盒, 视频盒对输入的视频图像进行实时的人脸检测, 并将检测到的人脸通过TCP/IP网络发送给中心应用服务器。

2 系统部署与安装

(1) 摄像头安装

尽量选择正对人员行进方向, 水平偏移的夹角应小于10度;保证人脸在镜头中为正面, 故俯冲角要小, 尽量不超过10度;这需要计算 (简单的几何关系) 并选择合适的水平安装距离和垂直安装高度;同时选择或调试合适的镜头焦距。在水平安装距离确定后, 也要保证较好的人脸采集大小, 在镜头画面中, 脸部眉毛到嘴的矩形框不小于64*64像素;为此, 建议抓拍处的画面宽度不超过1.4米;这需要选择/调试合适的镜头焦距;另外, 为保证抓拍人脸时现场光照足够, 建议若镜头画面中人脸不够亮时, 需要相应增加照明设备, 对人员脸部补光 (一般应达到100~800Lux) 。

(2) 安装软件

在中心应用服务器上安装银晨人脸识别布控中心。在管理机上安装银晨人脸识别布控管理端和报警端。配置视频盒和系统参数。中心应用服务器的工作主要集中在4点:

(1) 人脸数据特征值提取, 即建模; (2) 人脸存储; (3) 历史人脸检索; (4) 比对。

1颗英特尔至强X5504系列至强四核CPU, 每秒大约能处理50帧人脸数据, 考虑80%的并发率, 则实际处理能力可以满足3个视频盒的需要。假设每天有20000人通过采集点, 每人平均通过时间在3秒左右, 则每天采集的人脸总数为20000*3*10=600KB。每张人脸的大小在10KB, 则每天的存储空间消耗为600KB*10KB=6GB。存储周期按30天计算, 需要空间总计为6GB*30=180GB。0KB=6GB。存储周期按30天计算, 需要空间总计为6GB*30=180GB。

(3) 测试系统

在系统输入测试目标照片。测试目标依次通过各个采集点。检查采集和报警情况, 并调整识别参数。

3 结语

目前, 在地铁车站维护公共安全以及打击恐怖主义的活动中, 已经应用了"人脸识别"技术, 取得较好的效果。未来机场、地铁、汽车站和火车站将会用上"人脸识别系统"。

参考文献

[1]王昆翔, 李衍达, 周杰.关于人脸图象自动识别研究中的几个问题.公安大学学报, 2013, 31 (1) :109-114.

人脸识别考勤管理规定 篇5

有效识别时间: 上午: 7:00-11:55

下午:夏季14:00-18:10

春秋冬季 13:00-17:10

二、相关规定

1、考勤次数安排:一日两次签到、两次签退;上班铃响前30分钟开始签到,放学铃响后开始签退,10分钟内签退完毕。

2、在“有效识别时间”段内签到、签退者为有效考勤,其他时间段签到、签退无效。

3、晚于上班时间10分钟内签到视为迟到。

4、上班时间因故外出者需有书面请假条,无假条且未在“有效识别时间”段内签到、签退者视为旷工。

三、使用注意事项

1、由于考勤机签到速度有限,请大家上班提前几分钟签到。 2、如遇特殊情况考勤机不能正常使用时,改用其他方式签到、签退。

人脸识别过四关 篇6

1.“人脸识别过四关”是专为新成立的初中集体打造的“交往类”破冰游戏。

2.在游戏中通过互动、竞猜、交流的形式,了解新同学、结识新朋友,从而提高初中少先队员的交往能力,培养集体主义精神。

二、游戏时间

40分钟

三、游戏对象和人数

初中新生,全中队

四、活动道具

1.每位新同学准备一张小学一年级的单人清晰正面照片,在照片反面写上四个自己最突出的特征,其中三个特征为真,一个特征为假(假的特征用于“干扰”,以增加游戏难度)。

2.准备一个抽奖箱(抽取照片用)。

3.如果条件许可,可以准备投影仪或带有照片的PPT展示。

4.“笑脸贴”(用于过关奖励)。

五、活动准备

1.根据中队人数分成5-6个小队。

2.由中队辅导员担任主持,将照片打乱后投入抽奖箱。

六、活动规则和步骤

1.第一关:每个小队派一位代表上台,抽取一张照片,队员们相互交流一分钟,然后在现场找到照片上的队员,并站到他身边向主持人举手示意。正确即过第一关,获得“笑脸贴”。

2.第二关:小队代表依次上台描述照片上的队员是谁,并在黑板上写出他的名字。名字写对即过第二关,获得“笑脸贴”。

3.第三关:每个小队的队员依次讲出该照片上这个队员的一个优点,相互间不能重复。得到掌声最响亮的小队获胜,即过第三关,获得“笑脸贴”。

4.第四关:辨析照片背面四个特征里哪一个为假,并说明理由。获得照片上这个队员本人认可即过四关,获得“笑脸贴”。

通关活动可以反复进行,被抽中的队员照片不得再放入抽奖箱。各小队比赛获得“笑脸贴”最多的即为获胜小队。

该游戏不受场地限制,操作简单,尤其适合新成立的中队开展。

七、设计说明

该游戏关注到初中生形成自我意识的关键时期,从第一关感性的“人脸识别”开始,激发队员主动交往的意识;第二关“写出新同学的名字”是对新朋友的一种尊重;第三关是关注“新伙伴的优点”,尝试欣赏他人,友善相处;第四关则是从理性认知的层面出发,通过辨析特征排除“干扰项”,学会全面地认识和了解他人。

该游戏最具有趣味性和激励性的特点是:每个人都有可能成为游戏参与的主角和被关注的对象,每次随机抽取照片的时刻都会令人紧张、兴奋和期待。当游戏的四个环节逐一被攻破后,也就是队员们相互增进友谊的开始。游戏过程中充满积极的正能量,符合中学生期待被关注的心理需求,有助于中队集体的和谐建设。

人脸图像识别 篇7

自2001年美国“9·1l”恐怖袭击发生以来, 如何在车站、机场等公共场所利用高科技手段, 迅速而准确地发现并确认可疑分子成了目前世界各国在反恐斗争中普遍关注的问题。生物特征识别技术日益成为当前模式识别与人工智能领域的一个研究热点。

生物特征识别技术主要包括:人脸识别、虹膜识别、步态识别以及多生物特征融合识别等。其中人脸识别以其方便, 易于为公众接受成为生物特征识别技术的主流[1]。

JPEG是最为常见的图片格式之一, 相比于灰度图像, JPEG图像的人脸识别研究较少。本文利用PCA抽取JPEG图像的量化DCT系数特征, 选取合适的分类器并结合留一法进行交叉验证。

在压缩域的特征提取有效避免了传统的人脸识别方法, 要先进行压缩图像的“全解压”操作, 然后再进行识别, 大大提高了识别效率[2]。

2. 人脸识别的基本原理

2.1 K-L变换的基本原理

由于PCA的是建立在K-L变换上的, K-L变换时一种常见的正交变换[3]。设X是n维的随机变量, 常以X的协方差矩阵S作为K-L坐标系的产生矩阵, 然后求出的S的特征向量及特征值, 以特征向量组成的矩阵为投影矩阵, 将原矩阵投影至新的特征空间中。

2.2 PCA人脸识别原理

设图像大小为D=m*n的人脸图像, N是训练样本的数目, Xi为第i幅人脸图像形成的人脸向量, 则所有训练样本的协方差矩阵为:

其中, 为训练样本的平均向量, 且。令, 则, 其维数为D*D。

根据奇异值分解原理, 通过求解的特征值和特征向量来获得的特征值和特征向量[4]。设的特征值为, 对应的特征向量为, 选取前d个最大的特征值对应的特征向量组成新的特征空间U。

特征向量个数d通常按照特征值所占的能量比例来选取:

其中, 本文在试验中根据该特点选取d=40。

将任一人脸向量Xi投影到特征空间, 根据公式 (3) 获得人脸识别的特征。

2.3 PCA识别过程

将JPEG人脸图像的量化DCT系数投影至新的特征空间, 得到所有图像的识别特征, 然后根据一定得分类器对其分类, 判断其属于哪一类。

2.4 交叉验证 (Cross Validation) 方法

交叉验证为CV, 是用来验证分类器的性能一种统计分析方法, 基本思想是把在某种意义下将原始数据进行分组, 一部分做为训练集, 另一部分做为验证集, 用前者对分类器进行训练, 然后利用后者测试训练得到的模型, 以此来做为评价分类器的性能指标。

常见的CV有二分法, 将原始数据随机分为两组, 结果受分组影响很大;随机N分法, 将原始数据随机分成N组, 对每一个子集做验证获得评价结果;留一法, 每次只留一个样本作为验证, 其余均是训练集, 相比与前面两种方法有两个明显的优点:

(1) 每一回合中几乎所有的样本皆用于训练模型, 因此最接近原始样本的分布, 这样评估所得的结果比较可靠。

(2) 实验过程中没有随机因素会影响实验数据, 确保实验过程是可以被复制的。

3. 试验结果及分析

3.1 实验结果

本实验采用了多个人脸数据库作为分析。采用留一法验证分类器性能, 采用马氏距离作为分类器, 获得了较好的实验结果。

1) Face94人脸数据库

该数据库人脸表情丰富。实验选取该数据库中40个人, 每人20张图片共800张图片, 选取的特征数与准确率如表一所示:

2) Face95人脸数据库

该数据库人脸有角度变化。实验选取该数据库中40个人, 每人20张图片共800张图片, 选取的特征数与准确率如表二所示:

3) Face96人脸数据库

该数据库有较强的光照变化实验选取该数据库中40个人, 每人20张图片共800张图片, 选取的特征数与准确率如表三所示:

3.2 实验分析

从理论上讲, 在高斯分布条件下, 马氏距离的分类是最好的, 在本实验的结果中也可以验证这一点。

从表二中的实验数据可以发现, 当特征空间维数较少时, 识别率的增加很明显。例如维数从10增加到20, 识别率平均增加了10.02%。当特征空间维数增加到40左右时, 识别率开始缓慢增加并趋于平稳, 因为当特征空间维数在40左右时式 (2) 中的值已经接近99%所以在增加维数对识别率的贡献就已经很有限了。

实验选取的三个图像库, 分别具有表情丰富、角度变化、光照影响。实验结果表明, 在压缩域的特征提取对以上变化均具有较强的鲁棒性。

4. 结论

本文以JPEG图像经熵编码和反量化后得到的DCT系数为样本, 结合PCA降维方法, 提取特征。通过选择马氏距离分类器, 并利用留一法对结果进行验证。本文方法对外界因素具有较强的鲁棒性, 识别率高。

参考文献

[1]边肇祺, 张学工, 等.模式识别[M].北京:清华大学出版社, 2000

[2]张娜娜.基于变换域和PCA的人脸识别方法的研究.硕士学位论文.2006.4

[3]李月敏, 陈杰, 高文, 尹宝才.快速人脸检测技术综述.全国第16届计算机科学与技术应用学术会议, 中国合肥.2004.8

人脸图像识别 篇8

人脸识别是当今计算机专业领域的一个热点研究课题, 它广泛应用于政府、军队、银行、社会福利保障、电子商务、安全防务等等领域。在过去的几十年内, 研究学者们提出了很多关于人脸识别的方法[1], 主要可以分为两大类:基于统计的方法[2]和基于几何的方法[3]。在近几年, 基于统计的方法是人们研究的主流, 而PCA方法作为基于统计中人脸识别的经典方法被很多人借鉴并加以扩展, 其中, 基于双向PCA方法[4]、加权变形2DPCA方法[5]、基于特征融合的三维人脸识别[6]等等。这些改进都为人脸识别的研究作出了贡献。

主成分分析方法PCA[7], 即K—L变换, 是图像压缩中的一种二维最优正交变换。它首先将图像矩阵转化为图像向量, 然后求出协方差矩阵进行特征提取。由于维数一般很高, 所以造成特征提取困难, 比如图像矩阵为112×92, 那么协方差矩阵就是10 304×10 304, 这样程序运行的时间会很长。本文针对这个问题提出了一种新的图像矩阵分割方法, 即将人脸图像分割成五部分, 分别是额头、左眼、右眼、鼻子、嘴巴, 这五部分包含的人脸特征最为明显, 表情变化最为丰富;至于双耳以及脸部的大部分并不在分割的五部分之中, 因为这些部位识别特征不明显且又占了很大一部分数据, 这种数据大多是噪声干扰以及无用的数据, 所以这部分数据将被舍弃。以ORL人脸库为例:图像大小为112×92, 提取出五部分额头 (5:40, 8:84) 、左眼 (40:60, 8:40) 、右眼 (40:60, 50:85) 、鼻子 (55:78, 25:70) 、嘴巴 (78:98, 25:75) , 一共用到约6 400个数据, 只占了整个人脸数据的60%左右且每个矩阵都不大, 因为这6 400个数据包含特征明显, 噪声相对很少, 因此, 经实验证明只用这60%的数据同样可以得到不错的识别率, 并且因为矩阵相对较小所以速度也比传统PCA要快。

为了让分类效果更为明显, 本文引入了模糊隶属度函数[8];传统的人脸识别中, 一张人脸属于某类或者不属于某类是确定的, 而对于模糊隶属度函数来说, 每个元素都是以一定的程度属于某个集合, 也可以同时以不同的程度属于几个集合。引入隶属度函数以后, 经计算每张测试人脸都会得到一个与训练集中所有人脸的相似程度, 找出其中隶属程度最大的再加以判断得到识别结果。本文先是介绍了文献[9]中的隶属度函数, 后面则提出了一个新的隶属度函数, 经过实验比较新给出的隶属度函数分类效果优于文献[9]中的隶属度函数。本文以ORL标准人脸库为例, 比较了传统PCA与新分割方法PCA (FG_PCA) 的运行时间和识别率, 以及不同隶属度函数对于FG_PCA方法的识别效果的影响。

1 相关知识

1.1 PCA方法

PCA方法, 即主成分分析, 是一种统计分析方法, 可以从影响事物的多种因素中提取出最主要的因素, 摒弃大部分的噪声, 使复杂的问题简单化。在人脸识别应用中, PCA方法常用于数据降维, 它将高维的数据经过一个投影矩阵投影到低维的空间中, 使得投影后的低维矩阵的每维都是正交的。投影矩阵又称变换矩阵。通过样本矩阵的协方差矩阵可以求出协方差矩阵的特征向量, 特征向量的选择取决于特征值的大小, 这些特征向量组成的矩阵就是投影矩阵[10]。

PCA方法的基本步骤如下:

假设训练集有M幅人脸图像, 设二维人脸图像为I (m, n) 并将它按行堆叠成列向量, 即图像变为m×n维的列向量, 则可以分别用X1, X2, …, XM来表示所有的图像;M幅图像的平均值向量为:

所有训练样本的总体协方差矩阵为:

对于m×n维的列向量, 协方差矩阵的大小为 (m×n) × (m×n) , 对它求特征值和特征向量是很困难的。令式 (1) 表示为St=AAT, 根据SVD奇异值分解原理[11], 通过求ATA的特征值和特征向量来获得AAT的特征值和特征向量。令λi (i=1, 2, …, r) 为矩阵ATA的r个非零特征值, vi为矩阵ATA对应于λi的特征向量, 则AAT的正交归一特征向量ui为:

这就是协方差矩阵St的特征向量;将特征值λi按从大到小的顺序排列λ1≥λ2≥…≥λr>0, 其对应的特征向量是ui (i=1, 2, …, r) , 每一幅人脸图像都可以投影到ui所代表的子空间上。为了减少维数, 可以只取前d个特征向量作为子空间, 可以按照特征值所贡献的比例来选择最大的前d个特征向量:

一般取α=90%。

由特征向量组成的一组降维子空间, 任何一幅图像都可以向它投影得到一组坐标, 这组坐标表示了该图像在子空间中的位置, 并以此作为识别的根据。由此可用最简单的最近邻分类器来对人脸进行分类。

1.2 隶属度函数

使用模糊技术进行人脸分类处理不再是一个模式明确属于某一类或不属于某一类, 而是以一定的隶属程度属于每个类别。模糊集合隶属度函数的建立是非常关键的, 本文也提出了一个隶属度函数并与文献[9]的隶属度函数进行比对, 下文会有说明。本质上说隶属度函数的建立应该是客观的, 但每个人对于同一个模糊概念的认识理解又有差异, 因此, 隶属度函数的确定又带有主观性。通常有这样几种方法[12]:模糊统计法、例证法、专家经验法、二元对比排序法等。

定义1[13]设已知第Ci类的所有图像的矩阵为 (A1i, A2i, …, ANi) , 对应的特征向量为 (X1, X2, …, XN) , 未知图像矩阵为Q, 对应的特征向量为r, 则未知图像Q隶属于Ci类的程度为:

简称图像隶属度, 其中, λj为任意实数, 为向量范数, 为向量隶属度。用最大隶属度原则进行人脸识别时, 首先输入每张人脸测试图像, 通过式 (4) 计算出这张图像对各类人脸图像的隶属程度, 若:

则判别测试样本为Ci类人脸图像。

2 本文方法

2.1 新分割方法

新分割方法的思想是从一个m×n的矩阵I中取五个模块图像矩阵, 分别表示为FH (额头) 、RE (右眼) 、LE (左眼) 、NS (鼻子) 、MU (嘴巴) , 五个矩阵大小各不相同, 但对这五块矩阵所做的处理都是一样的, 以FH矩阵为例来描述下面的步骤。

设训练集人脸图像共M幅, Ii (i=1, 2, …, M) 是全部训练图像, 图像大小是m×n, 模式类别有C个, ω1, ω2, …, ωC, 每类训练样本N个, 将FH变换为D=m1×n1维的列向量XFH, 且m1<

其中, 是M幅额头图像的均值向量。同理, 可以得到SRE, SLE, SNS, SMU。对SFH求特征值和特征向量, 根据SVD分解原理通过求矩阵的特征值与特征向量来求出SFH的特征值和特征向量, 显然, 这个矩阵为非负定矩阵, 令λi (i=1, 2, …, r) 为矩阵的r个非零特征值, vi为矩阵对应于λi的特征向量, 将特征值λi按从大到小的顺序排列λ1≥λ2≥…λr>0, 则矩阵的正交归一特征向量ui为:

每幅人脸图像都可以投影到ui所表示的子空间上。根据PCA方法只取前d个特征向量作为子空间, 按照特征值所贡献的比例来选择最大的前d个特征向量:

取α=90%。同理可求出其他四个矩阵对应的特征值和特征向量。

2.2 特征提取

定义2最优投影向量组P1, P2, …, Pd可取为SFH的d个最大特征值所对应的标准正交特征向量。令PFH=[P1, P2, …, Pd], PFH称为最优投影矩阵。同理, 能够得到PRE, PLE, PNS, PMU。

对已知的额头图像样本XFH, 将XFH投影到矩阵PFH构成的子空间上, 即:

投影特征向量YFH=[Y1, Y2, …, Yd]称为额头图像样本XFH的主成分。

同理, 能够求出另外四个部分的主成分特征矩阵YRE, YLE, YNS, YMU。

2.3 分类

用图像的特征向量来描述图像, 那么所有图像的特征向量就构成了特征向量空间, 就该空间而言, 未知图像的归类问题等价于将某一向量归属于某类图像子空间的问题。因此, 本文通过引入模糊数学中的隶属度概念, 提出了一个新的隶属度函数, 利用最大隶属原则进行人脸分类识别。

定义3设已知Ci类有N幅额头图像, 额头图像矩阵为 (IiFH1, IiFH2, …, IiFHN) , 对应的特征向量为 (XFH1, XFH2, …, XFHN) , 未知额头图像矩阵为Q, 对应的特征向量为r, 则未知额头图像Q隶属于Ci类的程度为:

其中, β为任意非零正整数, dv是测试图像Q的特征向量r与Ci类的均值的向量范数, 表示为向量范数, uFHCi (r) 简称为图像隶属度。

由于本文将图像分为了五个部分, 所以只是额头的图像隶属度, 同理, 可以求出右、左眼和鼻、嘴的图像隶属度分别是又因五个部分代表人脸的不同部位, 对人脸特征的贡献度有所不同, 比如:做表情时鼻子基本不动, 明显的特征不多, 所占的权重不应太多。所以五个部分总的累加和是:

其中, a、b、c、d、e的值分别是每个部分所占权重, 五个权重值是从多次实验结果分析给出。是最终的人脸图像隶度。若则判别测试样本为Ci类人脸图像。

3 实验结果

本文采用Win 7系统和Matlab 7.1版软件, 并且用ORL[14]人脸数据库验证所提出的算法。该数据库由40人的400幅灰度图像组成, 每个人有不同表情或不同视点的10幅图像。这些图像为灰度图像, 倾斜角一般不超过20度, 分辨率为112×92像素。在每个人的10幅图像中分别任意取4幅、5幅、6幅、7幅、8幅图像作为训练样本对它们进行训练, 余下的图像作为测试样本。

在ORL人脸数据库的基础上, 首先进行第一组关于识别率的测试实验, 分别选择4到8不等的训练样本数目, 且都是提取特征值所占能量的90%, 在每种不同的样本数目下, 各个方法都执行六次并求出平均识别率。基于新分割PCA方法用FG_PCA表示, 基于新分割加上文献[9]中隶属度函数PCA方法用FG_LSD_PCA[1]表示, 基于新分割加上本文所提隶属度函数PCA方法用FG_LSD_PCA[2]表示。实验结果如表1所示。

实验结果表明:基于新分割PCA方法 (FG_PCA) 与传统PCA方法相比, 在相同的实验条件与实验数据下, 识别率明显, 大部分情况下都超过了传统的PCA方法。这说明本文提出的新的分割方法是有效的, 可操作的。在基于新分割PCA方法中引入不同的隶属度函数, 可以发现本文提出的新的隶属度函数 (FG_LSD_PCA[2]) 的识别效果, 要比文献[9]中 (即FG_LSD_PCA[1]) 的隶属度函数的分类识别效果略好一些, 而FG_LSD_PCA[1]的识别率也略高于FG_PCA, 这说明了引入隶属度函数进行分类, 要比没有引入的识别效果好, 而且, 不同的隶属度函数对于识别率是有影响的, 显然本文提出的隶属度函数要比文献[9]中略好一些。再者也说明了, 完全可以用少量的含有明显特征的数据来做处理, 最后也会得到令人满意的识别率。

然后进行第二组关于程序执行时间的测试实验, 实验的所有数据和上面一样不会变化, 实验硬件也完全一样, 以ORL人脸库为例, 由于每张人脸图像基于新分割的方法只用了约60%的数据, 因此本次实验我们测试各种方法的执行时间, 每种方法都执行六次并计算平均执行时间, 观察实验结果并分析。实验结果如表2所示。

实验结果表明:凡是用新分割方法处理过的方法程序执行时间相差不大, 而且并不受分类函数的不同而有所变化, 而未用新分割方法处理过的程序执行时间显然比前者略多一些, 这是因为在程序执行过程中新分割方法只用了约60%的人脸数据并且还被分成了五个部分, 所以用的矩阵一般较小, 处理速度也快。

4 结语

人脸图像识别 篇9

一、人脸图像识别技术

生物特征识别技术是指通过计算机科学技术与人体固有物理和行为特征来进行身份验证的一门科学, 属于模式识别类问题。主要包括两类问题[1]:一类是基于物理特征的生物识别技术, 包括人脸图像识别、虹膜识别、指纹识别、DNA识别技术等;另一类是基于行为特征的生物识别技术, 包括语音识别、签名、步态识别技术等。人脸图像识别就是将待识别的人脸与已知人脸进行比较, 得出相似程度的相关信息。我们常说的人脸识别还可以分为确认和辩认两种情况。确认是一对一进行图像比较的过程, 辨认是一对多进行图像匹配比对的过程[2]。

二、开发背景与需求分析

1. 项目开发背景。

近年来, 随着国家经济体制结构不断变化, 社会用工需求对于具有高级技术资格的高技能人才需求越来越大。职业技能培训与职业技能资格的考核与鉴定工作需求量与社会认可程度也大大增加了。职业技能培训与职业资格鉴定工作量与日俱增, 得到了社会普遍认可。随着职业技能鉴定工作需求量的增加, 职业技能鉴定考试中验证考生身份问题呈现出日益严重化且监考教师验证考生身份工作量不断增加的现象。在现有职业资格考试系统的基础上研发人脸图像识别系统模块, 用以帮助监考教师验证考生身份, 同时将职业技能鉴定工作全面推进信息化。

2. 功能需求分析。

在职业资格鉴定系统中应用生物特征识别技术, 研制“人脸图像识别”系统模块。该系统模块可以通过人脸识别技术进行身份验证:考生进入考场后, 系统首先需要通过摄像头获取到考生考试当天的人脸图像, 并对采集到的人脸图像进行一系列图像处理工作, 这个处理过程也称图像预处理。再同图像数据库中的图像进行比照, 如果考生身份得到正确的确认, 即可进入注册信息审核确认页面;否则, 拒绝进入。实现智能化验证考生身份的功能, 以达到辅助监考老师验证考生身份、降低监考老师监考工作量和提高职业资格考试严肃性与严谨性的目的。

3. 开发环境需求分析。

硬件资源:CPU要求PentiumⅣ及以上;内存要求2G及以上;视频采集卡、USB2.0接口摄像头。软件资源:开放式标准操作系统, 如Windows2000, Windows XP, Windows 7等。程序设计语言处理软件。如:Visual C++、JAVA、MATLAB、SQLServer等。熟悉VC++、C++、JAVA、MATLAB、SQLServer等高级程序设计语言。

三、系统设计

1. 总体设计。

本课题研究属于人脸图像的确认识别。其研究内容包括四个主要部分:一是人脸检测技术, 二是人脸定位技术, 三是人脸表征技术, 四是人脸鉴别技术。人脸图像识别模块的工作过程是: (1) 获取人脸图像:通过采集设备获取输入图像, 并生成其面纹编码。 (2) 建立人脸图像档案:通过采集人脸图像或获取照片文件上的人脸图像进行信息处理, 生成特征向量。 (3) 人脸特征的检索与对比:将待比对的人脸图像特征向量与人脸图像档案中的人脸图像特征向量进行检索与对比。 (4) 输出识别结果:进行身份的确认或是身份的选择。人脸图像识别系统的工作原理为:考生首先需要在考试报名现场进行第一次照片采集, 照片采集成功后, 系统会自动对采集到的照片进行图像预处理操作、提取面部特征, 并将提取到的特征数据存入数据库;考试当天, 考生进入考场后, 需要进行第二次照片采集, 识别系统会将采集到的照片进行图像预处理操作、提取面部特征, 得到考生考试当日采集照片的人脸面部特征值后, 人脸识别系统会将两次采集到的人脸图像特征值进行对比识别。即将考试当天提取到的面部特征值与数据库中的人脸面部特征值进行对比与识别, 最终得出识别结果。实现考生身份的验证与识别。

2. 采集模块功能设计。

人脸图像采集模块功能:负责获取人脸图像, 图像可能来自与计算机连接的摄像头也可能来自人脸图像存储的数据库。将采集到的人脸图像转换为可处理的数字图像格式, 进行图像信息存取。

3. 图像预处理模块功能设计。

图像预处理操作包括对图像进行多种图像处理操作, 以使图像本身具有的特征能够更加明显地在图像中表现出来。目的是为后面的人脸特征提取模块提供基础操作处理。本项目中, 需在图像预处理模块中进行的图像处理操作有:灰度均衡化、图像二值化和边缘检测等技术操作。

4. 人脸特征提取模块功能设计。

该模块的工作原理是对获取到的人脸图像进行特征提取, 主要包括人脸检测及定位、图像标准化、特征提取三个子功能。

5. 人脸图像判定模块功能设计。

该模块工作原理是通过模式识别中的分类决策把识别对象归为一类。即确定某一个差别规则, 进行检测对比, 最后输出识别的结果。本系统中的具体操作即需要将数据库中人脸图像与对应考生现场采集到的人脸图像特征信息进行对比, 并得出对比值。再进一步对该对比结果值进一步分析, 如果其范围在我们所确认的范围内, 我们就认为现场采集图像的考生与注册日人像图像的采集人为同一人, 即身份确认通过。否则, 则拒绝考生进入答题系统。

四、系统功能实现

人脸图像识别系统功能实现共分为人脸图像采集模块、图像预处理模块、人脸特征提取模块、人脸图像识别模块四个子模块的功能实现。人脸特征提取的效果的好坏对识别准确率效果有重大的影响。本系统采用的特征提取方法是PCA特征提取方法。本系统中人脸图像识别功能的分类决策问题可以分解为两大核心任务问题:SVM分类器识别过程与最近邻分类器识别过程。

1. PCA经典主成分分析。

主成分分析算法是一种经典的统计方法, 这种线性变化被广泛地应用在数据和分析中, 是用来描述和表征细微差异的有力工具。在语音和图像信号处理时, 经常会遇到高维的向量空间的数据处理问题, 而这些高维数据往往存在较大程度的相关冗余, 所以希望从高维空间的数据中找出具有代表性的低维子空间, 从而对数据更容易地进行分析和处理。本系统功能实现方法为:首先把待检图像转换成特征脸, 作为最初训练图像集的基本组件。利用PCA方法进入处理:在通过操作得到特征脸空间后将待检测图像的线性变换特征投影到该子空间中, 最后是将得到的结果与投影后的训练图像相比较, 最终得出识别结果。

2. 特征脸法。

该方法将人脸看作一个二维的灰度变化的模板, 这样就可以将人脸图像看成只是一个高维图像空间中很小的一部分。然后利用人脸图像由高维空间通过低维空间进行表征这一工作原理得到一个经过优化的人脸图像坐标系统。

3. SVM分类器识别。

假设识别样本有x类, 记为S1, S2, …, Sx。则首先需要设计正样本训练器, 如本操作中根据题意需设计x个SVM分类器;然后进行负样本训练器的设计, 本操作根据题意设为其所有样本Sj (j<>1) 个。接下来将每个测试样本输入到x个分类器中, 计算样本与这p个分类器所代表的各个训练样本之间的距离。在输出结果中, 如果只有值为正1, 我们就可判定出该样本的类别了。如果有多于一个的分类器输出结果为正1, 那么后面就需要用最近邻分类技术了。

4. 最近邻分类器识别。

一幅N*N像素的图像可以看成是由这幅图像的像素空间中的所有点组成的, 图像就可以看作是由N2个像素点组成。具体的操作就是通过把图像投影相应的矢量空间后, 利用投影间的各种距离值来对图像的相似度以进行判定。如果两点间距离最短, 我们就会认为它们可能属于同一子类中。但对于本操作系统, 仅有这些信息是远远不够的, 除了需要判定待检测的人脸图像在人脸库中, 还需要确定这个人就是某个人, 也就是说接下来还要继续进行相似度的再判断。一般我们采用计算特征向量的余弦夹角的方法来进行相似度的判断。

五、测试与结论

在人脸图像识别功能测试中, 使用SVM分类器结合最近邻分类器识别人脸图像进行测试。测试时, 以一个考场30人为例, 即需要一个30个人共150张人脸图像库作为测试用库。在待检测图像经过图像格式转化与一系列预处理操作与特征提取处理操作后, 将处理后的数据信息进行保存后, 即可调取图像库中的平均图像特征值与图像特征值数据信息进行对比识别了。测试中, 每个测试者都可采用多个训练样本与多个对应的测试样本。对于考生在采集图像时经常会出现的面部表情微变及面部采集角度有一定偏离的情况, 测试的处理操作是相同的, 经过与图像库图像的对比识别发现当方差相似度阐值θ为0.8时会有比较理想的识别效果。测试正确识别率高于90%, 足以证明该方法的有效性及实用性。

摘要:本文结合职业资格考试系统实际功能需求, 主要研究在职业资格考试系统中应用人脸图像识别技术, 设计制作人脸图像识别系统模块以实现智能验证考生身份。从技术源头杜绝考试中出现“枪手”的可能性。将生物特征识别技术应用到职业技能鉴定系统中, 提高职业技能鉴定考核系统的信息化程度, 同时可以减少监考教师的监考工作量。从而达到提高职业资格考试制度的严肃性与严谨性、使职业资格考试制度真正起到为社会选拔有用人才的目的, 具有很好的实际应用意义。

关键词:人脸识别应用系统,技能鉴定,设计实现

参考文献

[1]郭宝龙, 孙伟.数字图像处理系统工程导论[M].西安电子科技大学出版社, 2012.

人脸图像识别 篇10

针对拍摄时造成人脸图像的模糊和噪声的干扰问题,本文利用约束最小二乘方滤波法[4,5]使原图像复原,从而保证了特征提取的高效性。Gabor滤波器可以从多方向、多尺度来获得人脸图像的局部特征和对光照变化、人脸姿态的不敏感。但是得到的人脸Gabor特征向量的维数很高,使得数据的处理变得很复杂,为了解决此问题本文把Gabor和直接线性鉴别分析( DLDA) 相融合,使得Gabor处理后的向量的维数大大降低,而且DLDA还弥补了线性鉴别分析算法[6,7]( LDA) 小样本问题的缺陷。因此,此算法大大提高了人脸的识别率。

人脸自动识别的另一关键问题是分类标准,常用的主要有BP网、K阶近邻、SVM、欧氏距离等。K阶近邻和欧氏距离虽然计算方便但其误差较大; BP网在训练时达到最小值的时间长,易掉进局部的极小值,而且还存在过学习和欠学习等缺陷[8,9,10]; SVM虽然在泛化方面的能力强,也不需先验知识但训练的速度慢。所以本文选择了SVM的改进的方法LSSVM[11],它有效地避免了BP网的过拟合现象和SVM的训练速度慢等弱点,从而提高了人脸识别的效率和速率。

1 Gabor小波与DLDA特征提取算法

1. 1 二维Gabor变换算法

Gabor变换被Daugman等人首次运用在二维空间,它在时域和频域上都具有良好的分辨能力而且在频域中可以从不同方向和尺度上提取图像的纹理特征。由于2DGabor滤波器[12,13,14,15]是由类似高斯函数形状的波组成的,所以它对图像的形状变化、光照强度、角度等因素具有不敏感性,使得它在纹理识别方面具有良好的识别效果。它的核函数定义式是

式中:k决定Gabor内核的尺度和方向;kmax为最的大频率;kv=kmax/fv是采样的尺度;σ为常数;z=(x,y)是空间位置坐标。尺度上的k写为v∈{0,1,…,4}是尺度标号;φμ=πμ/8是采样的方向;μ∈{0,1,…,7}是方向的标号;尺度的因子是f。

将Gabor内核和它的变换做卷积

设 φk是它的相位,Ak是Jk( z)的幅值,则Gabor特征矢量是由Jk( z)的特征在z位置处的图像构成的。

Gabor的相位信息易出现周期性的变化,所以不稳定,一般不予以采用,而它的幅值信息一般稳定平滑,所以可利用。本文将按照图像的输入顺序依次和每个滤波器做卷积,并将得到的图像幅值信息当作输出。即

一般采用包含8 个方向( n = 8; μ = 0,1,…,7) 和5 个尺度(f = 2; v = 0,1,2,3,4) 的Gabor滤波器组构成,把它用于图像的Gabor特征提取中。处理后得到的其中一个图像的Gabor幅值信息如图1 所示。

由图1 知,当位置改变时,与灰度人脸图像相比较,可知图像幅度信息没有较大的改变。说明Gabor特征能在方向上很好地选取和空间中的部分性,而且对不同的光照、不同的姿态具有较好的稳定性,对对齐误差和器官的定位也具有更大的容忍性。

1. 2 DLDA算法原理

线性判别分析( Linear Discriminant Analysis,LDA) 是一种基于Fisher准则的特征提取的监督型模式分类方法。它利用投影方法使难分类的高维样本投射到低维空间,使得投影后的点同类之间距离较小,不同种类间的距离较大。其实质是寻找一个最好的投射向量,使之容易找到全局最好的解。但它有自身的局限性: 1) 在对数据处理时,通常假设数据服从高斯分布,可实际数据并非都服从高斯分布,那么此时的分类效果就会较差; 2) 其决定因数是样本中心而不是样本的方差,且存在小样本问题。由于LDA的上述缺点本文选择既能使类内矩阵单位化又能使类间矩阵对角化的算法DLDA用来实现数据的降维处理。其算法步骤如下:

假设所用的样本训练集为式( 3) 表示,样本不同种类的个数为c,第j类中的样本数为Nj,各类模式的样本平均值为μi,样本总均值为 μ0第i类中的第j个样本是Vj,类Vi中的样本个数是Ni,Sw为同种类内散布矩阵,Sb为不同种类之间散布矩阵,φ 为最佳投影矩阵。

第一步: 计算训练样本的均值

第二步: 平均脸和每张训练人脸图的差值

第三步: 创建重要的协方差矩阵,然后求出此矩阵中最重要的信息即它的特征向量和特征值

因为Sb的零空间没有有用的分类信息,所以去掉对角阵中等于零或接近零的特征值。即VTSbV = ∧ VTV = I。∧ 为降序排列的对角化矩阵。Y是V前的m列向量( n × m) ,即YTSbY = Db,Db是∧的m × m的子矩阵。

第五步: 使对角化ZTSwZ,可得到UTZTSwZU = Dw,其中UTU = I。

第六步: 令A = UTZT,则Dw= ASwAT,I = ASbAT,A已对角化Sw,可得投影的矩阵为Dw- /2。

2 图像去模糊的模型及算法

2. 1 约束最小二乘方原理

在实际的图像去模糊中通常原始图像和噪声的功率谱是未知的,而且它们的信噪比一般没有合适的解,在上述情况下维纳滤波和逆滤波的效果不佳,为了解决上述的不稳定性,本文选择最小二乘方滤波法进行图像的去模糊和滤噪,在最小二乘约束去模糊中,欲使函数最小化,关键是得到一个最好的f估计值。在此前提下,可把不清楚的图像问题转化为对f的估计求式( 5) 目标泛函数最小值的问题。

式中: L一般选择拉普拉斯算子,是对原图的估计进行某些线性操作的矩阵。λ 是拉格朗日乘子,欲使式( 7) 最小则对式( 7) 求导并等0,即可求出最小二乘解f的估计值。

为了易求出式( 8) 的解则对其实行FFT运算之后再求,变换后的公式为

通过调整r = 1 /λ 的值,可使得约束最小二乘滤波器达到较好的去模糊效果。其中H ( u,v) 的共轭是H*( u,v) ,g( x,y) 和h( x,y) 经过二维傅里叶变换后分别为G( u,v) 与H( u,v) 。噪声和信号的功率谱密度分别为Sn( u,v) 和Sf( u,v) ,该算法可以自动抑制噪声的放大,但是它却使低频段中偏高的频率成分增强了,通常情况下在信号的高频谱区,信噪比较小,噪声项一般包含在高频范围中,因此噪声被滤波器所抑制,但与此同时,它也使得一些有用的高频细节丢失,在低频谱区信噪比很高时,滤波器接近于反向滤波器的效果使小细节被增强。通常r在0 ~ 1 之间取值,但实验证明其在信噪比较高时r一般在0. 1 ~ 0. 4 之间取值效果最佳。此方法去图像模糊的效果图如图2 所示。

3 LSSVM分类器

SVM分类器由于在工作时无需先验证知识,泛化能力强等优点所以被广泛应用于各个领域,尤其是在模式识别中,对于解决具有维数高的非线性的和样本少的问题效果更为明显。但它在训练样本时所需时间长,针对此缺陷本文采用LSSVM法,其计算过程如下:

第一步: 建立一个分类的函数设一训练集为( xi,yi) ,i = 1,2,…,l ,x∈Rd,y∈R,偏置量为b,权值向量为w,则LSSVM在维数高的样本中的线性函数是

第二步: 根据结构风险最小化原理建立目标函数设分类误差为 ξ 正则化参变量为r。

限制条件为

式中: ‖ω‖2用来控制模型的复杂度; c为正则化的参数; ξi表示松弛因子。

第三步: LSSVM优化对应的拉格朗日函数为:

式中: ai( i = 1,2,…,l) 是拉格朗日乘子。对上面的式子求偏导,并且将结果设置为0,高维计算的问题可以转化为求解线性方程组的问题。

式中: e =[1,1,…,1]; Y =[y1,y2,…,yi]; Ωij= K( xi,yj) ,最后得出非线性的回归模型

第四步: 选择最佳的核函数,若使用径向基函数作为核函数则LSSVM的分类决策函数为

径向基核函数的宽度参数为 σ,LSSVM的惩罚参数和核函数的值选择什么可以直接影响到预测结果的准确度,然而,需要解决的难题是怎样能找到合适的惩罚参数和核函数的值。

4 Gabor + DLDA + LSSVM算法原理

1) 图像预处理: 在采集人脸图像时可能会由于光学系统的配置、相机对焦不准、人手的抖动、光线的强弱等因素造成的人脸图像的模糊不清或噪声的污染,从而会导致人脸识别率的降低,为了尽可能的避免这种原因造成的干扰,在进行人脸识别之前先对其进行约束最小二乘法去模糊处理。

2) Gabor特征提取: 将人脸的图像分别与40 个Gabor滤波器进行卷积运算,即可得到人脸图像的Gabor幅值特征,但所得到的Gabor特征矢量维数可高达40 × 图像的分辨率维,在Gabor特征相邻信息中有相当多的冗余信息。

3) DLDA降维处理: 把上步得到的高维人脸Gabor特征矢量进行DLDA数据降维处理,消除冗余特征,大大节约了存储空间提高了人脸识别速率。DLDA算法相比LDA算法不仅克服了小样本的缺点而且它还使同类之间的离散度矩阵的零空间保存下来同时删掉了不同类之间的离散矩阵。

4) LSSVM训练分类: 数据经过DLDA运算后得到的最佳投影矩阵作为LSSVM的输入,选择合适的核函数和参数并计算出每个支持向量机的最优决策函数值,最后把待测人脸图像经过相同变换后输入到LSSVM中得到40 个决策值,把每个决策值做统计,最后票数最多的类就是样本的类别。本文算法Gabor + DLDA + LSSVM具体过程如图3 所示。

5 仿真实验结果与分析

5. 1 实验数据库简介

为了验证本文算法的高效性和广泛性,本文分别选择了两种不同的人脸数据库进行实验验证。一种是被英国剑桥大学所收集的并且在国际上通用的标准ORL人脸库,此图像库中包含400 幅人脸图像,其中有40 个不同类型的人,每类人有10 种不同的表情。它们的面部表情各不相同,有哭或不哭,是否佩戴眼镜,人脸的朝向不同,每幅图像的分辨率是112 × 92; 灰度等级为256,它的部分人脸如图4 所示。另一种是YALE标准人脸库,此库中共有165 张图像,其中有15个不同类型的人如男、女等,每个人又有11 张不同的表情动作图,其不同体现在光照、表情、姿态等的变化上,每幅图像的分辨率为100 × 100,灰度等级为256。YALE人脸数据库的优点是充分考虑了现实场景下,不同光照、面部缺失和表情各异等状态,其部分人脸图如图5 所示。

5. 2 实验结果及分析

实验条件为分别在ORL库和YALE库中随机获得每人5幅图像当作训练的样本,剩余的作为测试样本,所有仿真软件为Matlab2012 和Windows XP系统,为更充分地证明本文算法的高效性,首先仿真出PCA + SVM算法的识别率,其程序的可视化界面为图6 所示。

为了比较各个算法在不同训练样本数目下的影响,在ORL库中随机抽取每一个人的1,2,…,8 幅人脸图作为训练样本,各算法的特征维数保持一致。图7 中PCA、Gabor +PCA方法的实验参考结果数据来源于文献[16 ]。LDA算法结果来源于文献[7],而SVM + PCA、Gabor + DLDA + LSSVM的数据结果是由软件编程仿真得到的,五种方法结果对比如图7 所示。

由图7 结果可以得出,在50 次求平均的相同实验条件下,首先在ORL库中,本文方法对人脸的正确认知率上明显高于其他四种算法。还可以明显看出Gabor + PCA算法的识别率高于SVM + PCA算法。当每种训练的图像个数增加时,测试的图像上识别率就随着增加,即分类器的分类能力会随着训练图像个数的增加而增强。但是当训练的样本数目达到一定数量时识别率趋于一种稳定状态。

在为了验证本算法的广泛性,排除偶然性,在用50 次求平均相同实验条件下,使用YALE人脸库进行实验,得出的实验结果如表1 所示。

通过对上表分析可得出如下结论,可以明显看出本方法在YALE人脸库中对人脸的正确认识率也明显高于其他四种算法,当训练样本的数目曾多时可以看出识别的正确率也会相应的提高。通过两个人脸库的验证结果可以说明本文方法具有稳定性和广泛性。对比在表1 和图7 中的同一种方法的不同识别率可知,在ORL人脸库中的识别率普遍高于YALE中的。这是因为在YALE库中的人脸受光照、表情的影响比ORL中的稍高。

5 结语

上一篇:电机传动下一篇:舞台