瑞典开发出基于人脸特征的网络搜索技术(共2篇)
篇1:瑞典开发出基于人脸特征的网络搜索技术
和Like.com网站类似,一家名叫PolarRose的瑞典网络公司日前宣布,他们也开发出了一种可以用图片甚至图像作为关键词进行搜索的技术,不过...
和Like.com网站类似,一家名叫PolarRose的瑞典网络公司日前宣布,他们也开发出了一种可以用图片甚至图像作为关键词进行搜索的技术,不过更有意思的是,这家公司将新技术的应用专注在了人脸识别上,
PolarRose公司的副总裁尼古拉斯・尼格罗姆说:“以前,要想找一个人,你必须知道他的一些信息,比如姓名、毕业学校、家庭住址等,然后把它们输入网站,才有可能找到这个人的其他资料。现在,利用我们的人脸搜索技术,你就可以根据人脸部的一些基本特征,实现在不同场景、灯光的照片里寻找同一个人,只要能看清他的脸。”
PolarRose公司打算本月发布这样一个系统在网站上,供网民使用,
目前,他们已经得到一些图片网站授权,可以使用后者的图片,他们还会从一些个人博客上采集图片。“我们正在构建一个庞大的人脸数据库,每一个人脸都会有一个名字,就像每一个人有一个名字一样。目前,一些人脸已经有了名字,在将来的使用中,我们和网民都可以补充没有名字的,也可以纠正已有名字中弄错了的。”
尼古拉斯说:“我们希望最终能做到,可以在互联网上寻找每一张照片里的每一个人,既包括明星,也包括我们身边的普通人。那时,生活会变得很有趣,有可能每个人都会被广告公司看中来投放广告在你的照片里。”该公司已经获得了超过530万美元的投资来发展这一技术。
当然,对于那些因为个人隐私而不希望自己在该数据库中“露脸”的人,该公司总裁简・艾瑞克表示:“如果可以事先询问,一定事先询问;如果无法确认,那么一旦有任何异议,其信息都将从我们的数据库中消失。”
篇2:瑞典开发出基于人脸特征的网络搜索技术
人脸特征点定位在人脸识别、姿态估计、人脸跟踪、人脸表情分析等大部分人脸感知任务中扮演着重要的角色。文献
在早期的一些方法中,主动形状模型ASM(Active Shape Model)
1 基于深度自编码器网络的定位方法
在数目较多的人脸特征点定位任务中,如果使用一个单一的深度学习网络对所有特征点进行估计,将导致网络结构复杂和训练过程困难,同时由于姿态、表情、光照等因素使得精确的定位更加困难。针对这一情况,本文设计了一个基于深度自编码器网络的人脸特征点定位方法,这一部分首先对设计的方法进行概述,然后分析自编码器网络的设计细节,最后给出实验中的网络设置参数。
1.1 方法概述
本文设计了三层级联的自编码器网络,并通过粗到精的方法对多数目的人脸特征点进行定位。如图1所示,根据面部结构特征,我们将眉毛、眼睛和鼻子整体作为一个部件(包含31个特征点),嘴巴单独作为一个部件(包含20个特征点),人脸轮廓作为一个部件(包含17个特征点),从而将所有特征点分成三部分。第一层深度网络以整个人脸图像作为输入,训练网络直接估计出三个部件的边框位置(边框左上角和右下角点的坐标)作为输出。通过边框位置信息对人脸图像进行剪裁,分别得到三个部件的图像,作为第二层网络的输入,针对三种不同部件分别训练第二层深度网络对相应部件中的特征点做出初始的估计,得益于深度网络对从图像到特征点之间复杂的非线性映射关系的优良拟合能力,同时每个网络仅对数目不多的特征点进行预测,使得第二层深度网络的初始预测已经比较接近实地真值。鉴于人脸图像在表情、姿态、光照等方面的较大变化,设计第三层深度网络来刻画描述这些变化,在当前特征点周围提取的局部索引特征用于特征点定位是经常使用并且有效的方法
其中,S表示最终人脸特征点(人脸形状)估计值,S0表示第二层网络对特征点的初始估计值,ΔS表示第三层网络对上一层网络特征点估计值与真实值的偏差估计值。
第一层估计各部件位置,将得到各个部件边框左上角和右下角坐标,为便于显示,图中各部件位置用不同粗细的矩形框框出来,之后将各部件剪裁出来分别进行估计和求精,最后将所有部件特征点合并得到一个完整的人脸形状。
图1 方法概述
1.2 深度自编码器网络
我们使用深度自编码器网络作为设计的三层级联网络的基本构件。给定一个由d维人脸(或人脸部件)图像x∈Rd,Tg(x)∈Rp表示p维的目标输出变量,各层的网络学习出一个从图像到目标值的映射函数F,如下所示:
一般来说,映射F是一个复杂的非线性函数,为了实现这一目标,k个单一的隐藏层自动编码器被堆叠起来作为一个深度神经网络来拟合这个映射函数。具体而言,各层网络的任务可以看作最小化以下目标函数:
其中,F={f1,f2,…,fk},fi是深度网络中第i层的映射函数,σ是sigmoid函数,ai是第i层的特征表示。自编码器网络中前k-1层神经元节点激活函数使用sigmoid函数来刻画图像特征与目标变量之间的非线性,然而,由于sigmoid函数的输出范围是
为了避免过拟合,引入规则化项∑ki=1‖Wi‖2F(也叫权重衰减项)到目标函数以减小权重的幅度,则目标函数可以进一步写为:
映射函数F含有大量的权重和偏置参数,在优化过程中容易陷入局部最小值,为了更好地优化函数F,首先采用无监督预训练过程初始化前k-1层参数,随机初始化第k层参数,之后以有监督方式微调整个网络参数。对于前k-1层,通过优化下面的目标函数进行预训练:
自编码器网络在通过式(7)进行初始化后,网络所有层参数按照式(6)进行微调,如此,自编码器网络的前几层用来捕获低层特征,如图像中的纹理模式;较后面的几层来刻画包含纹理模式上下文信息的较高层的特征。网络以图像原始像素为输入变量,以期望的回归目标值作为输出进行训练,测试时,网络的输出值即为相应的预测值。
1.3 实现细节
数据扩增:为了通过训练得到一个鲁棒的深度网络,对每一个训练样本(按照数据集提供的人脸边框提取的人脸图像)进行随机缩放和平移操作扩充样本容量,这样可以有效地防止深度网络模型训练过拟合,增强对自然环境下各种变化的鲁棒性。
参数设置:实现中使用由三个非线性隐藏层和一个线性输出层构成的深度自编码器网络模型来拟合非线性映射函数。调整输入网络的人脸(或人脸部件)图像到固定大小(50×50像素),隐藏层神经元节点个数分别为取1600、900、300,在提取局部形状索引特征时,我们在每个特征点周围提取9×9的小块,式(6)中的权重衰减项参数α用来控制样本集均方差项和权重衰减项的相对重要性,实验中取值为0.001。
2 实验
为了评估所文中设计方法的性能,我们在常用人脸特征点定位数据库上进行了多次实验。这一部分首先介绍所使用的数据库,之后给出实验结果与分析。
2.1 数据库介绍
我们在LFPW
2.2 实验结果与分析
实验结果采用平均估计误差和失效率两个指标来度量所设计方法的性能,这两个指标显示了一个特征点定位算法的准确度和可靠性。估计误差公式如下:
其中,(x,y)和(x',y')分别表示特征点真值坐标和估计坐标,d表示估计误差标准化因子。如果估计误差超过10%,则认为估计失效。两眼中心距离常用来作为估计误差标准化因子,然而,与正脸相比,侧脸两眼中心的距离较短,使用两眼中心距离作为估计误差标准化因子在人脸姿态变化较大时显然是不合适的,这一点在文献
我们将文中设计的方法和主动表现模型(AAM)方法
表1和表2分别给出了在LFPW和HELEN数据库上的平均估计误差和失效率。与AAM和SDM方法相比,文中设计的方法在两个数据库上平均估计误差最小,失效率最低(表中用粗体呈现),表明文中设计的方法在特征点定位的准确度和可靠性(鲁棒性)上有相应提高。图2给出了在LFPW(左三列)和HELEN(右三列)数据库上结果对比。从上到下依次为:实地真值、AAM方法、SDM方法和本文设计的方法。从图中可以看出,当人脸姿态或表情有较大变化时,鼻子和嘴巴处的特征点准确定位比较困难,然而,文中设计的方法在应对这种姿态或表情变化有一定的鲁棒性。图3和图4分别给出了文中设计方法在LFPW和HELEN数据库上的一些特征点定位结果,这些人脸图片在姿态、表情、年龄、肤色都有变化,有的还存在一些遮挡,尽管如此,我们设计的方法依然能够比较准确地定位。
表1 LFPW数据库上不同方法比较结果
表2 HELEN数据库上不同方法比较结果
图2 不同数据库和不同方法同方法的对比结果
图3 LFPW数据库上一些样本的结果
图4 HELEN数据库上一些样本的结果
3 结语
【瑞典开发出基于人脸特征的网络搜索技术】相关文章:
申请留学瑞典的条件04-08
瑞典的工作文化与创新06-09
瑞典留学资金问题的解决方法06-21
瑞典政治概况05-24
瑞典留学费用05-29
瑞典司法体制08-09
赴瑞典留学行前必须准备的物品介绍04-17
关于赴德国、瑞典、法国考察的情况报告05-21
瑞典、芬兰企业债务重组情况的考察报告04-12
什么是瑞典模式05-26