3.狭义的人脸识别,即完成输入人脸与系统已见过、记忆过的人脸的比对。
在这里,我先总体上概括一下这三个步骤上的年度进展:
1. 人脸检测
2. 核心技术
里面的核心是“如何提取具有区分能力的特征”,2012年以来,采用深度卷积神经网络进行特征学习已经成为人脸识别领域的标准技术。过去一年来,这方面主要的进步还是来自更大规模实战数据以及残差卷积神经网络ResNet的应用。
3. 数据增广
此外,对于一些难以获取大量数据的场景,研究人员也在想法设法采用半自动或自动的方法“增广”数据集,包括基于三维人脸模型合成人脸或者采用GAN这类方法生成数据,这里的3D人脸模型既可能是采用专用设备采集的,也可能是采用3D MM等方法自动重建的。值得注意的是,尽管GAN很火热,也能合成出一些视觉效果不错的人脸图像,但其合成的增广人脸数据是否能够用来增广特定人的数据并提高特征学习的效果,目前尚不得而知。此外,面向移动终端和嵌入式应用等实际应用需求,也有大量工作是进行模型压缩和计算加速的。
这三类场景的技术成熟度差别很大:在N等于10000人、误识率不高于1%时,A场景识别率可以做到98%以上,B场景可以做到70%~90%,C场景恐怕只能做到80%以下,某些条件下甚至可能低的不忍直视。需要特别强调的是,这里误识率1%看起来有点高,但在N等于1万人时,大概相当于1:1场景下的百万分之一的误识率,实际上已经非常有挑战了。
2. 人脸防骗技术
这是一场魔高一尺、道高一丈的博弈“游戏”,风险确实是存在的,尽管可能并没有央视报道的那么夸张。
3. 黑名单动态布控系统
对于人脸识别最大的实战应用场景,即黑名单动态布控系统,也就是前面所说的3C场景,目前N等于1万人,错误接收率等于1%,条件较好的时候首选识别率可以做到80%左右。但实际需求是在开放监控场景下,N等于100万人,误识率要求低于0.01%,甚至要对各种试图逃避识别的目标人达到首选识别率90%以上——这是极具挑战的任务,难度比现在能做到的要高4~5个数量级。是否能在两三年内做到我个人持谨慎的怀疑态度,这个过程中工业界需要保持冷静,避免因过度承诺而失去用户信任,带来人脸识别应用的“倒春寒”。
2. 学术界的机会
而因为商业原因,学术界对工业界的实际进展难以把控。当然,学术界的机会恰恰在工业界不愿意关注的地方,比如在数据少甚至没有标注数据的情况下,如何可以仍然有效的学习模型?在有数据但数据脏乱差的情况下如何鲁棒的训练模型?
666
@gegey 图片好像挂了,我自己都看不到,晚上回去修复下