当前位置:首页 > 消费电子 > 触控感测
[导读] 些年得益于网络架构、训练策略以及人脸数据的发展,人脸识别技术取得了巨大的提升,越来越多地被推广到安防领域,延伸出考勤机、门禁机等多种产品,产品系列达20多种类型,可以全面覆盖煤矿、楼宇、银行、军

些年得益于网络架构、训练策略以及人脸数据的发展,人脸识别技术取得了巨大的提升,越来越多地被推广到安防领域,延伸出考勤机、门禁机等多种产品,产品系列达20多种类型,可以全面覆盖煤矿、楼宇、银行、军队、社会福利保障、电子商务及安全防务等领域,人脸识别的全面应用时代已经到来。

然而,现有方法主要关注自然环境下的人脸识别,其训练数据大都从网络上收集而来,一般只包含中等量级的人数(约10万人),但每类平均样本数很多(多于20个)。然而,实际应用中的人脸识别系统通常只能获取2张图像,一张证件照,一张现场照。同时,系统需要面对的人脸个体数量可达到上百万甚至是千万级。因此,实际中人脸数据库通常具有海量类别,但每类只有2个样本,一般被称之为大规模双样本问题。

现有方法在训练这种数据时会遇到巨大的挑战,例如类内变化不足使得训练难以收敛以及海量样本数对计算设备的极端要求。为此,中国科学院自动化研究所针对真实场景下的人证核验问题,提出了基于深度学习的大规模双样本学习方法,解决了双样本数据带来的类内变化不足问题和海量样本数计算压力大的问题。

目前,深度学习在人脸识别界具有统治地位,基于分类的训练方法是主流,其将每个人当作独立的类别,并使用softmax进行分类训练。近两年SphereFace,CosFace以及InsightFace进一步引入了边界裕量(margin)来提高识别网络的可扩展性,在公开测试集上取得了领先性能。然而,softmax的计算消耗与类别数直接相关。在实际应用中,百万类甚至千万类的分类会对训练平台产生极大压力,普通训练平台(如8卡TITANX)甚至无法训练,给主流方法的应用带来了困难。

自动化所朱翔昱、雷震等研究人员提出的大规模双样本学习方法包括两个方面,一是提出了一种分类-验证-分类(CVC)的训练策略来逐步提高实际场景中的性能,二是针对大规模分类问题提出了DP-softmax使得深度学习在超大规模类别的分类上具有可扩展性。

在分类-验证-分类(CVC)训练策略中,研究人员将整个训练过程分为三个阶段。第一个阶段为Pre-learning(ClassificaTIon),首先在网图人脸数据库上训练一个深度神经网络模型,以得到一个较好的初始人脸识别性能。第二阶段为Transfer Learning (VerificaTIon),使用基于度量学习的人脸验证方法如triplet loss在大规模双样本数据上进行微调,将人脸知识从自然环境迁移到人证场景下。第三阶段为Fine-grained Learning (ClassificaTIon),构建了一个特殊的分类层DP-softmax对百万级类别进行分类,最终达到人证场景下的最优性能。

DP-softmax极大降低了大规模分类的计算需求,首先通过CVC策略中第二阶段的模型对训练数据抽取特征并构建每个类别的类别模板(prototype),生成所有类别的类别模板库。在训练过程中,针对当前mini-batch中的样本选择与他们最相似的少量类别模板构建临时分类层来完成本次分类训练。整个过程可以在不影响训练效果的前提下,极大降低大规模分类的计算需求。研究人员对提出的方法进行了充分的实验,表明在IvS场景下,该方法相比现有方法有了明显提升。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

虽然现有的技术已经显著改善了盲人的导航和障碍物检测,但它们主要集中在这些方面。我们的目标是扩展这项技术,不仅包括检测,还包括物体、人脸和图像的识别。人工智能的广泛应用旨在通过提供有关其周围环境的更详细和有意义的信息来增强...

关键字: 人工智能 GPS 人脸识别

Facenet-PyTorch 是一个基于 PyTorch 框架实现的人脸识别库。它提供了 FaceNet 模型的 PyTorch 实现,可以用于训练自己的人脸识别模型。FaceNet 是由 Google 研究人员提出的...

关键字: pytorch算法 人脸识别 开发板

人脸识别技术在过去十年中有了巨大的进步,现在它主要用于监视和安全目的。在今天的教程中,我们将学习如何使用树莓派构建人脸识别门锁系统。本项目分为三个阶段:

关键字: 树莓派 人脸识别 继电器
关闭