当前位置:首页 > 智能硬件 > 人工智能AI
[导读]   李繁是科大讯飞云平台事业部人脸声纹技术主管,作为研发负责人参与构建了面向十亿级互联网用户提供语音交互服务能力的“讯飞开放平台”,负责平台身份验证业务线技术孵化与能力输

  李繁是科大讯飞云平台事业部人脸声纹技术主管,作为研发负责人参与构建了面向十亿级互联网用户提供语音交互服务能力的“讯飞开放平台”,负责平台身份验证业务线技术孵化与能力输出。以下笔者整理的李繁近期在一公开课上分享的内容:

  大家晚上好,我是科大讯飞的李繁。科大讯飞在语音技术方面的基础研究时间超过了16年,目前正构建人工智能生态圈,拥有专门面向互联网开放的人工智能开放平台,输出各项核心的前沿技术。

  目前,生物特征识别技术已经逐步在金融领域推广使用。上一期钛客们分享了人脸识别技术(钛坦白干货)和虹膜识别(钛坦白干货)在金融领域的应用,也对这些生物特征为何能应用金融领域的特性做了说明。今天我主要从技术解决方案角度来说明,多生物特征融合认证系统一个基于人脸识别技术与声纹识别技术为接入点,可同时对多种生物特征进行融合认证的身份验证解决方案。

  

  早前,国际生物特征组织分别从干扰用户程度,独立性,费用代价,易用性这四个层面对市场上在用的生物特征进行了系统的统计分析,分析包括掌纹识别,签名识别,指纹识别,语音识别,虹膜识别,视网膜识别,脸部识别以及温谱识别。提出,理想的生物特征系统需要具备高独特性,高易用性,对用户干扰程度低且费用代价低的特性。从这里可以看出,在人类认知范围内的声纹识别、人脸识别技术和签名识别技术以及人类认知范围外的指纹识别,虹膜识别,和掌纹识别,为何能在各自的领域中发挥着重要的作用。

  声纹识别技术和人脸识别技术能够被用作便捷的身份认证形式,与其拥有的特点是分不开的,首先这些生物特征与生俱来的,具备唯一性,不易被复制。其次,这些特征都是易采集且采集隐蔽性较强,无需新增硬件成本还能够被远程操作。

  

  以声纹技术来说,声纹是根据语音波形中反映说话人心理和行为特征的语音参数,自动识别说话人身份,每个人无论别人说话模仿的多么相似,他都具有独一无二的声纹。这是由每个人的发声器官在成长过程中形成的,这个唯一性能够唯一确定一个用户的身份。

  讯飞是国内最早开始研究声纹识别技术且最早达到实用级别的厂商,在提出多生物特征融合认证解决方案之前,就已经为公共安全部门和金融机构提供了相关技术支持。作为身份验证的一种方式,自然说话中即可确定身份,接受度较高。

  声纹识别模式目前对外支持了声纹自由说、动态数字密码、开放文本密码、固定文本密码。如下图,各种识别模式均有其对应的应用场景。动态数字密码因其使用便捷性,已成为金融支付中最为广泛的声纹识别模式。

  

  在这个领域中声纹识别主要用途分为两种,与人脸识别相似,一是声纹确认,即1:1比对,二是声纹鉴别,即1:N比对。声纹确认直接使用待校验人的声纹模型数据与注册时的声纹模型数据比对,得出一个相似度得分,而声纹鉴别在一组模型中找出与待校验人相似度最高的声纹发音者,当然这个相似度得分能否作为判断是本人的依据,需要应用根据其容忍度进行来设置。

  下面来说一下声纹识别技术的效果衡量标准(这个效果衡量标准的实质就是安全性与易用性间的权衡):

  错误接受率(False Accept Rate),指非本人被错误的认为是本人的次数占声纹冒人操作次数的比值;

  错误拒绝率(False Reject Rate),指本人被错误的认为是非本人的次数占声纹确认操作次数的比值;

  相等错误率(Equal Error Rate),指FA等于FR时的百分比。是衡量声纹验证效果的重要依据。

  至此,想必大家对声纹识别技术以及人脸识别技术都有了一个基本的认识。

  可能有人会问,现在的人脸识别作为一种支付认证手段已经在市场上推广使用了,而且普遍反馈效果很好,为什么还要去做这个多生物特征融合?以人脸识别技术来说,在最新的deepID2算法下,人脸的分辩能力能够达到99.47%,但是在实际的应用中还面临着各种挑战,比如说大家都能感受到的一个比较大的挑战就是,我们旁边的这些韩国小姐;当然,声纹识别技术同样也有应用上的挑战,比如说声纹易变形,易受身体状况、年龄、情绪等方面的影响,实际使用中会受到录音设备的影响。所以说,作为单一的生物特征认证有一定的不稳定性和局限性。

  为应对支付领域的高安全性需求同时解决单一生物特征的不稳定性和局限性,提出了多生物特征融合认证解决方案,多生物特征融合的核心基础就是特征间的独立性和互补性,从不同维度对两种生物特征进行融合计算,能够最大限度的利用两种生物特征的优点,同时能够从一定程度上降低误识率,比如说刚才提到声纹变形或录音设备的影响。

  多生物特征融合认证解决方案是一整套的互联网解决方案,关键特性包括:

  1、 统一接入方式,云服务持续优化升级,对于后续新开放的生物特征能够灵活接入,集成应用可以根据需要灵活选择新切入的生物特征。

  2、 自定义安全阈值,结合应用场景设置安全级别,对于支付认证这种安全要求较高的领域中可以设置当所有生物特征都必须全部匹配时才认为确认无误,而在对安全性要求不高的领域中,比如打卡系统,可以设置当任意一种生物特征的匹配度符合标准都予以通过。采用这种方式能在保障校验准确度的同时有效的提高通过率。

  3、 闭环的安全校验,能够为应用提供闭环的安全校验交互,避免特征交互过程中被篡改或者伪造,同时特征的传输通道采用多层加密的方式。

  多生物特征融合认证解决方案在支付领域里面的应用,下面为大家举几个例子,

  1、2015年8月,科大讯飞联合中国银联和徽商银行发布了 “声纹+人脸”融合认证个人转帐应用,是第一款采用多生物特征融合技术在移动支付领域的产品,能够有效防范图片或者视频回放的欺诈风险。在绑定银行卡环节中,还应用了自动识别身份证和银行卡的功能,显著简化了用户的操作。

  2、2016年的2月,徽商银行正式发布带有人脸声纹识别功能的手机银行版本,用户在使用手机银行的时,可用“人脸+识别”替代手动输入密码。

  3、目前正在对接的多家证券公司,都希望这个方案能够用于远程开户和安全支付,用户不必再通过繁杂的人工校验审核,也不用担心因审核过程的复杂而错失一个投资良机,对于使用者和企业来说都是比较高效的一个应用方式。

  除了在金融支付领域,在其他领域也在使用这种多生物特征融合认证的解决方案,比如,科大讯飞目前在用的身份认证考勤,全国各地的分公司只要在指定的地点进行通过app进行“人脸+声纹”打卡即可。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭