当前位置:首页 > > 充电吧
[导读]记者消息,7 月 4 号,微软官方发布消息,测试版的 SwiftKey(记者按:2016 年,SwiftKey 被微软收购)中加入了新功能 Puppets,这个新功能提供了熊猫、恐龙、猫头鹰等多个动物

记者消息,7 月 4 号,微软官方发布消息,测试版的 SwiftKey(记者按:2016 年,SwiftKey 被微软收购)中加入了新功能 Puppets,这个新功能提供了熊猫、恐龙、猫头鹰等多个动物的 3D 形象,还能够通过 AI 技术来实时反映用户的表情和头部动态。

尽管 3D 表情近几年开始席卷全球,但值得一提的是,人们关于创建 3D 动态形象的想法,早在十几年前就已经生根发芽了。

从好莱坞大片中得到的灵感

2005 年左右,运动追踪技术还远未达到成熟阶段,即便是在 2009 年上映的《阿凡达》,也需要演员提前在脸上标记特定的小点,穿上带有特制小球的衣服,帮助光学系统追踪人脸和身体的动作变化,最终精准地捕捉到人物角色的表情和动作。

记者注:上图为《阿凡达》剧照

Faceshift 公司(记者注:Faceshift 是一家人脸追踪技术公司,2015 年被苹果公司收购)的联合创始人之一 Mark Pauly 表示:

为演员的脸部标点是一个很不错的想法,因为这样可以帮助简化运动追踪的计算量。但这需要大量的设备,还需要花费大量的时间成本。

Mark Pauly 和其他研究者开始寻求新的方法——开始探索如何使用深度感应相机和算法来取代传统的方法,使面部表情追踪变得更简单。而他们的最终目标是制作出可以实时模仿人类表情的动态数字形象。

由于人脸总是持续变化,因此,为了让机器可以准确识别出面部运动,必须让它识别出在不同环境或状态下的人脸,比如变幻的光线,头部的旋转角度,人脸的肤色等。接下来就是不断地训练算法来处理这些面部数据信息,然后建立大量的 3D 模型,形成模拟形象。

人脸追踪技术从电影走向手机

在 2013 年开始,苹果就陆续收购了 3D 传感器制造商 PrimeSense、图像识别公司  Perceptio、增强现实公司 Metaio 和 人脸追踪技术公司 Faceshift。从现在看来,这波疯狂收购的背后,很大一部分原因是苹果在为推出 iPhone X 做准备。

2017 年 9 月,苹果推出了 iPhone X,从外形上来看,除了经典 Home 键的消失,屏幕顶部还出现了一块“刘海”区域。

在这块神秘的黑色刘海之下,内置了麦克风、扬声器、前置摄像头,以及包括环境光传感器、距离感应器、红外镜头、泛光感应元件、点阵投影器在内的 5 种感应器。这 5 种感应器组成了原深感摄像头系统(True Depth Camera  System),它可以捕捉并分析用户的面部 3D 结构特征,类似 3D 建模一样,然后再通过苹果神经引擎(A11 Bionic Neural Engine)即时处理识别数据。

基于原深感摄像头和神经网络的支持,3D 版的 Emoji——Animoji 就这样应运而生了;用户可以在使用 iMessage 时开启 Animoji 录制一段不超过 10 秒的小视频,而 3D 动画形象会同步用户的表情,而且这个功能还支持录音。

虽然,Animoji 只是作为 iMessage 的一个功能出现,但从 3D 动画表情创新的层面上来说,Animoji 可以算得上是开山之作,它让好莱坞大片中的 3D 人脸追踪技术走向了手机。

在苹果开始采用 3D 结构光技术来支持人脸识别和 Animoji 之后,三星、华为、小米等手机厂商也在不断努力之后,实现了这一技术,并打造了属于自己的“Animoji”,甚至逐渐摆脱了对原深感摄像头的依赖。

基于深度神经系统的 Puppets

与苹果 Animoji 不同的是,微软 3D 动画表情 Puppets 的载体不在于系统内的短信(iMessage),而是在于第三方软件 SwiftKey;这款个性化输入法基于先进流利的预言推理引擎,能够进行十分快速的输入操作——微软预计,SwiftKey 每周可以节约总计 2000 万个小时的打字时间。

除此之外,Puppets 最大的不同在于,苹果 Animoji,以及其他许多 3D 动态表情都需要原深感摄像头的支持,从而扫描人脸的 3D 结构图来建模,而 Puppets 仅用普通摄像头也能塑造出实时 3D 动态表情。这是因为 Puppets 的运作原理基于一个由志愿者提供图片和视频集成的庞大数据库,微软通过这个数据库来训练自己的深度神经网络,从而识别用户的表情,比如微笑和眨眼,直接进行模仿。

用户可以通过 Puppets 录制长达 30 秒的视频,视频会实时转化为 3D 动态形象,这些小视频还可以分享到社交媒体或其他平台上。

微软产品经理 Deepak Paramanand 表示:

我们希望 SwiftKey 用户在与家人朋友沟通时,除了预先设置的 GIF 动图之外,还能有更多的选择,因此我们创建了 Puppets。人们希望快速打字,SwiftKey 能够满足这一点;人们也希望以有趣的方式来表达自己,这一点 SwiftKey 现在也能做到了。

记者小结

从应用在 3D 电影中的人脸追踪技术,到苹果开先河的 3D 动画表情 Animoji,再到微软的 Puppets,这些技术和产品或许有其不足之处,但至少可以清楚地看到它们在随着迭代而成长。

值得一提的是,目前推出的 Puppets 还只是测试版,而且仅限于 Android 手机;更多关于 Puppets 的动态,记者(公众号:记者)将会继续关注。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭