当前位置:首页 > 芯闻号 > 充电吧
[导读]AI换脸又一次刷爆了朋友圈 最近云毕业正当时,各家科技公司顺势推出了自己的AI换脸技术,结果又被同学们玩坏了! 换脸这件事绝不能少了业界大佬们! 不得不说,好看是不分性别的,彦宏兄气质满分! 仔细来看

AI换脸又一次刷爆了朋友圈

最近云毕业正当时,各家科技公司顺势推出了自己的AI换脸技术,结果又被同学们玩坏了!

换脸这件事绝不能少了业界大佬们!

不得不说,好看是不分性别的,彦宏兄气质满分!

仔细来看,AI换脸技术近些年还是成熟不少,整体的面部贴合度、细节处理都有了明显的提升。近日,Deepfake领域再一次取得了重要突破。据了解,迪士尼公司公布了一项最新研究成果,声称其人脸交换技术可达到业内最高水平。

从效果图来看,果然一点挑不出毛病!

据了解,迪士尼研究室与苏黎世联邦理工学院合作基于GAN提出了一种新型算法,它可以自动实现图像/视频中的人脸交换,同时保证数百万级的高分辨率。

更值得关注的是,目前这项研究成果已初步计划用于好莱坞大片制作,据说因为它可以改善电影质量和后期制作成本。

走进好莱坞大片的Deepfake

人脸交换在电影行业并不罕见。在一些好莱坞大片经常会用到替身演员完成一些专业的、高难度动作。为了保证电影效果,后期制作会花费大量成本。然而常见的计算机图形合成技术,效果常常差强人意,甚至会翻新重拍。

这在时间和金钱方面都是非常大的成本消耗,因此,迪士尼公司特此联合苏黎世联邦理工学院开展了此项合作研究。

近日,迪士尼公司对完宣称,他们研究了一款新型人脸交换技术,可用于电影或电视剧制作。他们声称该技术可在人脸交换过程中产生高分辨率,逼真的图像/视频,非常适合大屏幕播放。

局部融合更考验换脸的技术难度。为了验证算法性能,研究人员他们没有对人脸的眼部、唇部等局部器官进行了融合,效果也是非常惊人。

基于图一,图二、三分别进行了唇部和眼部的局部人脸融合,可以看出局部融合度非常高,高清、自然,看不出一点破绽。同时它能够随着唇部抖动实时贴合,毫无跳脱感。而且研究人员证实,视频中的人脸交换一般比静态图像效果更好。

局部人脸交换在动态视频中的融合优势,这在电影场景中是非常必要的。

更值得关注的是它可以产生百万级像素的分辨率。不过,研究人员表示他们采用了一种渐进式的方法(Progressive Training)对源视频/图像进行预训练,算法可从中提取较高分辨率图像。下图可明显看到经训练的人脸像素远高于未经训练的结果。

研究人员介绍,基于高清分辨率和局部融合技术的新型算法最大限度地扩展了人脸交换在电影中的应用。除了替身演员的全脸交换外,如需要刻画一位年龄逐渐增长的任务或已经进入垂暮之年的老人,可以根据需要为角色添加细微皱纹、发型和体态。

另外,它可以与其他作品完成表演上的替换,当然这里可以对原视频的背景和光照进行特殊处理,以使他可以融入电影场景中。这也是区别于传统后期制作的一种新方法。

基于梳状模型的最新算法

那么这项AI换脸技术是如何实现的呢?我们先来看一组完整的换脸路径图:

步骤1和2:对源图像进行面部识别、特征提取,以及标准化剪裁(1024x1024);

步骤3:将图像输入通用编码器进行模型训练;

步骤4:将解码后输出的图像与需要匹配的目标进行多频带混合,最终得到人脸交换后的效果图。

其中通用编码器的训练模型是一个关键,这里研究人员采用的是一种渐进式梳状网络结构(Comb Model)面部交换主要是通过域转移的方法来实现。我们使用通用编码器将经预处理的图像嵌入共享的潜在空间中,然后使用与之对应的解码器将这些嵌入映射回像素空间中。通常域转移主要在这两个空间中进行切换,但在本文中,研究人员扩展了一种新的思路。

如我们图中看到的,经编码器处理的图像,被解码器分支到P个域中,研究人员将这种架构成为梳状模型。这里各个编码器就相当于梳状结构的“齿子”。

在这里,单个梳状模型可以处理多个源目标的人脸融合,而且与双向模型相比,它可以有效减少训练的时间,同时明显提高图像的保真度

如前文所说,模型训练采用的是一种渐进式的方式。该过程通过对高分辨率图像进行下采样,得到低分辨率图像,然后在训练中再逐步输入高分辨率,逐渐扩展网络的容量,最终得带高保真图像。

不过,这里要注意的是,最终输出的图像分辨率会受到原始数据集图像分辨率的限制。如果数据集缺乏高分辨率,可以采用超分辨率的方式对图像进行预处理,不过最好采用特定于面部的SR训练方法。

除此之外,研究人员介绍,梳状模型和多频带的混合策略,还有助于保持融合背景的光线和对比度。

对比分析,优势明显

研究人员将渐进式梳状模型与目前三种开源的人脸技术,分别为Deepfake、DeepFaceLab和Nirkin et aI进行了对比研究。其中,Nirkin et aI采用三维可变模型,不需要预训练。后两者采用Y形自动编码器结构的实现。


人脸交换方法的比较

本次试验对五组人脸进行了对比。前两列分别源图像和目标图像,需要进行AI融合,从之后的图像可以看,本次研究模型在细节融合、图像分辨率以及阴影处理上,要高于其他算法模型。

而且,它采用的多频带混合在消除伪影方面要明显优于泊松混合。DeepFakes和DeepFaceLab都的使用是泊松混合(Poisson)。

不过,研究也存在明显的局限性,比如显示无法对戴眼镜的人进行稳定的人脸交换,不是因为眼镜部分无法渲染,而是无法将脸部与周围图像混合。研究人员曾尝试调整输入源与之相匹配,但结果时好时坏。、

不过,研究人员也解释在实际应用或电影场景中,可能影响不大。



本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks 公司的合作伙伴团队与ST 共同讨论了对边缘机器学习的看法,并与 STM32 社区分享了他们的设计经验。

关键字: AI 机器学习 处理器

业内消息,在昨天的中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标Sora...

关键字: Sora 清华 AI Vidu

OPPO今日推出 Find X7全新配色 ——「白日梦想家」,为消费者带来更多选择。新配色采用独特釉层处理工艺,焕发如白瓷般柔润细腻的光泽,带来初夏般的清爽。Find X7「白日梦想家」以敢想敢做,坚韧信念、无限潜能的信...

关键字: Find X7 大模型 AI

4月26日,MediaTek宣布推出天玑汽车平台新品,以先进的生成式AI技术赋能智能​汽车的体验革新。

关键字: AI 汽车电子

2024年4月26日,中国深圳——2024年是OPPO品牌成立20周年。在2024年世界知识产权日,OPPO正式发布首份《OPPO创新与知识产权白皮书》,系统性地展现了OPPO 20载技术创新和知识产权保护成果。

关键字: OPPO 知识产权 AI

「人工智能浪潮下的中国制造」论坛顺利召开 上海2024年4月17日 /美通社/ -- 4月12日,由百年名校法国里昂商学院主办,斯巴诺萨设计承办,福州东湖数字小镇,福建亚太合会数字经济专委会协办的"中法建交6...

关键字: 微软 雷诺 AI 中国制造业

根据调研机构Gartner的预测,由于竞相投资AI以及IT设备更换周期的到来,全球2024年的IT支出将增长8%。

关键字: GenAI IT AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

眼下,人工智能不仅能辅助科学研究与艺术创作,还能实现自动驾驶、打造“无人农场”和“黑灯工厂”,成为解锁新质生产力的关键钥匙。

关键字: 人工智能 AI 无人农场
关闭
关闭