当前位置:首页 > 芯闻号 > 充电吧
[导读]如果乔布斯看到最新的 iPhone 11 Pro 后面的三颗吐出来的「浴霸」造型摄像头,不知道会作何感想。当然,不管「乔帮主」可能会怎么看,摄像头个数代表手机档次,已经成为一个潜规则。虽然牺牲了部分造

如果乔布斯看到最新的 iPhone 11 Pro 后面的三颗吐出来的「浴霸」造型摄像头,不知道会作何感想。当然,不管「乔帮主」可能会怎么看,摄像头个数代表手机档次,已经成为一个潜规则。虽然牺牲了部分造型,但确实给手机带来了新的功能,例如获得深度信息,这也是为什么出现了 iPhone 拥有双摄之后,出现了能够虚化背景的「肖像模式」。

新功能需要新玩法,两年前,Facebook 推出了 3D 照片的新功能,正是通过双摄手机的「肖像模式」,让 2D 照片出现「部分 3D」的效果。遗憾的是,当时拥有双摄旗舰机的人还是少数的。几天前,Facebook AI 发布博客,表示通过神经网络训练,现在 Facebook 已经可以将普通单摄手机拍摄的 2D 照片,转化成具有 3D 效果的图片。

除了用户在手机页面停留更长时间,「3D 照片」功能背后的积累,可以落地在更多场景,例如 AR 场景以及无人驾驶。鉴于 Facebook 对于 VR 的野心依旧,这项新功能将如何实现扎克伯格「10 亿人共 VR」的梦想,也令人颇为期待。

2D 照片如何变 3D

同样是 3D 照片,两年时间有什么不一样的?答案是,深度信息。2018 年的 3D 照片功能要依赖当时手机双摄「肖像模式」带来的深度信息,而现在 Facebook AI 可以直接将任何时候拍摄的 2D 照片转化出 3D 效果,不需要深度信息。

抛开深度信息来制造 3D 效果的照片,需要面对两个挑战,一个是训练模型来推测各种物体的 3D 位置,另一个是优化系统来让各种移动设备都能在短时间内将功能跑起来。为此,团队使用卷积神经网络(CNN)训练了数百万对的 3D 照片以及对应的深度信息;同时,利用 Facebook AI 团队之前的开发 FBNet 和 ChamNet 的优化方式,来将功能推广到更多的设备上。

通过这个方式,给出任意一张标准的 RGB 图像,卷积神经网络可以估算出任一像素到摄像头的距离。目前,iPhone 7 及之后的设备,都可以使用 3D 照片功能。

在攻克 2D 照片的深度信息预测算法之后,Facebook AI 团队表示正在尝试将实验扩大到视频范围,后者的挑战在于每一帧画面的深度必须与前后帧的保持一致,同时好消息是,由于视频通常有同一物体的不同视角,能够用来提供更精确的深度信息预测。而这些尝试将让团队强化算法在深度、物体表面以及空间方面的推测能力,并最终将其使用到实时场景之中,例如手机端的 AR 应用上。

如果通过这些方式,能让机器更好的理解立体的现实环境,也会对无人驾驶车辆或者无人机的导航提供帮助。

YouTube 和 3D 民主化

十五年前的 2005 年,YouTube 的三位创始人创立这个平台的时候,最开始的想法是做成视频相亲网站,很难说当时如果他们坚持那个方向,是不是还会变成现在这个视频界的谷歌。当时数码设备尚未流行,员工经常需要跑到用户家里去取用户想要上传的视频的光盘,拿回到公司帮忙上传,可想而知平台前几年发展有多艰难。如果没有后来智能手机的爆发,估计也不会有现在的 YouTube 了。

从 2014 年收购 Oculus,Facebook 在 VR 上下了重注,但是行业发展显然没有扎克伯格当时签支票时预料的那么快。视频 3D 效果的创意,其实早在几年前 Facebook 360 视频团队就曾经尝试过,由于 Facebook 360 项目最终停滞,相关的内容也难以见到了。

这折射了 VR 和 AR 行业发展的一个瓶颈,如果普通用户无法用手机便捷的创建 3D 内容,那么他们可能不会对 VR 或者 AR 产生太大的兴趣。虽然收购了一家又一家 VR 游戏公司,但是用 PGC 的方式生产 VR 内容,毕竟速度和数量都和视频的 UGC 不在一个数量级上。

另一个对 VR 和 AR 抱以厚望的巨头谷歌,曾经收购过 VR 第一个热门应用 Tilt Brush,后者堪称是 VR 时代的「画图板」。该应用曾经吸引了不少国际知名艺术家,在 VR 中挥毫泼墨,吸引了普通用户。但是问题还在于,Tilt Brush 还是需要戴上 VR 头显才能使用,依然有局限性。

带来可能解决方案的,反而是一直闷声积累 AR 实力的苹果公司,后者在 iPhone X 上使用了前置 3D 摄像头模组,用户不仅可以利用其解锁手机,同时还能创建一个模仿自己脸部动态的 3D 动画形象。不过,苹果对于 iPhone「齐刘海」的 3D 摄像头功能控制的很严,无法任意使用,好在 Android 手机厂商随后跟进,将前置 3D 摄像头变成标配。曾经有人用小米手机的前置 3D 摄像头,扫描出物体的大致 3D 模型。

3D 打印厂商清锋科技曾经告诉极客公园(id:geekpark),未来希望人们能使用手机摄像头来扫描自己的双脚,通过得到的 3D 数据,来使用 3D 打印机来制作完全贴合自己脚型的运动鞋。要让手机的 3D 摄像头达到 3D 打印需要的精度,可能还需时日,不过,大致扫出一个物体的模型,现在基本可以做到了,只是手机厂商们仍未想好是否要开放这个功能。

可以想象,有一天你可以像拍照一样,随便一扫就可以建造出眼前事物的模型,肯定会第一时间分享给朋友,或者上传到 3D 版的 instgram 或者 YouTube 上。不过,在那之前,你现在可以先在 Facebook 上,提前体验一下未来。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭