当前位置:首页 > 智能硬件 > 机器人
[导读] 随着材料科学、感知人工智能以及5G、云等网络技术的不断进步,将出现护理机器人、仿生机器人、社交机器人、管家机器人等形态丰富的机器人,涌现在家政、教育、健康服务业,带给人类新的生活方式。以5G、A

随着材料科学、感知人工智能以及5G、云等网络技术的不断进步,将出现护理机器人、仿生机器人、社交机器人、管家机器人等形态丰富的机器人,涌现在家政、教育、健康服务业,带给人类新的生活方式。以5G、AR/VR、全息技术、机器学习等新技术使能的超级视野,将帮助我们突破空间、表象、时间的局限,见所未见,赋予人类新的能力。

近日,来自中国AI在这项能力上已经打破了世界纪录。在第二届全球AI视觉对话竞赛(Visual Dialogue Challenge)中,阿里AI击败了微软、首尔大学等十支参赛队伍,一举获得冠军。

这场视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室(FAIR)等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前视觉对话领域最权威的竞赛之一。

竞赛结果显示,阿里AI以74.57%的准确率获得冠军,将上一届比赛的纪录提高了16.82%,并且超过微软AI的64.78%的准确率。而在相同的数据集中,人类的准确率仅为64.27%,AI甚至胜过了人类。传统的视觉AI主要针对目标的检测和识别,但对复杂场景中目标之间的逻辑关系理解、推理能力较弱,无法回答表达图片对象直接关系的复杂问题,也难以将图片信息转化为人类理解的语言输出。这意味着,要实现视觉对话能力,传统的视觉AI在学会“看图”之后,还要有一种语言模型来支撑它“说话”。阿里AI的突破就在于提出了“递归探索对话模型”

目前微软还开放了能“看图说话”的AI系统,用户进入官网上传图片,稍等一会,就能看到系统对于图片的描述。其准确率虽然不低但依旧有待提升,以一张曾经广为流传的黑人问号表情图片为例,AI很快给出了客观的回答:“我觉得这是篮球队员尼克·杨露出牙齿微笑。”

以“看图说话”为代表的视觉对话是近年来快速崛起的AI研究方向,目的在于教会机器用自然语言与人类讨论视觉内容,这能够使机器拥有了对真实视觉世界的理解与推断能力,也意味着AI的认知能力将迈上新的台阶。

正如《2001太空漫游》《流浪地球》等科幻大片中无障碍的人机对话系统所描绘的那样,拥有智能视觉对话能力的AI随着技术的不断突破,正在向我们走来。

市场研究机构 IDC 最新发布的《全球半年度 AI 系统支出指南》显示,亚太地区 2019 年在人工智能 (AI) 系统方面的支出预计将达到 55 亿美元,比 2018 年增长近 80 %。随着各行各业积极投资于利用 AI 软件功能的项目,预计 2022 年将增至 150.6 亿美元。亚太地区正迅速推动 AI 应用迅速增长,因为其数字生态系统非常适合这种新生技术发展。

人体识别指的是运用计算机技术在视频流或图像中对人体进行检测、属性描述以及行为识别,如我们熟知的人体检测与跟踪、人体关键点定位、人像分割、人体行为识别 ReID 技术、手势识别等。

微美全息专注于计算机视觉全息云服务,微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。

微美全息十分注重底层技术的研发,凭借多年来在计算机视觉领域的耕耘与积累,微美全息已经完成了从0到1的技术沉淀、打磨,微美的AI视觉技术已经到了成熟落地,各项技术指标也达到了行业的领先水平。技术成熟后,微美着重规划了从1到N落地应用,其中机器人是规划中非常重要的一环。微美全息云产品布局商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。

微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。

全息面部变化技术基于全息3D图层替换技术,包括基于AI的图像识别和动态融合处理技术,实时跟踪图像以及用其他面部替换面部。该技术取代视频帧中的人脸,合成视频并添加原始音频。微美已经在全息AR插件广告应用中验证了这些技术模块,并将继续开发和升级这些技术模块。微美相信这项技术将为名人广告,电影发行和直播视频流等应用带来新的业务增长。

图:全息三维人脸识别技术

同时,机器人行业也迫切需要AI视觉技术的支持来突破技术瓶颈,解决机器人现有成本、智能化等问题。通过微美全息的图像语义技术,机器人可以进行图像识别、语义分割,结合深度数据可以帮助机器人建立语义地图,实现对周围环境的立体感知与理解,使机器人具备从识别到决策的AI交互能力,实现诸如目标行人追踪、服务机器人送餐上门等功能,大幅提升机器人的智能水平。

近日,中国华为技术有限公司发布了全球产业展望报告GIV2025,认为智能世界正在加速而来,触手可及。根据该报告的预测,到2025年,智能技术将渗透到每个人、每个家庭、每个组织,全球58%的人口将能享有5G网络,14%的家庭拥有“机器人管家”,97%的大企业将应用人工智能。华为全球信息和通信技术基础设施业务首席营销官张宏喜表示:“人类的探索永不止步,从地球到太空要飞得更高,从过去到未来要看得更远,从创新到创造要想得更深。今天,以人工智能、5G、云计算为主导的第四次工业革命所带来的改变,正在改变各行各业,推进智能世界加速到来。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭