当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 一般利用均衡器可以将音乐中的低音部分调出来,但是麻省理工学院的计算机科学和人工智能实验室(Computer Science and ArTIficial Intelligence Lab,CSA

一般利用均衡器可以将音乐中的低音部分调出来,但是麻省理工学院的计算机科学和人工智能实验室(Computer Science and ArTIficial Intelligence Lab,CSAIL)的研究人员发现了更好的解决方案。他们所研发的新系统 PixelPlayer,能够利用人工智能来区分和过滤声音,让音乐听起来更洪亮或更柔和。

将指定视频录入经过充分训练的 PixelPlayer,系统随机能够过滤伴奏,同时识别音源,接着计算图像中每个像素的音量,然后通过“空间定位”确定产生相似音波的片段。

今年9月,德国慕尼黑即将举行欧洲计算机视觉会议(European Conference on Computer Vision),会议中要发表的一篇新论文则详细论述了“像素的声音(The Sound of Pixels)”。麻省理工学院计算机科学和人工智能实验室的博士生,同时也是这篇论文的合著者 Zhao Hang 同学表示,“最好的情况就是,我们能识别出哪种乐器发出怎样的声音。”

PixelPlayer 的核心是一种基于乐器组合多模态训练的神经网络,数据集采用了 Youtube 上 714 条未经修剪且未经标记的视频。其中,总时长为 60 小时的 500 条视频用于训练,剩余的则用于验证和测试。在训练过程中,研究人员分别根据原声吉他、大提琴、单簧管、长笛和其他乐器向系统馈入了算法。

这只是 PixelPlayer 多重机器学习框架的一个部分。经过训练后的视频分析算法将从剪辑帧中提取出视觉特征,这就是系统的第二个神经网络,即音频分析网络。音频分析网络将声音拆分为片段,并从中提取特征。最后,音频合成网络将把上述两个网络输出的特定像素和声波关联起来。

PixelPlayer 进行完全自监督的学习,人们无需对数据注释,而且系统目前已经能识别 20 种乐器。Zhao Hang 说,较大的数据集增强了系统的识别量,但识别乐器子类的能力却不佳。系统也可以识别音乐元素,例如小提琴的谐波频率。

研究人员认为 PixelPlayer 可以进行声音剪辑,或者帮助机器人理解动物、车辆和其他物体所制造的环境声音。他们写到,“我们希望我们的工作能够开辟新的研究途径,从视觉和听觉信号角度实现声源分离”。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

● Arm® 终端计算子系统(CSS)作为新的计算解决方案,结合了Armv9架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新Arm CPU和GPU实现,可赋能芯片合作伙伴快速创新,并加快产品上市进程。 ●...

关键字: AI 人工智能

高性能存储最远可以出现在什么地方?对于铠侠而言,从遥远的太空,到身边的手机、家电,几乎所有智能化设备与存储息息相关,特别随着各行各业对存储需求不断增多,存储容量和性能变得更为重要。

关键字: 存储 物联网 人工智能

5月30日消息,据媒体报道,日本经济产业省近日宣布,将在半导体、先进电子零部件、蓄电池、机床及工业机器人、飞机零部件等五大关键产业领域实施更为严格的监管措施,以遏制技术外泄风险。

关键字: 半导体 传感器 人工智能 电动汽车

5月26日,华为ICT大赛2023-2024全球总决赛闭幕式暨颁奖典礼在深圳举行。本届大赛为华为历届最大规模的线下比赛,共吸引了全球80多个国家和地区、2000多所院校、17万余名学生报名参赛,经过国家赛、区域赛层层选拔...

关键字: ICT 华为 大赛 人工智能

近日,整数智能与浪潮信息签署元脑生态战略合作协议。双方将秉持协同共生、开放共赢的原则,在元脑生态的框架内开展AI与数据科学领域的深度协作,共同为各行业提供更安全高效的数据管理平台,用智能标注助力数据生产的低成本、高精度、...

关键字: 自动化 人工智能 元脑生态

2024年5月25日,上海市欧美同学会长宁分会与曼彻斯特大学中国中心以"智能向善 AI for good"为主题,联合举办了"第二届人工智能论坛"。人工智能领域的企业家和专家学者发表主题演讲及参与圆桌论坛,逾百余位海归学...

关键字: 人工智能 AI 大语言模型

进入人工智能时代,数据重要性进一步凸显。今年,国家数据局等17部门联合印发的《"数据要素x"三年行动计划》指出,要以数据驱动发现新规律、创造新知识,加速科学研究范式变革。北京材料基因工程高精尖创新中心在浪潮信息助力下,通...

关键字: 新材料 数据中心 人工智能

2024年5月28日,中国上海 —— 今日,备受瞩目的Keysight World Tech Day 2024在上海隆重拉开帷幕。作为是德科技年度盛大的技术交流盛会,它不仅是电子测试测量及相关应用领域最新行业趋势与前沿测...

关键字: 测试测量 人工智能 新能源汽车

加利福尼亚州 坎贝尔 – 2024 年 5月 21 日 – Arteris, Inc.(纳斯达克股票代码:AIP)是一家领先的系统 IP 供应商,致力于加速片上系统(SoC)的创建,晶心科技(台湾证券交易所股票代码:65...

关键字: 片上系统 RISC-V 人工智能

5月23日消息,近日在澳门举行的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰表示,中美在通用大模型底座上的差距,是半年到一年半之间的动态追赶,不会被甩开。

关键字: 科大讯飞 人工智能 AI
关闭
关闭