当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 任何曾经编辑过磁带或SpoTIfy播放列表的人都知道,当他们在歌曲中传递出了某种情感时,他们就会取得成功。这就是为什么Gracenote的音乐数据专家长期以来一直根据情绪和情感对世界万千繁杂音乐

任何曾经编辑过磁带或SpoTIfy播放列表的人都知道,当他们在歌曲中传递出了某种情感时,他们就会取得成功。这就是为什么Gracenote的音乐数据专家长期以来一直根据情绪和情感对世界万千繁杂音乐进行分类的原因。

而Gracenote团队实际上并没有真正逐首听过他们数据库中成千上百的歌曲。取而代之的是,它教会了电脑去识别情绪,使用机器聆听,借助人工智能(AI)来判断一首歌曲的风格,进而判别是梦幻、性感,还是纯粹的悲伤风格。

机器学习是我们所具有的一个巨大的战略优势,”Gracenote的总经理BrianHamilton在最近的一次采访中说。

据悉,Gracenote在10年前就开始了它所谓的“声音情绪分类”工作。随着时间的推移,传统算法越来越多地被先进的神经网络算法所取代,这项工作也随之进化了。这也已经成为音乐行业对人工智能越来越依赖的最佳例证之一。

举例来说,电脑是如何得知LadyGaga的Lovegame是一首性感热曲的呢?

首先,人工智能是不知道你的感受的。“我们不知道音乐作品会对个体听众产生了什么影响,”Gracenote的研究副总裁在接受采访时表示。相反,它试图将音乐家的创作意图作为一种内在的情感品质,并对这些品质进行辨别。换句话说:它想要教电脑识别哪些歌曲是悲伤的,而不是识别哪首歌会让听众感到忧郁,因为你的感受可能是因为个人的经历而产生不同的情绪。

教电脑识别音乐中的情绪有点像心理治疗

首先,你得说出你的感受。Gracenote的音乐团队最初开发了一种分类标准,这包括了超过100种氛围和情绪,之后又将这个标准扩充到了400多种类别。

其中一些是“性感”和“时髦”这样比较经典的类别,但也有一些极其具体的类别,比如“梦幻感”、“苦乐参半的柔情”和“绝望的疯狂”。新的类别不断被添加,而另一些则根据系统的表现进行了微调。

“这是一个更新换代的过程,”Gracenote的内容架构和探索主管彼得迪马利亚解释说,“分类在不断进化和演进。”

除了这一系列情绪之外,Gracenote还使用所谓的“训练集”来进行机器学习。该公司的音乐专家挑选了大约4万首歌曲作为不同类别歌曲的例子。

汇编这种训练集本身就是一门艺术。迪马利亚说:“我们需要确保提供了正确的范例。”与此同时,范例歌曲必须是这些情绪的最佳例证。他说:“有些歌儿风格有点模糊。”

目前的培训内容包括LadyGaga的Lovegame,这首是性感热曲的范例;电台司令的PyramidSond是哀伤风格的范例;而碧昂斯的MeMyself&I则是感性和亲密风格的范例。

就像情绪本身一样,训练集需要不断地被更新以保持新鲜。迪马利亚说:“艺术家们一直在创造新的音乐表达方式。我们需要确保系统已经听到了这些声音。”尤其是快速发展的音乐类型,如电子乐和嘻哈音乐,需要频繁更新。

对电脑而言,它肯能会将压缩过的歌曲识别为一种音乐风格。一旦系统接受了这些歌曲的训练,它就会被应用到数百万的音轨上。但电脑不会一首一首地听播放列表上的全部歌曲。

相反,Gracenote的系统将每条音轨切割成700毫秒的片段,然后从任何这类片中提取大约170种不同的声学值,比如它们的音色。此外,有时一首歌分辨相似的风格须要用到更长的片段。然后这些值会与现有数据进行比较,这样一来将每首歌曲分类。

这样的结果不仅是得到情绪风格,而是得到每种情绪风格的档案。在此期间,Gracenote的团队必须定期确保不会出错。“混音是一件非常复杂的事情。”乐器、人声和各种效果叠加,并且音乐本身会被针对在汽车音响播放或在流媒体播放的不同而被优化:这样一来电脑可以听的东西太多了,这包括了那些不属于音乐本身东西。“它可以捕捉到很多不同的东西,”他说。

在无人监督的情况下,Gracenote的系统可能会决定关注被压缩的部分,并将它们与情绪相匹配,而Cremer则开玩笑说系统可能会决定:“这些都是96kbps,所以这些歌曲属于悲伤风格。”

被情绪分类的世界音乐

Gracenote将音乐分类按照情绪分类,它之后就会把数据传递给客户,而客户使用它的方式多种多样。较小的媒体服务商通常会授权Gracenote获取他们的音乐数据,并进行端对端的音乐整理和推荐。例如,媒体中心应用开发商Plex使用该公司的音乐推荐技术,为客户提供个性化播放列表,以及被该公司称作“情绪电台”的服务。

Plex的用户可以选择“苦乐参半的柔情”这一风格,然后等着听到MazzyStar乐队的迷幻之音。

Gracenote还向包括苹果和SpoTIfy在内的一些业内最大的音乐服务运营商提供数据。这些大公司通常不喜欢公开谈论他们是如何使用Gracenote的数据的。更大的流媒体服务公司一般都倾向于使用自己的音乐推荐算法,但他们通常仍会利用Gracenote的情绪数据来训练和改进这些算法,或者帮助策展人预先选择歌曲,这些歌曲随后被编辑为播放列表。

这意味着乐迷们可能会敏锐地意识到Gracenote在情绪分类上做的工作,而其他人可能无法察觉该公司的人工智能技术是如何帮助他们提高音乐体验的。

不管怎样,Gracenote必须确保其数据在国际上得到妥善的转码,尤其在它即将在别的国家开展业务之际。

该公司宣布将在欧洲和拉丁美洲开始销售其音乐数据产品,其中包括情绪分类标准,以及在分类中使用到的描述性、整洁的元数据。

为了确保这种转码过程中没有任何损耗,该公司聘请了国际编辑,他们不仅翻译了“感伤”一词,而且还会听一些歌曲,以找出在他们的文化背景下哪种表达最有效。

国际关注是双向的

Gracenote也不断在全球范围内搜寻新的国际声音,以满足其训练集的需求。“我们的数据可以用于所有那些即将消失的声音,”他说。

像Gracenote这样的公司不仅依赖人类,而且还依赖人工智能和机器监听等技术;最终,我们将会能够对全世界所有音乐进行分类。

在很多方面,教计算机识别悲伤的歌曲实际上可以帮助人类获得更好、更有意义的音乐体验。

如果仅仅依靠人类进行分类,那么会有上百万首歌曲无法分类,而人们也无法获得个性化的音乐列表。

利用数据和技术来解锁世界音乐是他工作中最令人兴奋的部分之一,Cremer说:“我在这里的原因是要确保每个人都能接触到所有被妥善分类的音乐。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭