当前位置:首页 > 芯闻号 > 充电吧
[导读]11月6日,锤子科技在成都举行了新品发布会,发布了首款智能音箱—;—;“大卫和希瑞高级智能音箱 D1”。据了解,锤子的这款音箱搭载了猎豹移动旗下人工智能公司猎户星空的全套语音OS解决方案,包括语音合成

11月6日,锤子科技在成都举行了新品发布会,发布了首款智能音箱—;—;“大卫和希瑞高级智能音箱 D1”。

据了解,锤子的这款音箱搭载了猎豹移动旗下人工智能公司猎户星空的全套语音OS解决方案,包括语音合成(TTS)、自然语言处理(NLP)、语音识别(ASR)等一系列的技术。

同时,猎户星空还针对锤子打造了业界首个“一人分饰两角”的声音人设引擎。基于大数据情感的语音合成、汉语语音合成引入重音,打造了智能语音助手在生活和工作中的不同性格特征。

老罗在现场表示,今后还将联合猎户星空,推出更多有个性的人物设定。他同时感谢合作方猎户星空,“我们提了最多、最‘变态’和最让他们意外的需求,他们仍然给了我们最好的支持。”

在猎豹移动的“321机器人之夜”上,老罗就曾为好友—;—;猎豹移动董事长兼CEO傅盛站台,并表示“猎户语音OS是市面上最好用的语音OS”。今天回到锤子的主场,老罗也用行动证明了自己当时打的Call。

发布会现场,老罗还和机器人“傅盛”进行了一场对话。据了解,机器人“傅盛”是猎户星空研发的语音合成技术,傅盛本人只录制了十段话,就达到了“以假乱真”的效果。

老罗:“市面上最好用的语音OS”

语音交互能力被看作是智能音箱的“灵魂”。据不完全统计,目前国内有数十家“语音开发平台”,竞争十分激烈。作为老罗口中“最好用的语音OS”,猎户星空为什么能从众多竞争对手中脱颖而出,为手机界里最具“工匠精神”的锤子科技保驾护航?

双人设-TTS

双人设引擎功能是本次发布会上的最大亮点之一。这是猎户针对锤子打造的业界首个“一人分饰两角”的声音人设引擎。

不同于以往的语音交互体验中,只有一个声音一个人设,或最多支持声音的切换。

双人设引擎功能采用猎户的语音合成技术,基于大数据情感的语音合成、汉语语音合成引入重音,打造了男生“耿大卫”、女生“何希瑞”在生活和工作中的不同性格特征。

在语音合成的声音风格和文本语料的设计上,呈现出男友风、男职业风、女友风、女职业风的性格特征,满足不同的用户需求。


女生“何希瑞”


男生“耿大卫”

在双人设的TTS合成上,猎户星空也花了很大的心血。从最初的发音人挑选到最后的语音合成,严格把控每一个环节,只为把合成的声音做到最好。

在确定好人设风格后,从200个发音人中投票选出男、女发音人,经过3个月的时间,打造出人设相关的情感语音库。

因为是同一个发音人“分饰两角”,为了保证声音效果的完美呈现,猎户TTS团队在参数的调优和效果的打磨上下了很大的功夫,最终呈现出同一个人生活和工作中,声音温柔甜美和干净利索的双人设风格。

中英文混合识别能力

多语种混合Query的识别是语音技术中攻克的难点,例如,“我想听Taylor Swift的One More Night”这样一句普通的需求,正常人都可以理解。

但是对于智能音箱来说,就是一个不小的挑战。这是因为,语种切换对语言模型带来了更大的复杂度。

为了解决这一难题,猎户语音OS团队投入了大量的精力,特别是针对性优化了中英文点播体验,达到了行业领先效果。

其中一项重要工作就是,提升训练数据的数量和丰富性:猎户语音OS拥有上千小时的远场中英文语料,可用于语言模型的训练;建模一千多个中文音节,并用中文音节建模英文发音。

此外,猎户语音OS还支持8万首新热的英文资源歌曲与8千名英文歌手的点播。这些数据成为了猎户语音OS的“基础设施”。

除了丰富的数据积累,猎户星空还拥有独特的技术壁垒:基于远场的语音语义一体化技术,可以提高远场交互中高频Query的识别率,让机器更好地听懂世界;其次,围绕音频内容进行深度定制,动态地更新模型;最后,做好口语化指令泛化,让点播粒度更细。

在团队的共同努力下,猎户语音OS的通用内容点播准确率超过90%,在行业内遥遥领先,同时还支持中英文、儿童、翻译、车载等场景识别。

猎户语音OS成为行业标配

作为应用最广的中文语音合成技术,猎户语音OS技术占有中国智能语音市场份额超过30%,累计激活设备超过3000万。截至目前,猎户语音OS每天线上语音指令超过2000万次,拥有上百万小时的远场语音数据积累。

猎户星空过去一年在AI硬件赛道奔跑的历程,一直拥有两个核心的逻辑:自主研发完整技术链条,以及整体战略上的开放心态。

猎户星空的整套AI技术都是自主研发,包括语音识别、图像识别、视觉导航等,所以猎户星空能根据场景来定制算法,打造更好的用户体验。

具体到猎户语音OS上,全链路自研会让不同技术环节的衔接更为融合,让语音交互更为迅速准确:垂直领域深度语义理解96%的正确率、远场语音识别率达到行业领先的97%、全链路流畅网络下1.5s的平均响应速度。这些都是“下苦功夫”之后带来的回报。

智能语音的发展不断成熟,为各行各业带来新的发展机遇。猎户星空在打磨自己技术的同时,也在将技术优势赋能行业。

据了解,猎户语音OS已经应用到了华为、小米、美的、喜马拉雅、猎豹移动等多家合作伙伴的产品中,成为“应用最广泛”的AI语音系统。

10月15日,中国人工智能产业发展联盟(AIIA)在人工智能开发者大会公布了国内智能音箱智能化评级结果,包括猎豹移动、小米、喜马拉雅、百度、京东在内的五家主流厂商携其智能音箱产品参与了首批测试评估。

猎户语音OS占据了获评产品前五强中的三席,支撑起了智能音箱市场的大半壁江山。

结合自身人机交互的产品基因和猎户星空拥有的行业唯一的全链条AI技术,猎豹移动也在不同行业推动人工智能产品的场景化落地。

未来,猎豹移动与旗下猎户星空还会将自主研发的视觉、导航、语音、机械臂技术等核心能力逐步对外开放,与合作伙伴一起,让机器人产品走进大众生活。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

【2023年11月1日,德国慕尼黑讯】在近日举办的OktoberTech™ Silicon Valley活动上,全球功率系统和物联网领域的半导体领导者英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY...

关键字: 毫米波雷达 Wi-Fi 智能音箱

2023年8月30日——全球半导体存储解决方案领导厂商华邦电子与快速增长的硅知识产权(SIP)、平台与 IP 设计服务供应商 Mobiveil 今日宣布,双方将合作开发全新的 IP 控制器,将应用场景拓展至汽车、智能 I...

关键字: IoT 控制器 智能音箱

亚马逊和谷歌在人工智能领域一直都处于领先地位,一直都积极的将技术实现落地。不过在智能家具这块市场上,亚马逊先做表率,早在2014年就发布了智能音箱硬件产品Echo,虽然亚马逊Echo在智能音箱领域属于开创者,但考虑到谷歌...

关键字: 谷歌 智能音箱 Google Home

智能音箱是近年来越来越流行的智能家居设备之一,它们可以通过语音命令或者手机应用程序进行控制,为用户的生活带来诸多便利。目前市面上的智能音箱品牌和型号越来越多,不同的智能音箱产品在性能、价格等方面都有所不同。本文将对市面上...

关键字: 智能音箱 智能家居

Facebook是一家全球知名的社交媒体公司,近年来也在智能音箱领域有所布局。Facebook的智能音箱产品主要包括 Portal 和 Portal Plus,以下是具体介绍:

关键字: Facebook 智能音箱 Portal

小米智能音箱是一款集成了语音助手和智能家居控制功能的音频设备。它具有优秀的音质、丰富的功能和实用的语音助手,但是也存在一些缺点。本文将对其性能进行详细评测,探讨其优劣势。

关键字: 亚马逊 智能音箱

小米智能音箱是一款集成了语音助手和智能家居控制功能的音频设备。它具有优秀的音质、丰富的功能和实用的语音助手,但是也存在一些缺点。本文将对其性能进行详细评测,探讨其优劣势。

关键字: 小米 智能音箱

亚马逊的智能音箱产品是该公司的一款非常重要的产品,它采用了亚马逊的Alexa语音助手技术,可以执行许多语音指令,例如播放音乐、回答问题、设置闹钟、购物等等。智能音箱产品是亚马逊在智能家居领域中的一项重要创新,它使用户能够...

关键字: 亚马逊 智能音箱

智能音箱是一种内置智能语音助手的设备,可以与用户进行交互,通过语音控制家庭设备、播放音乐、查询天气、设定闹钟等。随着智能家居的普及,智能音箱也变得越来越受欢迎。如果您想购买一款智能音箱,以下是一些您可能需要考虑的因素以及...

关键字: 智能音箱 语音设备

智能音箱是一种内置智能语音助手和互联网连接的音箱,它可以接受语音命令并执行相应的任务,例如播放音乐、回答问题、控制家庭设备等。智能音箱技术的发展已经使得人们可以通过语音指令来轻松地实现各种操作,大大提高了人们的生活质量。

关键字: 智能音箱 语音助手
关闭
关闭