当前位置:首页 > 智能硬件 > vr|ar|虚拟现实
[导读] 近期,Oculus为三星Gear VR虚拟现实头盔增加了两项分别名为“ParTIes”和“Rooms”功能,旨在提高用户在使用VR设备时进行更多的

近期,Oculus为三星Gear VR虚拟现实头盔增加了两项分别名为“ParTIes”和“Rooms”功能,旨在提高用户在使用VR设备时进行更多的互动交流。2016年FaceBook创始人扎克伯格在VR计划会上也讲到,“VR将成为下一个计算平台,将带领人们完全颠覆现有的网络社交模式。”VR社交概念被炒得如火如荼,但VR路途却并不那么美好,首先,现今面临的问题就是语音交互的问题。今天,小编就来为大家讲讲VR语音交互的这个问题。

一、科大讯飞语音引擎系统

InterReco语音识别系统

科大讯飞推出全球领先的InterReco语音识别系统,InterReco驱动自助语音服务和语音搜索业务,是语音商务(V-Commerce)的核心动力引擎。目前,InterReco语音识别系统已经能够利用先进的自助语音服务解决方案来处理日益增长的信息咨询、电子交易和客户的服务需求。基于InterReco的解决方案帮助用户在任何时候、任何地点通过随处可得的电话轻松自然的获得信息与服务,享受高效、稳定、便捷的应用体验。

InterReco语音识别系统采用分布式架构,继承了科大讯飞久经考验的电信级语音平台高稳定的特点,可以满足电信级应用的高可靠性、高可用性要求。针对传统语音识别产品集成开发困难,业务设计繁琐的问题,InterReco产品大大简化了集成开发和业务开发的复杂度,为系统集成人员和业务开发人员提供了便捷、高效的开发环境。

InterReco产品的主要功能组成模块及结构

InterReco语音识别系统主要包括应用接口、识别引擎和操作系统适配三个层次,这三个逻辑层共同构成完整的InterReco系统架构。

应用接口是InterReco系统提供的开发接口,集成开发人员应关注这些接口的定义、功能和使用方法。识别引擎提供核心的语音识别功能,并作为应用接口的功能实现者;同时

为了便于开发和使用,系统在这一层提供了一系列高效、易用的工具。操作系统适配层屏蔽了多操作系统的复杂性,为识别引擎提供操作系统相关的底层支持。

InterReco语音识别系统按照逻辑组成可以分为识别语法(Grammar)、识别引擎核心(Recognizer Core)、语音端点检测(Voice AcTIvaTIon Detector)、音频输入(Audio Source)四个子系统,系统的主要设计和开发将按照这些子系统进行。

嵌入式语音Aisound系列产品

同样,科大讯飞还提供了电信级及嵌入式语音合成技术,嵌入式语音Aisound系列是公司一款全球领先的语音合成技术,其尺寸小,资源占用低,效率高,主要应用于嵌入式领域的语音合成软件模块。适用于不同行业的语音播报和应用需求。

科大讯飞嵌入式语音方案主要提供:XFS3031CNP中文语音合成芯片、XFS4243CE中英文语音合成模块、XFS5152CE中英文语音合成芯片、XF-S4240中文语音合成模块等四套语音合成方案,目前已成功应用于车载调度仪、信息机、气象预警机、考勤机、排队机、手持智能仪表、税控机等各类信息终端产品上。另外,语音引擎还提供轻量级语音合成软件Aisound,支持的嵌入式平台和支持功能应用均非常广泛。

XFS3031CNP中文语音芯片系统构成图

科大讯飞语音合成系统框架图

二、云知声“远场语音识别技术”方案

在语音云平台方面,云知声主要在语音识别、语义理解以及语音合成等三方面具备自身的技术优势。语音交互作为VR领域的一个交互入口,云知声更是强调适应各种不同日常场景的交互技术,目前,云知声主要针对语音云平台、智能车载、智能家居、教育等四个垂直领域的语音识别技术提供解决方案。

云知声研发的最新语音技术——“基于双麦克风阵列的远场语音识别方案”。 这款方案采用了世界领先的SSP技术可以有效抑制用户语音之外的噪声和混响效应,做到在95%以上的场景中可以有效地进行远场拾音,配合云知声的远场语音识别引擎,保证了5米距离内,达到精准的识别效果。同时,由于该方案只需要2只麦克风,安装位置灵活,也无需考虑设备朝向。

云知声“云端芯”生态

云知声提供语音识别、语义理解、语音合成、声纹识别等多项语音核心技术,云知声开放平台支持一站式语音应用开发,可自主创建语音应用、并可添加相应的匹配需求方案,通过平台类型设置完成SDK集成包开发,并完成语音产品上线发布。

三、声网Agora.io实时语音系统

声网Agora.io语音SDK采用全球独有的32khz超宽频音质,是普通电话音质的4倍,并提供多声道音效系统,实现VR体验中的“听声辩位”,堪比3D音效。更重要的是,实时语音还可以完美的与游戏背景音乐融合,大大增加了用户的临场感。

除了音频处理上的优化,声网Agora.io依托全球部署的虚拟通信网络,确保为游戏应用提供不卡、不掉线、超低延迟的体验,特别针对网络状况不好情况下的独特优化,可极大提高游戏应用和游戏直播的互动性。这一“重量级武器”,开发者只需要30分钟集成即可轻松完成。

针对无法实现基本的听音辨位问题,声网Agora.io推出了多声道音效系统解决方案。通过集成语音通话SDK,可获得拥有实时高清音质、32khz超带频的语音编解码器NOVA,实现VR画面中声音的立体化环绕,让用户感受到来自四面八方环绕的声音,同时通过智能化回声消除和降噪功能,让用户可以通过声音精准定位空间位置,实现良好的画面沉浸感受。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭