当前位置:首页 > 消费电子 > 音频技术
[导读]   或者我们可以把第一次工业革命看作是人类开始系统的思考人类与机器的交互,那或是人机交互的开端,这也许是从人类不自觉情况下开始的,但是从此之后人机交互的进展就再也没有停止过。   我们发

  或者我们可以把第一次工业革命看作是人类开始系统的思考人类与机器的交互,那或是人机交互的开端,这也许是从人类不自觉情况下开始的,但是从此之后人机交互的进展就再也没有停止过。

  我们发现,人类和机器的交流,最开始发生在工厂内。改善人机交互体验的动机是提升工作效率。发展到如今,人机交互的研究已经不单单是为了提升工作效率那么简单。进入21世纪之后,人机交互的思路发生了新的改变。随着技术的进步,各种感应器的出现,开始让让人机交互进入新的阶段。那就是机器可以主动“体会”用户的意图了。虽然目前这种体会还非常的简单,可能只是自动选择屏幕,或者自动调节亮度这样简单。但是这是人机交互的一个本质性的变化。人和机器的交互,不再是简单的“你说我听”。

  此外交互方式的变革也是值得我们注意的,当用户向手机或者计算机发问的时候,输入的方式也改变了。鼠标比键盘方便,触控比鼠标方便,语音输入可以说更加的省时省力。在这一背景下,2015年7月29日,国内顶尖智能语音技术公司——思必驰,在深圳举办【语声纪元】新技术发布会,各路智能硬件大咖齐聚深圳,共迎智能语音交互技术领域的革新一刻,从智能语音技术的角度共同讨论人工智能的发展与未来。

 

  据思必驰CEO高始兴透露,思必驰作为一家领先业界的智能语音技术公司,是国际上最早提出”交互人工智能“并开始研发的技术公司。 现在,随着智能硬件时代的全面到来, “人机交互”的概念也被炒得火热。在移动互联时代,由于交互模态和交互目标的丰富,用户对人机交互的自由度和丰富性的需求日益提升,已经不满足于简单的搜索功能,而是正在逐渐向“任务处理”变迁,思必驰顺应趋势积极开发优势技术。

  现在,移动互联网大潮来了,思必驰觉得是个机会,把思必驰几乎所有的人力、精力和财力向移动互联、智能硬件去专注,去投,专注在扎实的语音技术上,希望服务于广大的移动互联和智能硬件的开发者,做最极致的体验。而智能家居、可穿戴、车载则是目前思必驰最为关注的三大领域。

  

  思必驰CEO高始兴

  2015年,物联网和智能硬件的大风来了,但是思必驰看到市面上诸多的智能硬件在人机交互方面做得还不够好,没达到完美,甚至可以说距离良好的用户体验差距还非常大,甚至可以说,我们现在看到市面上的人机语音交互,还非常的基础。

  思必驰联合创始人、首席科学家俞凯教授则认为,在智能硬件整个生态圈里面,交互是重要的一环,而且,我们认为智能硬件需要一颗心,不仅仅是让每款产品有一个耳朵、嘴巴,还要有大脑,会思考。思必驰当初创业的梦想就是让每个设备能有智能语音,自然与人对话起来。让智能设备有嘴巴、有耳朵、有大脑,这是我们一直以来的梦想和使命。

  俞凯教授强调, “所以我希望思必驰能够一直努力,做好我们的技术,做好我们的方案,做好我们的服务,我们自己跟合作伙伴能够紧密联系起来,一起让每个智能硬件有极致的交互体验。”

  但是目前语音技术面临着巨大的挑战。真正的自由和稳定的人机交互系统不仅需要解决语音的“感知/表达”,即传统的语音识别和合成,更需要解决认知理解和抽象思维的智能。这需要经历两个阶段,一个是传统语音技术的优化,使其更加人性化;二是对话技术的使用,采用认知交互智能提升任务完成的水平和用户体验。

  

  思必驰联合创始人、首席科学家俞凯教授

  此次新技术发布俞凯教授分享了思必驰最新技术突破,包括远场及抗噪技术突破、更先进的回声消除和麦克风阵列算法组合、基于统计的参数化语音合成方法、多轮交互和根据上下文的语义解析。并现场演示了“语音输入板”,赢得满堂喝彩。

 

  俞凯教授现场演示“语音输入板”赢得满堂喝彩

  远场及抗噪技术突破:在国际通用的噪声标准测试库上,思必驰的最新结构化抗噪语音识别技术刷新了国际记录,取得目前世界单系统最好成绩。模型算法的优化突破,使得思必驰仅用软件解决方案就可以达到以往采用语音降噪芯片才能达到的效果,大幅提升了识别率,降低了成本。

  更先进的回声消除和麦克风阵列算法组合:先进的回声消除算法和麦克风阵列算法结合,可以有效的跟踪用户位置,增强语音信号质量,实现高性能的通用语音识别。软硬件结合的多种解决方案,更给出了更多的选择和可能性。仅靠软件且单麦克风条件下,通过大数据整合以及智能算法,思必驰仍然可以达到极为优秀的使用体验,识别速度与准确率均处在世界领先水平。

  基于统计的参数化语音合成方法:传统语音合成是采用拼接技术,录制大规模的语音库,切片后在合成的时候把片段拼起来,这就往往需要大量的标准语音。思必驰采用最新的基于统计的参数化语音合成方法,可以实现模型规模的大幅压缩,语音连贯性的大幅提升,能够自由训练个性化的语音。

  多轮交互和根据上下文的语义解析:在真实场景下,传统语音识别加自然语言处理的方案并不能很好地实现自由的“人机交互”。思必驰在领先的传统语音识别合成技术的基础上,引入交互认知智能,通过情境理解和多轮交互,面向最终任务完成度和用户体验进行系统设计和优化。

  

  会场展示的智能产品吸引了众多眼球

  此外,易观智库的高级分析师封莉、欧瑞博CEO王雄辉、映趣科技CEO王小彬、威仕特CEO闻政亲临现场助阵,分享他们的产品经验极对语音技术的看法。如今的智能硬件市场已从最初的产业蓝海逐渐转变为下一个产业风口,产业生态系统尚未完善,需要多方合力,思必驰正积极联合各方合力,力争推动智能硬件的快速发展。思必驰、FACE++、微动、ablecloud、72变、中发时代联合主办即将于8月中下旬正式启动上线的一档大型活动——“创星计划”,旨在培育中小型开发者成长,推促进智能硬件领域蓬勃发展的创业孵化器计划。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

通顺的自然语言生成 通达的全领域知识体系覆盖 通畅的人机交互接口

关键字: 人工智能 人机交互 大模型

采用启英泰伦推出的第三代高性能神经网络智能语音芯片,包括CI13XX和CI230X系列,芯片集成了启英泰伦自研的脑神经网络处理器BNPU V3,且CI230X系列芯片支持Wi-Fi及 BLE 5.1 无线通信协议。

关键字: 语音 通信系统 智能语音

北京和慕尼黑2023年9月3日 /美通社/ -- 在2023德国国际汽车及智慧出行博览会(IAA MOBILITY)上,宝马集团带来全球首发的BMW新世代概念车,展示了面向未来的出行理念——以人为本、智能为纲、责任为先。...

关键字: 人机交互 宝马 显示屏 集成

北京——2023年8月7日 亚马逊云科技近日宣布,正在将Amazon Bedrock提供的大语言模型能力与支持自然语言问答的Amazon QuickSight Q相结合,在Amazon QuickSight中提供生成式B...

关键字: 人机交互 生成式BI

工业设备在提高工业自动化水平与加快生产效率上有着显著的推动作用。工业HMI(人机交互界面)作为用户与机器之间的沟通平台,具有转换信息、系统控制、人机交流等功能,助力完成工业控制中各种辅助智能操作。随着工业4.0的快速推进...

关键字: 工业HMI 工业4.0 人机交互

在现代工业领域中,随着科技发展步伐不断加快,协作机器人已经成为现代工业和服务领域中不可或缺的一部分。优傲机器人能够与人类共同工作,提高生产力和效率,并减轻体力劳动负担。新时代机械手臂采用一系列先进技术,为工作环境带来了革...

关键字: 协作机器人 人机交互 机械手臂

今日,三星公司在备受关注的Galaxy Note 9的发布会上还推出了它们的第一款智能音箱Galaxy Home,其搭载了应用在三星手机内的智能语音助手Bixby。

关键字: 三星 智能音箱 智能语音

3月14日,2023年德国纽伦堡嵌入式系统展(Embedded World 2023,以下简称:EW23)拉开帷幕。EW23以“embedded responsible sustainable”为主题,与全球展商共同探讨...

关键字: 人机交互 电机控制应用 嵌入式系统

深圳2023年1月18日 /美通社/ -- 近期,锐思华创探讨了ARHUD与智慧交通、智能汽车之间的关系,分享观点如下: 智慧交通的概念诞生于20世纪80年代末90年代初。一方面,当时发达国家的交通基础设施网已基本建成...

关键字: 智慧交通 智能汽车 人机交互 CORE

键盘包括编码键盘和非编码键盘两种。编码键盘带有能够自动识别按键的硬件电路,当按键被按下闭合时,硬件可以提供按键的编号(也被称“键值”),这种键盘使用方便,但是硬件复杂,价格相对较高。非编码键盘不附带按键识别电路,需要利用...

关键字: 键盘 人机交互 编码键盘 非编码键盘
关闭
关闭