[导读]智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。可以理解为人类与机器间通过自然语言完成信息传递的技术。语音交互的完整流程,如下图所示。通常,根据距离远近语音交互场景可分为两种:近场语音场景:通常通过按键激活,例如智能手机等便携设备。远场语音场景:通常通过唤...
智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。可以理解为人类与机器间通过自然语言完成信息传递的技术。
语音交互的完整流程,如下图所示。通常,根据距离远近语音交互场景可分为两种:
- 近场语音场景:通常通过按键激活,例如智能手机等便携设备。
- 远场语音场景:通常通过唤醒词激活,例如智能音箱等固定设备。
远场语音场景下,在产品策略上通常会采取两种方案,以提高唤醒的准确率:
- 将唤醒词的音节长度增加到4音节。这是因为音节越长,唤醒的准确率就会越高。比如:“小兴小兴”的唤醒准确率远高于“小兴”。
- 白天只对唤醒词做本地校验,夜间则再增加云端二次校验。这是唤醒速度和准确率间的平衡策略。
- 白天用户更看重响应速度,发生偶尔的误唤醒用户能理解或接受,这时候仅由本地的唤醒检测模块进行快速检测,保证 700 ms 内快速响应用户。
- 晚上睡觉时用户对误唤醒是零容忍的,这时候就要偏重唤醒的准确度,将本地检测过的语音上传到云端进行二次确认,再决定本地是否响应。
语音识别阶段的主要作用是采集用于语音,并将语音转换为文字,该阶段主要做两件事情:1. 寻向降噪。寻向的作用就是判断用户方向,由用户方向的麦克风采集语音数据,保证语音的数据是最清晰的。降噪是对环境音进行消除,提高识别准确率。2. 识别语音并转换成文字。为提高特定内容的识别率,一般都会提供热词服务,配置的热词内容实时生效,并且会提升 ASR 结果的识别权重,在一定程度上提高 ASR 识别的准确率。语义理解就是尝试理解人类的语言,即把语音识别的结果转成结构化的、机器能够理解的语言。
NLU 的工作逻辑是将用户的指令进行 Domain(领域)→Intent(意图)→Slot(词槽)三级拆分。例如:“设置一个明早 8 点的闹钟”这样一条指令,经过 NLU 处理,用户的指令则被拆分为如下三级:- 领域:“闹钟”
- 意图:“设置闹钟”
- 词槽:“明早8点”
- 先决策。机器在对话过程中不断根据当前的状态决策下一步应该采取的最优动作。
- 再执行。如提供结果,询问特定限制条件,澄清或确认需求,调用各种 Skill 技能(AI 时代的 APP),从而最有效的辅助用户完成信息或服务的获取。
NLG 的主要目的是降低人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式。简单的 NLG 可以将数据进行合并处理,而高级的 NLG 则可以理解数据想要表达的意图,并考虑上下文,呈现出可以轻松阅读的内容。
目前在一些有比较明显规则的领域中,比如体育新闻,已经可以借助 NLG 进行新闻的自动发布了。也许你现在正在看的一篇文章就是由机器生成的~将文字内容转换成语音输出,让机器跟我们对话。这涉及到两个过程:- 将从文字内容转换成语音输出,让机器说话。
- 合成语音:狭义上专指根据音素序列(以及标注好的起止时间、频率变化等信息)生成语音,广义上它也可以包括文本处理的步骤。
家庭中语音交互的主要应用场景包括:语音查询资讯、语音控制播放、语音免提拨号、语音控制家电等。缩略语:ASR:Automatic Speech Recognition,自动语音识别技术NLU:Natural Language Understanding,自然语言理解DM:Dialog Management,对话管理NLG:Natural Language Generation,自然语言生成TTS:Text To Speech,从文本到语音NLP:Natural Language Processing,自然语言处理IPTV:Internet Protocol Television,网际协议电视OTT:Over The Top,通过互联网向用户提供各种应用服务IMS:Interactive Multimedia Service,交互式多媒体服务IOT:Internet of Things,物联网我们是一群平均从业年限5 的通信专业工程师。关注我们,带你了解通信世界的精彩!
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
智能音箱是一种集成了语音识别、语音合成、智能问答等多种人工智能技术的设备,它能够实现语音交互、智能家居控制、娱乐等多种功能,为人们带来更加智能、便捷的生活体验。以下是智能音箱的主要功能:
关键字:
智能音箱
语音交互
语音交互:对交互效率提升意义重大,理解能力推动大规模落地。语音交互的无 接触属性与自然性凸显其对提升交互效率的意义,在数十年的发展历程中,2000 年以 来语音理解能力的发展推动语音交互以大规模嵌入产品进入商业市场。
关键字:
智能家居
语音交互
语音助手
(全球TMT2022年5月28日讯)奇瑞汽车全新旗舰产品瑞虎8 PRO正式上市。新车搭载了奇瑞全新一代"Lion 5.0 AI科技智慧座舱",率先采用基于地平线征程3芯片打造的Horizon Halo®️...
关键字:
芯片
奇瑞
多模
语音交互
摘 要 :针对家庭用药的储藏管理和安全使用等问题,提出一种智能家用医药箱控制系统设计方案。该设计以树莓派和 STM32 为核心,融合语音交互和图像识别技术,实现了对家庭药物的储藏管理、分类和使用指导。使用树莓派控制摄像头...
关键字:
智能家用医药箱
语音交互
图像识别
物联网技术
药物智能储藏
树莓派
摘 要:i-mirror 智能家居机器人是在智慧生活的概念下将传统家居镜进行改进的智能家居产品。它为居住者提供家电控制、信息获取、环境监控、休闲娱乐、远程操作等一系列智能体验。文中针对智能家居在家庭中的智联互通和信息整合...
关键字:
智能家居机器人
树莓派
人脸识别
语音交互
摘 要:云计算技术和语音识别技术的迅猛发展使得人工智能的实现变得越来越容易,但目前多个硬件软件之间的合作并不友好。文中研究并设计了基于云平台和iOS的语音交互系统,同时通过实验证明了在iOS系统的HomeKit中可以加...
关键字:
云计算
人工智能
iOS
语音交互
9月18日,在2020云栖大会上,达摩院公布了语音AI技术的最新突破:端上语音识别和语音合成能力首次达到媲美云端的水平,这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。
关键字:
达摩院
语音ai
语音交互
通过语言和声音来表达自己的意愿是人与人沟通的基本方式,可是人与机器间却一直存在着沟通上的种种障碍,如何突破这种限制,形成像人与人之间充满智慧、温情的人机交互一直是人类努力的方向。iPhone
关键字:
人机交互
语音控制
语音交互
ivoka
上一代系统使用汽车内置功能来提供娱乐与信息系统,而下一代汽车信息娱乐系统的功能将源于驾车者的移动设备,如iPhone、iPad和其它智能手机及平板电脑。这是一个巨大的变化。信
关键字:
映射技术
语音交互
语音识别
车载语音识别
在行车过程中,注意力分散会影响驾驶员的操控,容易导致交通事故,车载语音交互技术的出现很好的解决了这个问题。它的重要作用就是提升驾驶的安全性,为用户创建一个丰富、便捷和安全的车生活。
关键字:
华强聚丰
思必驰
电子发烧友
语音交互
如今,人机交互技术应用潜力开始凸显,比如智能手机配备空间跟踪技术,应用于虚拟现实、遥控机器人及远程医疗等的触觉交互技术,对于有语言障碍的人士的无声语音识别,还有各种创新技术,如指纹识别、TD
关键字:
思必驰
语音交互
车联网
李彦宏称,牛顿、达尔文、霍金都是对他产生了非常深远影响的“剑桥人”,而对他启发最大的,则是知名诗人徐志摩和人工智能之父——艾伦·
关键字:
人工智能
图像识别
百度
语音交互
不论是不温不火的智能穿戴、智能家居类产品,还是最近大火的各种用途的智能机器人。我们明显感受到在硬件智能化的过程中,语音交互已成为一项普遍并且关键的交互、控制技术,只需动一下“嘴巴
关键字:
机器人
科大讯飞
语音交互
随着人工智能行业的快速发展,未来机器人都将在各行各业发挥重要的作用,且充满无限可能。在电影《超能陆战队》中,机器人主角“大白”既能识别他人跟它说的话,又能&ldquo
关键字:
思必驰
机器人
语音交互
“人工智能无成本复制的能力和持续向前进化的能力是人类自身所无法比拟的。”在科大讯飞研究院院长胡国平眼中,人工智能的无穷魅力就在于此,“人类智能无法复制。即
关键字:
人工智能
语音交互
马云说:“过去是知识驱动,未来是智慧驱动;过去把人变机器,未来把机器变人。”杨元庆说:“每一台终端又从云端汲取智慧,更能理解人们的需求,能用自然语言与人们交流
关键字:
2016iot大会
人工智能
声瀚科技
语音交互
2017年已然开始,人工智能将会是大家关注的焦点。无论是创业者还是投资人,无论是国内还是国外,都掀起了人工智能热潮。那么,2017年人工智能会有哪些行业趋势呢?
第一个趋势是,全
关键字:
人工智能
机器人
语音交互
编者按:语音助手和语音交互领域的市场争夺已经在2017CES上初现锋芒,除了原有的美国亚马逊、谷歌、微软等国际厂商不断推进这个领域新产品,国内科大讯飞,包括华为都在全力开拓这个领域。语音交互作为
关键字:
alexa
科大讯飞
语音交互
谷歌
3月10日,由智东西、AWE、极果等联合举办“GTIC 2017全球(智慧)科技峰会”在上海证大喜马拉雅中心正式开幕。地平线机器人副总裁张永谦发表了名为“&l
关键字:
人工智能
传感器
智能家居
语音交互
苹果即将发布的iOS 10.3版本中,内置的Siri能够支持上海话了;Assistant支持下的Google Home有望在今年加入通话功能;Alexa到2020年将为亚马逊创造100亿美元的营
关键字:
智能家居
物联网
语音交互