当前位置:首页 > 嵌入式 > 嵌入式动态
[导读]OFweek电子工程网讯:近几年,在新手机面世时的广告语中,“交互新革命”“全新的交互体验”等名词层出不穷,在众多交互方式中最为突出的一种当属语音

OFweek电子工程网讯:近几年,在新手机面世时的广告语中,“交互新革命”“全新的交互体验”等名词层出不穷,在众多交互方式中最为突出的一种当属语音交互。语音交互,说白了就是采用语音助手等系统级应用或者第三方应用来对手机进行控制。自苹果的Siri打开了智能语音助手之门后,各类语音助手野蛮生长,互联网巨头、移动运营商、手机厂商等众多企业纷纷涌入,手机应用市场内多达几十款之多的语音助手让人看得眼花缭乱,各类内置语音操控的智能手机也陆续问世。但是,我们会一个奇怪的现象——并没有多少人去用它。就连整体性能最优的苹果的Siri助手,我们也鲜少看到有人使用,这是为什么呢?本文就粗略来分析一下。

不确定性

目前,大多数语音助手对于自然语言识别率已经达到了一个较高的水准,对于常用的手机语音操控短句识别率较高并且拥有极高的响应速度。但是,识别并不等同于理解,对于一些复杂句式的长句,在人看来很正常很容易理解,机器可能就无法理解。于是,这就导致了一个不确定性的问题:语音助手大多采取一问一答的方式来处理问题,很多情况下你问了却没有回复,一方面是无法准确识别语音内容,另一方面就是系统可能不支持你的语音控制命令。在使用手机助手时,如果经常遇到这样的问题,那就自然有了“说了后未必能得到回复”或是“可能要再说一遍”的潜意识。重复几次失败后,人们自然会对这种理解能力的东西意兴阑珊了。

 

针对不确定性的两个方面,首先固然是语音识别技术本身,自然语言的算法速率和准确率需要进一步提升,另外,还需要庞大的时间去机械地积累语料库,这些可能只能等待人工智能的进一步发展了。就算不用像人类这样聪明,其程度也必须要达到基本通过“图灵测试”(一种测试机器是不是具备人类智能的方法。其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试)。

无法排除的环境干扰

由于手机使用的场所十分多变,有可能时常处于声音极其嘈杂的环境下,所以要实现准确的识别功能,智能设备也需要像人耳一样具有排除噪声的能力。这就涉及到噪声的过滤,这类良好的噪声过滤的实现需要软硬件共同的努力:硬件上,已有的方法例如使用两个麦克风进行信号收集比对,混合处理,达到剔除噪声的目的;软件上,主要依赖于各类滤波算法的使用,这也是最难的,目前大多还停留在实验阶段,并没有什么特别成熟的解决方案。

 

另外,现行的语音操作过程甚至还强迫用户手动辅助完成,这根本是语音助手类应用致命性的缺陷。语音交互的根本目的在于解放人的双手,人机的语音交流应该是具备相较于“触摸”更远的交互距离。比如你的手机在桌上,你躺在沙发上。这时候你拿手机会比较麻烦,所以就会用到语音交互的方式。但较远的距离也势必会影响声音的传达,所以除了噪声过滤算法之外,模糊人声识别也会成为一个必要的技术方向。

无法覆盖App功能

在三大手机平台上,苹果的Siri、安卓的GoogleNow以及微软的 Cortana可以说都算不错的语音助手。但是都有一个通病,就是基本只限于自身系统这个层级,无法渗透到APP中去。或者换个说法,也就是语音助手无法实现完全语音控制。举个例子,使用系统语音助手可以轻松打开一款第三方的音乐播放软件,但是打开这款软件后就没有与之相配套的语音命令了,例如“暂停”、 “下一首”、“调高/低音量”或重复播放等等。从技术角度来说,这种完全语音控制APP几乎不存在任何障碍,几乎所有语音命令系统都能理解上述这些简单的词汇。解决这个也只需系统开发者提供相应的语音助手API(应用程序接口)即可,可是如今却没有一个厂商愿意这么做。

 

其实,这涉及到一个业界生态的问题,虽然语音识别和屏幕触控都可以通过开发API的方式在非系统层级应用中使用。但语音识别是暂时是需要通过云端服务器来实时返回结果的,而不是像屏幕响应这样在本机上就可以处理完成结果。那么就算安卓或是iOS开发出了相应的语音识别API,各大应用服务商会允许谷歌或是苹果深入到应用的数据上面吗?

就像腾讯是以中国几亿QQ用户的关系链数据发家,它是否会允许苹果在语音识别的API上深入到其数据内部呢?所以这些也涉及到商业利益的问题。

隐私及安全问题

在上一节中提到,语音识别会通过云端服务器来返回结果。既然涉及到了云存储,那么又会带来隐私与安全的问题。任何一家公司都无法回避这样的问题,即使是“最好”的苹果公司也因为iCloud导致的好莱坞女星艳照事件而备受指责。

 

撇开个人隐私不说,这还可能上升至国家信息安全的问题。在今年8月,苹果公司把中国用户的数据转存至中国电信的云服务存储器上。从关注信息安全的人士看来,苹果此举相当于“把球踢给了中国政府”。业内人士表示,如果不从法律法规上对跨境数据的流动进行规范和管理,那么即使苹果等境外互联网公司租用中国的服务器,对于中国的信息安全局势而言,安全风险并不会降低,而是变得更高。[!--empirenews.page--]

回归本文,如果语音交互开放到一定程度,未来用户可能使用语音来输入账号、密码或者进行相对私密会话,这类语音信息的安全存储能否得到保证也值得关注。

总结

随着智能手机的发展,关于语音交互的革命仍然会继续,这将是一场持久战。一项新技术的诞生到被人们完全接受使用必定要经历一段阵痛。总的来说,语音控制的未来是光明的,这是一项造福于人类,改变人们生活方式的新型技术,让我们共同期待吧。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

特朗普集团近日取消了其新推出的T1智能手机“将在美国制造”的宣传标语,此举源于外界对这款手机能否以当前定价在美国本土生产的质疑。

关键字: 特朗普 苹果 AI

美国总统特朗普在公开场合表示,他已要求苹果公司CEO蒂姆·库克停止在印度建厂,矛头直指该公司生产多元化的计划。

关键字: 特朗普 苹果 AI

4月10日消息,据媒体报道,美国总统特朗普宣布,美国对部分贸易伙伴暂停90天执行新关税政策,同时对中国的关税提高到125%,该消息公布后苹果股价飙升了15%。这次反弹使苹果市值增加了4000多亿美元,目前苹果市值接近3万...

关键字: 特朗普 AI 人工智能 特斯拉

3月25日消息,据报道,当地时间3月20日,美国总统特朗普在社交媒体平台“真实社交”上发文写道:“那些被抓到破坏特斯拉的人,将有很大可能被判入狱长达20年,这包括资助(破坏特斯拉汽车)者,我们正在寻找你。”

关键字: 特朗普 AI 人工智能 特斯拉

1月22日消息,刚刚,新任美国总统特朗普放出重磅消息,将全力支持美国AI发展。

关键字: 特朗普 AI 人工智能

特朗普先生有两件事一定会载入史册,一个是筑墙,一个是挖坑。在美墨边境筑墙的口号确保边境安全,降低因非法移民引起的犯罪率过高问题;在中美科技产业之间挖坑的口号也是安全,美国企业不得使用对美国国家安全构成威胁的电信设备,总统...

关键字: 特朗普 孤立主义 科技产业

据路透社1月17日消息显示,知情人士透露,特朗普已通知英特尔、铠侠在内的几家华为供应商,将要撤销其对华为的出货的部分许可证,同时将拒绝其他数十个向华为供货的申请。据透露,共有4家公司的8份许可被撤销。另外,相关公司收到撤...

关键字: 华为 芯片 特朗普

曾在2018年时被美国总统特朗普称作“世界第八奇迹”的富士康集团在美国威斯康星州投资建设的LCD显示屏工厂项目,如今却因为富士康将项目大幅缩水并拒绝签订新的合同而陷入了僵局。这也导致富士康无法从当地政府那里获得约40亿美...

关键字: 特朗普 富士康

今年5月,因自己发布的推文被贴上“无确凿依据”标签而与推特发生激烈争执后,美国总统特朗普签署了一项行政令,下令要求重审《通信规范法》第230条。

关键字: 谷歌 facebook 特朗普

众所周知,寄往白宫的所有邮件在到达白宫之前都会在他地进行分类和筛选。9月19日,根据美国相关执法官员的通报,本周早些时候,执法人员截获了一个寄给特朗普总统的包裹,该包裹内包含蓖麻毒蛋白。

关键字: 美国 白宫 特朗普
关闭