当前位置:首页 > 原创 > 21ic专访
[导读]随着技术的发展,人机交互界面在不断改进,从最初的命令行、窗口图形界面再到触摸屏,人机交互的方式变得越来越人性化。触摸屏之后,又会有哪种交互方式带来新的变革呢?无疑,语音技术最令人期待,因为它是人类最自

随着技术的发展,人机交互界面在不断改进,从最初的命令行、窗口图形界面再到触摸屏,人机交互的方式变得越来越人性化。触摸屏之后,又会有哪种交互方式带来新的变革呢?无疑,语音技术最令人期待,因为它是人类最自然的交流方式。试想,如果你家的电器设备都能像你的朋友一样听懂你的要求,并按照你的要求作出正确的反应,那该是多么美妙的体验。时下,这种语音交互技术正越来越多地应用到我们身边的电子设备中。

早在2011年,IBM的超级电脑“沃森”战胜美国智力问答节目《危险边缘》的两名冠军选手,引起极大轰动。从某种程度上说,沃森已经可以和人类实现自如语音交流,这离不开其背后强大的计算性能。据介绍,IBM耗费数年才研制出沃森,沃森拥有10组Power 750服务器,运行linux操作系统,具有15TB内存,2880个处理器,每秒可进行80万亿次运算,而其体积有10个冰箱大小。

编辑视点图片1.jpg

图 IBM沃森参加美国《危险边缘》智力问答节目现场


虽然要实现像沃森这样的自如地人机交互还挑战重重,但这并没有阻止语音技术在特定环境特定领域的应用,尤其是像车载、移动终端这样的嵌入式设备中,语音技术已经得到了消费者的认可。

语音交互在车载设备和移动终端中发展迅猛

Strategy Analytics的统计表明,2012年,中国原始设备制造商(OEM)所提供的具备语音人机接口的信息娱乐和车载信息通信系统(telematics)的出货量达到300万台,并预期在2018年达到2000万台。在北美和欧洲市场,带语音交互功能的车载设备应用已很普及。福特SYNC系统,即专为手机和数字媒体播放器配备的福特车载多媒体通信娱乐系统,是目前车载系统中采用语音交互技术的成功的案例,已经广泛应用在福特多个系列汽车中。搭载SYNC系统后,配合汽车中控台上的显示屏,可通过语音控制、兼容并操控便携式通信/娱乐设备等方式,让驾驶者在开车过程中更轻松,便捷地实现诸如语音拨号、语音播出短信内容、语音控制音乐播放等功能。


编辑视点图片2.jpg
图 驾驶者双手无须离开方向盘,即可操控SYNC系统(福特福克斯中文SYNC系统)

汽车之外,移动互联网终端大概是目前最热衷采用语音交互的另一类产品,自从苹果率先在其iPhone 4中推出智能语音助理应用Siri后,Google公司也在其安卓智能手机操作系统中推出了Google Now智能语音搜索及问答服务,微软公司也将语音技术应用于其Windows Phone。现在,几乎每一家手机厂商都试图将语音技术融于其移动产品、应用和服务中。这其中最主要的一个原因就是这类终端设备外型小巧,触摸输入很不方便,这种情况下,语音交互就变成了一种非常必要的人机沟通的补充方式。这一点,笔者深有感触,自从使用安卓手机后,笔者一度不再发短信(太麻烦),现在,安装了一个讯飞语音输入法后,又开始和朋友们短信交流了,语音输入真是又方便又快捷。


编辑视点图片3.jpg
图 讯飞语音输入法手机界面

语音交互需要强大的软硬件技术支持

虽然语音技术给我们带来了极大的乐趣和帮助,但要实现真正流畅自然的语音交互还需要强大的软硬件技术协作。语音技术牵涉到语音合成、语音识别、语音评测、自然语言理解等多个方面,而语言的复杂性、多样性都为语音技术的应用带来多种挑战。Nuance、科大讯飞、微软、IBM、Google都在投入力量研发语音新技术。其中,作为中文语音技术的领导者,科大讯飞已占有中文语音技术市场70%以上市场份额,其讯飞语音云合作伙伴已经超过了10000家,讯飞输入法也是深入人心。Nuance的语音识别平台在行业内也得到广泛应用,前面提到的福特SYNC系统、苹果Siri都采用了Nuance的技术。前不久,微软宣布研发出一种新型语音识别技术,这项名为“深度神经网络”的技术,能够像人类的大脑一样处理语言行为,据称该技术比目前的语音识别技术快2倍。

有了好的语音软件和算法,还必须要高性能的硬件来支持。相信,随着语音技术的发展和硬件性能的提高,自然语音将为下一代人机交互带来新的变革。
 

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

业内消息,近日IBM要求其员工在新一轮全球裁员中自愿离职,其中很大一部分裁员发生在人力资源(HR)等部门。报道称,裁员的原因是出于重组公司的计划,而不仅仅是基于财务压力。IBM公司委婉地将其为“资源行动”而不是裁员。

关键字: IBM 裁员

通顺的自然语言生成 通达的全领域知识体系覆盖 通畅的人机交互接口

关键字: 人工智能 人机交互 大模型

随着科技的飞速发展,人工智能、大数据、云计算等技术逐渐渗透到各个领域,为人们的生活带来了极大的便利。在这其中,语音技术作为人机交互的重要方式之一,已经成为了当今科技领域的研究热点。本文将对语音技术的关键技术进行探讨,并分...

关键字: 语音技术 语音识别

上海2023年9月20日 /美通社/ -- 2023年9月19日-23日,第二十三届中国国际工业博览会(以下简称“工博会”)在国家会展中心(上海)举行,来自全球30个国家和地区的2800家展商,覆盖从基础材料、基础零部件...

关键字: 富士 存储技术 IBM 数据流

北京2023年9月19日 /美通社/ -- 跨越式的变革往往发端于某个远见,成就于群策群力的布道与施道。 不久前,IBM在北京举办的"企业级AI的未来—...

关键字: IBM AI 模型 生成式AI

北京2023年9月5日 /美通社/ -- 9月4日至6日,2023中国国际智能产业博览会(以下简称"智博会")在重庆国际博览中心举行。IBM大中华区董事长...

关键字: IBM AI 人工智能 模型

(全球TMT2023年8月31日讯)VMware和IBM基于双方20多年的合作伙伴关系开拓创新,提供全新扩展的解决方案,为双方客户在部署和管理VMware工作负载方面的需求和目标提供支持。通过双方在市场进入、销售和支持...

关键字: IBM VMWARE OS DIRECTOR

北京和慕尼黑2023年9月3日 /美通社/ -- 在2023德国国际汽车及智慧出行博览会(IAA MOBILITY)上,宝马集团带来全球首发的BMW新世代概念车,展示了面向未来的出行理念——以人为本、智能为纲、责任为先。...

关键字: 人机交互 宝马 显示屏 集成

作者:Rohit Badlaney,IBM Cloud 产品和行业平台总经理 北京2023年8月31日 /美通社/ -- 企业已经广泛采用混合云来实现敏捷性,并推动数字化转...

关键字: IBM VMWARE BSP FOR

北京——2023年8月7日 亚马逊云科技近日宣布,正在将Amazon Bedrock提供的大语言模型能力与支持自然语言问答的Amazon QuickSight Q相结合,在Amazon QuickSight中提供生成式B...

关键字: 人机交互 生成式BI
关闭
关闭