当前位置:首页 > > Techsugar
[导读]自从技术出现以来,对技术的道德恐慌就一直是人类体验的一部分。而人类科技所带来的信息共享,正有逐步让人类打消对隐私的顾虑,习惯透明化生存,以及将人体作为物联网终端一部分的趋势。

自从技术出现以来,对技术的道德恐慌就一直是人类体验的一部分。而人类科技所带来的信息共享,正有逐步让人类打消对隐私的顾虑,习惯透明化生存,以及将人体作为物联网终端一部分的趋势。

数据研究者称 2020 年,语音交互将占据 50% 的搜索入口。Amazon Alexa和Google助手等语音助手,AIOT, 车载助理,智能音箱... 在目前人类科技树上,“语音交互” (Voice interaction) 已然成为必点技能之一。然而在各种场景下,人们尝试通过“自然语言”重新与冰冷的机器对话,但往往效果不及预期。

语音识别技术大概经历过三个阶段,从匹配声纹和声波到下达命令,面临很难进行统一地语法规律,识别的错误率很高的挑战,一直到依托于算力和大数据,通过神经网络来建立更复杂的这种语音识别模型。

VUI(Voice User Interface,语音用户界面)正是在第三阶段快速发展的新领域。VUI对用户体验提出了更多关于语言学、情感塑造、逻辑搭建等方面的新要求。

语音技术,越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域。而语音识别和自然语言处理技术是VUI的基础。

“千箱大战”退潮,智能语音交互持续进化


人类传统的交互单一通道有眼(视觉系统)、耳(听觉系统)、口(味觉系统)、鼻(嗅觉系统)、手(触觉系统)等器官,在这些通道彼此融合后,人机交互技术正从键盘鼠标变成了触屏,又转变成现在的语音视觉等多模态交互。具体表现为从“手指”优先,发展为“语音”优先。语音交互技术兼顾老人、儿童以及方言人士让语音对话体验越来越好。语音与视觉,触屏,LCD反馈显示结合的交互体验,令交互门槛的不断降低。


VUI是用户通过语音或者语音平台与计算机进行人机交互,来启动自动化服务或流程。VUI设计,即用户与语音应用系统的交互设计。VUI是直接面向用户的界面,所以是否能满足用户需求是系统成功与否的决定性因素之一。


VUI各种场景下对声音信息的收集带来了便利,个性化推送、定制服务都不再高端,逐渐平民化,提高了社会运行效率,降低时间与商家的营销成本。



VUI将成为私人助理


一个行业,如果有爆发式的增长,一定是打中了被压制的需求。声音的价值在于便利性和情境性或者情感性,VUI正是戳中了别的交互技术所不能达到的情境性。



Siri淑女、微软小冰的童真可爱、小爱同学的青春靓丽,商家主动打造VUI虚拟角色、树立不同人格特质供用户选择。


VUI技术的发展将更容易为人们提供量身定制的数字体验,它不但能成为人们的私人助理,了解人的需求,还能超前预测需求。它能涉及到你生活的方方面面,甚至是你想象不到的领域。


声音承载的信息特性是能包含更多感情信息。因为需要稳定易理解的文字信息所以更需要语音识别,只是强调语音清晰还不够用。但其实无论是Siri还是微软小冰,语音呈现模仿人类的语言情感仍不算非常理想,“机器味儿”重。



VUI 的设计趋势


衡量语音交互的质量也不再局限于识别的准确率,而是更侧重垂直场景下的语义理解,以及后端的内容服务。


让智能语音交互实现“真”智能

未来的语音交互终端需要理解“千人千面”,即使对面是一台机器,它不仅懂你声音的语义,也懂你的情感和诉求。


声音承载的信息本身,信息密度不高,而且人类主要依赖视觉信息。声音信息(生物特征识别)本身的价值,比较有限,应用也很有限。说话声音的粗细音调高低语言习惯,这些在刑侦领域、安防技术领域有应用。无障碍设计,创建可用不同方式呈现的内容(例如简单的布局),而不会丢失信息或结构。


追求的一种自然、亲切的交互方式,使产品“带有情感和温度的交互体验”,真正的从用户角度出发。


消除使用者的认知负荷

声音信息的价值被注意到,但是如何利用和维护是个问题。


一方面,目前缺乏监管、缺乏法律对于声音信息收集的约束(其实对于隐私收集,全世界范围内都缺乏成熟的法律法规),导致声音信息收集被滥用。另一方面,一些打着科技让生活更美好的幌子的企业们干起了用户信息灰色交易、大数据杀熟等等勾当。

19年南京建环给环卫工配发智能手环


更敏感的,是公权力对于声音信息的收集是否对于公民权利构成侵犯。对于公权力法无授权地侵犯,法律似乎没有明确这方面的界限。


消除使用者的认知负荷,是VUI技术持续发展亟待解决的问题。



协同图形用户界面(GUI)


语音、视觉、触控加上反馈的融合是未来的方向。建立GUI+VUI协作机制,可打造更多智慧体验。


GUI的内容主要为图形和文字;VUI的内容主要为文字。人们主要通过点击和手势的方式与GUI进行交互,人们通过对话的方式与VUI进行交互。VUI要给出正确的响应事件必须要先理解人类在说什么,更重要的是在想什么。


例如Siri、Google Assistant、Cortana、Bixby,以及Alexa屏幕版。在GUI的基础上增加VUI有助于简化整个导航的交互,可以做到无直接关系页面的跳转,例如以命令的形式导航去其他应用的某个页面。在VUI的基础上增加GUI可以使选择、确认等操作得以简化,尤其是用Alexa进行购物时。




智能语音是未来最重要的交互入口,但目前语音交互仍没有成为主流的人机交互手段。除了技术上人工智能还未特别“智能”,还有一部分来源于人们的认知负荷。


自从技术出现以来,对技术的道德恐慌就一直是人类体验的一部分。


人类科技所带来的信息共享,正有逐步让人类打消对隐私的顾虑,习惯透明化生存,以及将人体作为物联网终端一部分的趋势。



更多精彩

电动汽车电池剩余电量不准惹的祸 里程焦虑如何拯救?

【典型新旧造车势力大盘点】彩虹总现风雨后 当把新桃换旧符

自动驾驶方案的安全风险化解之道

优化衬底助推第三代半导体实现汽车创新

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭