当前位置:首页 > 消费电子 > 音视频及家电
[导读] (文章来源:环球网) 人工智能如今已经家喻户晓,从日常生活到行业赋能,都可见其存在。在这之中,伴随着智能音箱等单品的爆发、语音交互的普及,AI语音技术也走进大众视野。历经近30年的探索,

(文章来源:环球网)

人工智能如今已经家喻户晓,从日常生活到行业赋能,都可见其存在。在这之中,伴随着智能音箱等单品的爆发、语音交互的普及,AI语音技术也走进大众视野。历经近30年的探索,微软AI语音性能已达到全球领先水平,AI语音技术服务遍及140个国家和地区。

从2017年在Switchboard语音识别基准测试中以低至5.1%词错率创造当时对话语音识别错误率最低纪录以来,微软AI语音技术不断解新成就:成为首个在中译英新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统;带来媲美人类专业发音人水平的基于深度神经网络的语音合成技术;2019年,在斯坦福文本理解任务中,微软机器阅读理解系统刷新记录,成为排行榜上唯一一个超过人类分数的模型。

谈及此,微软(亚洲)互联网工程院资深产品总监丁秉公说道:“对于微软来说,我们要让更多的研究成果走出实验室,不仅要输入到微软的各个产品中,而且还要通过提供先进的工具和平台服务,让合作伙伴和开发者获得可打造自己的人工智能产品和解决方案的能力,这也是微软语音研发的一个定位。”

疫情当下,为助力企业高效恢复生产,微软围绕Azure、Office 365、Dynamics365 智能云服务和Surface硬件,推出了多项免费及优惠措施。本次微软还在疫情期间面向有需要的企业、政府机构和开发者推出免费语音服务,包括语音识别、语音合成、语音评估服务。

微软AzureAI语音服务平台的功能已经渗透到各个领域和应用场景。据悉, AI语音在疫情期间可以有着广泛应用,譬如可以应用于通过防疫智能外呼,进行社区情况排查和通知,回访协助政府排查疫情;利用智能语音导航与智能客服,解答用户的问题,协助用户办理业务,同时启动智能客服表单服务,帮助企业和政府收集和记录信息。

实现智能医疗,助力医院智慧化建设,通过图片分析/人脸识别,声音合成,语音识别/声纹识别,语言理解/信息搜索等功能,实现患者与医务人员、医疗机构、医疗设备之间的互动。可与多种医疗数据整合,构建智慧医疗体系;以及在疫期利用AI语音合成系统将文字内容转成有声书,提高学习娱乐体验。

对此,丁秉公也表示:“我们在由世纪互联运营的微软Azure云上推出了面向中国用户的语音服务,助力复工复产复学,让企业可以更好地把握未来数字化转型机遇,让公共部门更有效率,让个人成为技术创新的受益者。”

几十年来,微软一直从事着与人工智能相关的技术研发,微软全球人工智能首席技术官,原微软首席语音科学家黄学东此前更是在采访中指出,语音和语言技术是AI皇冠上的明珠。在万物互联的5G时代下,随着低延时、低功耗、高带宽的到来,语音交互也将会成为一个主流。

“伴随语音技术更加成熟,应用场景越来越丰富,语音交互通过定制也将可以达到更加卓越的效果。这里包括两个层面,就语音识别来说,一个语音识别系统的识别精度会受到领域相关的词汇影响很大。通过定制,就可以针对某一个领域的专业词汇,让它的识别精度在原有通用模型的技术上变得很高,还可以针对每一个人的这个口音进行定制。另外一个方面来说,微软语音合成的定制可以为企业定制从男女,到不同年龄的丰富音色,甚至对于同一个音色我们可以定制各种的风格。” 在谈到不断优化的语音交互体验时丁秉公说道,“因为5G时代的网络会比现在更加快更加好,联上网一定会有很好的网络服务,所以基于这两点,我相信整个语音的应用会有一个爆发式增长。”

作为一家全球公司,微软语音也是支持了世界上的主要语种,其中语音识别技术支持39个国家与地区的语言、语音合成技术支持80个多语言发音以及翻译支持60种语言互译。同时,Azure拥有全球覆盖最广的数据中心,所以微软语音语种的全球覆盖加上Azure云的全球覆盖保证了微软和其生态伙伴能够一起赋能世界上的每一个人和每一个组织。

丁秉公认为,中国AI语音创新无论是在技术、产品上,还有商业模式上都会有特别大的潜力。语音技术也将因此走进千家万户让普罗大众,特别是包括视障和听障人士,都可以享受到技术带来的益处。并且,未来语音技术也将越来越会像空气一样,融入日常生活。只要对着一个东西,一个设备,一个服务去说话,就能够被理解并得到响应和互动。

微软CEO萨提亚·纳德拉曾在微软Ignite大会上写了一个公式叫 technologyintensity (技术密集)= (tech adoption 技术落地x tech capability技术能力)^ Trust(信任)。所谓的技术密集就是随着数字化的不断深入,企业可以利用数字工具和平台结合行业和自身的特点开发专有技术、产品和服务,以迎接不断涌现的新机遇和新突破。为了打造一流的技术密集未来,微软语音研发团队的目标是让语音技术的能力能够实现跨领域、跨语言、跨用户的不断提高同时增加技术落地赋能,让每个企业和个人能通过技术实现繁荣发展;最后是发展可信赖和负责任的技术,这也是其最珍视的技术底线。

丁秉公表示:“希望微软语音技术可以帮助中国的AI生态走得更远更好。帮助更多的中国企业走出去,也可以帮助国外的企业走进中国,享受无缝的语音服务,没有语言的障碍。这次疫情也让我们更加感受到世界各国的联系其实远比许多人所想象得更紧密。在这个地球村,我们需要来共同应对和解决关乎人类共同命运的问题。我们也希望微软的语音技术能够帮到大家。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

业内消息,科技媒体 Android Headline 近日深挖数据库,发现魅族计划推出包括魅族 21 Note 在内 5 款手机,型号分别为 M411H、M411L、M412H、M421Q 和 M431Q,只是目前尚未确...

关键字: AI 魅族

在MDDC 2024会上,MediaTek联动天玑平台合作伙伴,共启“天玑AI先锋计划”;联合业界生态伙伴发布《生成式AI手机产业白皮书》,共同定义生成式AI手机;分享了生成式AI端侧部署的解决方案“天玑AI开发套件”以...

关键字: AI

《生成式AI手机产业白皮书》详细地阐述了生成式AI与智能手机深度融合的趋势,深入探讨了生成式AI手机生态中芯片厂商、手机厂商、大模型厂商、开发者的AI战略,以及生成式AI手机的软硬件科技全景,并给出了Counterpoi...

关键字: AI

May 6, 2024 ---- 根据TrendForce集邦咨询资深研究副总吴雅婷表示,受惠于HBM销售单价较传统型DRAM(Conventional DRAM)高出数倍,相较DDR5价差大约五倍,加上AI芯片相关产品...

关键字: DRAM HBM AI

4月27日-29日,2024中国移动算力网络大会在苏州顺利召开,大会以“算力网络点亮AI新时代”为主题,旨在汇聚业界精英,探讨算力网络技术趋势,凝聚产业发展共识。

关键字: 算力网络 AI 数字经济

业内消息,近日芯片巨头高通公司发布了2024财年第二财季财报,其中营收为93.89亿美元,同比增长1%;净利润为23.26亿美元,同比增长37%;不按照美国通用会计准则,调整后净利润为27.61亿美元,同比增长14%。

关键字: 高通 财报 AI

近期,亿欧EqualOcean主办的商用机器人出海论坛如约而至,为行业内的企业和企业家提供了一个深入探讨和交流的平台。普渡机器人创始人兼CEO张涛应邀出席,与行业同仁共同破解出海之路的难题,并分享了普渡机器人在国际市场取...

关键字: AI 机器人

业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks 公司的合作伙伴团队与ST 共同讨论了对边缘机器学习的看法,并与 STM32 社区分享了他们的设计经验。

关键字: AI 机器学习 处理器

业内消息,在昨天的中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标Sora...

关键字: Sora 清华 AI Vidu

OPPO今日推出 Find X7全新配色 ——「白日梦想家」,为消费者带来更多选择。新配色采用独特釉层处理工艺,焕发如白瓷般柔润细腻的光泽,带来初夏般的清爽。Find X7「白日梦想家」以敢想敢做,坚韧信念、无限潜能的信...

关键字: Find X7 大模型 AI
关闭
关闭