当前位置:首页 > 消费电子 > 音视频及家电
[导读] (文章来源:砍柴网) 全球领先的实时音视频云PaaS服务商声网Agora近日宣布其推出的“一站式智能语音识别方案”将实现升级,在新的方案中,在原有合作伙伴“数美科技”基础上,将新增依图、

(文章来源:砍柴网)

全球领先的实时音视频云PaaS服务商声网Agora近日宣布其推出的“一站式智能语音识别方案”将实现升级,在新的方案中,在原有合作伙伴“数美科技”基础上,将新增依图、阿里云这两家智能语音识别服务商,通过整合行业TOP3服务商的语音识别技术优势,帮助直播、语音聊天室等互联网平台更智能、高效的识别语音中存在的涉黄、涉政、广告等不良信息,实现全面、深入的净化平台网络环境。

近年来,随着直播、短视频、语音社交等行业的快速发展,由用户创造的UGC内容成为了互联网内容生态的重要构成,并丰富了人们的互联网生活。而另一方面,随着用户UGC内容越来越多,涉黄、涉政、不良广告等违法、违规的内容也频频出现,成为了“害群之马”,给很多平台带来了风险。同时,相对于图文和视频,音频审核本身在技术上也更具难度,又增加了平台方的内容审核压力。

在去年8月,声网Agora就推出了“一站式智能语音识别方案”,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,在语音识别服务方面接入了数美科技的“天净”智能语音审核系统,通过声纹检测、语音识别等技术,智能识别语音环境中的涉黄、涉政、广告等违法违规信息,受到了很多企业的好评。

而此次升级后的“一站式智能语音识别方案”再接入了阿里云、依图科技先进、智能的语音识别技术,整合了业界 TOP3 智能语音识别服务商的技术优势以提供目前互联网行业最全面、最高效的智能语音识别技术。例如,数美科技的“天净”智能语音识别,基于深度学习语音识别技术,多维度智能实时审核。

深挖场景需求,为直播视频流、UGC短视频、FM电台、语音广场、语音直播间等各类场景提供智能内容过滤服务,通过语音识别转文本的方式,识别文本内容中涉政、广告等不良信息;业内首创的娇喘语音识别,基于基于Bi-GRU、Attention模型,精准识别声音中含有娇喘、呻吟、耳骚、喊麦等违规音频,准确率达到90%以上。声纹识别与检索对比”技术可进行声纹聚类、关联,发现线上、线下语音广告与欺诈行为等。

而依图科技在公共安全领域早已深耕多年。依靠世界级算法团队自研的语音识别、自然语言理解和声纹算法,依图的“智能语音审核”拥有准、快、省三大特点。准——凭借世界级算法能力加已有场景数据的螺旋迭代提升,依图的召回和准确率居行业前列,帮企业最大程度的降低风险。快——实时监测并在3秒内返回结果。省——同步返回高精准转写文本和违规音频片段,帮人工审核员提高效率、节省时间。

声网Agora的“一站式智能语音识别方案”可为企业提供实时音视频+实时录制+实时智能语音识别的一站式高度集成服务,也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外 SDK、无需自己对接 CDN 厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。

在智能语音识别方面,声网Agora整合了业界 TOP3 智能语音识别服务商的技术优势。而在实时音视频功能方面,声网自建的软件定义实时网SD-RTN专为实时音视频业务提供SLA/ QoS 质量保证,能为企业提供高并发、高可靠性、低延时和抗弱网等特性的实时音视频技术。

声网Agora目前在全球拥有250多个数据中心。在网络架构设计上能够应对10倍以上的负荷,具备千万级并发能力。声网的软件定义实时网SD-RTN拥有超低延时特性,可做到全球端到端延时小于400ms,延时中位数76ms,处于行业领先水平。声网还具备优秀的弱网传输和抗丢包算法,可以在60%的丢包环境下保障音视频流畅,70%的网络丢包环境下保障语音的流畅。在终端性能和适配方面,声网针对实时互联网last mile做了深度优化,目前已经适配6000多款终端设备,网络覆盖全球200多个国家和地区,即使在网络环境差的偏远山区或跨国场景中用户也能实现顺畅互动。

此外,对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案还融合声网 Agora 语音引擎与 AI 音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高 30% 以上。

通过声网Agora的“一站式智能语音识别方案”可以帮助企业严格、有效的净化平台内容质量,降低监管风险,提升用户体验,同时还能为企业大幅节省接入成本。据了解,接下来声网还将联合更多业界知名智能语音识别服务商,为企业持续提供业界最高效、最严格的内容审核机制,促进网络生态健康发展。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

凭借深度学习技术和SmartBid产品,百度国际MediaGo获得美国商业奖认可 旧金山2024年5月6日 /美通社/ -- 第22届美国商业奖(American Business Award®)近日发布获奖名...

关键字: MEDIA GO SMART BSP

近日,字节跳动发布《企业纪律与职业道德委员会通报(2024年2号)》,因涉嫌构成刑事犯罪、违反廉洁诚信制度、违反利益冲突制度、违反信息安全制度四项原因辞退员工61人。近年来,多家互联网公司密集进行内部反腐整顿,包括腾讯、...

关键字: 互联网 字节跳动 辞退 腾讯 百度

广州2024年4月17日 /美通社/ -- 已火爆拉开帷幕的第135届广交会一期线下展中,新质生产力成为核心亮点。超3100名以先进生产力和优质为关键词的创新企业集结现场,向世界释放新质生产力赋能下的行业新"磁...

关键字: 电子 PS GO 科沃斯

北京2024年4月17日 /美通社/ -- 2024年4月13日,由北京康盟慈善基金会主办的"县域诊疗,规范同行"——肿瘤诊疗学术巡讲项目首站在广州隆重召开。本次会议邀请全国多位肺癌领域专家和县域同道...

关键字: AI技术 医疗服务 BSP 互联网

机器人技术将与移动互联网、物联网、大数据、云计算、人工智能等新一代数字技术进一步融合,特别是5G技术将使工业机器人成为工业智能制造体系的一部分,通过实时传输数据提高效率。

关键字: 机器人 医疗机器人 互联网

在这个互联网时代我们的数据越来越多但也越来越透明,想不明白自己的手机号和姓名是怎么泄露的,每天都会有各种广告推销打给自己,也曾听说谁谁谁的照片不知道为何被外泄讨论。数据存储和安全管理已经成为企业运营和个人生活中不可或缺的...

关键字: 铁威马 互联网 nas网络存储

SAP(思爱普)近日发出的裁员计划,不仅涉及全球范围内约8000个职位,更是在中国区造成了近1500名正式员工和合同工不续的情况。

关键字: 软件 互联网

最近总是出现iPhone16和ipad的概念新闻,以前为了跟风也会更换手机,后来是因为职业原因拍摄大量视频照片占据手机空间而不得已换了一部又一部手机。但慢慢地我发现,想要查找几年前的视频总得翻找之前的手机,流程繁杂又拖沓...

关键字: NAS 互联网 存储

本文中,小编将对语音识别技术予以介绍,如果你想对语音识别技术的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 语音识别 语音识别技术

在这篇文章中,小编将为大家带来语音识别技术的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: 语音识别 语音识别技术
关闭
关闭