当前位置:首页 > > 充电吧
[导读]2019 年两会期间,由「分身技术」合成的 AI 女主播「新小萌」正式上岗新华社。这款产品是以新华社主播屈萌为原型,不仅会用自然连贯的人声进行播报,就连唇形、面部表情也十分逼真。这不是搜狗 AI 主播

2019 年两会期间,由「分身技术」合成的 AI 女主播「新小萌」正式上岗新华社。这款产品是以新华社主播屈萌为原型,不仅会用自然连贯的人声进行播报,就连唇形、面部表情也十分逼真。

这不是搜狗 AI 主播第一次引起轰动。2018 年的 11 月,搜狗分身技术第一次在媒体领域实现落地—;—;以央视主持人新华社为原型的虚拟主播亮相乌镇世界互联网大会,眨眼、挑眉、唇动每个动作都自然得超过了预期,引得周围不停有人驻足、拍照、询问。

分身技术,这种基于多种模态识别融合的技术,包括语音、手写、唇语等维度的识别和模拟,能通过数个小时的视频资料就能合成一个比较逼真的真人形象。

这是搜狗上市后,在其 AI 故事框架活跃着的最新主角们。

有人质疑继语音笔后,搜狗又在自己的 AI 战略中搞了新的「噱头」。500 天以来,搜狗在人工智能方面取得的成绩在外人看来却有些火候欠佳。翻译笔、虚拟主播以及在 3 月 18 日最新发布的录音笔,这些看起来互不关联的落地产品构成了搜狗 AI 战略的前行的一个个脚印。

但搜狗的 AI 技术落地产品真的是噱头吗?如何理解搜狗这些看似毫无关联的产品?这些产品背后又体现了王小川哪些思考?为了解答这些疑问,我们在极客公园 IF 大会后和王小川聊了聊,也走进搜狗内部与搜狗语音交互技术中心高级总监,同时也是新华社 AI 主播项目的负责人陈伟进行了交流。试图理清搜狗正在真正讲着的故事。

一个个顿号

自今近 500 天前,2017 年 11 月 9 日是属于搜狗的高光时刻。在上市缄默期结束的六个小时之后,王小川第一次提出了公司未来的 AI 战略—;—;以语言为核心。其中包括两个部分:第一部分是人机交互,包括感知和认知层面对语言的理解,以及语音合成;第二部分以语言为核心,围绕机器阅读理解和推理能力,称为知识计算。

这恰好是能完整地扣回到分身上的理念。据陈伟介绍,在形成基于从识别到理解、认知,再到表达整个闭环过程中,团队里有两条不同的大线,一条线在做语音交互,怎么能够让人机交互更自然;另一条做语音翻译,语音同传的能力。翻译笔亦是如此,紧紧围绕着公司 AI 战略的核心。

熟知王小川的好友对极客公园说:「分身、智能硬件只是一个大方向上的子集,一种阶段性成熟技术的应用。不是终点,也不是下一个业务,甚至不是逗号,是一个顿号。」对于搜狗而言,逗号意味着以特定产品作为阶段性目标,而顿号只是一个个尝试。在真正寻找下一个增长点时,搜狗还需要更多顿号去实验和实践。

他相信搜狗目前的这些看似分散的产品,最终拼凑成一张抵达王小川关于智能世界终极设想的蓝图:用 AI 解决跨语言隔阂问题,优化人类沟通效率,「你可能现在并不能发现这一个个产品的关联,但是就像拼图一样,其实是在一个统一设想下进行的。」

这些产品不仅是围绕着大方向演进,而且还有自身的商业价值。陈伟说,目前的 AI 分身项目已经具备快速稳定落地的能力,从语音识别到合成、唇语识别,到图像方面的表情生成、肢体生成等,团队已经建立一套完整的流水线工作体系。未来除了在新闻主播领域之外,分身技术或将在客服、教育、娱乐等场景落地,「商务的事情是商务团队正在谈。」

智能硬件变现能力早已受到肯定。署名为 Himalayas Research 的科技股和全球消费买方分析师认为对搜狗的正确考量应该是:「投资者应该继续关注广告收入的趋势,以及该公司的其他业务组成(微信搜索变现和智能硬件)能否开始对收入做出贡献。」

理工男的技术信仰

从财报来看,搜索成了一块旱涝保收的「自留地」。2018 年搜狗总营收达 11.2 亿美元,同比增长 24%;美国通用会计准则下,归属于搜狗的净利润 9880 万美元,同比增长 20%。其中,搜狗搜索和搜索相关营收为 10.2 亿美元,较 2017 年增长 28%,仅 2018 年第四季度就达 2.77 亿美元。

因此,对于外界而言,直到今天,广告收入和流量成本仍然是考量搜狗的核心指标。Himalayas Research 在 2019 年 2 月的分析文章写道:管理层预计,2019 年全年,以人民币计算,行业总水平将以每年 10% 左右的速度增长,搜狗在 2019e 财年的表现应该会更好,这意味着今年晚些时候的增长会加快。尽管如此,考虑到广告空间的竞争越来越激烈,而 TAC(流量获取成本) 的增长速度超过了收入的增长速度,这并不让人印象深刻。

用产品获取用户,再用流量换得收入。这是市面上通行的游戏规则。

在互联网还处于蛮荒拓展时期,这种流量为王的思维并不过时。不论是古老一些的 QQ,还是前两年的疯狂补贴的「外卖战」,再到通过聚拢还没有被挖掘的流量,从而短期获得快速增长的拼多多、趣头条都印证了这一想法。

技术、产品、流量,这三者中受重视的是后两者,技术是退居幕后的角色。但王小川却试图打破这一默认规则,把技术作为搜狗的本质。「王小川还是希望搜狗能坚持技术公司的本质,考虑到资本市场、股价等,很多人认为抓住流量变现是现在搜狗需要做。如果按照这样的方式去考量搜狗的产品策略,就很难真正理解他的想法。」

在技术探索上,搜狗很慷慨。2019 年 2 月 1 日,搜狗公布了截至 2018 年 12 月 31 日全年未经审计的财务报告。其中显示,2018 年研发支出为 2.017 亿美元,较 2017 年增长 17%,占总营收费用的 17.9%。而该项支出除了用于核心业务技术升级外,还用于探索分身技术、智能硬件等最新的商业应用场景探索。

不过,在将技术作为攻克跨时代困扰的手术刀时,王小川也很清楚的认识到,搜索业务在搜狗内部仍然是重要的驱动引擎。他曾在接受媒体采访时表示,2018 年搜狗的核心战略是通过 AI 升级搜索和输入法双引擎。搜索是走向问答,输入法是走向对话。

在让搜狗从输入法、浏览器、搜索的技术时代,进入下一个技术时代的过程中,收入并非一件被忽视的事,但更高维的是,王小川希望用一种能真正回归技术的方式,来探索收入增长模式的另一种可能性。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭