当前位置:首页 > 公众号精选 > Techsugar
[导读]昨天,阿里巴巴发布了第一款AI芯片——含光800。除了参数外,还有怎样的故事和深层次考虑?最近一两年,只要国内有公司发布AI芯片,就会在各大社交圈、媒体中炸开锅。日子过不了多久,就会淡去,留下三三两两历史记录中的文章。但我们很少知道背后的故事,这并不是几日的技术狂欢所能说清的。昨天,阿里巴巴发布了第一款AI芯片——含光800。合着云栖大会的热闹,该芯片瞬间成为了近日最闪耀的头条新闻。当阿里CTO张建锋在会议厅展示这块芯片时,介绍很简短,除了参数外,并没有介绍背后的故事。

昨天,阿里巴巴发布了第一款AI芯片——含光800。除了参数外,还有怎样的故事和深层次考虑?最近一两年,只要国内有公司发布AI芯片,就会在各大社交圈、媒体中炸开锅。日子过不了多久,就会淡去,留下三三两两历史记录中的文章。但我们很少知道背后的故事,这并不是几日的技术狂欢所能说清的。昨天,阿里巴巴发布了第一款AI芯片——含光800。合着云栖大会的热闹,该芯片瞬间成为了近日最闪耀的头条新闻。当阿里CTO张建锋在会议厅展示这块芯片时,介绍很简短,除了参数外,并没有介绍背后的故事。


“前几天,我们都还不知道能不能完成。只能每周干7天,每晚干到12点。就在15号凌晨时,我们最后一批人早上5点20离开(实验室),终于调出来了。当时很多人说不可能,但我们做到了。” 阿里巴巴达摩院平头哥AI芯片研究员焦阳(骄旸)在接受TechSugar等媒体采访时,说到了这款芯片背后的故事。

故事的开头夹杂的质疑,故事的结尾如这批研究员所愿。


这颗芯片

7个月完成了前端设计,之后用3个月就成功流片,速度的确惊人。


据现场介绍,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。


人工智能芯片分论坛中,焦阳介绍了更多该芯片的细节,如下两张图。


含光800采用四核设计,其包含170亿颗晶体管,采用台积电的12nm工艺。之所以采用四核架构,焦阳表示:“在设计之后,由于良率提升需求,四个Core任何有一个Core坏死,都不影响芯片工作,这是我们在架构设计时做的特别处理。”

此外,计算单元尽量被放在了存储边上,这是功耗做的很低的原因。

含光800性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。

过去半年,平头哥先后发布玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

到底怎么想的?

在发布会结束后,笔者从分论坛中,了解到了这款NPU更多的故事和背后的想法。首先是为什么——阿里巴巴为什么要做云上大芯片?


从焦阳的回答中,笔者总结为以下几点:

1,阿里巴巴云计算是一个快速增长的业务,在业内处于领先地位。硬件设计可以帮助阿里巴巴快速拓展业务,降低计算成本,提供海量的计算能力。云计算走到今天,如果没有硬核就很难继续往下走,未来很难在算力上有更多的提高。

2,这不是为了短期商业化,而为更远的愿景。以技术为本,打造过硬的技术。

3,为什么做推理而不是训练?虽然在AI发展中,第一步都是要做很多的训练,但随着算法高速发展之后,将迎来推理端的发展。阿里巴巴涉及的业务,如城市大脑、视觉分析等,算力大大提高其计算效率,把真正的业务量达到突破,从而在云计算中增加更多流量,解决未来业务发展目标。

4,阿里巴巴与传统互联网公司不同,除了搜索和广告业务,还有更丰富的视觉类业务,如淘宝图片、搜索、智能城市、智能工厂等。基于这些业务,CNN加速是对NPU的一个重要方向点,此外阿里还将扩展到新的模式适配。(如下图)


在提到未来芯片计划时,焦阳非常务实地说道:“第一步先把技术做深做扎实,达摩院或者其他的技术团队,目前都在做很多的项目,我们需要从业务中了解业务,不能仅限于只做业务,需要举一反三,来产生更有深度,更有技术水平的产品。含光虽然已经取得了初步的结果,但这远远不够,我们要达到英伟达的水平还有很长的路要走,有了好技术才能有章可循,没有技术,连推产品都推不动。”


“AI芯片是新的领域,新领域本身就存在很多机会。而且人工智能算法是需要特殊架构的,对于阿里巴巴来说,就是挑战皇冠上的明珠。”有20年GPU领域工作经验的焦阳,谈到公司未来也是充满信心。

阿里芯片的边界

前不久,看到新闻上提到马云在阿里巴巴卸任现场上演唱了《怒放的生命》时,我突然发现,凡人已经很难阻止阿里巴巴了。

2017年,宣布成立达摩院;2018年成立平头哥;2019年便掏出了这一款AI芯片。对2020年的大事,目前笔者还没嗅到什么消息,凭借阿里的想象力,总预感会有大事发生。

其实在芯片这块,阿里巴巴的所涉及的部分已经超过一般人所知。

阿里巴巴集团副总裁周明的题为《阿里巴巴基础设施挑战与芯片策略》的演讲中提到,如今阿里在技术分布有CPU、异构计算、NPU、FPGA;互联和网络部分则有自研网络交换机及NOS、自研400G硅光模块、HAIL2.0数据中心网络架构;存储端集合了从SSD到DRAM到新型存储截止爱到服务器的一体机,其中包括AliFlash V3、AliFlash V5.0、阿里巴巴自研云计算服务器、阿里巴巴边缘云服务器。

因为基础设施的加持,才有云栖大会第一场主论坛中,阿里巴巴董事局主席兼首席执行官张勇对数字经济的畅想,他表示:“在数字经济时代,大数据是石油,而算力是引擎。算力不仅代表计算的规模和计算的效率,同时它也包括数量的要求、智慧的程度。算力的发展,最终一定是“数”和“智”全面结合。只有这样,我们才能够在走向数字化的同时,真正走向未来我们共同相信会全面爆发的智慧化、数智化。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着2024年的到来,北斗系统建设已走过栉风沐雨、接续奋斗的30年,几代北斗人也走过了北斗系统建设从无到有,从有源定位到无源定位,从服务中国到服务亚太,再到全球组网的“三步走”发展历程。

关键字: 华大北斗 芯片

微控制单元(Microcontroller Unit;MCU) ,又称单片微型计算机(Single Chip Microcomputer )或者单片机,是一种针对特定应用的控制处理而设计的微处理器芯片,其工作频率(在1M...

关键字: MCU 芯片 半导体

今日凌晨,中国台湾东部的花莲县连续发生地震,最高强度为6.3级,震源深度10公里,据中国地震台网分析,本次地震均为4月3日台湾花莲县海域发生的7.3级地震的余震。中国台湾地区在全球半导体供应链中扮演者重要角色,其10nm...

关键字: 固态硬盘 芯片 存储

在科技飞速发展的今天,电子设备已经成为了我们日常生活中不可或缺的一部分。而在这些电子设备的内部,一个不可或缺的组成部分便是开关电源芯片。作为电源管理集成电路的核心,开关电源芯片在电子设备中发挥着至关重要的作用。本文将深入...

关键字: 开关电源 芯片

开关电源芯片作为电子设备中的重要组成部分,是实现电源转换和管理的核心器件。随着科技的不断进步,开关电源芯片的种类也在不断增加,各具特色,满足了不同设备和应用场景的需求。本文将深入探讨开关电源芯片的种类及其科技应用,带领读...

关键字: 开关电源 芯片

4月17日消息,Intel官方宣布,工程师内部研发了一种新的AI增强工具,可以让系统级芯片设计师原本需要耗费6个星期才能完成的热敏传感器设计,缩短到区区几分钟。

关键字: Intel 芯片 1.8nm

业内消息,昨天美国芯片设计公司 AMD 推出了锐龙PRO 8040/8000系列AI处理器芯片,为支持人工智能的PC提供动力,试图在与英伟达和英特尔等竞争对手的AI PC 竞争中获得领先地位。

关键字: AMD 锐龙 AI处理器 芯片

今天,小编将在这篇文章中为大家带来电容笔的有关报道,通过阅读这篇文章,大家可以对电容笔具备清晰的认识,主要内容如下。

关键字: 电容笔 导体 芯片

Intel日前举办了Vision 2024年度产业创新大会,亮点不少,号称大幅超越NVIDIA H100的新一代AI加速器Gaudi 3、品牌全新升级的至强6、AI算力猛增的下一代超低功耗处理器Lunar Lake,都吸...

关键字: Intel 芯片 1.8nm

4月12日消息,Intel日前发布了LGA1851独立封装接口的酷睿Ultra处理器,代号Meteor Lake-PS,但不是给消费市场用的,而是面向嵌入式和边缘计算。

关键字: Intel 芯片
关闭