当前位置:首页 > 半导体 > 半导体
[导读]AI的快速发展直接促进了CPU和GPU的发展,而AI应用专门的处理器是IPU,IPU将基于自身优势为世界的智能化进程增添不竭动力。

AI的快速发展直接促进了CPU和GPU的发展,而AI应用专门的处理器是IPU,IPU将基于自身优势为世界的智能化进程增添不竭动力。

一、英伟达专注的GPU优势逐渐缩小

从专注图像渲染崛起的英伟达的GPU,走的也是相当于ASIC的技术路线,但随着游戏、视频渲染以及AI加速需要的出现,英伟达的GPU也在向着GPGPU的方向演进。

当硬件更多的需要与软件生态挂钩时,市场大多数参与者便会倒下。在竞争清理过后,GPU形成了如今的双寡头市场,并且步入相当成熟的阶段。

ASIC本身的成本、灵活性缺失,以及应用范围很窄的特点,都导致它无法采用最先进制程: 即便它们具备性能和能效优势,一旦无法采用最先进制程,则这一优势也将不再明显。

为保持其在GPU领域的寡头地位,使得英伟达必须一直保持先进的制程工艺,保持其通用性,但是要牺牲一定的效能优势。

相比于来自类GPU的竞争,英伟达不应该忽视Graphcore的IPU,特别是Graphcore一直都在强调其是为AI而生,面向的应用也是CPU、GPU不那么擅长的AI应用。

二、利用AI计算打侧面竞争战

不管CPU还是GPU都无法从根本上解决AI问题,因为AI是一个面向计算图的任务、与CPU的标量计算和GPU的矢量计算区别很大。

而另一边的IPU,则为AI计算提供了全新的技术架构,同时将训练和推理合二为一,兼具处理二者工作的能力。

作为标准的神经网络处理芯片,IPU可以支持多种神经网络模型,因其具备数以千计到数百万计的顶点数量,远远超过GPU的顶点规模,可以进行更高潜力的并行计算工作。

计算加上数据的突破可以让IPU在原生稀疏计算中展现出领先IPU 10-50倍的性能优势,到了数据稀疏以及动态稀疏时,IPU就有了比GPU越来越显著的优势。

此外,如果是在IPU更擅长的分组卷积内核中,组维度越少,IPU的性能优势越明显,总体而言,有4-100倍的吞吐量提升。

在5G网络切片和资源管理中需要用到的强化学习,用IPU训练吞吐量也能够提升最多13倍。

三、两种芯片势能英伟达与Graphcore的较量

Graphcore成立于2016年,是一家专注于机器智能、同时也代表着全新计算负载的芯片制造公司,其包括IPU在内的产品研发擅长大规模并行计算、稀疏的数据结构、低精度计算、数据参数复用以及静态图结构。

英伟达的潜在竞争对手Graphcore的第二代IPU在多个主流模型上的表现优于A100 GPU,两者将在超大规模数据中心正面竞争。

未来,IPU可能在一些新兴的AI应用中展现出更大的优势。

第二代IPU相比第一代IPU有两倍峰值算力的提升,在典型的CV还有NLP的模型中,第二代IPU相比第一代IPU则展现出了平均8倍的性能提升。

如果对比英伟达基于8个最新A100 GPU的DGX-A100,Graphcore 8个M2000组成的系统的FP32算力是DGX-A100的12倍,AI计算是3倍,AI存储是10倍。

四、AI计算未来有三种计算平台

第一种平台是CPU,它还会持续存在,因为一些业务在CPU上的表现依然不错;

第二种平台是GPU,它还会持续发展,会有适合GPU的应用场景。

第三种平台是就是Graphcore的IPU。

IPU旨在帮助创新者在AI应用上实现新的突破,帮助用户应对当前在CPU、GPU上表现不太好的任务或者阻碍大家创新的场景。”卢涛副总指出。

目前GPU在全球已是大规模的商用部署,其次是Google的TPU通过内部应用及TensorFlow的生态占第二大规模,IPU处于第三,是量产的、部署的平台。

与此同时,Graphcore也在中国积极组建其创新社区。Graphcore已在微信、知乎、微博和GitHub开通了官方频道,旨在与开发者、创新者、研究者更好地交流和互动。

关于未来的AI计算领域,未来会是 “CPU、GPU、IPU并行” 的时代,GPU或部分CPU专注于业务场景的实现和落地,而IPU专为AI创新者带来更多突破。

五、构建生态链条IPU仍在路上

IPU想要在AI计算中拥有挑战GPU地位的资格,除了在性能和价格上面证明自己的优势之外,还需要在为机器学习框架提供的软件栈上提供更多选择,获得主流AI算法厂商的支持。

在标准生态、操作系统上也需要有广泛的支持,对于开发者有更方便的开发工具和社区内容的支持,才能从实际应用中壮大IPU的开发生态。

一个AI芯片从产出到大规模应用必须要经过一系列的中间环节,包括像上面提到的支持主流算法框架的软件库、工具链、用户生态等等,打通这样一条链条都会面临一个巨大挑战。

目前申请使用Graphcore IPU开发者云的主要是商业用户和高校,个人研究者比较少。IPU开发者云支持当前一些最先进和最复杂的AI算法模型的训练和推理。

和本世纪初的GPU市场一样,在AI芯片市场步入弱编程阶段,如今百家争鸣的局面预计也将很快结束,市场在一轮厮杀后会剩下为数不多的参与者做最终对决。

现在要看的是在发展初期的逐一击破阶段,Graphcore是否真有定义并主控第三类芯片的魄力了。

不过从创新的架构到芯片再到成为革命性的产品,Graphcore从芯片到落地之间的距离,需要易用的软件和丰富的工具来支持,特别是对软件生态依赖程度比较到的云端芯片市场。

IPU不是GPU,既是挑战也是机会。IPU不是GPU的替代品或者类似品,所以不能拿GPU的逻辑来套用IPU的逻辑。

近两年,基于AI 芯片研发的各种产品的井喷,预计未来IPU在各类AI应用中将具有更大的优势。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

只要计算机依然遵循冯·诺依曼体系结构所定义的形态,那么关于计算的发展创新,大多都将围绕着“存”与“算”的协作。不过有趣的是,从古文明到计算机时代,千年以来人类对“存”的需求似乎总是优先于“算”——只要条件允许,人们就倾向...

关键字: 计算 云上存储 人工智能

美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2024 年 3 月 18 日 —— NVIDIA 于今日宣布推出 NVIDIA Blackwell 平台以赋能计算新时代。该平台可使世界各地的机构都能够在万亿参数...

关键字: 生成式 AI 大语言模型 计算

【2024年2月28日,德国慕尼黑讯】为实现有雄心的增长目标,英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)正进一步强化其销售组织。自3月1日起,英飞凌的销售团队将围绕三个以客户为中心的业务领域...

关键字: 电子制造 计算 半导体

近日,由中国电子学会主办、百余所高校参与的第十七届中国高校电子信息学院院长(系主任)年会在北京交通大学成功举办。此次年会聚焦新发展格局下电子信息领域创新人才的交流与培养,旨在为工程教育、科研、产学研结合及专业学科建设提供...

关键字: 计算 FPGA 数字经济

世界顶级服务器制造商和云服务提供商即将推出 HGX H200 系统与云实例

关键字: 服务器 生成式 AI 计算

高性能计算和人工智能正在形成推动半导体行业飞速发展的双翼。面对摩尔定律趋近极限的挑战,3DIC Chiplet先进封装异构集成系统越来越成为产业界瞩目的焦点。这种创新的系统不仅在Chiplet的设计、封装、制造、应用等方...

关键字: 计算 人工智能 半导体

英国著名科幻小说家阿瑟·克拉克(《2001:太空漫游》)有言:“任何先进的技术,初看都与魔法无异。”在英特尔这家巨大的半导体公司的内部,有一批人正在专注于此,即用新颖的方法,在广泛的前沿研究领域中探索如何帮助人类应对在计...

关键字: 计算 量子计算 数据中心 AI

“AI正在催生全球增长的新时代,在新时代中,算力起着更为重要的作用,让所有人迎来更美好的未来”,9月19日,在2023英特尔on技术创新大会的主题演讲中,英特尔公司首席执行官帕特·基辛格(Pat Gelsinger)介绍...

关键字: AI 计算 半导体

全面了解内存标记扩展 (Memory Tagging Extension, MTE),如何在 Arm 移动生态系统中实现 MTE,以及为何 MTE 是解决内存安全漏洞这一业界挑战的重要安全功能。

关键字: 内存标记 计算 MTE
关闭
关闭