当前位置:首页 > 半导体 > Habana Labs
[导读]为系统带来性能突破、实现本地以太网扩展

2019年6月19日,中国北京——行业领先的人工智能处理器开发商Habana Labs (www.habana.ai) 宣布推出Habana Gaudi™人工智能训练处理器,基于Gaudi的训练系统实现了比拥有相同数量的GPU系统高四倍的处理能力。

Gaudi™处理器的创新架构可实现训练系统性能的近线性扩展,即使是在较小Batch Size的情况下,也能保持高计算力。因此,基于Gaudi™处理器的训练性能可实现从单一设备扩展至由数百个处理器搭建的大型系统的线性扩展。

HL-205 heatsink (1).jpg

除了领先的性能,Gaudi™处理器还为人工智能训练带来了另一项“行业第一”。该人工智能处理器片上集成了RDMA over Converged Ethernet(RoCE v2)功能,从而让人工智能系统能够使用标准以太网扩展至任何规模。凭借Gaudi™处理器,Habana Labs的客户亦可利用标准以太网交换进行人工智能训练系统的纵向扩展和横向扩展。同时,以太网交换机已被数据中心应用于计算系统和存储系统的扩展中,在速度和端口数方面可提供几乎无限的可扩展性。另外,与Habana的标准设计相比,基于GPU的系统依赖于专有的系统接口,对系统设计人员来说,这从本质上限制了可扩展性和选择性。

HL-205 heatsink.jpg

Linley集团首席分析师Linley Gwennap评论说:“Habana Labs推出新产品,其产品组合迅速地从推理处理器扩展到训练处理器,涵盖了神经网络的所有功能。在众多的人工智能训练加速器产品中,Gaudi™处理器能够提供强大的性能,达到行业领先的能效水平。作为首款集成100G以太网链路并支持RoCE的人工智能处理器,Gaudi™为使用行业标准组件构建而成的大型加速器集群提供了强大的支持。”

HL-205 Mezzanine Card.jpg

Gaudi™人工智能训练处理器配备32GB HBM-2内存,目前提供两种规格:

·HL-200-PCIe卡,设有8个100Gb以太网端口;

·HL-205-基于OCP-OAM标准的子卡,设有10个100Gb以太网端口或20个50Gb以太网端口。

HLS-1 covered.jpg

另外,Habana推出了一款名为HLS-1的8-Gaudi系统,配备了8个HL-205子卡、PCIe外部主机连接器和24个用于连接现有以太网交换机的100Gbps以太网端口,让客户能够通过在19英寸标准机柜中部署多个HLS-1系统实现性能扩展。

HLS-1_Branded.jpg

Gaudi™处理器是Habana Labs继去年推出Goya™人工智能推理处理器后的第二款人工智能专用处理器。Goya™处理器自2018年第四季度开始发货,并向业界展示了领先的推理性能,可实现业界最高的吞吐量、功效比(图片/每秒瓦)以及实时。

Habana Labs首席执行官David Dahan 表示:“人工智能模型训练所需的计算能力每年呈指数增长。因此,提高生产率和可扩展性,解决数据中心和云计算对计算能力的迫切需求成为至关重要的任务。凭借Gaudi™处理器的创新架构,Habana Labs带来了业界最高的性能,同时集成了标准以太网,进而实现无限可扩展性。Gaudi™处理器将打破人工智能训练处理器领域的现状。”

Facebook技术和战略总监Vijay Rao表示:“Facebook正在寻找开放的平台以进行行业创新融合。我们很高兴看到Habana Labs的Goya™人工智能推理处理器为Glow机器学习编译器实现后端开源,并且Gaudi™人工智能训练处理器采用OCP加速器模块 (OAM)规范。”

Gaudi™是一款完全可编程且可定制的处理器,搭载第二代Tensor处理核(TPC™) 并集成开发工具、库和编译器,共同提供全面而灵活的解决方案。此外,Habana Labs的SynapseAI™软件栈包含一个丰富的内核库和开放工具链,以供客户添加专有内核。

Habana Labs将于2019年下半年面向特定客户提供Gaudi™人工智能训练处理器的样品。欲了解更多关于Gaudi™处理器和Goya处理器的信息,敬请浏览www.habana.ai。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

拉斯维加斯2025年9月11日 /美通社/ -- 在9月8日至11日举办的RE+ 2025展会上,全球综合储能解决方案供应商德赛电池(Desay Battery)全面展示了其创新成果,并宣布与深圳市华宝新能源股份有限公司...

关键字: 电池 电芯 人工智能 锂电

AI赋能制造,黄埔汇聚全球新机遇 广州2025年9月11日 /美通社/ -- 2025年9月10日,由广州开发区投资集团有限公司、广州开发区黄埔区具身智能机器人产业发展促进会、华南美国商会共同主办的"2025...

关键字: 智能制造 AI 人工智能 供应链

香港2025年9月11日 /美通社/ -- 华钦科技集团(纳斯达克代码:CLPS,以下简称"华钦科技"或"集团")近日宣布成功利用人工智能(AI),包括微软Copilot等客户指定AI模型,完成对一家香港大型银行30年历...

关键字: 人工智能 PS REACT 测试

在科技飞速发展的当下,人工智能与边缘计算的融合正以前所未有的速度重塑着我们的生活。RK3576芯片拥有4核Cortex-A72以及4核Cortex-A53提供基础算力,6TOPS算力NPU来模型推导运算。使用YOLOv8...

关键字: 人工智能 边缘计算 YOLOv8模型

德国康佳特亮相上海工博会,展示多款应用就绪的嵌入式解决方案平台

关键字: 嵌入式 传感器 处理器

广州2025年9月9日 /美通社/ -- 在2025年柏林国际消费电子展(IFA  2025)上,来自中国的清洁能源科技企业,广州疆海科技有限公司(征拓)以其前沿的...

关键字: 新能源 消费电子展 人工智能 清洁能源

9月10日消息,在最近的高盛Communacopia +科技大会上,Intel副总裁John Pitzer透露了Intel在x86和IFS计划方面的一些新细节。

关键字: Intel 处理器

上海2025年9月9日 /美通社/ -- 为全面落实党中央、国务院和上海市委、市政府关于加快发展人力资源服务业的决策部署,更好发挥人力资源服务业赋能百业作用,8月29日,以"AI智领 HR智链 静候你来&quo...

关键字: 智能体 AI BSP 人工智能

深圳2025年9月9日 /美通社/ -- 2025年9月3日,国际独立第三方检测、检验和认证机构德国莱茵TÜV大中华区(以下简称"TÜV莱茵&q...

关键字: 研讨会 汽车行业 ISO 人工智能

在当今的高性能计算领域,确保处理器、存储和加速器之间快速可靠的通信对系统性能和可扩展性至关重要。因此,就诞生了Compute Express Link®(CXL®)标准:其目标是实现一致的内存访问、低延迟的数据传输,以及...

关键字: 芯片设计 处理器 加速器
关闭