当前位置:首页 > 芯闻号 > 充电吧
[导读]Graphcore 于近日正式发布第二代IPU以及用于大规模系统级产品IPU-Machine: M2000(IPU-M2000),新一代产品具有更强的处理能力、更多的内存和内置的可扩展性,可处理极其庞大的机器智能工作负载。

Graphcore 于近日正式发布第二代IPU以及用于大规模系统级产品IPU-Machine: M2000(IPU-M2000),新一代产品具有更强的处理能力、更多的内存和内置的可扩展性,可处理极其庞大的机器智能工作负载。

IPU-M2000是一款即插即用的机器智能刀片式计算单元,由Graphcore全新的7纳米 Colossus™ 第二代 GC200 IPU提供动力,并由Poplar™软件栈提供全面支持。其设计便于部署,并支持可扩展至大规模的系统。这款纤薄的1U刀片机可提供1个PetaFlop的机器智能计算,并集成了针对AI扩展优化的网络技术。

Graphcore第二代Colossus™ IPU处理器:GC200

IPU-M2000可构建成IPU-POD64这一Graphcore全新模块化机架规模解决方案,可用于极大型机器智能横向扩展,提供前所未有的AI计算可能性,以及完全的灵活性和易于部署的特性。它可以从一个机架式本地系统扩展到高度互连的超高性能AI计算设施中的1000多个IPU-POD64系统。

“随着IPU-M2000和IPU-POD64的推出,Graphcore进一步扩大了我们在机器智能领域的产品竞争优势。” Graphcore首席执行官Nigel Toon 指出:“Graphcore通过技术创新实现更强有力的产品线,这些创新能够提供客户所期望的行业领先性能。对于寻求将机器智能计算添加到数据中心的客户而言,Graphcore最新推出的IPU-M2000凭借其强大的算力、易于扩展的灵活性和突出的易用性,将具有极强的可行性和价值提升潜力。”

Graphcore IPU-M2000

Mk1 IPU产品的用户可以确信,他们现有的模型和系统可以在这些新的Mk2 IPU系统上无缝运行。虽然第一代Graphcore IPU产品已经处于领先地位,但与之相比,第二代产品的性能还将提高8倍。

IPU-M2000的设计使客户可以在IPU-POD™配置中构建多达64,000个IPU的数据中心规模系统,提供16ExaFlops的机器智能计算能力。新的IPU-M2000甚至能够处理最艰巨的机器智能训练或大规模部署工作负载。

Graphcore全新的IPU-Fabric™技术使大规模连接IPU-M2000和IPU-POD成为可能,该技术是专为机器智能通信而从头设计的,并提供了专用的低时延结构,可在整个数据中心内连接IPU。

Graphcore的Virtual-IPU软件与工作量管理和编排软件集成在一起,可以轻松地为许多不同的用户提供训练和推理服务,并允许根据工作情况调整和重新配置可用的资源。

无论您是要使用单个IPU还是要使用数千个IPU来完成机器智能工作负载,Graphcore的Poplar SDK都可以使这一过程变得简单。您可以使用首选的AI框架(例如TensorFlow或PyTorch)。而且,从这一高级描述中,Poplar将构建完整的计算图,以捕获计算、数据和通信。然后,它会充分利用可用的IPU硬件,编译此计算图,并构建用于管理计算、存储和网络通信的运行时程序。

Mk1 IPU产品与Mk2 IPU产品性能对比

Graphcore的最新产品线是通过三大颠覆性技术创新实现的,这些创新可提供客户期望的行业领先性能:

● 计算:每个IPU-M2000的核心都是Graphcore新的Graphcore Colossus™Mk2 GC200 IPU。该芯片采用台积电最新的7纳米工艺技术开发,每个芯片在一个823平方毫米的裸片上包含超过594亿个晶体管,使其成为有史以来最复杂的处理器。

● 数据:每个IPU都有大量的In-Processor Memory™。Graphcore新型Mk2 GC200在处理器内部具有史无前例的900MB超高速SRAM,在每个处理器内核旁边都设有大量RAM,以实现每位最低能量的访问。Graphcore的Poplar软件还允许IPU通过Graphcore独特的Exchange-Memory™通信访问Streaming Memory™。这甚至可以支持具有数千亿个参数的最大模型。每个IPU-M2000都可以支持密度高达450GB的Exchange-Memory™,以及前所未有的180TB/秒的带宽。

● 通信:IPU-M2000具有内置的专用AI联网IPU-Fabric™。Graphcore创建了一个新的Graphcore GC4000 IPU-Gateway芯片,该芯片可提供令人难以置信的低时延和高带宽,每个IPU-M2000均可提供2.8Tbps。在从数十个IPU扩展到数以万计个IPU的过程中,IPU-Fabric技术使通信时延几乎保持恒定。

Graphcore IPU-Fabric™技术

“将强劲算力与网络能力相结合,我们能够处理全球最先进、最复杂的算法模型。”Graphcore高级副总裁兼中国区总经理卢涛 表示:“这样的算法模型,对中国本地的AI算法落地场景,如云计算、互联网和通信等场景都会产生推动作用,并将为AI产业者提供巨大的价值。”

在中国市场,Graphcore与领先的本地商业用户展开紧密的早期合作,基于IPU的开发者云已于7月初正式上线,其IPU-POD产品技术,已在IPU开发者云上供用户访问。因此,中国很可能成为Graphcore最新推出的第二代处理器技术最先实现商业化落地的区域之一。

以上努力,仅仅是Graphcore在中国市场进行的相当规模的投资中的一部分。Graphcore还在本地构建了强有力的工程化团队,希望与本地的AI产业者和AI创新者进行紧密合作,以先进科技助推中国AI创新。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

「人工智能浪潮下的中国制造」论坛顺利召开 上海2024年4月17日 /美通社/ -- 4月12日,由百年名校法国里昂商学院主办,斯巴诺萨设计承办,福州东湖数字小镇,福建亚太合会数字经济专委会协办的"中法建交6...

关键字: 微软 雷诺 AI 中国制造业

根据调研机构Gartner的预测,由于竞相投资AI以及IT设备更换周期的到来,全球2024年的IT支出将增长8%。

关键字: GenAI IT AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

眼下,人工智能不仅能辅助科学研究与艺术创作,还能实现自动驾驶、打造“无人农场”和“黑灯工厂”,成为解锁新质生产力的关键钥匙。

关键字: 人工智能 AI 无人农场

Arm CPU正在从根本上推动AI变革,并造福地球。Arm架构是未来AI计算的基石。​

关键字: ARM AI

Apr. 23, 2024 ---- 随着节能成为AI推理服务器(AI Inference Server)优先考量,北美客户扩大存储产品订单,带动QLC Enterprise SSD需求开始攀升。然而,目前仅Solidi...

关键字: SSD AI 服务器

深圳2024年4月23日 /美通社/ -- 全球AI解决方案与工业级存储领导品牌宜鼎国际 (Innodisk)持续深化边缘AI布局,今(23)日发表全球首创"MIPI over Type-C"独家技术,让旗下嵌入式相机模...

关键字: AI 嵌入式 相机

作为 Rambus 行业领先的接口和安全数字 IP 产品组合的最新成员,GDDR7 内存控制器将为下一波AI推理浪潮中的服务器和客户端提供所需的突破性内存吞吐量。

关键字: GDDR7 内存控制器 AI

武汉2024年4月22日 /美通社/ -- 4月19日,2024 TCL实业全球合作伙伴大会(GPC 2024)在武汉圆满落幕。作为TCL实业规模最大、面向全球全品类智能终端客户的顶级峰会,此次大会共吸引了来自全球六大洲...

关键字: 供应链 智能物联 AI
关闭
关闭