当前位置:首页 > 芯闻号 > 充电吧
[导读]超级计算机(Supercomputer)通常简称超算,在科学界常被视作一个国家技术领军能力的指标,因为它能够为AI、空气动力、大气科学、能源科学等重要技术的研究提供算力支撑。如今强国之间的竞争已经进入

超级计算机(Supercomputer)通常简称超算,在科学界常被视作一个国家技术领军能力的指标,因为它能够为AI、空气动力、大气科学、能源科学等重要技术的研究提供算力支撑。如今强国之间的竞争已经进入到了百亿亿次级超算的时代,这就需要更强大的处理器。

目前,X86、Power作为超算CPU计算节点的主要架构,那么NVIDIA宣布CUDA支持ARM谁将是最大的赢家?

超算竞争进入百亿亿次级时代

去年六月,美国能源部公布了世界上最快的超级计算机—;—;Summit,反超中国超算太湖之光重夺超算Top 500第一的位置,并且美国表示他们预计在2021年建造一台每秒运算数十亿亿次计算机“极光(Aurora)”,甚至会打造更高效能的计算机。


2019超算Top 500

当然,中国也在建立一个百亿亿次级超级计算机系统,有消息称它基于已构建的三种原型系统:曙光、天河和神威。日本和欧洲也不甘落后,日本希望在2021年有一台百亿亿次级的超级计算机,欧洲人则在希望在2023年实现这一目标。显然,超级计算机的竞赛跨入了Exascale计算(百亿亿次级的计算,也可称E级超算)时代。

用一个不精确的说法来解释百亿亿次级计算,一个百亿亿次级计算机一瞬间进行的计算,相当于地球上的所有人每天每秒都不停地计算四年。这样强大的计算能力需要更加复杂的系统。

与普通计算机一样,超算同样由硬件和软件系统组成,但超算仅硬件部分就由高速运算系统、高速互连通信网络系统、存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。

其中,高速运算系统负责逻辑复杂的调度和串行任务和并行度高的任务,可采用同构计算(纯CPU组成计算节点),也可以采用异构计算(CPU+加速器组成计算节点)的方式。

实现百亿亿次级超算的新途径

根据国际组织TOP500编制的超级计算机榜单,从2019年度ISC国际超算大会上公布的超算性能500强榜单中,我们不难发现IBM Power、NVIDIA Volta/Tesla、Intel Xeon显然是超算计算节点的重要组成。


2019年度ISC国际超算大会上公布的超算Green500

但是,随着算力的进一步增强,超算产生的热量不仅会造成更多的资源消耗,冷却系统的设计同样面临更大的挑战,因此没瓦特性能也十分重要。

TOP500也编制了一个Green500的超算排行榜,这个排行榜比拼的不是性能,而是比拼每瓦性能,所以,即便某个超算在TOP500榜单中垫底,在Green500中却获得好名次。

根据最新的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。

这其中的关键之一就是采用了异构计算的方式,让x86或者Power架构的CPU与NVIDIA GPU协同,把繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上。

不过在CPU市场,ARM架构也不可忽略,那么在超算的百亿亿次级竞争中,ARM CPU是否也能发挥优势?

现在下结论还为时尚早,但英伟达并不打算错过这个可能的机会。6月17日,2019年度ISC国际超算大会上,NVIDIA宣布将于年底前向ARM生态系统提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

这也就意味着,在NVIDIA的堆栈优化完成之后,NVIDIA将为所有主要CPU架构提供加速,包括x86、Power和ARM。

对于新的宣布,NVIDIA创始人兼首席执行官黄仁勋表示:“超级计算机是促进科学发现的重要工具,建立百亿亿次级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。NVIDIA CUDA加速的计算和ARM的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百亿亿次级。”

NVIDIA的好生意

从百亿亿次级超算建造者的角度看,ARM CPU+NVIDIA GPU是一个新选择,但从NVIDIA的角度看,CUDA支持ARM不是一个简单的宣布,而是资源的投入。让NVIDIA有动力进行这样的投入,是各国和巨头公司们的需求和投入。

仅美国方面,下一代超算技术的研发总投入将达到4.3亿多美元,美国能源部部长里克?佩里就表示,这些资金剑指“下阶段研发百亿亿次系统的全球竞赛”。

显然,百亿亿次级超算的构建少不了NVIDIA的GPU,特别是AI技术蓬勃发展并且越来越重要的当下。此时NVIDIA又联合ARM为构建百亿亿次级超算提供了新的途径,自然能让其从超算市场获得更多的营收。

NVIDIA的在超算市场的努力不止CUDA支持ARM,NVIDIA在2019年度ISC国际超算大会上还宣布了全球速度排名第22位的超级计算机—;—;DGX SuperPOD。

根据NVIDIA的说法,该超级计算机系统采用了96台NVIDIA DGX-2H超级计算机,内含1536颗NVIDIA V100 Tensor Core GPU,由NVIDIA NVSwitch及 Mellanox网络结构相联接。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。

对比来看,具备同等性能的其他TOP500超级计算机系统需要由数千台服务器构建,而DGX SuperPOD占地面积更少,体积比同等系统小400倍左右。部署方面,其他同等规模的系统通常需要6-9个月才能完成部署毕,DGX SuperPOD在工程师采用经过验证的规范性方法情况下,仅需3个星期。

据雷锋网(公众号:雷锋网)了解,NVIDIA DGX系统已经服务于众多对大规模计算有需求的企业机构,例如宝马、Continental、福特与Zenuity 等汽车公司,还有Facebook、微软与富士胶片等公司,还有研究领域的日本理化学研究所与美国能源部实验室等。

NVIDIA希望还没有部署人工智能的数据中心的企业机构使用NVIDIA SuperPOD架构。这可以让双方都从中获益,不止于此,NVIDIA还能通过构建这样的超级计算机,可以学会如何设计面向大规模人工智能机器的系统。

显然,超算特别是百亿亿次超算对NVIDIA是可以多赢的好生意。

ARM的好机会

对于ARM而言,百亿亿次级超算市场则是一个好机会。在移动市场占据领导地位的ARM遇到市场增长放缓时,同样也希望能够将其架构拓展到新的市场带来增长,近年来也在努力联合合作伙伴推动ARM服务器的发展,不过情况并不理想。

但在超算市场,特别是CUDA支持ARM之后,ARM能够迎来了好机会。Atos高级执行副总裁、大数据和网络安全部门负责人Pierre Barnabé表示:“凭借万宝龙项目,以及为百亿亿次级超级计算机BullSequana X所做的ARM计算刀片设计,Atos成为了ARM生态系统中的先驱者。”

全球重要的超算提供商Cray总裁兼首席执行官Peter Ungaro表示:“我们的Cray系统管理和编程环境(编译器、库和工具)已经能够在XC和未来的Shasta超级计算机上支持ARM处理器,将CUDA和CUDA-X HPC和AI软件堆栈用于ARM平台,并将其与Cray系统管理和编程环境紧密集成,能够助力我们的超级计算机实现我们的愿景。”

另外,Ampere Computing、CSC、EPI、HPE、Jülich超算中心、Marvell等都表达了对于CUDA支持ARM的期待。同时还要看到,CUDA支持ARM能够建造百亿亿次级超算,同样也能让服务器厂商更便捷地制造ARM服务器,所以,ARM的好机会是让其能够更好的拓展架构优势。

小结

百亿亿次级超算系统是各国努力正在打造的新一代超算,此时,英伟达CUDA支持ARM给正在打造新一代超算的国家以及对算力有更高需求的企业一个新的选择,这既是英伟达能够多赢的好生意,更是ARM进入超算市场的好机会。

现在有众多的支持者表态支持这一新路径,我们虽然对此也保持积极的态度,但结果仍需通过实际的百亿亿次级的超算系统来得出。创新不会百分之百成功,但创新才是推动革新的最大动力。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

近日,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。

关键字: ARM

为了赶超云计算市场上的竞争对手,谷歌正试图通过定制的Arm服务器芯片降低云计算服务成本。

关键字: 谷歌 ARM 定制芯片

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

机器人技术的进步对于解决全球面临的各种挑战,如老龄化社会、医疗保健需求增加、生产效率提升等,具有重要意义。我们希望未来的机器人,不仅具备人形,更重要的是具备“人性”,更加的像一个真正的人:能够理解人的自然语言,读懂人的微...

关键字: 英伟达 GTC 新生成式AI 具身智能 NVIDIA 机器人

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS

2月2日消息,美国对中国半导体技术的封锁越来越严格,但是在商言商,NVIDIA始终没有放弃中国市场,一直想尽办法打造符合美国出口管制的中国特供版本,尤其是AI GPU,第二波三款正在到来。

关键字: NVIDIA AMD 显卡

一直以来,riscv架构都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来riscv架构的相关介绍,详细内容请看下文。

关键字: riscv ARM riscv架构

1月7日消息,据报道,即使有新规限制,NVIDIA依然没有放弃中国市场,NVIDIA CEO黄仁勋也是表示,他们仍在中国开发特供芯片。

关键字: NVIDIA AMD 显卡
关闭
关闭