当前位置:首页 > 芯闻号 > 充电吧
[导读]超级计算机(Supercomputer)通常简称超算,在科学界常被视作一个国家技术领军能力的指标,因为它能够为AI、空气动力、大气科学、能源科学等重要技术的研究提供算力支撑。如今强国之间的竞争已经进入

超级计算机(Supercomputer)通常简称超算,在科学界常被视作一个国家技术领军能力的指标,因为它能够为AI、空气动力、大气科学、能源科学等重要技术的研究提供算力支撑。如今强国之间的竞争已经进入到了百亿亿次级超算的时代,这就需要更强大的处理器。

目前,X86、Power作为超算CPU计算节点的主要架构,那么NVIDIA宣布CUDA支持ARM谁将是最大的赢家?

超算竞争进入百亿亿次级时代

去年六月,美国能源部公布了世界上最快的超级计算机—;—;Summit,反超中国超算太湖之光重夺超算Top 500第一的位置,并且美国表示他们预计在2021年建造一台每秒运算数十亿亿次计算机“极光(Aurora)”,甚至会打造更高效能的计算机。


2019超算Top 500

当然,中国也在建立一个百亿亿次级超级计算机系统,有消息称它基于已构建的三种原型系统:曙光、天河和神威。日本和欧洲也不甘落后,日本希望在2021年有一台百亿亿次级的超级计算机,欧洲人则在希望在2023年实现这一目标。显然,超级计算机的竞赛跨入了Exascale计算(百亿亿次级的计算,也可称E级超算)时代。

用一个不精确的说法来解释百亿亿次级计算,一个百亿亿次级计算机一瞬间进行的计算,相当于地球上的所有人每天每秒都不停地计算四年。这样强大的计算能力需要更加复杂的系统。

与普通计算机一样,超算同样由硬件和软件系统组成,但超算仅硬件部分就由高速运算系统、高速互连通信网络系统、存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。

其中,高速运算系统负责逻辑复杂的调度和串行任务和并行度高的任务,可采用同构计算(纯CPU组成计算节点),也可以采用异构计算(CPU+加速器组成计算节点)的方式。

实现百亿亿次级超算的新途径

根据国际组织TOP500编制的超级计算机榜单,从2019年度ISC国际超算大会上公布的超算性能500强榜单中,我们不难发现IBM Power、NVIDIA Volta/Tesla、Intel Xeon显然是超算计算节点的重要组成。


2019年度ISC国际超算大会上公布的超算Green500

但是,随着算力的进一步增强,超算产生的热量不仅会造成更多的资源消耗,冷却系统的设计同样面临更大的挑战,因此没瓦特性能也十分重要。

TOP500也编制了一个Green500的超算排行榜,这个排行榜比拼的不是性能,而是比拼每瓦性能,所以,即便某个超算在TOP500榜单中垫底,在Green500中却获得好名次。

根据最新的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。

这其中的关键之一就是采用了异构计算的方式,让x86或者Power架构的CPU与NVIDIA GPU协同,把繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上。

不过在CPU市场,ARM架构也不可忽略,那么在超算的百亿亿次级竞争中,ARM CPU是否也能发挥优势?

现在下结论还为时尚早,但英伟达并不打算错过这个可能的机会。6月17日,2019年度ISC国际超算大会上,NVIDIA宣布将于年底前向ARM生态系统提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

这也就意味着,在NVIDIA的堆栈优化完成之后,NVIDIA将为所有主要CPU架构提供加速,包括x86、Power和ARM。

对于新的宣布,NVIDIA创始人兼首席执行官黄仁勋表示:“超级计算机是促进科学发现的重要工具,建立百亿亿次级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。NVIDIA CUDA加速的计算和ARM的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百亿亿次级。”

NVIDIA的好生意

从百亿亿次级超算建造者的角度看,ARM CPU+NVIDIA GPU是一个新选择,但从NVIDIA的角度看,CUDA支持ARM不是一个简单的宣布,而是资源的投入。让NVIDIA有动力进行这样的投入,是各国和巨头公司们的需求和投入。

仅美国方面,下一代超算技术的研发总投入将达到4.3亿多美元,美国能源部部长里克?佩里就表示,这些资金剑指“下阶段研发百亿亿次系统的全球竞赛”。

显然,百亿亿次级超算的构建少不了NVIDIA的GPU,特别是AI技术蓬勃发展并且越来越重要的当下。此时NVIDIA又联合ARM为构建百亿亿次级超算提供了新的途径,自然能让其从超算市场获得更多的营收。

NVIDIA的在超算市场的努力不止CUDA支持ARM,NVIDIA在2019年度ISC国际超算大会上还宣布了全球速度排名第22位的超级计算机—;—;DGX SuperPOD。

根据NVIDIA的说法,该超级计算机系统采用了96台NVIDIA DGX-2H超级计算机,内含1536颗NVIDIA V100 Tensor Core GPU,由NVIDIA NVSwitch及 Mellanox网络结构相联接。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。

对比来看,具备同等性能的其他TOP500超级计算机系统需要由数千台服务器构建,而DGX SuperPOD占地面积更少,体积比同等系统小400倍左右。部署方面,其他同等规模的系统通常需要6-9个月才能完成部署毕,DGX SuperPOD在工程师采用经过验证的规范性方法情况下,仅需3个星期。

据雷锋网(公众号:雷锋网)了解,NVIDIA DGX系统已经服务于众多对大规模计算有需求的企业机构,例如宝马、Continental、福特与Zenuity 等汽车公司,还有Facebook、微软与富士胶片等公司,还有研究领域的日本理化学研究所与美国能源部实验室等。

NVIDIA希望还没有部署人工智能的数据中心的企业机构使用NVIDIA SuperPOD架构。这可以让双方都从中获益,不止于此,NVIDIA还能通过构建这样的超级计算机,可以学会如何设计面向大规模人工智能机器的系统。

显然,超算特别是百亿亿次超算对NVIDIA是可以多赢的好生意。

ARM的好机会

对于ARM而言,百亿亿次级超算市场则是一个好机会。在移动市场占据领导地位的ARM遇到市场增长放缓时,同样也希望能够将其架构拓展到新的市场带来增长,近年来也在努力联合合作伙伴推动ARM服务器的发展,不过情况并不理想。

但在超算市场,特别是CUDA支持ARM之后,ARM能够迎来了好机会。Atos高级执行副总裁、大数据和网络安全部门负责人Pierre Barnabé表示:“凭借万宝龙项目,以及为百亿亿次级超级计算机BullSequana X所做的ARM计算刀片设计,Atos成为了ARM生态系统中的先驱者。”

全球重要的超算提供商Cray总裁兼首席执行官Peter Ungaro表示:“我们的Cray系统管理和编程环境(编译器、库和工具)已经能够在XC和未来的Shasta超级计算机上支持ARM处理器,将CUDA和CUDA-X HPC和AI软件堆栈用于ARM平台,并将其与Cray系统管理和编程环境紧密集成,能够助力我们的超级计算机实现我们的愿景。”

另外,Ampere Computing、CSC、EPI、HPE、Jülich超算中心、Marvell等都表达了对于CUDA支持ARM的期待。同时还要看到,CUDA支持ARM能够建造百亿亿次级超算,同样也能让服务器厂商更便捷地制造ARM服务器,所以,ARM的好机会是让其能够更好的拓展架构优势。

小结

百亿亿次级超算系统是各国努力正在打造的新一代超算,此时,英伟达CUDA支持ARM给正在打造新一代超算的国家以及对算力有更高需求的企业一个新的选择,这既是英伟达能够多赢的好生意,更是ARM进入超算市场的好机会。

现在有众多的支持者表态支持这一新路径,我们虽然对此也保持积极的态度,但结果仍需通过实际的百亿亿次级的超算系统来得出。创新不会百分之百成功,但创新才是推动革新的最大动力。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

特朗普集团近日取消了其新推出的T1智能手机“将在美国制造”的宣传标语,此举源于外界对这款手机能否以当前定价在美国本土生产的质疑。

关键字: 特朗普 苹果 AI

美国总统特朗普在公开场合表示,他已要求苹果公司CEO蒂姆·库克停止在印度建厂,矛头直指该公司生产多元化的计划。

关键字: 特朗普 苹果 AI

4月10日消息,据媒体报道,美国总统特朗普宣布,美国对部分贸易伙伴暂停90天执行新关税政策,同时对中国的关税提高到125%,该消息公布后苹果股价飙升了15%。这次反弹使苹果市值增加了4000多亿美元,目前苹果市值接近3万...

关键字: 特朗普 AI 人工智能 特斯拉

3月25日消息,据报道,当地时间3月20日,美国总统特朗普在社交媒体平台“真实社交”上发文写道:“那些被抓到破坏特斯拉的人,将有很大可能被判入狱长达20年,这包括资助(破坏特斯拉汽车)者,我们正在寻找你。”

关键字: 特朗普 AI 人工智能 特斯拉

1月22日消息,刚刚,新任美国总统特朗普放出重磅消息,将全力支持美国AI发展。

关键字: 特朗普 AI 人工智能

特朗普先生有两件事一定会载入史册,一个是筑墙,一个是挖坑。在美墨边境筑墙的口号确保边境安全,降低因非法移民引起的犯罪率过高问题;在中美科技产业之间挖坑的口号也是安全,美国企业不得使用对美国国家安全构成威胁的电信设备,总统...

关键字: 特朗普 孤立主义 科技产业

据路透社1月17日消息显示,知情人士透露,特朗普已通知英特尔、铠侠在内的几家华为供应商,将要撤销其对华为的出货的部分许可证,同时将拒绝其他数十个向华为供货的申请。据透露,共有4家公司的8份许可被撤销。另外,相关公司收到撤...

关键字: 华为 芯片 特朗普

曾在2018年时被美国总统特朗普称作“世界第八奇迹”的富士康集团在美国威斯康星州投资建设的LCD显示屏工厂项目,如今却因为富士康将项目大幅缩水并拒绝签订新的合同而陷入了僵局。这也导致富士康无法从当地政府那里获得约40亿美...

关键字: 特朗普 富士康

今年5月,因自己发布的推文被贴上“无确凿依据”标签而与推特发生激烈争执后,美国总统特朗普签署了一项行政令,下令要求重审《通信规范法》第230条。

关键字: 谷歌 facebook 特朗普

众所周知,寄往白宫的所有邮件在到达白宫之前都会在他地进行分类和筛选。9月19日,根据美国相关执法官员的通报,本周早些时候,执法人员截获了一个寄给特朗普总统的包裹,该包裹内包含蓖麻毒蛋白。

关键字: 美国 白宫 特朗普
关闭