当前位置:首页 > Neoverse
  • x86危?腾讯百度“偏爱”的Arm再翻倍!

    x86危?腾讯百度“偏爱”的Arm再翻倍!

    云计算和边缘计算这两个词是近几年被电子行业提及频次最高的词,伴随相关应用逐步融入社会各个领域,数据处理便成为了行业首当其冲的领域。 此前,腾讯宣布TARS微服务开发框架已成功移植至Arm CPU架构;百度在其数据中心采用了基于Arm架构的智能计算;亚马逊AWS云在自己的云服务器上做了一个基于Arm架构的自研项目…… 事实上,Arm架构服务器由于其高性能以及自身具备的低功耗素质,已成为数据中心基础设施建设的焦点。 9月23日,Arm宣布Neoverse新增Arm Neoverse V1平台以及第二代的N系列平台Neoverse N2,两款新品使得Neoverse再度进阶,而新产品直指的目标则是超级计算机和数据中心。21ic中国电子网记者受邀参加此次新品发布的在线研讨会,揭秘Neoverse处理器IP背后的发展。 01 翻倍,性能冲刺之路 首先,Arm新发布的这两款Neoverse平台究竟有多强?直接上数据。通过Arm给出的数据,相比去年推出的Neoverse N1,代号为“Zeus”的Neoverse V1比N1单线程性能提升50%,代号为“Perseus”的Neoverse N2在相同水平的功率和面积之下比N1单线程性能提升40%。 另外,会议上,Neoverse平台的最新路线图也一并被披露,图示显示Neoverse目前处于制程节点7/5nm上,支持PCle Gen5、DDR5、HBM2e和CCIX 1.1;至2021年将全面进入5nm制程节点,支持HBM3、CCIX 2.0、CXL 2.0;至2022年将进入5/3nm制程节点,支持CCIX next和CXL next。 值得一提的是,会议上,Arm承诺后续的Neoverse产品在2022年以后,每年也都会有30%的性能提升。Arm基础设施事业部高级副总裁兼总经理Chris Bergey表示,这与Arm工程团队的努力和投入是分不开的,另一方面,能够保持稳定的性能提升与Arm自身软件生态的逐渐成熟有很大关系,例如很多云原生的软件现在可以比较无缝运行在Arm架构上面。 图1:Arm Neoverse最新技术发展路线图 在核心和线程上,以云工作负载为例,可以看出Neoverse V1在96核96线程下拥有极佳的处理能力,可以在核心数更少的情况下发挥更好的性能;Neoverse N2则可以多达128核128线程的设计,拥有极强的扩展性,并在同样的扩展能力下拥有比N1更强的性能。 图2:云工作负载使用内核数量 文行至此,可能大家并没有感受到本次发布的Neoverse V1和N2的强大?那么从Neoverse从初版发布到现如今推出产品的历史来看起。 Neoverse处理器IP首次亮相于2018年10月18日,同为Arm指令集的IP产品,不同于Cortex系列,Neoverse面向的是高性能计算市场。当时Neoverse平台产品中代号“Cosmos”的产品是基于16nm工艺,A72、A75核心的产品。当时公布的路线图中,Arm提出了每年每代产品的30%的单线程性能提升,每一代提升30%也是Arm的“老传统”。 图3:2018年Arm公布的Neoverse发展路线图 但时间推移到下一代产品发布时间2019年2月21日,Neoverse N1和E1平台被公布出来后,一切预测都被推翻了。属于7nm工艺时代的Neoverse N1相比A72的“Cosmos”单线程性能提升了60%,超出预计整整一倍,关键云端负载性能则提升了高达2.5倍。Neoverse E1作为低功耗和低面积的代表,也拥有不俗的实力,与Arm前几代方案相比,吞吐量性能提升超过2.7倍,吞吐效率提升超2.4倍,计算性能提升超2倍。 图4:2019年Arm公布的Neoverse发展路线图 上文有提到,V1比N1单线程性能提升50%,N2比N1单线程性能提升40%,而这一切的基础都是在N1超出前一代60%的基础上完成的。换言之,也就是说V1比“Cosmos”单线程性能出140%,N2比“Cosmos”单线程性能高出124%,超额两倍完成了2018的初版路线规划。 02 定位,面向不同市场 Neoverse平台系列几经周折,现如今形成了三个定位,这种定位也与现今数据中心市场相符合。另一方面,也与Arm的Cortex的最新定位相呼应,即无视面积和功耗、纯粹注重高性能的Cortex-X1、PPA(功率、性能、面积)最大化的Cortex-A78。 1、V系列:追求终极性能的系列产品,性能优先于面积和功耗。拥有最高的带宽和性能表现,以及最大的Buffers(缓冲区)、Caches(缓存)、Windows(窗口)和Queues(队列),随之而来的是最大的面积和功耗。 2、N系列:满足横向扩展性能需求的系列产品,最大化PPA,即在性能、功耗和面积上保持平衡。拥有更强的扩展性,更加平衡的性能,同样面积或TDP下更多的核心数。因为支持更多的线程,因此在横跨云、智能网卡(SmartNICs)、企业网络、边缘设备上都拥有非常广阔的应用的场景。 3、E系列:低功耗小面积系列产品,面积和功耗优先于性能。拥有更好的效率、吞吐量和线程数,当然最重要的是在面积和功耗上拥有最好的优化。另外,E1还支持同步多线程(SMT)技术,能够提供网络效果优化。 图5:三个系列不同的定位 市场方面,Chris Bergey告诉记者,V系列、N系列、E系列会根据合作伙伴和客户对于功耗、性能和面积上不同需求进行配置,假若客户更看重线程,N系列便是首先,假若客户需要高性能计算工作负载,V系列就能提供更大的价值。 值得一提的是,Neoverse V1和N2均支持可伸缩矢量扩展(Scalable Vector Extensions, SVE),而SVE则可基于未知宽度向量单元的软件编程模型,执行单指令流多数据流(SIMD)整数、bfloat16、浮点指令。另外,SVE还可确保软件编码的可移植性与使用寿命,同时兼顾高效的执行。 利用SVE,半导体厂商可以对SVE电压和频率过渡实施控制,开发者可以在窄矢量和宽矢量之间随意混合代码。 SiPearl公司营销副总裁Craig Prunty表示:“Neoverse路线图上的SVE为HPC和ML带来了巨大的潜力,我们非常看好这项技术对未来Arm生态系统的发展。” 03 生态,软硬件钥匙 在硬件生态方面,支持重要的两个技术便是CCIX(针对加速器的缓存一致性互联)和CXL(开放互联技术)。CCIX主要用于跨芯片间互连,用于打造异构封装系统,支持完整缓存一致性;CXL则是基于PCle 5.0的规范,可让CPU与GPU、FPGA等加速器更好地连接,带来更好地带宽和内存一致性,简化硬件设计难度,降低系统成本。 当然,异构计算已逐渐成为现在数据发展的重要“根据地”,事实上,这也是生态中的一环。数据中心无论是存储还是数据加速,整体趋势是分布式的,这便对性能和功耗提出严苛的要求。Chris Bergey表示,Arm已看到很多异构计算的产品与方案目前都开始基于Arm的架构,例如存储控制器、智能网卡中用到的计算CPU。 在异构计算方面,对于Arm来说,如何提供紧耦合或是定制化的能力,甚至是通过多核封装或多芯片组装技术,将来自生态系统、IP技术与云厂商的需求与技术整合在一起,是很大的机遇。不论是基于FPGA、GPU、TPU单元的加速器,数据的移动是必不可少的,Arm架构的可扩展性便是优异的解决方案。 图6:CCIX和CXL领导智能未来 在软件生态方面,Chris Bergey为记者介绍,Arm将软件分为两种类型,一是云原生的软件,二是传统的企业级软件。云原生软件是Arm一直以来重视的领域,在这个领域Arm现在是拥有最大的持续集成/持续交付(CI / CD)平台的一等公民,并在大多数编程语言的生态环境中,Arm都扮演着核心角色,同时Arm也看到云原生技术在边缘计算领域变得越来越重要,在这一领域我们推出了Project Cassini项目。 此外,随着V-RAN、O-RAN等项目的崛起,云原生软件也将成为5G未来发展的一个重要组成部分。 另一方面,传统企业软件领域出现了“软件即服务”(SaaS)的发展趋势。面对这一趋势,由于在Arm架构之上能够创造非常有利的软件即服务产品,因此很多独立软件开发商(ISV)都对Arm表现出浓厚的兴趣,纷纷投入Arm阵营,在中国市场这一趋势尤其显著。 图7:Arm支持的软件生态 “Arm认为软件生态系统,特别在基础设施这个市场上,是非常重要的。” 根据Chris Bergey的介绍,现如今,Arm处理器核在性能方面的优势,不仅获得了美国的大型互联网公司的认可,在中国的大型互联网公司以及广大的软件生态系统层面,也获得了很多的进展。另外,Arm也很乐于与国内外厂商携手,利用Neoverse N1和V1来帮助客户交付相关项目。

    时间:2020-09-24 关键词: ARM neoverse

  • 亚马逊设计32核心ARM处理器:全新架构 超高频率

    亚马逊设计32核心ARM处理器:全新架构 超高频率

    多年来,ARM架构一直希望冲出移动领域,进入桌面乃至是服务器市场,也有不少厂商先后推出了各种设计。现在,亚马逊AWS正在面向云服务开发全新的ARM处理器。 亚马逊已经有了一款ARM架构处理器“Gravition”,基于ARM A72核心魔改,主频2.3GHz,最多16核心,分成四个四核集群,每个集群2MB共享二级缓存。 新一代处理器暂无名字,使用了ARM的下一代架构Neoverse N1,最多可达32核心,并通过Fabirc总线连接各种外部特定目的加速器,以提升特定工作负载的效率。 ARM Neoverse N1(又名ARES)架构基于消费级的A76,4宽度拾取/解码,11级流水线(需要时可改为9级),高频率设计以提升单线程性能,同时重新设计一致性缓存体系,可选1MB二级缓存。 根据ARM给出的指标,Neoverse N1架构核心频率可以跑到2.6-3.1GHz,而且能效极高,每个核心加二级缓存面积仅为1.2-1.4平方毫米,功耗也不过1.0-1.8W。

    时间:2019-12-24 关键词: 处理器 亚马逊 aws 32核心 n1 ARM neoverse

  • 针对5G网络、大规模云数据中心等,Arm发布业界首创Arm Neoverse 解决方案

    专为万亿智能互联设备打造,现代云端到边缘基础设施的根基 提供业界一流的性能、安全性和可扩展性,从超大规模到边缘访问,支持下一代基础架构的各种计算需求 新闻摘要: •专注于基础架构的全新产品路线图,采用领先的制程节点,实现每年30%的系统性能提升 •拥有广泛的生态系统支持,可通过从微架构设计到硬件、软件、工具和服务的创新实现多样化的解决方案 •Arm Neoverse代表了基于Arm技术的全新统一品牌标识和愿景,驱动未来覆盖核心数据中心到边缘的基础设施发展 Arm公布专为5G网络和下一代云端到边缘基础设施创立的全新基础设施级IP及开发路线图详细信息。业界首创的Arm® Neoverse®解决方案专为更高级别的性能、安全性和可扩展性而设计。从微架构设计到芯片、软件和系统的创新有助于设计一流的解决方案,满足整个计算领域多样化且不断变化的需求。 Arm还首次公布Neoverse处理器IP路线图,其中包含有关针对前沿制程节点优化的平台初步详细信息,这些平台将于不久的未来陆续推出。新的路线图专为基础设施而设计,首个基于7纳米技术的“Ares” IP平台将于2019年初推出,至2021年,每一代平台更新将带来高达30%的性能提升。Neoverse IP路线图专门针对独特的性能、效率和可扩展性要求而设计,从而可适应数据模式的不断变化、全新的工作负载挑战以及为支持万亿互联智能设备而不断发展的基础设施带来的持续需求增长。 Arm基础设施事业部高级副总裁兼总经理Drew Henry表示:“今天Arm发布为实现万亿互联设备的世界奠定基础的新型全球基础设施 Neoverse,这是整个云计算、网络和存储领域具有颠覆性的事件。Arm Neoverse IP将使我们广泛的生态系统合作伙伴能够将基础设施从云端向边缘转型,将计算性能推送到最需要的地方,将数据存储到最合适的位置,同时不断改进网络,将复杂的世界能够安全地互联。” Arm Neoverse针对全新基础架构和各种应用场景,其中包括超大规模云数据中心、存储解决方案和5G网络。Neoverse的设计指导原则主要为: ·为云原生和联网工作负载专门构建的一流高性能、安全IP和架构 ·针对领先制程节点进行优化的高度可扩展IP集,包括Ares(7纳米)、Zeus(7纳米+)和Poseidon(5纳米),旨在实现横跨基础架构的系统 ·通过对统一软件、工具和硅平台的杠杆投资,构建一个强大的生态系统,从而可开发针对各种应用场景的独特且多样化的解决方案 Moor Insights & Strategy首席分析师Patrick Moorhead表示:“现代数据中心不再是一个物理结构,而是位于云和边缘的数据和计算中心。企业比以往任何时候都更需要考虑分布式、互联的数据中心设计,以支持5G世界的数据和设备。Arm是市场上迅速崛起的公司之一,凭借Arm Neoverse专门构建的IP,将能够支持从超大规模到边缘访问的许多计算需求。” 为服务器、汽车和网络等重点市场设计IP和系统架构一直是Arm过去一年的重中之重。尤其在基础设施领域,Arm已成绩斐然,作为全球互联网基础设施中部署最多的架构,拥有近30%的市场份额。这一成就不仅突出了首选架构的转变,更彰显了在整个基础设施市场中Arm技术的普及程度。 Neoverse的发布凸显了Arm及其生态系统正在进行的持续投入,以便从云端到边缘提供更普适的计算,同时为下一代分布式云端到边缘基础设施提供一流的性能和效率。

    时间:2018-10-18 关键词: 云端 计算 ARM neoverse

发布文章

技术子站

更多

项目外包