当前位置:首页 > 芯闻号 > 充电吧
[导读]消息,继全球首款7nm手机处理器之后,同样基于台积电7nm制程的CPU和GPU产品也正式发布。近日,AMD在美国旧金山的Next Horizon会议上发布了全球第一款7nm 代号“Rome”(罗马)的

消息,继全球首款7nm手机处理器之后,同样基于台积电7nm制程的CPU和GPU产品也正式发布。近日,AMD在美国旧金山的Next Horizon会议上发布了全球第一款7nm 代号“Rome”(罗马)的第二代EPYC霄龙CPU处理器以及Radeon Instinct MI60/MI50的GPU计算卡。

7nm Rome(罗马)第二代EPYC霄龙处理器

首发7nm CPU和GPU

AMD代号为Rome的第二代EPYC霄龙处理器基于Zen2架构,Rome EPYC采用特殊设计的架构,每颗处理器有8个CPU 裸片,每个裸片内集成8个物理核心,共64个。同时为了更好地协调如此众多CPU核心的协同工作,还专门设计了一个I/O裸片,放置在中央位置,专门负责输入输出控制,不过I/O裸片用14nm工艺制造。Rome处理器有8通道DDR4内存控制器,每个插槽支持最高4TB DRAM。

Rome EPYC也是第一个支持PCIE 4.0技术的服务器级CPU,支持128个PCIe 4.0,带宽通道数翻番,可提升加速器性能,搭配同样支持PCIE 4.0技术的全新加速卡Radeon Instinct MI60,AMD表示可以带来前所未有的加速性能。当然,Rome EPYC也是全球第一款采用7nm工艺的数据中心处理器。目前Rome EPYC更详细的参数暂未公布,AMD预测Rome EPYC性能将因核心数量的增加而翻倍,浮点性能也将因为IPC架构的改进和核心数量的增加两倍。

兼容性方面,Rome EPYC与现有的Naples,以及下一代的Milan都将保持兼容,这可以简化基于AMD处理器的服务器开发,也能让服务器公司把现有的设计用在未来的服务器当中。进度方面,AMD正在向服务器制造商提供Rome EPYC样品,计划在2019年推出产品,但具体时间尚未公布。亚马逊AWS计算副总裁Matt Garman表示,基于AMD霄龙芯片的R5和M5实例产品今天就可使用,T3实例将在未来几周上线,并重点强调了帮助客户运行最常见应用程序时节省成本的特点。

GPU方面,AMD在今年Computex 2018上公布了7nm Radeon Vega GPU,《AMD抢先推全球首款7nm GPU,但能否按时出货?》有详细介绍,不过第一款正式发布的7nm GPU产品并不是Radeon RX游戏显卡,而是Radeon Instinct计算卡。AMD同时发布了Radeon Instinct MI60/MI50,均基于7nm工艺的Vega架构,得益于7nm工艺,Radeon Instinct计算卡集成132亿个晶体管,比目前14nm Vega 的125亿个晶体管增加了6.4%,核心面积为331平方毫米,比现在的484平方毫米缩小了31.6%。据称,在同等功耗下,新核心性能提升超过25%,同等频率下新核心功耗降低50%。


Radeon Instinct显存搭配最多32GB HBM2,带宽达1TB/s,內建ECC纠错。同样,7nm Vega也是世界首个支持PCIE 4.0技术的GPU,双向带宽64GB/s,借助带宽高达100GB/s的Infinity Fabric系统总线,支持4路GPU并行,双路性能提升99%,4路比单路提升298%,8路比单路提升664%。

AMD 7nm Radeon Instinct 计算卡

在加速功能上,7nm Vega计算卡在几个关键领域与Vega10有所不同,7nm Vega支持半速率双精度,同时支持新的低精度数据类型。具体看,MI60 FP64双精度浮点最高为7.4TFlops,FP32单精度最高为14.7TFlops,INT整数最高为118Tops,相比于同样Vega 10核心的MI25专业性能提升8.8倍。

还有值得注意的是,新的GPU还包括一对片外Infinity Fabric链路,允许Radeon Instinct卡通过相干链路直接相互连接。由于每个GPU只有2个链接,因此AMD的拓扑选项仅限于环上的变化,这意味着4路配置的GPU不能全部直接相互通信。另外,AMD仍坚持使用PCIe卡,没有像NVIDIA一样的定制夹层式卡,所以这些卡需要通过顶部的桥接器连接。

为弥补AMD在软件方面的不足,AMD宣布了开源计算平台ROCm 2.0,并继续承诺完全开源。进度上,Radeon Instinct MI50将于今年第四季度上市,MI60将在明年一季度上市。

7nm的胜利?

7nm无疑成为了业界关注的焦点,不过AMD总裁兼首席执行官苏姿丰博士(Lisa Su)此前已经多次谈到AMD的7nm进展。在此次Next Horizon会议上,AMD CTO Mark Papermaster表示,AMD在7nm上豪赌了一把,首先是相信能把7nm做出来,其次是认为7nm将成为产业关键节点,并持续很长一段时间。AMD最初的目标是用自己的7nm和英特尔10nm竞争,至少打成平手,但没想到AMD先做出了7nm,并将成为在新节点上最先推出产品的公司。


除了已经公布7nm架构和产品,AMD还表示明年锐龙、霄龙将全线转向7nm工艺的Zen2架构,接下来将是7nm+升级版工艺的新架构Zen3。不止于此,AMD还首次披露Zen4架构正在设计中。Papermaster也强调了AMD路线图的重要性以及实现路线图的能力和决心,他表示Zen2架构芯片正在流片,Zen3预计在2020年使用7nm+制程,Zen4开发已接近尾声。Zen4是否有机会用上5nm?

一举超越英特尔和英伟达?

在Next Horizon会议上发布7nm EPYC的时候,AMD用一颗Rome EPYC(64核心)与两颗Skylake Xeon 8180M(56核心)同时渲染1080p/QuadHD/4K图像对比,结果成绩分别是28.1秒和30.2秒,AMD更胜一筹。GPU方面,AMD拥有GPU最快配置的1TB/S全内存带宽,甚至超过NVIDIA旗舰产品GV100 GPU。这是否意味着AMD凭借着7nm一举超越了英特尔和英伟达?


在《AMD的7nm处理器样品出锅了,不过似乎对Intel威胁不大》一文中已经提到,国外论坛HardOCP上的一位坛友mockingbird爆料称RTG(Radeon Technology Group)已经收到首款Zen 2架构7nm处理器的样品,但测试样品的基础/睿频频率是4.0/4.5GHz,要比目前Ryzen 7 2700X(3.7/4.1GHz)高一些,但与英特尔8700K 4.7GHz的睿频频率有差距,更不及未来9800K/9900K的5GHz。虽然AMD未来还有继续打磨提高频率的空间,但从初代Ryzen测试样品与正式发售产品的频率对比来看,提升空间应该不大。

另外,硬件以及7nm并不就意味着处理器的成功,指令集也十分关键。据了解,AMD先有了SSE5指令集,然后英特尔推出了AVX指令集,接着AMD又效仿AVX,但保留SSE5中的FMA4、CVT16和XOP指令;然后英特尔效仿AMD加入CVT16,但改名为F16C,随后又加入FMA4简化后的FMA3和AVX2.0指令;AMD只得跟风,加入FMA3,承认F16C,将来还要加入AVX2.0。可以看到AMD在指令集方面的竞争非常激烈。

至于GPU领域,从AMD首发的7nm计算卡可以看出其非常重视服务器市场,不过在这一市场英伟达GPU拥有绝对的优势,与在CPU领域与英特尔的竞争一样,英伟达的领先使其有能力从架构以及指令集等方面占据优势,一旦使用了7nm工艺,AMD在部分性能方面的优势能保持多久就不得而知。我们也可以从架构上看,英伟达在今年八月放出了号称12年来的最大招图灵(Turing)架构,但图灵架构的RTX2080 GPU也继承了很多Fermi架构的东西,这意味着AMD也不太可能完全放弃GCN架构设计新的架构,并且此前AMD的研发中心都放在Zen架构上,GPU的改进乏力,基于目前的情况看,AMD能够凭借新的工艺就实现对英伟达的反超?

认为,AMD作为在高性能计算领域同时具有CPU和GPU产品的公司十分难得,不过可惜的是在CPU领域难以超越英特尔,在GPU领域难以超越英伟达,这其中有技术的因素,也有商业方面的原因。当然对于消费者和云厂商而言,只有竞争才会带来更好的产品,因此对于AMD的7nm CPU和GPU我们依旧保持期待。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

4月29日消息,美国对中国的封锁进一步加剧,甚至不想让ASML为已经卖给中国的光刻机提供售后维护服务,不过在ASML看来,这么做影响并不大,至少基本不会影响其收入。

关键字: ASML 7nm IMEC 光刻机

利用LogiCoA™微控制器,以更低功耗实现与全数字控制电源同等的功能

关键字: 微控制器 电源 CPU

北京——2024年4月25日 我们的客户选择亚马逊云科技运行他们的关键应用程序和最敏感的数据。每天,世界上发展最快的初创公司、最大的企业和最值得信赖的政府机构都选择亚马逊云科技作为技术基础设施平台。他们之所以选择亚马逊云...

关键字: GPU 计算 生成式AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

4月23日消息,荷兰对光刻机巨头阿斯麦离开的消息感到十分担忧,但现在情况有了明显的好转。

关键字: 光刻机 7nm

近日媒体Business Insider透露称,微软目前正在疯狂囤货GPU,目标在2024年12月前达到180万片。微软本次采购的 GPU 主要来自英伟达公司,不过微软也计划采购 AMD 等其它公司的 GPU 进行扩充。

关键字: 微软 GPU

2024年4月18日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 很荣幸地宣布与Edge Impulse建立新的全球合作关系。Edge Im...

关键字: 机器学习 MCU CPU

4月18日消息,光刻机巨头阿斯麦(ASML)业绩爆雷,这也导致公司股价大幅下挫。

关键字: 光刻机 7nm

无论您是在研究如何使用 10GigE 还是寻求所需考虑事项的建议,本文均提供有实践,帮助确保单相机 10GigE 视觉系统设置顺利并拥有良好性能。 我们列出了主机系统配置、布线和相机设置的实践。

关键字: 视觉系统 CPU 存储器
关闭
关闭