当前位置:首页 > EPYC
  • 下一代EPYC处理器现身Linux日志

    下一代EPYC处理器现身Linux日志

    尽管没有具体的时间表,但AMD ZEN3的发展速度是肉眼可见的。 最近,Linux更新日志中首次显示了新一代EPYC服务器的CPU代码名称Milan。 通过早些时候的技术路线图,Milan将是第三代EPYC处理器,基于下一代ZEN3架构。本次被网友发现的Milan处理器属于ES工程样品阶段,拥有1.5GHz基础频率和2.2GHz加速频率,这很可能不会是它最终的频率表现。 个人电脑方面,代号Vermeer的Ryzen 4000桌面处理器据信已经达到B0步进,并且进展顺利。从目前的情况来看,AMD手中拥有将其量产和发布的主动权。稍早些时候AMD已经确认会在今年内发布ZEN3架构的第四代锐龙(Vermeer)。 ZEN3架构将继续提升IPC效能,同时还将通过改进后的7nm工艺进一步提高运行频率。除了X570以及近期上市的B550主板之外,AMD已经承诺让上一代400系列主板也能支持ZEN3架构的新一代处理器。

    时间:2020-07-07 关键词: AMD epyc Linux zen3

  • AI时代算力为王 AMD 64核EPYC重新定义高性能计算

    AI时代算力为王 AMD 64核EPYC重新定义高性能计算

    AI时代的算力、算法和数据处在一种螺旋式的提升关系中,虽然芯片制程和计算性能的提升,使得对算力的渴求不像以前那样迫切,但当算法普及和数据累积达到一个新的程度时,原来的算力又不够了,成为AI性能提升的硬指标。 2019年5月初,AMD度过了自己的50岁生日。创办50年来,它已经成长全球唯一一个拥有高性能CPU和GPU芯片的半导体公司。也是在2019年,AMD推出了7nm Zen2架构的新一代霄龙/锐龙处理器,这是21世纪以来继64位K8之后AMD最重要的CPU升级之一。 在7nm Zen2架构处理器上,AMD再次将CPU性能和核心数量提升到了一个新纪录上。相比上一代Zen架构,单核心IPC性能提升15%,相当可观;核心数量更是直接翻番,第二代EPYC处理器以8的倍数从8核、16核……到48核,以及最高的64核128线程,可谓豪华。得益于EPYC的设计下放到消费级产品,主流桌面锐龙也做到了16核32线程,HEDT发烧平台做到了24核、32核乃至64核128线程。 在7nm Zen2发布之后,有分析师评价说,这是AMD 50年来首次在架构及工艺上同时领先对手,这在以前是没有过的。 AMD CEO苏姿丰在去年的发布会上表态,AMD已经变了,得益于一系列技术及产品突破,AMD从大家印象中的市场导向型企业变成了技术导向型企业,并且是“技术领导”型企业。 从2017年正式重返高性能计算领域,在2年时间里AMD经过三代锐龙、两代霄龙处理器的发展,就站上了高性能计算领域的制高点,他们是怎么做到的呢? 7nm Zen2创新制胜:x86首发小芯片设计 64核128线程破纪录 在AMD推出Zen架构处理器之前,x86 CPU行业的发展已经停滞多年了。单核性能多年没有明显提升,多核也没有明显变化,桌面市场10年间都是最多4核8线程,服务器市场还停留在20+核心时代,业界无奈称之为“挤牙膏”,这严重阻碍了x86行业的发展。 AMD在第一代Zen上取得了突破,IPC性能大涨52%不说,还顺手将CPU核心数量提升了一倍,桌面普及8核16线程,EPYC霄龙处理器也做到了32核64线程,多任务性能轻松碾压对手的CPU。 在7nm Zen2处理器上,AMD又实现了一次性能突破,大胆放弃了传统设计思路,首次在x86行业使用了chiplets小芯片设计,CPU计算核心与IO核心分离,核心数翻倍,最多64核128线程,再一次将CPU计算性能推向了新高潮。 以第二代EPYC为例,它的64核架构实际上就是1+8模块组成的。中间最大的那个是IO核心,称为IOD(IO Die),使用了12nm工艺制造,根据需要集成了不同数量的DDR主控、PCIe主控、IF总线等IO单元,EPYC版的IOD核心面积416mm2,集成340亿晶体管。 IO核心周围的8个模块则是CPU核心,7nm工艺制造,成为CCD(Core Chiplet Die),每个CCD中有8核16线程CPU,面积74mm2,集成38亿晶体管。 这样一来,AMD在设计EPYC处理器的时候就有足够的灵活性,好像搭积木那样堆出不同核心的EPYC处理器,以8的倍数,从8核到64核CPU只需考虑不同的IO核心及CCD核心搭配即可。 这种巧妙的设计不仅赋予了第二代AMD EPYC处理器灵活性,还大幅降低了成本。根据AMD的测算,核心数越多,成本优势就越明显,64核7nm锐龙作为100%基准的话,那么48核的成本就是0.9,而原生48核设计的成本至少是1.9,比小芯片设计高太多了,几乎翻倍。 当然,最重要的一点还有,在第二代EPYC处理器多核性能再次翻倍的同时,单核性能并没有止步,通过7nm工艺及架构改进,AMD在Zen2上实现了15%的IPC性能提升,Cinebench基准测试中实际提升20%以上。 总之,AMD的64核EPYC处理器凭借7nm Zen2巧妙、灵活的架构设计,再次将高性能计算能力翻倍,从发布到现在已经打破了至少140项世界计算纪录,并且还在持续不断地提升中。 EPYC高性能计算成功之道:把握技术趋势、敢于创新 为何EPYC处理器能够取得这样的成功,2011年进入AMD公司、2014年担任CEO的苏姿丰(Lisa Su)是最有发言权的。此前,对半导体行业另一个巨头英特尔来说,发展是遵循其著名的Tick-Tock战略的,要么提升芯片制造工艺,要么更新设计架构。 对AMD来说,他们急需一次爆发,因此公司决定双管齐下,创造一个全新的产品组合。 苏姿丰说服了客户,花费数年时间打造出了这一代7nm Zen2架构的处理器。在友商仍然使用14nm工艺的情况下,AMD在升级架构的同时,上马最先进的7nm工艺无疑是有极大风险的,但最后事实证明AMD“赌对了”。 对AMD来说,过去几年最大的收获就是他们成功制定并实施了新一代路线图,从2017年的14nm Zen架构开始,AMD在工艺、架构上就保持着同步升级的节奏,改变了业界Tick-Tock两年升级一次的惯例。 按照路线图发展下去,2020年AMD还会推出7nm工艺的Zen3架构的处理器,首发于第三代EPYC处理器 “Milan” (米兰)中,今年底应该就会上市了。 再往后,AMD也正式宣布了5nm工艺的Zen4架构,同样会首先应用于第四代EPYC处理器“Genoa”(热那亚)中。 AI时代来临 高性能计算新篇章开启 凭借7nm Zen2强劲的性能表现,AMD赢得了顶级超算的青睐。AMD先后宣布了新一代E级超级计算机 Frontier和El Capitan,预期峰值处理能力分别为150亿亿次FLOPS和200亿亿次FLOPS以上,计划分别于2021年和2023年交付,后者有望在交付后成为世界上速度最快的超级计算机。 Frontier将采用下一代EPYC,建成后,通过大幅提升大规模人工智能、数据分析和模拟的性能来实现科学突破,帮助科学家开展更多计算。 在Frontier创新成果的基础上,El Capitan采用代号为“Genoa”(热那亚)的下一代 AMD EPYC处理器以及针对高性能计算和AI工作负载而优化的新型架构的下一代 Radeon Instinct GPU。前者将基于“Zen 4”处理器核心来支持下一代内存和 I/O 子系统,从而更好地服务于 AI 和高性能计算工作负载,后者将采用下一代高带宽内存以实现出色的深度学习性能。El Capitan这样的设计将在 AI 和机器学习数据分析方面实现飞跃。 接下来的高性能计算该如何发展?从Zen2来看,人们对CPU单核及多核心的性能要求已经达到一个比较满意的地步,现在更关键的是如何利用好这些多核CPU的性能。最有希望的领域应该是AI人工智能了,AI时代的算力、算法和数据交替上升,对更高算力的需求永不停歇,成为AI性能提升的硬指标。 上面提到的Frontier超算性能轻易就达到了目前排名第一的超算系统Summit的7倍水平,而El Capitan的计算能力则更高。 AMD CEO苏姿丰前不久接受采访时就透露了这方面的信息,她举了一个前景很诱人的例子,那就是AI人工智能相关的语音识别,目前处理器文本信息不需要多强的CPU性能,但语音识别这样的应用场景现在多是靠后台的数据中心运算的。 如果超算技术下放到消费级产品上,那么语音识别等应用就可以利用本地的处理器来计算,这样速度、效率就会好很多。 根据苏姿丰的预测,EPYC处理器所代表的高性能计算会在未来5到10年里深刻影响我们的生活,不仅仅是推动数据中心领域的高性能计算发展,还会进一步促进与消费级产品的融合,特别是在AI技术飞速发展的过程中,无处不在的澎湃算力都是最关键的。

    时间:2020-06-29 关键词: 芯片 AI AMD epyc

  • AMD定制霄龙7R32浮出水面:280W TDP、不知几核心

    AMD定制霄龙7R32浮出水面:280W TDP、不知几核心

    亚马逊早在去年11月就宣布将会部署AMD二代霄龙,但直到今天,新的AWS C5a实例才全面上线,而它使用的处理器更加神秘,AMD只是说最高加速频率为3.3GHz,最多96个虚拟CPU(48个物理核心加多线程)。 AWS C5a实例分为八种不同配置,最低的提供2个虚拟CPU核心、4GB内存、万兆网络带宽,而最高的有96个新CPU核心、192GB内存、2万兆网络带宽。 AnandTech对其进行检测后,发现了“霄龙7R32”的名字,空闲频率为1.8GHz,最高加速确实为3.3GHz,甚至可以全核跑到3.3GHz,但几分钟后就会掉到3.2GHz,而在计算密集型负载下最高全核加速频率为3.1GHz。 但是它究竟有几个核心,暂时无法确认,可能48个,也可能64个。 霄龙7R32的名字早在今年2月初就曝光了,但只知道它的热设计功耗为280W,这也是AMD霄龙家族中迄今最高的,唯一可与之媲美的就是64核心的霄龙7H12,64核心128线程,基准频率2.6GHz,最高加速恰巧也是3.3GHz。 除了它还有霄龙7R22、霄龙7V12等类似的型号,显然都是AMD针对不同客户定制的产品,其中霄龙7R22肯定也是服务于亚马逊AWS,霄龙7V12则是64核心128线程。

    时间:2020-06-24 关键词: 亚马逊 aws 霄龙 霄龙7r32 AMD epyc

  • 141万元的8路GPU+128核CPU怪兽 AMD苏姿丰谈与NVIDIA合作

    141万元的8路GPU+128核CPU怪兽 AMD苏姿丰谈与NVIDIA合作

    AMD与NVIDIA也是斗了多年的竞争对手了,但是双方也不只是兵戎相见,偶尔也有合作的时候。前不久NVIDIA推出了售价141万元(20万美元)的DGX A100超算,除了自家7nm安培GPU之外,还使用了双路EPYC 64核处理器。 DGX是NVIDIA打造的小型GPU超算平台,这次推出的是第三代产品了,DGX A100内部配备了八颗安培架构的Tesla A100 GPU,每一颗整合40GB HBM2高带宽显存,总容量达320GB。 每颗GPU均支持多达12路的NVLink互连总线,GPU-GPU带宽高达600GB/s,可保证八颗GPU彼此完全互连,同时还有6颗NVIDIA NVSwitch芯片,双向带宽高达4.8TB/s。 在CPU方面,以前DGX系列是选择Intel Xeon处理器的,不过DGX A100使用的是AMD的EPYC 7742,64核心128线程,基准频率虽然稍低为2.25GHz,但是最高加速可达3.4GHz,同时热设计功耗控制在225W—;—;官方报价6950美元。 在CPU选择上,以前NVIDIA选择Intel并不让人意外,毕竟两家的竞争并不多,而AMD则是NVIDIA直接竞争对手,现在DGX A100依然选择AMD的EPYC处理器,只能说双方合作的诱惑大于竞争。 一方面是AMD的EPYC处理器是x86服务器CPU中唯一支持PCIe 4.0的,对性能提升作用巨大,另一方面当然是AMD的处理器性价比高,不到7000美元就能买到64核,双路直接128核256线程,划算多了。 对于双方的合作,AMD CEO苏姿丰日前也做了评价,她首先祝贺了DGX A100正式发布,其次就是对NVIDIA选择AMD的CPU产品感到骄傲,表示EPYC不仅带来了PCIe 4.0支持,还是唯一能够为8路安培GPU提供计算性能的。

    时间:2020-06-22 关键词: NVIDIA a100 dgx AMD epyc

  • 5nm Zen 4在路上 EPYC处理器将占AMD营收的30%

    5nm Zen 4在路上 EPYC处理器将占AMD营收的30%

    AMD今晚推出了新的EPYC处理器—;—;霄龙7Fx2系列,主要填补16核、24核的空缺,运行频率更高,三级缓存容量更大,而价格、性价比一如既往地诱人。 对AMD来说,EPYC霄龙系列处理器发展空间巨大,2019年该业务贡献了10亿美元的营收,只占AMD全年营收的15%左右,而AMD的目标是EPYC处理器能够占到30%的营收。 此外,AMD还计划在2023年将营收翻倍增长到150亿美元,30%的营收意味着45亿美元,相比现在的10亿美元还有3-4倍空间,潜力巨大。 EPYC处理器不只是增加营收,还是AMD推动盈利增长的关键,因为EPYC处理器的毛利率比锐龙CPU、Radeon显卡都要高,去年EPYC处理器的毛利率就有45%,超过了桌面CPU、GPU业务的43%毛利率,未来将进一步增加到50%以上。 在EPYC处理器上,AMD今年将推出7nm+工艺的Zen3架构EPYC处理器,代号milan米兰。再下一代则是5nm工艺的Zen4架构,代号热那亚Genoa,预计会在2022年发布。

    时间:2020-05-08 关键词: 处理器 5nm zen4 AMD epyc

  • AMD正式发布霄龙7Fx2:24核心冲到3.7GHz、性能暴涨47%

    AMD正式发布霄龙7Fx2:24核心冲到3.7GHz、性能暴涨47%

    2019年8月,AMD正式发布了代号Rome(罗马)的第二代霄龙EPYC 7002系列,创下80项世界纪录的史上最强x86处理器,拥有7nm工艺、最多64核心128线程、256MB三级缓存、八通道DDR4-3200内存、128条PCIe 4.0通道等令人目眩的规格,获得了整个行业的热捧。 在首发19款型号的基础上,AMD今天又带来了新的霄龙7Fx2系列,运行频率更高,三级缓存容量更大,而价格、性价比一如既往地诱人。 霄龙7F72: 24核心48线程,基准频率3.2GHz,最高加速3.7GHz左右,三级缓存192MB,热设计功耗240W,批发价2450美元。 相比此前的霄龙7402,它的基准/加速频率提高了400/350MHz,三级缓存扩大了一半,代价是热设计功耗增加了60W。 与之最接近的竞品是至强金牌6248R,频率3.0-4.0GHz,三级缓存35.75MB,热设计功耗205W,价格2700美元。 霄龙7F52: 16核心32线程,基准频率3.5GHz,最高加速3.9GHz左右,三级缓存256MB,热设计功耗240W,批发价3100美元。 相比于此前的霄龙7302,它的频率大幅提高了500/600MHz,三级缓存翻倍(甚至比24核心的还要多),热设计功耗也大幅增加85W。 与之最接近的竞品是至强金牌6246R,频率3.4-4.1GHz,三级缓存35.75MB,热设计功耗205W,价格3286美元。 霄龙7F32: 8核心16线程,基准频率3.7GHz,最高加速3.9GHz左右,三级缓存128MB,热设计功耗180W,批发价2100美元。 相比于此前的霄龙7262,它的频率提高了500/500MHz,三级缓存没变,热设计功耗增加35W。 与之最接近的竞品是至强金牌6250,频率3.9-4.5GHz,三级缓存35.75MB,热设计功耗185W。 性能方面,AMD也举了几个实例,比如戴尔PowerEdge R6525配备霄龙7F72,双路四节点系统,创下了VMmark 3.1性能的世界纪录,比以往提高了多达47%。 微软SQL Server 2017使用双路霄龙7F52,每分钟交易数提升了17%,而使用双路霄龙7F32,单位价格的每分钟交易数提升了35%。 与此同时,AMD还宣布了多款新的霄龙解决方案。 其中,超威的SMC SuperBlade是全球第一款基于AMD霄龙的刀片式服务器,第二季度上市;HPE/Nutanix HCI认证已经支持AMD霄龙,相关应用第三季度推出;IBM Cloud新增加48核心霄龙的Bare Metal实例,第二季度上市。 经过两代的耕耘,AMD霄龙已经在服务器、数据中心领域获得了广泛的生态支持,比如云端的亚马逊AWS、Google Cloud、微软Azure、IBM Cloud、Oracle Cloud、腾讯云等都已经是主力客户,更不用说戴尔、联想、HPE、超威、百度等等这些顶级OEM大客户。 而在代表极致性能的超级计算机领域,AMD霄龙也是收获颇丰,包括美国空军、印第安纳大学、橡树岭国家实验室、劳伦斯利弗莫尔国家实验室、阿拉贡国家实验室、圣地亚哥超算中心、法国气象局等等都已经或即将部署AMD霄龙,有的还会同时搭配AMD Radeon Instinct计算卡。 根据此前公布的路线图,AMD接下来将会推出基于7nm工艺、Zen 3架构的第三代霄龙“Milan”(米兰),再往后还有基于5nm工艺、Zen 4架构的第四代霄龙“Genoa”(热那亚)。

    时间:2020-05-07 关键词: 数据中心 服务器 霄龙 7f72 7f52 7f32 AMD epyc

  • AMD悄然升级EPYC 3000系列处理器:8核16线程最低25W TDP

    AMD悄然升级EPYC 3000系列处理器:8核16线程最低25W TDP

    日前AMD悄悄升级了EPYC 3000系列嵌入式处理器,增加了EPYC 3255型号,8核16线程,TDP最低25W,最高55W。 AMD在2018年2月份推出了EPYC 3000系列处理器,面向网络、工业、存储、边缘计算等领域,从血缘上讲与面向数据中心的EPYC 7000系列同宗同源,最多有16个核心32个线程、32MB三级缓存,SoC片上系统设计(无需额外的芯片组),最多支持四通道DDR4-2666内存、64条PCI-E 3.0总线、8个10GbE以太网、16个SATA或NVMe设备。 安全方面也是重中之重,集成独立的安全子系统,支持加密协处理、硬件可信根(Root-of-Trust)、SME/SEV内存加密,当然也少不了企业级的RAS特性。 EPYC 3000系列最多16核32线程,对嵌入式市场来说足够强大了。 AMD宣称,EPYC 3000系列的性价比相比对手(Xeon D系列)高出最多2.7倍,连接性多2倍。 昨天AMD悄悄升级了EPYC 3000系列嵌入式处理器,首先是删掉了两款产品线—;—;EPYC 3401、EYPYC 3301两款16核、12核处理器不再提供了。 AMD删除这两款处理器的原因不得而知,有很能是跟EPYC 3451、EYC 3351两款处理器定位太接近,没存在的意义了。 在删除两款产品的同时,AMD增加了一款新型号—;—;EPYC 3255处理器,8核16线程,TDP 25-55W,频率2.5GHz到3.1GHz,16MB L3缓存,支持2通道DDR4-2666内存,32条PCIe通道,工作温度-40°C到105°C。 从EPYC 3255处理器来看,它大幅削减了TDP功耗,最低可达25W,但频率又跟EPYC 3251一样,同时适应的工作温度范围大幅增加,之前范围是0-105°C,也就是不支持低温环境工作。 还有,EPYC 3000系列处理器的区分也更明显的,EPYC 3451、EPYC 3351两款使用的是SP4插槽,这两款是双核心架构,而其他CPU使用的是SP4r2插槽,都是单芯架构,内存通道、PCIe等IO数量也砍半了。 最后价格还是欠奉,不清楚多少钱。架构、工艺也没提及,这点应该跟2018年发布的EPYC都是一样的,没必要折腾上7nm工艺。

    时间:2020-04-30 关键词: 3000 处理器 嵌入式 3255 AMD epyc

  • Linux 5.7神优化:AMD 24核心霄龙性能暴涨最多4.2倍

    Linux 5.7神优化:AMD 24核心霄龙性能暴涨最多4.2倍

    Linux 5.7版内核虽然还在开发初期阶段,但已经展现了巨大的威力,尤其是Netfiler框架将会针对AVX2指令集进行优化,Intel、AMD的当代处理器都会获益匪浅。 Red Hat红帽的工程师就正在进行这方面的优化工作,并且取得了明显成效。具体技术原理、细节咱就不关心了,只说说结果。 在一套基于AMD霄龙7402处理器的服务器上,实测优化之后在不同测试项目中的性能提升幅度少则26%,最多可达惊人的420%,并且多数测试的提升幅度都超过了100%! 当然,这种优化对于Intel处理器同样有效,红帽工程师还在研究对ARM NEON架构进行类似的优化,但还没有具体性能变化数字。 霄龙7402(Rome)基于7nm工艺和Zen 2架构,拥有24核心48线程,三级缓存128MB,基准频率2.85GHz,最大加速3.35GHz,支持128条PCIe 4.0、八通道DDR4-3200,热设计功耗180W。

    时间:2020-04-28 关键词: 霄龙 AMD epyc Linux

  • AMD即将公布Zen4架构:64核或128核、5nm还是7nm悬念揭晓

    AMD即将公布Zen4架构:64核或128核、5nm还是7nm悬念揭晓

    AMD今天获得了一份新的超算订单,联合HPE旗下的Cray为美国能源部建造El Capitan超算,预算6亿美元,将使用AMD下一代CPU及Radeon加速卡,2023年问世,浮点性能200亿亿次。 El Capitan超算具体什么规格?现在还有3年多时间,所以CPU/GPU详情未知,可以确定的倒是第三代Infinity Fabric总线,每路EPYC CPU搭配4块Radeon Instinct加速卡。 对于超算的CPU,现在比较靠谱的说法是Zen4架构的新一代EPYC,按照之前的猜测来看,Zen4架构会是一次全新升级,平台也会升级到了DDR5、PCIe 5.0,这些先进技术对应百亿亿次超算时代,在性能及能效上才能满足要求。 在EPYC服务器中,对应Zen4架构的产品是Genoa热那亚,意大利城市,而现在的EPYC代号Rome罗马,二者之间还会有Zen3架构的Milan米兰,其基础规格和现在的Rome二代霄龙很相似,也是DDR4内存、PCIe 4.0总线、SP3封装接口,继续保持平台兼容,看来会集中精力于架构优化、性能提升。 现在最大的谜团就是Zen4及Genoa处理器的架构及工艺了,是继续坚持最多64核还是升级到128核,是使用5nm还是日前爆料的那样继续用7nm+打磨,这两个改进牵动着A饭以及业界的心。 相信所有人都期待着AMD能上5nm工艺打造128核256线程处理器,在高性能计算上继续一骑绝尘。 最终如何很快就要揭晓了,AMD数据中心暨嵌入式业务总经理Forrest Norrod表示AMD将在即将举行的分析师会议上公布Zen4/Genoa处理器,也就是这个周四—;—;国内大概是明天凌晨了。

    时间:2020-04-22 关键词: CPU 处理器 热那亚 zen4 AMD epyc

  • AMD扩展Infinity Fabric总线技术 CPU与GPU之间终于共享内存了

    AMD扩展Infinity Fabric总线技术 CPU与GPU之间终于共享内存了

    在AMD的锐龙处理器架构中,Infinity Fabric(以下简称IF)总线是个核心技术,有了它才可以让众多CCX模块互联互通。之前IF总线主要用于CPU核心之间连接,现在AMD终于开始用于EPYC CPU与Radeon显卡了。 在OGHPC会议上,AMD介绍了CPU与GPU之间通过IF总线连接的内存一致性情况,现在他们已经可以将EPYC CPU与Radeon显卡联合工作,带4组Radeon Instinct加速卡没问题。 AMD做到这一点倒是毫不意外,甚至说在这方面他们已经慢了几步,这是异构高性能计算必须的,IBM与NVIDIA联合开发的NVLink 3.0已经实现了300GB/s的带宽,Cray公司自己开发的SlingShot总线带宽也达到了200GB/s。 Intel这边也在开发CXL总线,计划基于PCIe 5.0总线技术,带宽也轻松超过128GB/s。 AMD的IF总线在7nm Zen2上发展到了第二代,位宽从之前256bit扩展到了512bit,带宽从42GB/s提升到了92GB/s,与其他总线相比没多少优势,估计很快就会有IF 3.0总线技术了。 今年1月初,AMD还挖来了前IBM Power 9处理器的开发工程师Joshua Friedrich担任副总裁一职,后者1999年加入IBM公司,已有20多年先进处理器开发经验,之前在IBM担任了Power处理器技术总监,当前TOP500第一超算Summit使用的处理器Power 9就是他任内主导开发的。 Joshua Friedrich进入AMD公司后,无疑会在EPYC处理器及Radeon Instinct加速卡紧密集成的研究中扮演重要角色。现在来看,AMD确实是有这样的计划的,这也是他们14年前收购ATI公司最重要的目的。

    时间:2020-04-21 关键词: CPU GPU 显卡 infinity fabric AMD epyc

  • Cloudflare放弃Intel至强处理器 全面转向AMD EPYC

    Cloudflare放弃Intel至强处理器 全面转向AMD EPYC

    在服务器处理器市场上,AMD今年的目标是占据至少10%的份额,这个不算很难,因为7nm Zen2架构的EPYC 7002系列正不断给AMD带来客户。今天Cloudflare宣布他们的第十代刀片服务器全面转向AMD的EPYC处理器。 Cloudflare是一家网络服务供应商,成立于2009年,主要提供CDN、DNS服务,截至2020年2月份在全球90多个国家200多个城市建有数据中心,每天有10亿个IP地址流经他们的网络,每秒钟处理1100个HTTP请求,95%的全球连接都可以在100毫秒内完成。 10年来Cloudflare的服务器一直都是选择Intel至强,放在以前这没什么问题,但是在第十代刀片服务器上他们放弃了老伙伴,转向了AMD的EPYC处理器,而且这一代服务器没有任何Intel组件,CPU、主板、内存、存储及网络接口上都没有Intel部件,这在行业内都是极少见的。 他们列举了最近几年来其刀片服务器的配置选择,2015年用是双路8核的至强E5-2630 v3,之后一路用到第九代刀片服务器的双路至强铂金6162,2x24核,2x150W TDP。 第十代刀片服务器中选择了AMD的EPYC 7642处理器,这是一款48核96线程处理器,他们最初也考虑上64核EPYC,不过测试之后发现性能提升没那么高,最终放弃了64核产品。 即便如此,48核的EPYC 7642依然能考单路就达到了之前双路的效果,而且缓存、内存、PCIe通道数等方面更好,TDP功耗都低了75W,相当于每核心TDP降低了25%。 至于为什么选择AMD EPYC处理器,他们公布的测试结果可以说明问题了。 详细的评测在下面,不过这张表格总结了EPYC 7642与双路至强铂金6162的性能对比,可以看到AMD在性能上少则领先27%,多则领先50%。 当然,最具悬念的还有售价,Cloudflare没公布具体价格,估计采购价不太好说,这是商业秘密。但公开报价来看,EPYC 7642是5885美元,至强铂金6162是3115美元,2颗就要6230美元。

    时间:2020-04-20 关键词: Intel 处理器 霄龙 至强 AMD epyc

  • 英国16亿美元建设全球最强气象超算 至少20亿亿次性能

    英国16亿美元建设全球最强气象超算 至少20亿亿次性能

    本周一,英国政府宣布拨款12亿英镑,约合15.6亿美元(约合110亿人民币)用于研发新一代超算,目标是在2022年获得全球性能最强的天气预报超算。 天气预报、气象模拟是超算使用最广泛的领域之一,复杂多变的天气最能发挥出高性能运算的优势。目前英国有三台美国Cray公司的XC40超算,最高性能性能乘客达14PFLOPS(1P=1千万亿次)。 英国的新超算预计性能是当前超算的20倍以上,预计性能水平至少是200PFLOPS的,也就是20亿亿次性能,跟当前TOP50冠军的美国Simmt超算性能差不多。 不过英国政府还没宣布他们的新气象超算会使用什么样的配置,基本上可以确定是CPU+GPU异构体系的,但具体如何在AMD、NVIDIA及Intel三家中选择就不好说了。 如果要猜的话,这套超算大概率会使用Cray公司的Shasta超算系统,最可能的组合还是AMD EPYC处理器及NVIDIA GPU。 Cray公司日前也宣布获得了美国海军超算资源中心DSRC的新超算订单,为后者研发12.8PFLOPS性能的新超算,使用的就是AMD EPYC霄龙处理器。 在此之前,AMD二代霄龙已经赢得了多笔超算订单,比如德国的Hawk,美国的Frontier(百亿亿次号称世界最快)、Perlmutter、BullSequana、芬兰的某超算,每一套都是成千上万颗,而且多数都是最顶级的64核心型号。

    时间:2020-03-09 关键词: 英国 气象 天气预报 超算 AMD epyc

  • 第二代AMD EPYC赋能OVHcloud为裸金属服务器带来超强动力

    总部位于法国的OVHcloud 是一家于1999年创立的全球超大规模云提供商,专注于提供专用裸金属服务器、私有云解决方案和公有云基础设施,并设计服务器、运营数据中心以及光纤网络。一直以来,OVHcloud致力于寻求依靠云服务的规模经济效益为其 160 万客户提供极具优势的方案。 OVHcloud 致力于为客户提供更具成本效益的裸金属服务器,以在提供更高性能的同时,减少资本投入并且降低运营成本,因此,一个性能高、多功能且经济实惠的平台是 OVHcloud 一直以来追求的目标。为此,OVHcloud 在部署了AMD EPYC( 霄龙)7351P和 7371 处理器后,进一步升级了包括 EPYC 7402P 和7451 处理器在内的高级服务器选项。实践证明,相同成本下服务器性能提高了 30%,能效得以提升,并降低了运营成本,总计节省 30% 至 50%。 采用AMD EPYC打造最高性价比解决方案 在20年的发展历程中,OVHcloud公司积累了庞大的用户群,因此其并不依赖任何第三方品牌的通用服务器。相反,它会评估各个组件,在每个类别中选择更好的组件,然后构建自己的服务器。因而,为了实现提供高性价比解决方案这一目标,常用的方法是在单路服务器中实现更高的性能以降低资本支出和日常运营成本。经过一系列的全面评估,AMD EPYC (霄龙) 系列处理器(以下简称“AMD EPYC“)成为OVHcloud的最佳选择,可同时提供更高的性能和更低的成本。 当企业在 30 个数据中心中运行超过 40 万台服务器时,AMD EPYC不仅可以帮助降低成本,而且能够提高核心密度,并在运营成本和客户满意度方面体现巨大的优势。利用 AMD 高性能单路服务器,OVHcloud 从 16 核心 EPYC 7351P CPU 开始构建初始平台,目标使用案例是虚拟化和传统计算。 “与竞争对手相比,我们新的基于 EPYC处理器的服务器平台以相同成本提供了 30% 以上的性能提升,使得选择这个平台的客户非常满意。” OVHcloud 裸金属产品经理 Ludovic Dargent表示。 在采用 AMD 的 EPYC 7351P 处理器取得成功之后,OVHcloud开始使用更多的 EPYC CPU 为高端服务器、基础设施以及 HG 产品线增加更多的选择。这其中包括作为高端产品线中的增强版本而推出的 AMD EPYC 7451、面向基础设施服务器产品提供的 16 核心更高频率的 AMD EPYC 7371、面向 HG 服务器所提供的具有 24 核心以及更高核心密度的第二代AMD EPYC 7402P。 “随着新的 EPYC架构的引入,AMD 在数据中心的价值得到了充分展现,”OVHcloud 裸金属部门负责人 Yaniv Fdida 表示,“客户正在寻找具有高性价比的产品,而 AMD EPYC所拥有的技术使每个核心都能满足期待的投资回报率。这意味着客户可以最大化地利用和优化其占用空间,同时提供相同的工作负载性能。总的来说,AMD EPYC可以被称为是目前整个市场最具吸引力和每核性价比的产品。” 从提高能效到定制化,AMD EPYC赢得用户青睐 AMD EPYC 除了能提供更高的性能和更低的成本,还可以提高能效,从而帮助OVHcloud的运营成本得到进一步减少。Fdida解释道: “客户可以花更少的钱购买相同数量的内核,也可以以同样的价格增加核心数量,因此无需再购买更多的服务器,反过来又降低了运营成本,带来了巨大的累计节省。 “事实上,OVHcloud 已经计算出,所有的节省加在一起可以等同于成本降低 30% 到 50%。 除此之外,AMD平台还拥有大量的PCI Express通道可以为不同的工作负载提供广泛的定制化服务。尽管OVHcloud的裸金属服务器具备完全可定制化,但前提是能够为所有解决方案采用相同的机箱,EPYC使得其在产品设计方面完全不受任何限制。 而真正的考验是新服务器在用户中的表现如何,因此OVHcloud通过客户反馈不断监控产品或服务的使用情况。Fdida表示:“到目前为止,我们所提供的首个基于 EPYC 7351P 的裸金属服务器产品取得了巨大的成功,数以百计的客户已经给了我们很好的反馈。性能一致、安全等级高、稳定可靠等优势,让每个测试 EPYC处理器解决方案的人都会最终选择它。” 期待采用更多第二代AMD EPYC,为客户创造更大价值 Fdida表示,基于持续的良好体验, OVHcloud非常期待能够使用更多第二代AMD EPYC(霄龙)处理器来开发服务器产品,为更多领域的客户创造更大价值。第二代AMD EPYC处理器在每个SoC上最多提供64个 “Zen 2”核心,最高拥有128个线程,与上一代相比,每个核心的服务器工作负载IPC性能提升高达23%,L3缓存最多增加4倍,能够大幅度的提升性能,负载能力更强且成本更低,拥有更高的性价比。 “我们有一个关键问题必须回答,”Fdida 说道,“即如何用有限的服务器平台满足尽可能多的客户需求,第二代 AMD EPYC 处理器将对我们有很大帮助——我们可以为多节点工作负载和数据处理提供以计算为中心的服务器、虚拟化平台以及高端 IOPS 和存储服务器,并且所有这些均使用了相同的可定制化基础平台。” 今天,产品的灵活性在迅速变化的市场中是至关重要的。Fdida认为:“越来越多的工作负载需要厂商能够提供基于高核心密度和高性能存储的经济型解决方案。AMD EPYC 能够为我们提供高性能、经济实用的解决方案,并且第二代AMD EPYC 延续了我们在第一代处理器中所看到的亮点。” 同时,AMD 的持续创新也推动了 OVHcloud 探索和追求更多市场机会的能力。Fdida 继续说道:“凭借每路翻倍的核心数量,我们将有机会进入金融科技和医疗等新兴市场,AMD EPYC将帮助我们在这些市场抢占先机。OVHcloud 提供了解决数据挑战所需的本地化和自由度,即以正确、负责任的方式面对各种问题和挑战,而AMD EPYC对此提供了巨大的帮助。我们很有信心基于AMD 的产品为客户实现其目标。” 为自由而创新是OVHcloud的宗旨,AMD EPYC(霄龙)处理器则与这个理念完美契合。OVHcloud 所实现的初始服务器产品现在正发展成为基于AMD EPYC的全系列服务器,并通过各种服务为公司及其客户带来利润。展望未来,第二代AMD EPYC(霄龙)处理器作为服务器市场的性能强者,会持续赋能OVHcloud不断创新突破,为用户带来更多更好的解决方案。

    时间:2020-03-03 关键词: 服务器 ovhcloud AMD epyc

  • 网课常崩溃?64核才给力!

    网课常崩溃?64核才给力!

    人们最近的生活,都被突如其来的疫情打乱了节奏。以家庭为单位,目前我们的生活是这样子的:几天外出一次采购日常所需的食物(兼职倒垃圾),其余时间一家人待在屋子里看电视,逛网店,远程办公或者在线复课学习,在目前的特殊情况下,宅在家,不乱走,就是做大贡献了。 但是,这种宅在家里的日子,时间短一点还行,长时间真的是耽误事。虽然大部分的企业延迟开工、学校延迟开学,但是该完成的KPI不能忘,该上的课也不能落下,怎么办?远程办公和在线教学成为企业和学校的必然选项。我们先看下目前复课需求迫切的学校以及千万学子和家长们关注的在线学习情况。 网课前的准备工作 对于老师来说,课前需要备课,规划给学生讲什么、如何讲。 对于学生来说,就是要严格遵守学校给出的课表,按照上面的时间进行打卡,认真听老师直播教学内容,积极与老师进行互动。 上课要有仪式感,为了提高上课的专注度,河北石家庄某中学要求学生在家上网课时身着校服上课,老师穿正装教学。 网课“崩坏”现场 理想很丰满,现实很骨感。 准备工作完成,当老师和学生通过电脑/平板/电视等终端设备打开网课软件(包括但不限于钉钉、腾讯课堂、学习通等)后,各种崩坏现场出现了… 新任主播(老师)以及主播粉丝们(学生们)开开心心的打开网课软件,准备上课或听讲,什么?登录不上?那一刻的心情,只能用“老爷爷、地铁、手机”来形容了 全国各大中小学以及高等院校已经陆续开始了在线教学,老师直播时问题层出不穷,不同的网课软件各有各的问题,十八般武艺花式上热搜。以IT技术过硬出名的北京某名牌高校就遇到了尴尬的情况:本学期开设的3千多门本科生和研究生课程中,真正能实现实时视频直播互动的课堂可能只有一门,其余的都是各院系各显神通,通过录播+微信群、MOOC平台+微信群、有声PPT+腾讯会议、公开课视频+微信群等等模式实现课件的展示和互动,微信群表示压力山大… XXX又崩溃了——这是最常出现的热搜,还有老师直播时,各种卡顿、音画不同步、音质差,以及老师与学生互动时网络延迟等等问题。出现这些问题时,需要第一时间检查终端设备以及网络情况,如果二者均运行良好,那就是网课平台出了问题。 为什么在线教学平台会频频出现问题?我们先来算算,有多少人要用到网课软件,基本是全国的小学生、初中生、高中生、大学生,再加上授课的老师,还包括其他行业占用网课软件的情况(比如钉钉),网课软件的后台系统峰值流量暴增几百倍甚至更多,服务器运行后台不堪重负,才会频频出现问题。 后台容量不足,扩容没有跟上并发的增长,导致网课软件登录难。而服务器配置过低、服务器资源过载、带宽不足等因素都会造成直播中出现卡顿,延迟,导致直播慢,内容声音不同步等现象。 如何解决?扩容啊! 答案似乎很简单:扩容!但是,扩容的代价真的很高。 扩容,无非有两种方式,增加服务器数量,以及增加单个服务器的负载能力,或者说找到负载能力更强的服务器产品。当然,也可以选择两者组合的模式,可以按需选择扩容模式。 但是,IT决策人员面临巨大的挑战,不扩容,平台应付不了暴增的在线学习需求,领导肯定不同意;扩容的话,又需要大笔的新投入,能不能获批,又是个难题,毕竟服务器系统成本高,采购服务器产品,需要严谨的合理的分析,正确的选型,更重要的是,找到高性能,低成本,或者说能够找到高性价比的解决方案是能否成功扩容的关键。 谁是扩容的优选? 在x86服务器市场,AMD一直以其高性价比产品得到用户的青睐。其最新推出的第二代AMD EPYC (霄龙)系列处理器(在产品性能、规格和创新特性、以及价格等方面都极具竞争力,可以为在线教育提供更高效、稳定、高性价比的全面保障。 第二代AMD EPYC是全球首款7nm数据中心处理器,其在每个SoC上最多提供64个“Zen 2”核心。与上一代相比,每个核心的服务器工作负载IPC性能提升高达23%。第二代AMD EPYC就是专门为现代数据中心工作负载而设计,其在多种工作负载下最高能将总体拥有成本(TCO)降低50%,负载能力更强,且成本更低。 同时,下一代AMD Infinity架构突破了x86性能和计算能力的界限,让客户能获得同类产品最高的I/O和内存带宽 ,包括PCIe 4.0接口,以全新领先特性充分释放服务器的吞吐性能。 可以说,不管企业选择哪种扩容方式,搭载第二代AMD EPYC的服务器产品都是一个极具优势的可选方案。企业通过采购搭载第二代AMD EPYC的服务器产品可以迅速扩展后台容量,另外第二代AMD EPYC性能超强,创造了超过140项的全新世界纪录,超高I/O带宽实现海量的并行负载能力,对于网课软件流量暴增所带来的登录难、卡顿、延迟等问题,都可以完美解决,还能进一步支撑用户暴增所带来的新需求。 总结来说,搭载64核128线程的第二代AMD EPYC的服务器产品能给各类在线教学平台提供更强有力的后台保障,应对流量暴增所带来的一系列挑战,从而确保在线教学直播可以稳定顺畅进行,为老师及学生们提供更流畅、高质量的在线教学/学习体验,在不返校的情况下成功复课,为广大老师和学生打造完美的在线教学互动平台。

    时间:2020-02-27 关键词: 在线教学 AMD epyc

  • 64核加持!第二代AMD EPYC处理器助力应对在线办公挑战

    “又崩了!” 在新冠疫情的背景下,远程在线办公成为多数公司的复工选项,与此同时“崩”成为了频繁冲上新闻榜单的热词。由于很多工作应用都转移到了线上,这也使得很多平台因为不堪用户的拥堵和流量的暴增纷纷发生崩溃问题。 特别是最近两周,随着越来越多的企业在线复产复工,在线办公平台也迎来了空前的流量大挑战。如何让在线办公更轻松,告别卡顿、延迟等问题的困扰,成为了众多平台提供商眼下面临的重大挑战。 办公平台问题频出,首次大规模在线复工体验不佳 事实上,为应对全国数千万企业组织、近2亿活跃用户激增的在线办公需求,各家在线办公平台提供商都纷纷采取行动。例如,钉钉不得不迅速连续两次扩容共2万台云服务器,企业微信也紧急进行了大幅度的扩容,以应付暴增的在线需求。应该说,面对突然涌入的大量企业用户,在线办公平台们虽然守住了“初考”,却仍然因为卡顿、延迟等问题用户体验不佳。 最大的难题在于系统的稳定性。由于登录用户过多,很多人在登录页面时发生系统无响应甚至崩溃的情况,需不断刷新登录页面。特别是早会高峰期9点左右,即使登录完成,在线办公平台或多或少也会出现短时间卡顿、掉线、看不到消息回复甚至无法进入会议的情况。 办公系统的流畅性也是在线办公用户的一大诉求,导致办公不流畅的因素除了网速,还包括平台本身,尤其是远程服务器的并发处理能力。不少用户抱怨,云平台虽然便于云端存储和移动共享,但在敏捷度和流畅性上则不尽人意,非常影响办公体验。 在线办公平台还要具备一定程度的安全水平。在远程办公状态下,企业员工分散在四面八方,如何确保远程办公人员身份的真实性、业务操作可溯源性、业务数据传输的机密性和设备应用的安全性,事关企业核心利益。并且在远程办公期间,也要加强对钓鱼邮件和水坑等攻击手段的防范措施,避免遭受数据信息乃至经济损失。 技术上看,在线办公平台除了上述的基础外,还需要具备一定的兼容性。在当前的在线办公环境下,越来越多的企业正在根据实际需求开发新的功能模块和技术,以实现“all in one” 的在线办公平台。这样的平台对服务器的兼容性也提出了更高的要求。 从“源头”入手,第二代AMD EPYC处理器解决四大“困扰” 对于目前充满挑战与机遇的在线办公平台运营者来说,用户体验意味着市场,容不得一丝懈怠。优质的线上服务离不开可靠、稳定的服务器设备。选一个功能强大的服务器处理器,相当于在本质上超越对手,保障办公平台的卓越性能。 对于目前的服务器处理器产品,从性能的领先性和成本的节约性两方面考虑,第二代AMD EPYC(霄龙)处理器可以说是在线办公平台提供商的绝佳选择。凭借64核128线程,7nm制程和对领先的PCI-E 4.0标准的支持,以及远低于同类产品的成本,第二代AMD EPYC一经发布便在全球服务器市场掀起了声势浩大的64核性能革命,已经创造了超过140项的世界纪录。面对在线办公平台对于数据中心服务器的工作负载需求,第二代AMD EPYC是应对目前挑战的理想选项。 首先,最高64核128线程,无与伦比的高性能,能轻松应对高并发,保障服务器的稳定性和速度。在远程办公蜂拥而上的情况下,技术平台服务器必须具备大并发处理能力和高可靠能力。第二代EPYC拥有的下一代AMD Infinity架构突破了x86性能和计算能力的界限,让客户能获得同类产品最高的I/O和内存带宽,包括领先的PCIe 4.0接口,从而满足对横向流量带宽的巨大需求。同时在每个SoC上最多提供64个“Zen 2”核心,最高拥有128个线程,与上一代相比,每个核心的服务器工作负载IPC性能提升高达23%,L3缓存最多增加4倍,能够大幅度的提升性能。 其次,突破性的运算性能,为远程办公提供灵活高效的运算能力。大规模的在线办公应用,无论在应用还是数据存储上,都必须依托计算能力足够强的处理器平台。对于现代云计算和虚拟化工作环境,第二代AMD EPYC处理器提供了创世界记录的虚拟化性能,重新定义了数据中心的经济性,能够充分满足传统、虚拟化、混合和多云等多种工作负载的需求。 再次,硬核加密为数据安全保驾护航。AMD 第二代EPYC提供“硬核”芯片级嵌入式安全子系统,以及安全内存加密和安全加密虚拟化等高级安全功能,帮助客户保护他们最重要的资产和数据。例如,在虚拟化环境中,用户可以通过安全加密的方式检查整个软件栈是否已成功在已选择的云服务器或服务上无损启动。采用加密内存后,也能够防范对主内存完整性的攻击(如冷启动攻击)。 最后,X86系统的兼容性为企业免除后顾之忧。AMD积极与开源社区、主流软件供应商、云服务提供商密切合作,形成了空前壮大的合作伙伴生态系统,包括以确保企业应用和支持软件可以非常好地与EPYC兼容。 于是,绝大多数领先的云服务提供商(如腾讯云、AWS、Google Cloud、Microsoft Azure、Oracle Cloud等)都纷纷选用了 AMD EPYC处理器。 当前,无论是数字化转型的大趋势,还是战“疫”背景下的在线办公需求激增,都意味着越来越多的企业将工作场景转移到线上,第二代AMD EPYC作为目前处理器市场上的性能王者,以最高64核128线程的空前高性能,无与伦比的I/O和内存带宽,以及率先支持PCIe 4.0等创新标准,加之以庞大的合作伙伴生态圈,无疑将成为越来越多企业和数据中心的新选择。

    时间:2020-02-25 关键词: 处理器 在线办公 AMD epyc

  • AMD EPYC(霄龙)处理器家族再添新成员

    AMD EPYC(霄龙)处理器家族再添新成员

    我们的目标是通过AMD EPYC(霄龙)处理器系列,在核心和速度方面,为客户提供其工作负载所需的强大性能。我们正在扩展EPYC(霄龙)系列,为客户的工作负载提供更多的选择。 在推出第二代AMD EPYC(霄龙)处理器时,我们是首个将64核x86服务器处理器推向市场的公司。近日,第二代EPYC(霄龙)家族增加了新的成员,其中一款是我们的第五款64核处理器:AMD EPYC(霄龙) 7662。这款处理器是进入64核市场的很好切入点,为客户提供了与速度绝佳的X86处理器AMD EPYC (霄龙)7H12相同的高性能“Zen 2”核心,但同时与其他主流64核AMD EPYC (霄龙)处理器相比成本更低。 另一款新增的AMD EPYC (霄龙)7532处理器,为客户提供了高性能的32核心,以及共256MB的L3缓存,缓存数量与第二代EPYC (霄龙)64核处理器相同,因此AMD EPYC(霄龙)7532非常适合缓存敏感型工作负载,如ANSYS CFX,允许每个核心访问高达8MB的L3缓存。在所有ANSYS CFX基准测试中,AMD EPYC(霄龙) 7532的平均性能表现卓越。 这两款处理器拥有第二代AMD EPYC(霄龙)处理器系列的所有特性,包括128条PCIe 4.0通道,以及支持高达3200MHz的内存和先进的安全功能。 首批支持这两款新处理器的合作伙伴包括Dell Technologies和Supermicro。两款处理器现已使用于Dell EMC PowerEdge R6515、R7515、R6525、R7525和C6525服务器,也适用于所有的Supermicro A+服务器,同时Supermicro “Big Twin” 服务器将支持搭载AMD EPYC (霄龙)7532。HPE和联想预计将在未来几个月内支持这两款全新AMD EPYC(霄龙)处理器。 产品详细信息请参考下表。

    时间:2020-02-24 关键词: 处理器 霄龙 AMD epyc

  • AMD数据中心业务去年营收10亿美元 EPYC处理器大涨

    AMD数据中心业务去年营收10亿美元 EPYC处理器大涨

    日前AMD发布了2019年Q4季度财报,营收大涨50%,净利润大涨350%,财务表现非常漂亮。推动AMD大涨的主要是计算及图形业务,营收增长了70%左右,那AMD视为重点的数据中心业务呢? 在AMD的财报数据中,Q4季度中企业、嵌入式和半定制业务收入4.65亿美元,同比增长7.4%,去年全年企业、嵌入式和半定制业务收入20.22亿美元,同比还减少14%,这个应该如何评价呢? 由于AMD把半定制业务也算作这里面,所以下滑并不是说EPYC处理器或者Radeon Instict显卡的问题,主要是现有一代的主机订单到了末期,下滑是常态了,而EPYC及Radeon部分是在增长的。 根据NPT网站计算,Q4季度中,AMD的Radeon Instinct加速卡业务营收8200万美元,同比增长了28.4%,其中谷歌的Shatdia云游戏平台就贡献了一半的营收,不过后者使用的显卡还是RX Vega 56定制版的,不是最新的7nm显卡。 EPYC处理器营收则达到了2.32亿美元,同比大涨了55.7%,涨势明显。 与Q4季度的21.3亿美元总营收相比,数据中心相关的业务营收3.14亿美元,增长了14.8%。 2019全年中,AMD的Radeon Instinct GPU加速卡业务营收2.93亿美元,EPYC处理器营收6.94亿美元,数据中心业务合计营收9.86亿美元,占全年营收的14.7%。 考虑到AMD目前的发展速度,数据中心市场还会继续增长,2020年的营收预计会增长一倍多,毕竟AMD的目标是在今年底占据至少10%的服务器处理器市场份额,而去年底的份额不过5%左右,仅此一项就能增加差不多10亿美元的营收。 当然,2020年还有一个重要的增长动力,那就是新一代主机PS5、Xbox Series X,这两个主机订单预计能增加7.5到8亿美元的营收。

    时间:2020-02-17 关键词: 数据中心 radeon 64核 AMD epyc

  • 14nm缺货已经影响高端至强处理器 AMD要躺赢了

    14nm缺货已经影响高端至强处理器 AMD要躺赢了

    不知不觉中,Intel的14nm缺货问题已经持续了一年半了,前不久仁宝表示这个问题要比之前预期的严重,有可能持续到2020年年底。按照之前的说法,14nm产能紧缺之后,Intel会优先供应至强、酷睿处理器,但是现在情况好像不太一样了,HPE(惠誉)等厂商抱怨说Cascade Lake-SP系列处理器也缺货了,他们不得不转向AMD。 Cascade Lake-SP系列处理器是Intel最新一代的至强二代可扩展处理器,用于取代Skylake-SP系列的至强可扩展处理器一代,也是14nm工艺的,核心数依然最多28个,去年4月份才发布的,是当前的服务器芯片主力。 二代至强拥有多达60款型号,并按照规格特性不同,分为多个子系列,其中M系列支持2TB中等容量内存(Medium),相比1.5TB的标准版贵大约3000美元,L系列则支持4.5TB大容量内存,比标准版贵大约7000美元。 有意思的是,最近Intel宣布二代可扩展至强M系列全部停产,L系列同时降价到M系列的档次,部分型号降幅高达54%,官方称这是出于客户反馈和市场销售情况,为客户提供最佳产品。 至强二代降价是好事,但是包括HPE惠誉、戴尔、联想在内的大客户最近开始抱怨14nm至强处理器的供应问题了,HPE预测称2020年的14nm至强供应依然会受到限制,使用这些处理器的平台会受影响。为了最大限度地减少Cascade Lake供应不足导致的影响,HPE督促客户选择可替代的处理器。 这个替代方面就是AMD处理器,如果是前几年估计AMD想替代也不行,EPYC霄龙之前的处理器性能、能耗都跟不上了,但是现在一代、二代霄龙今非昔比了,尤其是去年上市的EPYC 7002系列,7nm Zen2架构,最多64核128线程,128条PCIe 4.0通道,还有8TB内存支持,除了AVX512指令集之外几乎都是完胜,关键是价格还便宜一大截,比降价后的至强依然有优势。 按照AMD之前的预测,他们在2020年底前希望抢到10%的服务器处理器市场份额,但是现在看来,今年的目标有希望提前完成了。

    时间:2020-02-11 关键词: 产能 处理器 14nm 霄龙 至强 AMD epyc

  • AMD走出自己的路 小芯片设计如何打造业界最强64核EPYC?

    2019年5月,AMD迎来了自己的50岁生日。在X86这个行业,她只比老大哥Intel小一岁,后者去年迎来了自己的50周岁纪念日。50年来,这两家企业几乎主宰了全球半导体市场的风云变化,基本上Intel占主导地位,而AMD扮演挑战逆袭者的角色。 AMD的最近一次逆袭,还得从5年前更换CEO说起。2014年10月份,即将发布Q2季度财报的AMD公司宣布CEO罗瑞德退位,这个职务将由时任COO的苏姿丰博士(Lisa Su)接任。那时候的她,刚刚加入AMD公司2年而已。 彼时的AMD仍然处于蛰伏阶段。在CPU及GPU领域,AMD的两大对手Intel、NVIDIA已是如日中天,而当时的AMD并没有能足够与之博弈的处理器和显卡产品—;—;如今给AMD带来巨大转机的Zen处理器当时还在开发当中。不过,CEO苏姿丰是标准的女强人,AMD不服输的血性是刻在骨子里的。 刚刚接任CEO没多久,苏姿丰就在接受媒体采访时表态—;—;“我们不会活在Intel阴影下”,这句话不是苏姿丰担任CEO之后AMD才做的,多年来AMD实际上一直在这样做。AMD希望寻求一条不同于Intel的发展之路。 太远的不说,从X86处理器进入64位时代开始,AMD首次在64位指令集上做到了胳膊拧过大腿—;—;大家津津乐道的K8大锤处理器最关键的成功不是架构,而是抢先了64位指令集,如今我们在用的X86_64指令集的名字是AMD64,Intel后来也遵从了这一指令集。 在这之后,AMD在X86处理器发展上一直在走自己的路。2011年,AMD推出了推土机Bulldozer架构,这款处理器的设计思路非常先进,2个整数单元+1个弹性浮点单元的设计迎合了AMD收购ATI之后意图打造的CPU+GPU协同发展的理念,这种模块化设计是X86发展的一个里程碑。 推土机首发桌面8核处理器 再后来,AMD推出了我们今天讨论的主角Zen核心,这一代的处理器架构设计可谓具有突破性的改进,也同时延续了AMD自己的特色。它的问世不但让AMD实现了逆袭,也给AMD打下了未来十年的基础,目前发展到了Zen2,从路线图上看,Zen4架构已经在研发了。 Zen架构实现52% IPC性能提升 模块化设计重出江湖 十年磨一剑,终成大器!2017年3月2日,AMD终于拿出了Zen核心的锐龙处理器,重返高性能处理器市场。Zen架构的到来,给了AMD扭转局势的机会。在K10、推土机两代架构之后,这是AMD再一次冲击X86市场,AMD也多次表态要再现辉煌,夺回失地。 关于第一代Zen架构的改进细节,这里就不一一赘述了。两年前发布的产品在网上已经有大量评测和解析了,我们只提AMD在重新设计了内核、SMT多线程、缓存、Infinity Fabric总线等单元之后,Zen架构实现的目标吧。 AMD之前宣称Zen架构实现了40%以上的IPC提升,不过最终发布时,AMD表示其实际IPC性能提升了52%,远超预期。相比以往的K10、推土机架构有了质的改变,比对手挤牙膏式的架构升级也是天翻地覆的变化。 在上述架构改变中,AMD重新设计的CCX(CPU Complex)架构是最重要的。每个CCX单元有4个CPU核心,每个核心各自有64KB L1 I-Cache(指令缓存)、32KB L1 D-Cache(数据缓存)、512KB L2缓存,L3缓存高达8MB,但是4个核心共享的。 这样4核CPU组合的CCX算是AMD Zen架构的一个模块,在第一代中桌面处理器最多8核16线程,里面是2个CCX单元,二者之间使用Infinity Fabric总线(简称IF总线)连接,而IF总线又是Zen架构的另一个仅次于CCX的创举。 桌面处理器锐龙7 1800X的物理核心如下图所示: 桌面版锐龙7 1800X处理器开盖后的核心 用于服务器版的Naples处理器最多32核64线程,也就是8组CCX单元,分配在4组CCD(Core Chiplet Die)单元中。不过这时候AMD还没有正式用CCD这个命名,直到现在的Zen2架构中才出现这个命名。 服务器版EPYC 32核(Naples)处理器开盖后的核心 桌面版因为最多8核,所以只有1个CCD单元,外面看起来跟原生8核没什么区别,而服务器版是32核,有4组CCD单元,可以更清晰地显示出AMD在Zen(改进型Zen+是一样的架构)的设计思路—;—;那就是模块化。不过,这个模块化跟推土机的模块化不一样,属于创新模块,不是将内核模块,而是将CCD模块化,需要多少核心就配置相应的CCX/CCD核心即可。 摩尔定律放缓 AMD另辟蹊径:Zen2走向混合小芯片设计 在14nm Zen及改进型的12nm Zen+这两个系列的产品中,AMD解决了高性能处理器的有无问题,52%的IPC性能提升彻底改变了AMD处理器的处境,不过Zen第一代的产品依然谈不上完美,AMD要在新一代的Zen2架构上解决两个问题。 一个问题是继续提升Zen的IPC性能,另一方面则是要继续扩展Zen处理器的并行性,也就是更多的CPU核心。尽管AMD在Zen一代上已经实现了桌面8核、服务器32核,核心数上继续领先,但这还没有达到AMD的目标,要大幅超出才行。 前一个问题要靠继续挖掘Zen架构的潜力,后一个问题就不只是架构设计的问题了。工程实现上难度更大,因为AMD在Zen2架构上要做64核128线程,并首发7nm工艺,将打造迄今为止最强大的X86处理器。 在友商也只能做到28核的情况下,AMD做64核处理器最挑战的地方是什么?答案很简单,那就是成本,因为摩尔定律在最近几年中已经放缓了,AMD如果继续按照原有的思路做下去,那64核EPYC处理器的成本是难以想象的。 对于这一点,AMD有着清醒的认识,此前AMD CEO苏姿丰在2017年的一次会议中就对比过先进工艺对成本的影响。统一以250mm2的核心来算,45nm节点的成本算作1,32、28nm节点开始提升,20nm节点就变成2倍成本了,到了7nm成本跃升为4倍,未来的5nm更夸张,成本将是之前的5倍。 很显然,在Zen2架构确定要上7nm的时候,如果按照之前的路线走,后果就只有两种—;—;要么造不出来,要么造出来成本极高,因为按照AMD之前估算的那样,如果是原生64核,那么核心面积接近800mm2了, 这几乎是现有193nm ArF光刻机的处理极限,制造难度太大了。 当然,我们现在都知道了Zen2架构不会采用这样的原始方式,因为AMD在这一代X86处理器上用了升级的Chiplets混合小芯片设计,这也是未来处理器的发展方向。它比第一代Zen的小芯片更为高明,让Zen2有了脱胎换骨的变化,以一种更巧妙的方式实现了首款64核128线程X86处理器。 Zen2小芯片架构分析:CPU核心面积大降 IO搭配更灵活 什么是chiplets小芯片设计?业界并没有统一的定义,简单来说这是一种新兴的芯片设计思路,将大芯片化为多个小芯片,每个芯片的功能则比较单一,而且可以搭配不同的工艺,以实现提高性能、增加良率、降低成本的目的。 在7nm Zen2处理器上,AMD实现混合小芯片设计的方式就是将CPU与IO单元分离,分别称为CCD(Core Chiplet Die)、IOD(IO Die),在一代Zen架构中每个CCD单元都是一样的,每颗CCD都包含IO部分,1-4组CCD单元实现了8-32核的并行;而在Zen 2架构中,IO核心被分离了出来,1个IO核心连接所有CPU核心。 而且这个IO核心不需要使用7nm工艺,而是14nm(EPYC霄龙)或者12nm(Ryzen锐龙)工艺,核心面积分别是416mm2、125mm2,里面根据需要集成了不同数量的DDR主控、PCIe主控、IF总线等IO单元。 Zen2架构的CPU剥离了IO单元,变成了纯粹的CPU微内核,再加上7nm工艺相比14nm工艺带来了一倍左右的晶体管密度提升,所以在核心面积上7nm Zen2大幅缩小,单个小芯片面积只有74mm2,整合的L3缓存高达16MB,而Zen一代上一个芯片的面积是213mm2,其中核心部分只占120mm2,其余的都是IO单元的面积,由此可见Zen2架构采用小芯片设计带来的优势极其明显。 那么AMD采用小芯片设计到底有多大的收益呢?我们可以确定的是这种设计的良率会很高。到底有多高?AMD官方没有公布过具体数据,不过第三方分析称8核Zen2的良率达到了93.5%,在台积电7nm 12英寸晶圆上可以生产出749个8核处理器,生产32核心也有187个,成本优势明显。 当然,这样的算法只是用于评估Zen2采用小芯片设计带来的成本优势,真实成本要比纯代工成本高很多,还得算上研发、封装测试成本。但怎么来算,这种设计都赋予AMD在成本控制上极高的灵活性,远非原生大核心可比的。 最后还有一个问题值得关注,那就是延迟,虽然CPU、IO核心分离解决了超多核心的并行问题,但是IO、CPU分离开来也会导致延迟增加,这跟原生多核相比是个劣势。不过AMD在Zen2架构也针对此做了改进,包括IF2总线及缓存上的改进。 作为Zen2处理器CPU、IO及CPU核心之间的总线,IF2代采用了总线频率、内存频率分离式设计,保证可以达到更高频率和尽可能低的延迟,总线速率从前代的10.7GT/s提升到了18GT/s,数据传输更快。 而且每个CCD单元有各自的Infinity Fabric PHY物理层,通过它和I/O Die芯片内的数据总线(Data Fabric)进行高速互连通信—;—;注意,两颗CPU芯片之间没有直接通信,都要经过I/O Die,这样可以保证不同核心、缓存之间的延迟是一致的。 此外,缓存方面也做了改进,一方面Zen2架构的L3缓存翻倍,每个CCX单元配备的L3缓存从8MB翻倍到了16MB,8核处理器是32MB L3缓存,64核的EPYC处理器最多拥有256MB L3缓存,远高于前代及对手产品。 另一方面,Zen2的内存频率也大幅提升,前代EPYC支持的内存频率不过2666MHz(桌面Ryzen为2933MHz),这一代官方数据是服务器和桌面都可以支持3200MHz,但这个数据可能比较保守,据称桌面端可以一键超频到4200MHz,高者可达DDR4-5133Mhz。 还有一点需要强调的是,Zen2率先支持了PCIe 4.0标准,在IO的带宽上也有了长足的提升和保障。 64核EPYC处理器性能碾压式胜利 打破140多项世界纪录 得益于Zen2架构的性能改进及64核128线程的超多核心,第二代霄龙EPYC 处理器一经问世就打破了多项性能世界纪录,官方最新统计显示有140多项记录被64核128线程的EPYC刷新。 AMD打破性能记录的领域设计HPC、浮点运算、整数运算、Java、DB/ERP、能耗、大数据、云计算及渲染等,几乎囊括了每一个需要高性能计算的市场。 64核EPYC处理器的性能不只是AMD官方自吹自擂,许多第三方评测网站也证明了AMD所言不虚—;—;InsideHPC、Serverthehome、TheNextPlatform等专业网站也做了大量EPYC处理器性能测试,结果也显示64核128线程的EPYC处理器在性能上有非常明显的优势,大幅领先对手的28核56线程至强。 AMD不只是在性能上有优势,同时价格上也要比对手便宜—;—;64核128线程的EPYC 7742处理器只要6950美元,而对手的28核至强8280处理器售价超过1万美元,顶配版要1.3万美元,是AMD 64核的2倍左右。 上面价格对比不仅显示了AMD EPYC霄龙处理器的高性价比,实际上也反映了与友商的成本差距—;—;AMD采用的小芯片设计大幅降低了成本,而友商原生28核的设计使得制造难度极高,成本很难降低。 AMD对核心永远不满足 引爆X86核战 2019年是AMD成立50周年,X86处理问世41年。在过去几十年的历史中,X86处理器的舞台上主要留下了AMD及Intel两家公司,期间虽然大部分时间都是Intel在主导X86发展,但AMD也屡次实现了技术创新上的反超,像64位,成就AMD曾经辉煌的超传输总线技术等等,如今,在多核X86上,AMD再次占了上风。 为了尽可能提升多核性能,AMD在第一代Zen处理器上首次使用了chiplets技术。而在最新的Zen2处理器上,AMD又首创了Hybrid Multi-die架构的混合小芯片Chiplets设计,计算die和IO die采用不同的制程,赋予X86多核处理器极高的灵活性,使得AMD解决了7nm等先进工艺制造成本高、难度高、良率低的问题,可以更灵活地扩展CPU核心。这种堆积木的混合式组合使得桌面处理器达成达成了16核,服务器处理器轻松达到64核128线程。 最后的结果也证明,AMD这次赌对了。它不仅在桌面处理器上创造了世界首款12核、16核游戏处理器锐龙9系列,在服务器市场上更是凭借64核128线程大杀四方,性能及售价双重优势明显。 AMD引爆了X86处理器的“核战”,而且是主动出击,这也给对手Intel出了一个难题。后者目前最强的至强处理器也只有28核56线程,核心数方面与EPYC二代差距甚大,在性能上已经无法与之竞争,而且成本上更无还手之力—;—;AMD EPYC 64核在核心数翻倍的情况下售价只有一半左右,这样的吸引力对云计算、数据中心等客户是无法抵抗的。 更可怕的是,似乎AMD未来也不会停止这样的核战。AMD CTO Mark Papermaster在接受采访时表示,市场对处理器核心数没有天花板限制,软件正在快速针对多核CPU进行优化,可以充分发挥多核多线程的优势。AMD在核心数方面不会停止进步。 根据AMD官方发布的路线图,现在7nm Zen2架构之后的两代处理器已经确定,Zen3已经完成研发,Zen3之后,Zen4架构也在按计划研发设计中。虽然具体规格现在还没有确切消息,不过可以确定的是—;—;AMD在X86处理器上已经重回领导者地位了。

    时间:2020-01-13 关键词: x86 7nm 霄龙 小芯片 AMD epyc

  • AMD重返超算500强:定制64核心 排名最高第59

    AMD重返超算500强:定制64核心 排名最高第59

    威·太湖之光、天河2A继续分列第三和第四,而数量上中国以227台领先美国118台占据绝对优势。 单看处理器的话还有个亮点,那就是AMD EPYC霄龙处理器第一次上榜,这也是AMD平台时隔多年首次重返顶级超算行列。 霄龙超算此次共有四台入围,最好排名是“JOLIOT-CURIE ROME”位列第59,一套Atos Bull Sequana XH2000,采用了定制的Rome第二代霄龙7H12,64核心128线程,主频2.6GHz,总共2500颗、16万个核心,最大浮点性能3.686PFlops(3.686千万亿次浮点计算每秒),功耗795kW。 另一套二代霄龙超算“Spartan”排名第433,用的也是Atos Bull Sequana XH2000系统和霄龙7H12处理器,不过只有676颗、43264个核心,最大性能1.266PFlops,功耗219kW。 此外还有两套基于Naples一代霄龙的,一个是“CARA”,排名第221,基于NEC LX Cluster系统和霄龙7601 32核心,总计4560颗、145920个核心,最大性能1.746PFlops。 另一个是“曙光TC6000”,排名第244,用的是霄龙7501 32核心,总计3150颗、100800个核心,并搭配AMD Vega 20加速卡,最大性能1.661PFlops,功耗260kW。

    时间:2019-12-16 关键词: 超级计算机 霄龙 超算 霄龙7h12 AMD epyc

首页  上一页  1 2 3 下一页 尾页
发布文章

技术子站