当前位置:首页 > 消费电子 > 消费电子
[导读]z11处理器具有四个内核,每个内核具有64 KB的L1指令和128 KB的L1数据高速缓存,以及每个内核1.5 MB的L2高速缓存和在这四个内核之间的24 MB共享L3高速缓存。z10的NUMA芯片组具有两排96 MB的L4缓存,总计192 MB。

处理器性能与广义上的DRAM主存储器性能之间的差距至少在三十年前就成为一个问题。但在此期间,那些聪明的硬件和软件工程师创建了缓存层次结构的以及可以利用缓存层次结构的软件来缓解相关问题。

但是,随着我们坐在不断扩展的内存层次结构的风口浪尖上,诸如Optane 3D XPoint(相变内存的一种变体)之类的持久性内存已应用于DIMM和SSD尺寸因素以及诸如CXL,OpenCAPI,CCIX,NVLink和Gen等新协议,同时Gen-Z也被用来把处理器和加速器存储器连贯地(对称地或非对称地)连接在一起。

我们不得不思考:是时候向服务器添加4级缓存了吗?

由于有这么多不同的设备挂在CPU组件上(有些相对较近,有些相对较远),因此逻辑上想知道是否需要另一个高速缓存级别来掩盖这些其他内存的延迟并提高整体系统吞吐量。

为了了解可能的情况,我们与IBM,Intel,AMD和Marvell的服务器芯片架构师联系,以了解他们对使用L4高速缓存存储器的想法。在服务器上。L4缓存绝不是一个新的发展,但在系统体系结构中也不是司空见惯。

但是在我们进行讨论之前,需要先了解一些背景知识。

在1980年代后期,工程师向处理器添加了1级高速缓存,当时只有一种核心方式,这是在向内存子系统添加总体延迟以换取绝对降低处理器对数据和指令请求的总体平均延迟之间进行的权衡。

L1缓存最初是外部SRAM,它们安装在主板上并连接到CPU内存组合中。这个L1高速缓存在时钟时间和主板空间上都非常靠近处理器,这意味着CPU可以保持忙碌的状态。最终,这些1级缓存被拆分,因此它们可以将常用数据存储在一个块中,而流行指令存储在另一个块中,这有助于提高性能。

随着处理器时钟速度的提高以及CPU速度和DRAM速度之间的差距进一步扩大,L2高速缓存被添加到进来,但更臃肿,更慢,更便宜(基于每个位或每个带宽),再次在CPU封装之外,然后集成在上面。而且,当越来越多的内核被添加到CPU以及更多的DRAM存储器控制器来馈送(feed)它们时,甚至更大的L3高速缓存块也被添加到层次结构中以保持这些CPU的馈送。

在大多数情况下,这已经很好地解决了。在大多数CPU设计中,有一些经验法则可以反映出处理中缓存层次结构的级别,因为我们打算采用第四层。

英特尔的芯片工程师兼架构师克里斯·吉亚诺斯(Chris Gianos)领导了许多上一代至强处理器的设计,他这样解释道:“通常,对于每个缓存级别,我们都需要将它们增加一个合理的数量以达到上一个级别,以使其有意义,着是因为您需要足够有趣的命中率( hit rate)才能对系统性能产生显着影响。如果您仅在百分之几的时间访问高速缓存,那么可能很难注意到。其他所有东西都会淹没您的演奏,而您并没有动太多。因此,您需要相对较大的缓存,而在谈论更高级别时,则需要非常大的缓存。现在,我们的L2以兆字节为单位,而我们的L3以数十或数百兆字节为单位。显然,如果您开始考虑使用L4高速缓存,那么可能不是数百兆字节就是几百兆字节。而且由于它们很大,因此它们的成本无疑是一个问题。您必须付出足够的努力才能使其变得有趣,而且价格也不菲。”

AMD的架构师则不愿直接对话,因为他们不希望AMD被误解,让大家觉得AMD承诺将在Epyc处理器系列中添加L4缓存,但其实AMD并没有说出这样的话。但是它确实意识到这是下一步要考虑的事情,就像英特尔一样。

他们相信每个架构师都在考虑L4缓存,并且他也分享了一些想法。基本上,AMD的相关人士表示,缓存层数和延迟之间的折衷已经在行业和学术界进行了很好的研究,并且对于每个更大,更慢且访问更广泛的新缓存层,必须进行必要的折衷,以增加通往DRAM的总路径,因为大多数设计不会与上层的高速缓存标签查找并行地连续地推测性地访问层次结构中更下方的高速缓存层。当Gianos说您需要在命中率和缓存容量之间找到平衡时,这正是Intel在上面所说的,那就意味着L4也不例外。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月4日消息,据媒体报道,SK海力士员工今年将发放约3万亿韩元的奖金,每位员工将获得超过1亿韩元(约合人民币51.3万元)的奖金。

关键字: SK海力士 DRAM 三星

Sept. 2, 2025 ---- TrendForce集邦咨询表示,2025年第二季DRAM产业因一般型DRAM (Conventional DRAM)合约价上涨、出货量显著增长,加上HBM出货规模扩张,整体营收为3...

关键字: DRAM 智能手机 ASP

随着高效能运算(HPC)工作负载日益复杂,生成式 AI 正加速整合进现代系统,推动先进内存解决方案的需求因此日益增加。为了应对这些快速演进的需求,业界正积极发展新一代内存架构,致力于提升带宽、降低延迟,同时增加电源效能。...

关键字: AI DRAM LPDDR

8月7日消息,苹果公司宣布,三星电子位于得克萨斯州的工厂为包括iPhone在内的苹果产品供应芯片。苹果在声明中称,该工厂将供应能优化苹果产品(包括iPhone设备)功耗与性能的芯片。”对此,三星发言人拒绝发表评论。

关键字: 三星 存储芯片 DRAM

8月6日消息,据媒体报道,作为全球最早量产HBM4的存储器制造商,SK海力士正为AI芯片提供关键解决方案。依托与英伟达的独家供应链关系及自身技术领先地位,SK海力士计划提高HBM4售价,预计相比HBM3E溢价可能高达70...

关键字: QuestMobile AI搜 百度 夸克 SK海力士 DRAM 三星

8月3日消息,内存一哥三星在HBM技术栽了跟头,输给了SK海力士,错失几万亿美元的AI市场,但是三星现在要杀回来了。

关键字: 三星 存储芯片 DRAM

7月28日消息,据媒体报道,三星电子与特斯拉达成了一项价值高达165亿美元的芯片制造协议。知情人士透露,三星周一宣布获得价值22.8万亿韩元(约合165亿美元)的芯片制造合同,客户正是与其代工部门已有业务往来的特斯拉。

关键字: 三星 存储芯片 DRAM

当地时间本周一,韩国巨头三星电子向监管机构提交的一份文件显示,该公司已与一家大公司签订了一份价值165亿美元的芯片代工大单。

关键字: 三星 存储芯片 DRAM

7月22日消息,据媒体报道,三星决定推迟1.4nm工艺商用时间,全力提升2nm工艺的产能和良率。

关键字: 三星 存储芯片 DRAM

7月17日消息,据媒体报道,韩国最高法院今日就三星电子会长李在镕不当合并与会计造假案宣判,表示支持两项下级法院裁决,维持对李在镕的无罪判决。

关键字: 三星 存储芯片 DRAM
关闭