当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]在计算和网络应用中采用PCI Express® (PCIe) 接口非常普遍,这些应用包括中央处理器(CPU)、图形处理器(GPU)、网络接口卡(NIC)、交换机、服务器以及诸如固态设备(SSD)之类更 新型的存储系统,等等。然而,当今的网络和快速兴起的人工智能(AI)应用均要求在加速器 和GPU中采用更大的带宽以及更快的互连,以便发送和接收更大量的数据。

在计算和网络应用中采用PCI Express® (PCIe) 接口非常普遍,这些应用包括中央处理器(CPU)、图形处理器(GPU)、网络接口卡(NIC)、交换机、服务器以及诸如固态设备(SSD)之类更 新型的存储系统,等等。然而,当今的网络和快速兴起的人工智能(AI)应用均要求在加速器 和GPU中采用更大的带宽以及更快的互连,以便发送和接收更大量的数据。

鉴于PCIe在此类应用中的广泛使用以及越来越大的带宽需求,PCI-SIG产业联盟最近宣布了最新规范PCIe 5.0,它把数据速率提高到32GT/s,并使链路带宽增加一倍,从64GB/s 提高到128GB/s。 图1显示了PCIe 互连和总带宽的演变。

图1:PCI-SIG带宽增长

PCIe 5.0规范主要处理速度提升以及相关物理层(PHY层)的修改。然而,转向32GT/s设计时,将会带 来 系统设计人员及PHY设计人员都必须考虑的几项挑战。本文描述了转向32GT/s速度的PCIe设计所面临的挑战,以及设计人员如何能够利用新的PCIe 5.0接口成功设计出系统。

系统设计师面临的挑战

印刷电路板(PCB)的走线、连接器、电缆乃至IC封装都是系统级的带宽限制因素,它们使 得高 数据 速率 的设计变得具有挑战性。高信号频率增加了铜损和功率损耗,这会导致传输距离减小。另外,更高 信号 频 率中存在的通道损失会导致信号完整性(SI)问题。

为了满足各种应用的需求,PCIe通道的种类有很多,既有不包含连接器的“芯片到芯片”拓扑结构,也 有 包 含背板接口的复杂服务器拓扑结构,而且这样的背板 接口还包括多个 PCB卡和两个 或多个连 接器。 如图2至图5所示,大多数PCIe通道在每一端都由一个IC封装组成,而且带有多个PCB,其中包括: 处 理 器 板、附加卡和转接卡;它们全部连接至一个或多个夹层卡或PCIe卡机电(CEM)连接器。

图2:“芯片到芯片”接口,最简单的通道,没有连接器

图3(a):带有一个夹层连接器的通道

图3(b):带有一个边缘连接器(附加卡)的通道

图4(a):带有两个连接器并使用一个转接卡和一个附加卡的通道

图4(b):带有两个线路卡和两个连接器的标准背板通道

图5:具有两个以上连接器的复杂背板通道

历史上,PCIe系统设计人员把通用低成本FR4 PCB材料和引线键合(wirebond)封装用于 高达 8GT/s 数 据 速率(Gen3)的大多数应用,这种做法已被证明是成功的。但是,在32GT/s的数 据速率下 使用 这 种材料 和封装并不可行。

由于通道损耗的增加,即使在最大速率为16GT/s的PCIe 4.0中(它对于在下一代电路板设计中保持 现有 的 通道长度是必不可少的),大多数设计人员也正在从FR4 PCB转向更低损耗的材料,如MEGTRON。 PCB在 设计上也可以在走线之间采用更宽的空间间隔,以便进一步提高系统级SI性能。同样,对于SI,许多设计将 使用增强的CEM连接器或定制的夹层连接器,并且将回钻PCB通孔,以便尽量缩短截线(stub)长度。在 某些通道很长的情况下,也可以使用重定时器。

然而,所有这些增强都是有代价的。MEGTRON材料的成本可能比标准FR4材料高出1.2倍至2.5倍,而且PCB 走线可能需要进一步加大间隔以获得更好的抖动(jitter)性能,从而导致更大、更昂贵的 PCB。如果 采用 截线(stub)回钻(电路板制造过程中的一个增量步骤),也会增加 PCB的总成本。 另一个需要考虑 的因 素是,增强的和定制的表面贴装连接器如何比标准通孔CEM连接器更为昂贵。此外,采用时脉 重驱器会 增 加物料清单(BOM)成本、数据路径延迟和系统功耗;它们也会占据PCB上额外区域,这会增加电路 板及 组装成本。

为了验证其设计,系统设计人员必须与信号完整性工程师、封装设计人员、SoC设计人员 以及电 路板 布局 设计人员密切合作,对其通道中的每个组件进行建模,并验证其整个端到端性能。

PHY设计师面临的挑战

对16GT/s PHY设计进行渐进式改进在大多数应用中并不足以满足PCIe 5.0通道 要求。 由于在 32GT/s 速 度下信道损耗显著增加,发射器(TX)和接收器(RX)中的均衡电路需要显著的改进。另外,更 严 格 的 抖动参数和抖动限制以及回波损耗规格也要求在TX和RX中重新设计许多子电路。

预计PCIe 5.0的PHY将通过控制器以及单独参考时钟独立扩展频谱计时(SRIS)来支持通道通路裕量(Lane margining)请保留英文描述等功能,同时满足在过程、电压和温度角(Corner)建议保留英文 等方 面 更 严格的时序和抖动要求。

此类增强和额外的限制使得设计PCIe 5.0 32GT/s PHY变得非常复杂,需要许多方面的能力来实现低功耗、小面积和低延迟的PHY,同时提供最佳信号和电源完整性(PI)性能。

具有精确模型、经过硅验证的PHY使得设计人员能够对端到端通道进行建模、设计和模拟,以便对系统设计进行验证和优化。

小结

在诸如网络、存储和新兴人工智能等数据密集型应用中,对带宽的要求越来越高,这迫切需要更快的互连,例如在32GT/s速度下的新型PCIe 5.0技术。但是,设计人员必须了解并考虑在转向32GT/s PCIe设计时 面临 的诸多挑战。在更高的数据速率下解决信号完整性、封装和通 道性能等问 题需要在多 个领域具 备充分 能 力。这就是为什么越来越多的片上系统(SoC)设计人员采用经 过验证的第三方 IP来进行成功的 IC集成的 原因。

许多企业都在利用诸如Synopsys这样可靠且经过验证的第三方IP和电源完整性服务。借助于Synopsys以数十年PCIe专业知识为基础的面向PCIe 5.0的IP,SoC设计 人员可 以尽早启 动其32GT/s 的设计。 SoC设计 人 员可以与Synopsys合作,以讨论在更高数据速率下PCIe通道的性能需求,同时解决IP集成、时序收敛、信 号完整性、封装和制造方面的需求。我们将在随后发布的文档中详细阐述每项挑战。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

5月11日消息,Arrow Lake、Lunar Lake还没有发布,Intel再下一代处理器Panther Lake的消息就传出来了,CPU方面没啥惊喜,GPU又一次要飞跃。

关键字: GPU CPU 芯片

Optiver通过包括EPYC CPU、Solarflare以太网适配器、Virtex FPGA和Alveo加速卡在内的高性能AMD解决方案搭建其业务基础

关键字: CPU 数据中心 以太网

利用LogiCoA™微控制器,以更低功耗实现与全数字控制电源同等的功能

关键字: 微控制器 电源 CPU

2024年4月18日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 很荣幸地宣布与Edge Impulse建立新的全球合作关系。Edge Im...

关键字: 机器学习 MCU CPU

无论您是在研究如何使用 10GigE 还是寻求所需考虑事项的建议,本文均提供有实践,帮助确保单相机 10GigE 视觉系统设置顺利并拥有良好性能。 我们列出了主机系统配置、布线和相机设置的实践。

关键字: 视觉系统 CPU 存储器

Apr. 16, 2024 ---- NVIDIA新一代平台Blackwell,包含B系列GPU及整合NVIDIA自家Grace Arm CPU的GB200等。TrendForce集邦咨询指出,GB200的前一代为GH2...

关键字: CPU GPU

随着科技的飞速发展,电子产品在我们日常生活中扮演着越来越重要的角色。而在这些电子产品中,接口作为连接设备与外部设备的桥梁,其重要性不言而喻。其中,Type-C接口作为一种新型的接口标准,因其独特的优势,逐渐成为了众多电子...

关键字: 电子产品 Type-C 接口

人工智能是集合众多方向的综合性学科,在诸多应用领域均取得了显著成果[1]。随着航空领域人工智能技术研究的不断深入,面向开放式机载智能交互场景,人工智能的应用可解决诸多问题。例如智能感知、辅助决策等,可利用人工智能算法对多...

关键字: 人工智能 PCIe CPU

在嵌入式系统开发、调试和测试过程中,J-Link作为一种高效的调试工具,为开发者提供了极大的便利。然而,要想充分发挥J-Link的功能,首先需要正确安装其驱动程序。本文将详细介绍J-Link驱动的安装过程,并深入解析其中...

关键字: jlink 嵌入式系统 嵌入式开发

与谷歌的合作使 Nordic 能够在 nRF Connect SDK 中嵌入开发人员软件,以构建与安卓移动设备兼容的谷歌Find My Device和未知跟踪器警报服务

关键字: 谷歌 SoC 嵌入式开发
关闭
关闭