当前位置:首页 > 工业控制 > 电子设计自动化

时延是数据中心以太网的一个关键性能指标。这是因为在高频率金融交易(HFT)、高性能计算(HPC)和类似的性能敏感型环境中,超低时延10GbE交换功能是处理巨大网络流量的关键,这常常意味着每天上百万次的交易。电子交易中价格和交易数据速率的不断攀升以及保持竞争力的需求推动着金融市场股东们投资最新技术,以便支持螺旋式上升的带宽要求,并降低数据流时延。

因此,现在时延测量已经成为数据中心以太网交换机供应商测试报告的一个重要部分。在评估这些系统所用的交换IC时,设计师需要明白时延测量方法有好多种,采用不正确的方法可能是一种错误,因为有些方法并不能测出真实性能。

近来在测试中使用的其中一些测量方法使得LAN交换芯片供应商声称具有超低时延。这是怎么做到的呢?使用末位进、首位出(LIFO)方法,存储转发交换机确实可以报告亚微秒的时延。然而,这不符合RFC1242,该文档建议优先采用首位进到首位出(FIFO)方法:“理想情况下所有设备的测量都应从帧前导位之后的第一个实际位开始。”这种方法能够更精确地测量数据包穿透交换机时遇到的任何存储或处理时间。

交换机架构和时延

2006年推出的第一台低时延10GbE交换机使用直通工作模式取得了十分优异的时延性能,这种模式下交换机可以在帧被完整接收之前就开始发送。而存储转发交换机不能取得低时延,这是因为数据包在从出口发送出去之前必须完全存储在内存中。但并不是所有直通交换机都有相同的时延性能,因为它们采用的交换架构有很大的区别。

存储器存取带宽一直是交换芯片架构师心头的痛。在使用传统的交叉开关矩阵和内存设计时,将没有足够的片上带宽允许每个输入端口同时写入相同的输出队列。为了解决这种阻塞问题,芯片架构可以在每个交换输入端使用虚拟输出队列,即所谓的组合式输入/输出队列(CIQQ)架构(图1)。


图1 组合式输入/输出队列(CIQQ)架构

虚拟输出队列可以在每个输入端口为每个交换输出端口(出口)提供一个队列。如果某个特定的出口队列临时受阻,那么与之对应的入口队列将实行流控,而以其它出口为目的地的数据包可以避过这个受阻队列,将数据发送给其它无阻塞的出口。然而,对于一个N端口交换机而言,这意味着N*N输入队列和关联调度器,从而增加了很大的复杂性。同时还会增加数据包时延,因为每个数据包通过交换机时必须排队两次。鉴于VOQ和关联调度器的复杂性,许多交换机设计通过一定程度的内部阻塞来降低复杂性,这将进一步增加时延。

新的共享式内存交换技术第一次通过SRAM IP实现性能提升,使交换机能够支持具有特别低时延、完全无阻塞输出排队、共享的内存架构,见图2。通过使用专有的高带宽内存结构,交换架构可以做得更简单,进而消除入口VoQ的复杂性和所需的额外内存。另外,组播数据包只需存储一次,从而进一步降低了对片上内存的要求。由于只有一次内存入队/出队和非常低的内部阻塞,因此这种技术可以提供最低的时延。


图2 具有特别低时延的输出排队、共享内存架构

时延测量方法

测量通过交换机的时延有多种方法:首位进到末位出(FILO)、末位进到首位出(LIFO)、首位进到首位出(FIFO)和末位进到末位出(LILO)。每种方法的时延测量都是在交换机入口和出口进行的。

这种方法测量的是交换机的时延加上数据包从出口发送出来的时间。虽然这种方法对于服务器群集中的应用到应用时延等的测量足够了,但不是一种非常好的交换机时延测量方法。为了更好地表明这个观点,可以想像一个电气连接器。FILO方法意味着连接器具有与数据包大小相关的时延,但事实上连接器具有零时延。

大数据包会给这些测量结果增加较大的时延,使得提取实际交换机时延变得更加困难。最后,考虑两个串联的直通交换机。当使用FILO方法时,通过两个交换机的时延不能通过累加单个交换机的测量时延计算得到。鉴于这些因素,这种方法并不是测量交换机时延的正确方法。

LIFO方法在20世纪80年代晚期和90年代早期用于测量传输单元大小固定的电信网络中的时延。一些测试报告仍参考1991年发表的RFC 1242,这个时间比直通交换技术的发明早很多。对于只提供存储和转发交换机的供应商来说,这种测量方法可以使结果看起来更好,因为这种方法不考虑数据包在转发之前被完整存储在交换机中的时间。从图3可以看出,直通交换机的时延不能用这种方法精确测量。


图3 使用FIFO和LIFO方法的测量结果

这两种方法从效果上看是相同的,是正确测量通过直通交换机的时延的唯一方法。为了说明这些方法的工作原理以及与LIFO测试的区别,让我们对最近使用Fulcrum“Monaco”10GE交换机做的现场测试结果做一下评估。

FIFO与LIFO实际测试结果

Monaco参考平台例子包含有一个交换芯片,在1U外形尺寸内提供24个SFP+端口。这个平台中的时延包含了通过交换机的时延和通过SFP+ PHY的时延。这张图显示了交换机工作在直通模式时使用FIFO和LIFO方法的时延测量结果。

从图中可以看到,FIFO结果表明了交换机的实际直通时延,而LIFO数值是人工减去了完整接收一个帧所需的时间。对10GbE链路来说,这两种测量方法之间的关系可以用以下等式描述:

LIFO时延=FIFO时延-(帧长度+20)*0.8nS

由于LIFO测量方法可能导致像Monaco这样的直通交换机出现负时延,因此测试仪器将这种情况报告为“零”时延。这意味着在较大数据包情况下比较直通交换机将是无意义的,因为它们都显示为零时延。

结论

在为数据中心选择网络设备时时延是一个关键参数。网络设计师可能使用测试报告比较不同供应商的交换机,但必须仔细检查这些报告,因为测试时延有多种方法,而只有比较使用相同的方法测量竞争性芯片得到的时延才有意义。直通交换机可以为数据中心提供最低时延的网络解决方案。本文明确了测量直通交换机时延的唯一正确方法是首位进至首位出(FIFO)方法。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

在SEMICON CHINA 2024,Kulicke & Soffa Pte. Ltd. 作为行业领先的半导体封装和电子装配解决方案提供者,展示了先进点胶解决方案、多种先进封装解决方案、最新的垂直焊线晶圆级焊接工艺、还...

关键字: 智能制造 晶圆 数据中心

最新发布的平台增强功能帮助客户利用单一管理层加强数据存储环境的管控,有效简化端到端操作

关键字: 存储 数据中心 可持续发展

新的IEEE汽车以太网标准不断涌现,10BASE-T1S是最新的以太网标准之一。本文讨论汽车行业影响汽车电子/电气(E/E)架构变化的发展趋势,以及新10BASE-T1S标准如何支持和推动这种新架构的部署。

关键字: 以太网 汽车电子 传感器

该解决方案采用全新 1.6T 以太网控制器 IP、经过硅验证的224G PHY IP和验证IP,助力未来基础设施的升级建设

关键字: 数据中心 芯片 以太网

模拟与混合信号事业部将提供行业领先的技术为汽车、工业和云端市场提供全面的系统解决方案

关键字: 电源管理 传感器 以太网

没有数据中心,AI产业就无法正常发展。为了追赶新浪潮,美国科技巨头纷纷投入巨资,建设数据中心。

关键字: AI 数据中心

美光 HBM3E 比竞品功耗低 30%,助力数据中心降低运营成本

关键字: 人工智能 数据中心 存储

2024年3月4日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 与Analog Devices联手推出全新电子书,详细分析用于支持可持续制造实践的技术。

关键字: 以太网 工业物联网 放大器

过去一年,我们开始意识到AI蕴含的巨大能量及其激发的创新潜能,围绕AI的热议居高不下,其中许多创新将深刻改变科技行业乃至整个世界的发展进程。

关键字: AI 数据中心

英特尔发布两款全新芯片——Sierra Forrest 和 Granite Rapids-D,还宣布一个全新边缘平台全面上市。这些产品旨在满足运营商和企业在可持续发展和AI方面的需求。

关键字: 可持续发展 AI 数据中心
关闭
关闭