当前位置:首页 > 智能硬件 > 智能硬件
[导读]PCI Express 是目前 PC 芯片集及嵌入式处理器的普遍互连标准。尽管之前的PCI标准由PCIe所取代,但 FPGA 和I/O设备仍使用 PCI。当前基于 PCI 的设计均采用未集成 PCIe 接口的组件,因此若要升级系统,需使用 PCIe 桥接

PCI Express 是目前 PC 芯片集及嵌入式处理器的普遍互连标准。尽管之前的PCI标准由PCIe所取代,但 FPGA 和I/O设备仍使用 PCI。当前基于 PCI 的设计均采用未集成 PCIe 接口的组件,因此若要升级系统,需使用 PCIe 桥接器。例如,PCIe桥接器将用于采用I/O设备的嵌入式视频录音机,通过PCI连接至具有PCIe 端口的嵌入式处理器。

  在系统中添加桥接器将会带来一定的设计难题,本文旨在研究通常受引入桥接器影响的 PCI 读取性能问题,以及相应的解决方法。

  引入桥接器带来的性能挑战

  PCI 总线上的设备主要依赖有关系统从主机处理器读取大量的数据。PCI I/O 设备通常控制系统中的数据移动,并将读写循环传入主机内存。例如,主机处理器可通过写入外围设备上的寄存器设置外围设备中的 DMA,即可设置和配合数据移动,但为了专注于其他任务,处理器会将自身从数据移动中删除。然后,外围设备将读取或写入数据以服务 DMA。在其他时间,处理器可读取状态信息并写入寄存器以进行控制。通常,此通信量不会涉及高带宽,且不会对系统整体性能带来重大影响。

  对于安全数字视频录像机(DVR)等嵌入式处理系统,将捕获并压缩视频数据,通过磁盘控制器写入磁盘存储器,且磁盘控制器通过 PCI 总线读取主机内存中的数据即可实现上述结果。

  从 PCI 外围设备写入桥接器通常传送至内部写入缓冲器,以解决桥接器带来的内在性能影响。然而,PCIe 桥产品需要重试外围设备,直至它从主机内存中获得所需的数据。这通常意味着试图读取许多小型 PCIe 数据包,从而增加时延。通过使用分割式传输方式,PCI-X 协议可避免此问题,但传统的 PCI 协议并不具备此特点。此外,一些 PCI 设备在收到一条或两条数据缓冲行后就自动释放总线,这将成为 PCI 读取的性能挑战。

  例如,在使用嵌入式 DVR 的普通情况下(图1),系统需要将持续的压缩视频数据流写入磁盘,以便存储及随后检索或分析。在此系统中,一个或多个磁盘控制器(SATA 控制器)将读取系统主内存中的视频数据,以存储在相关磁盘阵列。上述系统还可以令以太网控制器等其他外部设备共享 PCI 总线。

如上所述,引入 PCI 桥接器可能导致性能下降。此读取性能如下所示(参考图 2):

1.SATA 设备"A"开始从主内存读取。桥接器从内存中预取数据。然后,SATA设备"A"读取部分预取数据。

  2.SATA 设备"B"开始从主内存读取。桥接器从内存中预取数据。然后,SATA设备"B"读取部分预取数据。

  3.SATA设备后续读取将要求桥接器丢弃缓冲的数据,并从主内存中重取数据。

  在此示例中,第 3 步会在读取事务之间带来重大时延,从而极大影响读取性能。对读取性能的实际影响,可能指实现的性能比直接使用 PCI 总线最初实现的性能下降许多倍。由于总线断开及多次重试和重取数据后,将持续读取数据,导致总线效率受到重大影响。此过程如图 3 所示。

查看说明实际数据读取点的 PCI_TRDYn(PCI 目标准备)轨迹可看到,首次读取(第 3 步)与下次读取(第 6 步)之间存在较大间隔。这意味着视频数据写入磁盘的最大速度大幅降低,从而限制了系统的性能。在此情况下,最大程度地提高写入视频数据的速度对于最终产品至关重要--可存储监测最高质量视频所需的诸多信道。

  解决问题 - 短期高速缓存

  Tundra 的 PCI Express桥接器(Tsi381、Tsi382和 Tsi384)具有短期高速缓存 (STC) 的功能,可有助于克服上述性能难题。短期高速缓存允许在最初 PCI 读取循环期间从相关 PCI Express 设备中预取数据,并临时存储在桥接器中以便在后续读取循环期间迅速周转。当所要求的设备停止此事务时,在后续过程中读取的数据不会立即丢弃。

  与最初情况相比,它对性能的改变比较大,以一个采用 Tsi381 桥接器的嵌入式 DVR 系统为例(参考图4)。在此情况下,启用 STC 后,后续读取不会延迟,原因是有关读取仍保留在 Tsi381 的高速缓冲存储器中,且桥接器在首次读取后无需从内存中重新读取数据,可确保有效地使用总线。

启用STC前后PCI 总线的计时见图5,它可清楚地反映出性能的差异。在此示例中,系统执行每台设备32位的读取,两台设备无STC时执行2次读取的相同期间,在使用STC后可进行7次读取。可见,在使用STC的情况下,系统的整体吞吐性能可提高三倍以上。对于通过一台设备执行读取的系统而言,性能将获得更大的提高。

Tundra PCI Express 桥接器可确保开发人员调整下列其他参数,从而进一步调谐系统: 调整数据保留在高速缓冲存储器内的时间。此特点确保设计人员丢弃过期的数据并预取从前过期的数据。 调整 PCI 读取预取长度。从理论上而言,桥接器不得预取比PCI外围设备通常所需的更多的数据,设计人员可根据通常预期的传输长度设置此参数。

  根据系统设计及设备的状况,设计人员可调整预取长度及短期高速缓存丢弃计时器,以提高整体性能或关键性能。

  总结

  使用PCIe桥接器将有助于解决由PCI转向 PCIe带来的设计难题。PCI 外围设备开始的读取将产生额外的延时,这通常对系统的整体性能带来重大影响。Tsi381及其他Tundra PCIe桥接器的功能集允许开发人员调谐桥接器,从而优化系统性能。利用短期高速缓存,这些桥接器可轻松消除 PCI读取相关的性能瓶颈。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

三星宣布,其最新的LPDDR5X内存已通过验证,可在骁龙(Snapdragon)移动平台上使用,该内存速度可达到当前业界最快的8.5 千兆比特每秒(Gbps)。通过优化应用处理器和存储器之间的高速信号环境,三星超过了自身...

关键字: GBPS 三星 内存 LPDDR5

(全球TMT2022年10月18日讯)三星宣布,其最新的LPDDR5X内存已通过验证,可在骁龙(Snapdragon)移动平台上使用,该内存速度可达到当前业界最快的8.5 千兆比特每秒(Gbps)。通过优化应用处理器和...

关键字: GBPS 三星 亚马逊 内存

在三星 Tech Day 2022 活动上,三星电子总裁兼内存业务负责人 Jung-bae Lee 表示,三星 40 多年来共生产了 1 万亿 GB 内存,仅在过去三年中就产生了大约一半。

关键字: 三星 内存 储存芯片

NAND Flash闪存芯片已经低迷一年了,但看起来对应的SSD价格还没触底。知名分析机构Trendfocus分析师在最新报告中指出,尽管主要颗粒厂已经开始削减产能,然而存储芯片和固态硬盘库存过剩的情况极其严重,他甚至预...

关键字: SSD NAND PCIE 固态硬盘

搁在四五年前,板载内存极大可能会被用户视为一台轻薄本的缺点,其实这也很好理解,板载内存无法扩容,而且当时内存容量并不大,板载内存的频率也普遍偏低,性能稍差,所以很多朋友选购轻薄本的时候,都会避开板载内存。

关键字: 板载 内存 半导体

上海2022年9月20日 /美通社/ -- 近日,在长江之歌学术周功能学与影像学高峰论坛上,波士顿科学血管内超声系统Polaris(以下简称"Polaris")巡回上市会正式启动。这是继实现国产化之后...

关键字: POLAR 超声系统 PCI 影像

印度班加罗尔2022年9月16日 /美通社/ -- 总部位于班加罗尔的公司Prodigy Technovations Pvt. Ltd推出了PGY-PCIeGen3/4-PA PCIe协议分析仪,支持2.5、5.0、8....

关键字: GEN PCIE 数据包 软件

继DDR5 DRAM成为英特尔“Alder Lake”第12代处理器的标准配置之后,AMD近日也宣布其7000系列处理器将支持DDR5内存,并在9月27日正式上市。AMD表示,该平台将不再支持DDR4,只支持DDR5产品...

关键字: DDR5 内存 三星

GRL通过与FuturePlus的合作伙伴关系,扩大了全球七个实验室所提供的DDR和LPDDR内存测试服务组合  加利福尼亚州圣克拉拉市2022年9月15日 /美...

关键字: DDR FUTURE SYSTEMS 内存

上海2022年9月1日 /美通社/ -- 澜起科技宣布在业界率先推出DDR5第一子代时钟驱动器(简称CKD或DDR5CK01)工程样片,并已送样给业界主流内存厂商,该产品将用于新一代台式机和笔记本电脑的内存。 澜起科技...

关键字: DDR 驱动器 时钟驱动 内存

智能硬件

22075 篇文章

关注

发布文章

编辑精选

技术子站

关闭