当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]利用MIPS多线程处理器优化SoC设计

多线程是一种基于硬件或软件的处理技术,它的首要目标是计算型工作中利用并发来提高性能。多线程也可以用于区别各种任务,以便可以将优先权分配给更多时间敏感的流量,如语音、视频或关键数据。而公认的基于软件的多线程技术,如任务切换和基于软件的线程调度已经存在了相当一段时间,很少有人知道基于硬件的多线程的历史。基于硬件的多线程技术其实已经存在了相当长一段时间,其实现可以追溯到20世纪60年代的CDC6600。在CDC6600电脑中,10个硬件线程被用来保证从I/O处理器到约16个外围设备的响应时间。这个例子的处理器运行速度远远超过了许多I/O设备,是一个充分利用多线程优势的典型应用,因为空闲处理时间可以被从线程到线程切换的有益工作所取代。在70年代,Denelcor HEP机是在CPU内,而不是在I/O实际执行线程切换。类似上例,最终结果是每个周期的指令(IPC)有了显著改善。之后10年推出的其他几个系统和学术研究进一步展示了硬件多线程的好处。

  今天的市场上有许多多线程处理器。英特尔公司已经利用其超线程技术将该技术引入高端计算应用领域。此外,其他许多SoC制造商,如Broadcom、Lantiq、Mobileye、NetLogic Microsystems、PMC-Sierra、Ralink Technology和Sigma Designs也交付了上百万个采用多线程处理器的产品。许多这样的SoC都采用了基于业界标准MIPS架构的多线程MIPS32 34K系列内核或多线程、多处理MIPS32 1004K一致处理系统(CPS)。目前硬件多线程已经成为主流应用,并越来越被视为SoC设计中实现最佳性能的有效方法。

  用多线程提高流水线利用率

  如前所述,增加一个给定单线程处理器的IPC数量是一个主要目标。通常情况下,即使是非常高性能的处理器也有大量时间闲置,目的是等待数据到达。常见的情况是,带有共享存储系统先进处理器需花50%的时间等待数据在缓存未中(cache miss)后返回。此数据检索的等待时间可能会持续几十个周期,在极端情况下甚至是数百个周期。无论数量多少,处理器在此期间做的都是无效工作。多线程处理器可以在多个线程之间切换以利用这些闲置的周期。这些周期现在可以用来自其他线程的有用指令填满,从而避免未使用的周期白白浪费。这最终将获得更好的流水线利用率并提升系统的吞吐量。

  确保线程切换效率的一个关键环节是怎样进行线程相关信息或语境的管理。当映射到一个线程时,每个任务都有相关的上下文信息,如程序计数器和寄存器信息子集,这些信息是以硬件加载和更新的。在单线程处理器中,由于处理器在线程之间切换,这些上下文必须导入(swapped in)或导出。当在线程之间变换时,需要有与保存和恢复操作有关的额外处理。这种负担可能会变得非常繁重,尤其是采用高语境(high context)切换。多线程处理器支持由每个硬件支持的线程的完整上下文存储,无需保存和恢复操作。这种机制支持切换线程或上下文的零周期开销。

  图1显示了多线程是如何提高流水线利用率的基本机制。在这种情况下,在不同的时间点有三个线程出现了缓存未中。在这些线程暂停(stall)期间,其他线程在同一条流水线上做着有用的工作,从而增加了IPC。

  

 

  MIPS多线程技术

  MIPS科技的多线程技术基于两个层次框架,涉及虚拟处理单元(VPE)和线程上下文(TC),支持每个周期的线程切换。每个多线程内核多达可支持两个VPE,它们共享其他硬件资源中的一条流水线。不过,由于每个VPE可以有自己针对高速缓存的转换后备缓冲器(Translation Look-aside Buffer,TLB),因此它们都可作为针对一个SMP Linux操作系统的两个独立处理器出现。对于更细粒度的线程处理应用,每个VPE可以支持多个TC。这些TC共享一个执行单元,但各有各的程序计数器和内核寄存器文件,以便每个TC都可以处理来自软件的线程。34K内核多达可以支持分配在两个VPE上的九个TC,在运行时进行优化和分区。利用最小的芯片面积可执行MIPS多线程功能。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

2020 年,公司处理器产品四核龙芯 3A5000/3B5000 研制成功。龙芯 3A5000/3B5000 基于龙芯 3A4000/3B4000 进行工艺升级,主频 2.3-2.5GHz, 单核通用处理性能是龙芯 3A...

关键字: 处理器 芯片 市场化

自主研发芯片对其自身有更为实际的意义。首先,自主研发芯片可以减轻对上游供应链的依赖。其次,自主芯片更方便打造出独家特色产品,增强产品在市场上的竞争力。再次,自主研发芯片能降低成本,提高利润。

关键字: 芯片 处理器 市场

本文中,小编将对无线模块予以介绍,如果你想对无线模块的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 无线模块 寄存器 处理器

(全球TMT2022年10月11日讯)近日,昆仑芯(北京)科技有限公司的第二代云端通用人工智能计算处理器昆仑芯2代AI芯片及AI加速卡与飞桨完成III级兼容性测试,兼容性表现良好。 产品兼容性证明 本次...

关键字: 人工智能 加速卡 处理器 模型

(全球TMT2022年10月8日讯)爱立信全新上线超过200个AI App的业务持续性解决方案,进一步保障并增强了CSP移动网络业务持续运行的效率和健壮性。该方案由爱立信与运营商联合开发,主要用于运维过程中的预测性维护...

关键字: AMD 处理器 爱立信 EPYC

台北2022年10月3日 /美通社/ -- AMD EPYC在CPU市场上始终处于变革性颠覆者的地位。从早期7001系列处理器推出高达32核、128 条PCIe Gen3通道到现在的"米兰"7003系...

关键字: AMD 处理器 EPYC BSP

据外媒报导,日本软银集团旗下的半导体IP公司Arm于当地时间8月31日表示,该公司已经对移动处理器大厂高通(Qualcomm) 与其子公司Nuvia 发起诉讼,控告这两家公司侵犯Arm专利。

关键字: ARM 高通 服务器 处理器

intel处理器(Intel cpu)是英特尔公司开发的中央处理器,有移动、台式、服务器三个系列,是计算机中最重要的一个部分,由运算器和控制器组成。如果把计算机比作一个人,那么CPU就是他的大脑,其重要作用由此可见一斑。

关键字: 英特尔 处理器 Intel Processor

高通昨日发布了骁龙 6 Gen 1 和骁龙 4 Gen 1 处理器。iQOO 宣布,将于 9 月 14 日在印度发布 iQOO Z6 Lite 新机,全球首发骁龙 4 Gen 1。

关键字: 骁龙4 Gen 1 处理器 iQOO

据业内消息,近日美国超威半导体公司AMD称,针对明年推出的处理器系列产品,给予全新命名系统。此系统将作为AMD未来相当长时间的基础标准为其处理器命名与编订型号,范围涵盖主流轻薄笔记本电脑至游戏与内容创作机型的最新SoC芯...

关键字: AMD 英特尔 处理器

嵌入式教程

6897 篇文章

关注

发布文章

编辑精选

技术子站

关闭