当前位置:首页 > 智能硬件 > 智能硬件
[导读] ARM Cortex内核系列提供非常广泛的具有可扩展性的性能选项,设计人员有机会在多种选项中选择最适合自身应用的内核,而非千篇一律的采用同一方案。Cortex系列组合大体上分为三种类别:● Cortex-A—面向性能密

 ARM Cortex内核系列提供非常广泛的具有可扩展性的性能选项,设计人员有机会在多种选项中选择最适合自身应用的内核,而非千篇一律的采用同一方案。Cortex系列组合大体上分为三种类别:

● Cortex-A—面向性能密集型系统的应用处理器内核

● Cortex-R—面向实时应用的高性能内核

● Cortex-M—面向各类嵌入式应用的微控制器内核

Cortex-A处理器为利用操作系统(例如Linux或者Android)的设备提供了一系列解决方案,这些设备被用于各类应用,从低成本手持设备到智能手机、平板电脑、机顶盒以及企业网络设备等。早期的Cortex-A系列处理器(A5、A7、A8、A9、A12、A15和A17)基于ARMv7-A架构。每种内核都共享相同的功能集,例如NEON媒体处理引擎、Trustzone安全扩展、单精度和双精度浮点支持、以及对多种指令集(ARM、Thumb-2、Thumb、Jazelle和DSP)的支持。与此同时,这些处理器也具有极高的设计灵活性,能够提供所需的最佳性能和预期的功效。

尽管Cortex-A5内核是Cortex A系列中体积和功耗都最低的成员,但它拥有支持多核性能的潜能,并且与该系列中的高级成员(A9和A15)兼容。对于那些之前采用ARM926EJ-S或ARM1176JZ-S处理器的设计人员来说,选择A5是自然的,因为它具有更高的性能和更低的芯片成本。

Cortex-A7在功耗和体积上与Cortex-A5相似,但其性能提升20%左右,且与Cortex-A15和Cortex-A17有完全的架构兼容性。Cortex-A7是成本敏感型智能手机和平板电脑的理想选择,而且它还可以与Cortex-A15或Cortex-A17组合使用,形成ARM称为“big.LITTLE”的处理结构。big.LITTLE结构实质上是一种功耗优化技术;高性能CPU(例如Cortex-A17)和高效率CPU(例如Cortex-A7)的组合配置能够提供更高的持久性能,同时因为更高效的内核很好的满足了应用对中低性能的需求,这种组合还显著节省整体功耗,节省75%的CPU耗能,并且延长电池的使用寿命。智能手机和平板电脑的性能需求发展远比电池容量的增长快得多,因此这种配置带给开发人员明显的优势。诸如big.LITTLE等设计方法,作为整体系统设计策略的一部分,能够显著降低这种电池技术造成的差距。

接下来让我们看看Cortex-A系列处理器中的高级别产品——Cortex-A15和Cortex-A17内核。这两款内核都是高性能处理器,也可用于多种配置中。Cortex-A17是最高效的“中级”处理器,直接针对高端智能手机和平板电脑。Cortex-A9曾广泛应用于这个市场,但与Cortex-A9相比,Cortex-A17性能提升了60%以上(循环周期),同时也改善了整体功效。Cortex-A17能够配置多达四个内核,每个内核都包含一个完整的乱序流水线。如前面提到的,Cortex-A17 可与Cortex-A7组合成高效的big.LITTLE配置,还可以搭配高端移动图形处理器(例如来自ARM的MALI),构成非常高效的设计整体。

 

 

Cortex-A15是该系列处理器中性能最高的成员,是Cortex-A9性能(移动配置模式)的两倍。不仅完全胜任高端智能手机或平板电脑这样的应用,而且运行速率可高达2.5GHz的多核Cortex-A15处理器也能够支撑低功耗服务器或无线基础设施等应用。Cortex-A15是ARM公司第一款对虚拟软件环境中的数据管理和仲裁提供硬件支持的处理器。这些软件环境中的应用能够同时访问系统资源,实现虚拟环境中设备的可靠运行和相互隔离。

最新成员Cortex-A50系列将Cortex-A系列的应用范围扩大至低功耗服务器领域。这些处理器基于ARMv8架构,支持AArch64——高效能64位运行态且可以与现行32位运行态共存。升级到64位的原因之一显而易见是为了支持大于4GB的物理内存,尽管Cortex-A15和Cortex-A7已经具备此能力。在这种情况下,升级到64位其实是为服务器应用提供更好的支持,服务器中越来越多的操作系统和应用程序都采用64位,当然,Cortex-A50系列为上述情况提供了功耗优化的解决方案。对于台式机市场而言,情况也大体相同,支持64位意味着Cortex-A50系列能够更广泛地应用到这一细分市场,而且某种程度证明了未来64位操作系统最终将迁移到移动应用。

介绍过Cortex-A,下面介绍Cortex-R系列——衍生产品中体积最小的ARM处理器,这一点也最不为人所知。Cortex-R处理器针对高性能实时应用,例如硬盘控制器(或固态驱动控制器)、企业中的网络设备和打印机、消费电子设备(例如蓝光播放器和媒体播放器)、以及汽车应用(例如安全气囊、制动系统和发动机管理)。Cortex-R系列在某些方面与高端微控制器(MCU)类似,但是,针对的是比通常使用标准MCU的系统还要大型的系统。例如,Cortex-R4就非常适合汽车应用。Cortex-R4主频可以高达600MHz(具有2.45DMIPS/MHz),配有8级流水线,具有双发送、预取和分支预测功能、以及低延迟中断系统,可以中断多周期操作而快速进入中断服务程序。Cortex-R4还可以与另外一个Cortex-R4构成双内核配置,一同组成一个带有失效检测逻辑的冗余锁步(lock-step)配置,从而非常适合安全攸关的系统。

Cortex-R5能够很好的服务于网络和数据存储应用,它扩展了Cortex-R4的功能集,从而提高了效率和可靠性,增强了可靠实时系统中的错误管理。其中的一个系统功能是低延迟外设端口(LLPP),可实现快速外设读取和写入(而不必对整个端口进行“读取-修改-写入”操作)。Cortex-R5还可以实现处理器独立运行的“锁步(lock-step)”双核系统,每个处理器都能通过自己的“总线接口和中断”执行自己的程序。这种双核实现能够构建出非常强大和灵活的实时响应系统。

Cortex-R7极大扩展了R系列内核的性能范围,时钟速度可超过1GHz,性能达到3.77DMIPS/MHz。Cortex-R7上的11级流水线现在增强了错误管理功能,以及改进的分支预测功能。多核配置也有多种不同选项:锁步、对称多重处理和不对称多重处理。Cortex-R7还配有一个完全集成的通用中断控制器(GIC)来支持复杂的优先级中断处理。不过,值得注意的是,虽然Cortex-R7具有高性能,但是它并不适合运行那些特性丰富的操作系统(例如Linux和Android)的应用,Cortex-A系列才更适合这类应用。

最后,我们来讨论Cortex-M系列,特别设计针对竞争已经非常激烈的MCU市场。Cortex-M系列基于ARMv7-M架构(用于Cortex-M3和Cortex-M4)构建,而较低的Cortex-M0+基于ARMv6-M架构构建。首款Cortex-M处理器于2004年发布,当一些主流MCU供应商选择这款内核,并开始生产MCU器件后,Cortex-M处理器迅速受到市场青睐。可以肯定的说,Cortex-M之于32位MCU就如同8051之于8位MCU——受到众多供应商支持的工业标准内核,各家供应商采用该内核加之自己特别的开发,在市场中提供差异化产品。例如,Cortex-M系列能够实现在FPGA中作为软核来用,但更常见的用法是作为集成了存储器、时钟和外设的MCU。在该系列产品中,有些产品专注最佳能效、有些专注最高性能、而有些产品则专门应用于诸如智能电表这样的细分市场。

Cortex-M3和Cortex-M4是非常相似的内核。二者都具有1.25DMIPS/MHz的性能,配有3级流水线、多重32位总线接口、时钟速率可高达200MHz,并配有非常高效的调试选项。最大的不同是,Cortex-M4的内核性能针对的是DSP。Cortex-M3和Cortex-M4具有相同的架构和指令集(Thumb-2)。然而,Cortex-M4增加了一系列特别针对处理DSP算法而优化的饱和运算和SIMD指令。以每0.5秒运行一次的512点FFT为例,如果分别在同类量产的Cortex-M3 MCU和Cortex-M4 MCU上运行,完成同样的工作,Cortex-M3所需功耗约是Cortex-M4所需功耗的三倍。此外,也有在Cortex-M4上实现单精度浮点单元(FPU)的选项。如果应用涉及到浮点计算,那在Cortex-M4上完成比在Cortex-M3上完成要快得多。也就是说,对于不使用Cortex-M4上DSP或FPU功能的应用而言,其性能和功耗与Cortex-M3相同。换句话说,如果使用DSP功能,那就选择Cortex-M4。否则,就选择Cortex-M3完成工作。

对于成本特别敏感的应用或者正在从8位迁移到32位的应用而言,Cortex-M系列的最低端产品可能是最佳选择。虽然Cortex-M0+的性能为0.95DMIPS/MHz,比Cortex-M3和Cortex-M4的性能稍稍低一些,但仍可与同系列其他高端产品兼容。Cortex-M0+采用Thumb-2指令集的子集,而且这些指令大都是16位操作数(虽然所有数据运行都是32位的),这使得它们能够很好的适应Cortex-M0+所提供的2级流水线服务。通过减少分支映射,系统就能节约一些整体功耗,而且在大多数情况下,流水线将保留接下来的四个指令。Cortex-M0+还具有专用的总线用于单周期GPIO,这意味着你能够利用位控制的GPIO实现确定接口,就像8位MCU那样,但却以32位内核的性能来处理该数据。

Cortex-M0+的另外一个重要的不同特点是增加了微型跟踪缓冲器(MTB)。该外设可使设计人员在调试过程中使用一些片上RAM来存储程序分支。这些分支随后能够回传到集成开发环境中,而且可以重建程序流程。这一功能提供了一种初步的指令跟踪能力,这对于不具备扩展跟踪宏单元(ETM)功能的Cortex-M3和Cortex-M4来说比较有意义。从Cortex-M0+中提取的调试信息等级显著高于8位MCU,这就意味着那些难以解决的调试问题变得更加容易解决。

综上所述,Cortex处理器系列产品为满足你的应用性能需求而提供了多种选项。无需劳神费力,也无论针对高端平板电脑还是物联网中超低成本的无线传感器节点,你都能够发现一款适合应用所需的处理器。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS

一直以来,riscv架构都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来riscv架构的相关介绍,详细内容请看下文。

关键字: riscv ARM riscv架构

最新消息报道,知情人士透露Arm近日裁掉了中国70多名软件工程师,并会将部分职位转移到中国以外的地区。Arm通过“全球服务”部门已经将支持其中国客户的工作外包给安谋科技,该部门曾经拥有约200名员工。

关键字: ARM 裁员

凭借着在个人计算机领域的广泛应用打下的坚实基础,X86自始至终统治着整个服务器生态。而这并不是业界希望看到的,因此Arm服务器被给予厚望。业界期盼Arm能够带来新的服务器CPU替代:打破一个同质化的数据中心架构,实现更高...

关键字: ARM 服务器 AI

本文中,小编将对64位处理器予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 处理器 ARM AMD

32位MCU开发方案的设计实例包括以下几个方面:

关键字: MCU ARM

业内消息,日本唯一一家负责定制 Soc 芯片的上市公司 Socionext 宣布将联合台积电合作开发一款 32 核 ARM 处理器,将采用台积电的 2 nm 制程工艺,该 CPU 采用了 Arm 的 Neoverse 计...

关键字: 台积电 2nm ARM 处理器 Socionext

业内消息,近日传闻芯片巨头英伟达正在开发基于 Arm 架构并适用于微软 Windows 系统的 PC 芯片,同时知情人士称 AMD 也计划制造基于 Arm 的芯片,这些芯片最快会在 2025 年发布,英特尔股价应声下滑。

关键字: 英伟达 ARM 芯片 微软 英特尔 AMD
关闭
关闭