当前位置:首页 > 原创 > 刘岩轩
[导读]在今年的3月份,ARM曾在北京召开全球发布会,宣布下一代多核设计技术DynamIQ发布。而在近日召开的ARM TECH DAY的活动上,又有了全新的进展——首款采用DynamIQ技术的大小核A75和A55发布。ARM CPU产品部高

在今年的3月份,ARM曾在北京召开全球发布会,宣布下一代多核设计技术DynamIQ发布。而在近日召开的ARM TECH DAY的活动上,又有了全新的进展——首款采用DynamIQ技术的大小核A75和A55发布。

ARM CPU产品部高级营销市场总监Ian Smythe,资深产品经理Phil Burr,高级技术总监Peter Greenhalgh和GPU产品部Espen Oybo都出席并进行了精彩的演讲。

DynamIQ让big-LITTLE更加自如

作为一种全新多核设计技术,DynamIQ提供了更大的设计灵活度,增强了内存分配的能力,专门加强了人工智能的应用。关于人工智能方面的增强主要是增加了优化算法库,这个在前文中有讲述,此处不再提及。主要来分析一下其多核设计灵活度和内存分配方面的升级。

全新的DynamIQ可以支持4大4小,1大7小,2大6小,4小核,1大2小,1大3小和1大4小的多种设计,比起传统的big-LITTLE设计灵活度上可以说是提高了很多。这种高度灵活性使得A核处理器市场覆盖面达到前所未有的广度。1大7小可以适用于移动手机市场,这也是原b-L时代就已经取得的成绩,而4小核的设计更加适用于智能家居的场景内,4大4小则可达到笔电,汽车电子的应用需求。

DynamIQ.jpg

可以这样想,b-L实际上就是实现了跨核动态功耗调节,也就是Dynamic voltage and frequency scaling(DVFS)。而在b-L存在的问题是不能对一个集群(或称簇,或称Cluster)内的每一个核都单独进行电压配置。来举一个常见的实例来说明,为什么人们常见在iphone在待机和性能方面的平衡表现要比很多安卓机要好一点呢?因为苹果并没有完全依赖于b-L,而是采用自研技术,跨核动态功耗调教的较好。而DynamIQ的出现,完全解决了这一问题——现在设计者可以对一个集群内的每一个大小核都单独进行电压调节。

dynamIQbigLITTLE.jpg

更加灵活的多核设计和更加精细的单核电压调节,还是不够的,ARM还给每一个核心都单独配置了专用L2 Cache,此外还有共享的L3 Cache。这个L3 Cache被设计在一个叫做DSU(DynamIQ Shared Unit)的部件内。

DynamIQ集群.jpg

如上图所示,DSU内部除了L3之外,还有电源管理、Snoop filter、ACP和BUS等等。下面来主要介绍一下L3的动态分配。下图是俩个不同的应用场景,L3中的一部分会被用来外围传感器数据收集,另外的部分根据不同应用需求产生的不同任务数量被分配成多份,每一份L3对应一个任务,给这一任务组内的CPU群组共享。两任务组也可以规划为共享一块L3。

L3.jpg

分块使用可以缓解CPU的压力,此外L3还可以实现半关断!譬如视频播放这样的任务,可能一半的L3 Cache就已经足够,那么就可以关闭一半的L3,实现功耗节省。要知道,设备在很多状态下,耗电大户不是CPU而是这些cache的漏电。

L3半关断.jpg

DynamIQ的技术革新要点基本如上,接下来我们一起来看看基于DynamIQ设计而来的A75和A55都有了哪些提升。

A75

A75对比A73.jpg

得益于DynamIQ的设计,A75相对A73有了大幅提升,官方宣称整体性能表现提升了50%(A73at2.4GHz,A75at3GHz)。

75升级.jpg

A55

A53对比A55.jpg

同样是得益于DynamIQ技术,官方宣称A55的功效表现是A53的2.5倍(A53in28nm,A55in16nm)。拆分开来看,同样频率下A55的性能是A53的两倍,功耗表现提升15%。

A55升级.jpg

此外,A55具有多达3000+的可配置参数,可以8个小核配置成一个集群,这在A35上是无法实现的。

G72——Bifrost架构升级

除了CPU之外,Mali GPU也是ARM业务的重要一部分,主要有G系列,V系列和DP系列等,分别面向不同的应用领域。目前Mali在全球的出货量位列第一,市面上半数的智能手机和移动VR设备中都使用了Mali的GPU。而随着生活场景的不断变化,现在ARM已经将高保真移动游戏、VR和设备端的机器学习视为Mali的最重要业务增长点。

此次ATM TECH DAY的活动推出的Mali-G72是其全新高性能GPU的代表,沿用Bifrost架构并进行了优化,比起前代产品G71实现了25%的功耗降低。

G72iscoming.jpg

移动游戏方面可以节省68%的带宽,机器学习方面可以减少17%的功耗。

betterpeformance.jpg

M3已在DesignStart中开放

除了硬件方面的更新之外,ARM此次还带来了重磅利好消息,DesignStart将取消预付授权费,并且将M3核也纳入该计划中来。这对于一些小型创业公司而言是极为有益的,可以降低其开发风险。而且一旦得到验证想要投入生产的话,500万M3的总成本将低于20万美金。为了实现ARM 1 trillion的出货量愿景,服务好各种新兴应用的小客户变得尤为重要。DesignStart就是其布局重要一环,除了IP免费外,DesignSrart还提供mbed、IDE工具、Debug工具等软件和附加服务。从SoC的设计开始到最终产品生产,给客户实现一个全方位支持。

DesignStart.jpg

 

搭载全新A75,A55的CPU预计很快就可以和大家见面了,不少公司已经取得授权。全新DynamIQ会比传统b-L在实际产品上的表现会有多大的提升?这个很值得令人期待。另外如果你想要M0和M3的免费授权的话,就赶快去申请吧,从Ian现场的演示来看,这一过程还真的是非常方便的。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS

一直以来,riscv架构都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来riscv架构的相关介绍,详细内容请看下文。

关键字: riscv ARM riscv架构

最新消息报道,知情人士透露Arm近日裁掉了中国70多名软件工程师,并会将部分职位转移到中国以外的地区。Arm通过“全球服务”部门已经将支持其中国客户的工作外包给安谋科技,该部门曾经拥有约200名员工。

关键字: ARM 裁员

凭借着在个人计算机领域的广泛应用打下的坚实基础,X86自始至终统治着整个服务器生态。而这并不是业界希望看到的,因此Arm服务器被给予厚望。业界期盼Arm能够带来新的服务器CPU替代:打破一个同质化的数据中心架构,实现更高...

关键字: ARM 服务器 AI

本文中,小编将对64位处理器予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 处理器 ARM AMD

32位MCU开发方案的设计实例包括以下几个方面:

关键字: MCU ARM

业内消息,日本唯一一家负责定制 Soc 芯片的上市公司 Socionext 宣布将联合台积电合作开发一款 32 核 ARM 处理器,将采用台积电的 2 nm 制程工艺,该 CPU 采用了 Arm 的 Neoverse 计...

关键字: 台积电 2nm ARM 处理器 Socionext

业内消息,近日传闻芯片巨头英伟达正在开发基于 Arm 架构并适用于微软 Windows 系统的 PC 芯片,同时知情人士称 AMD 也计划制造基于 Arm 的芯片,这些芯片最快会在 2025 年发布,英特尔股价应声下滑。

关键字: 英伟达 ARM 芯片 微软 英特尔 AMD
关闭
关闭