当前位置:首页 > 物联网 > 智能应用
[导读]很多物联网应用的运行使用小型电池供电,或者至少一部分时间甚至用收集的电量供电,因此电量预算非常紧。既要根据市场需要提供越来越多的功能,又要按应用要求维持低功耗,面向物联网市场的SoC设计工程师面临着独一无二的挑战。

 系统架构要求

为了执行高级系统功能,系统设计经常要求升级应用处理器的性能水平,但同时还要维持类似8位微控制器系统的功耗。把它想象成用发条玩具的电量提供一个智能手机的大脑。能配置处理器实现这些似乎有冲突的目标,至关重要。本文说明通过选择和配置处理器,降低系统功耗的技术和方法。

把 DSP 处理与 RISC 处理相结合

物联网设备的定义是根据它们的能力,包括吸收或“感知”真实世界的信号,通过互联网或本地网络对关联数据和通信结果进行操作。大多数通用 RISC 处理器可以成功地处理信号,但是专用的 DSP 处理这些任务的功耗效率更好,延迟更低。另一方面,RISC 处理器很适合传递数据和设置通信通道。用分离的多个独立的处理器是一个选择,但是它会增加系统的成本和板级空间,开发和调试还要用多种环境与工具。如果一个芯片兼具两种功能,就可以降低复杂性和成本。

语音触发、语音控制、语音回放和惯性传感器处理等主要功能在实时启动和低功耗环境中已经是必需品了,这就要求系统的DSP指令能够在满足低功耗目标下实现诸如滤波、快速傅立叶变换(FFT)和插值等任务。

DesignWare® ARC® EMxD 系列处理器面对这些挑战,通过向 ARC 可配置处理器核心增加有 ARCv2DSP指令集架构(ISA)的 DSP 引擎,在一个统一的架构里进行 RISC 和数字信号处理(图 1)。它们功耗低,对语音控制用的语音检测功耗可以低于 1 微瓦。

ARC EM DSP 处理器高度可配置,以便每个用例都可以量身定制,最好地平衡目标应用的 DSP 性能和 RISC 性能,以及功耗效率和面积效率。例如,ARC EM5D 和 EM7D 很适合需要约 50% DSP 处理的应用,而 EM9D 和 EM11D 支持 XY 存储器,用于 DSP 敏感的应用很理想。ARC 处理器扩展(APEX)技术还让设计工程师能创建用户定义指令,支持集成定制的硬件加速器,提高特定应用的性能,同时又降低耗电量和减少需要的存储器数量。



图 1:ARC EMxD 框图

包括支持多组存储器

在RISC + DSP处理器中用来实现典型的 DSP MAC 操作的代码,包括从存储器加载数据,然后按加载的操作数执行 MAC 操作。如图 2 所示,先是通过加载指令获得两个数据值然后紧接着进行MAC操作,本架构的最大吞吐量可以达到每个周期1/3 MAC。

 


 

图 2:RISC + DSP 架构中的 DSP MAC 操作

增加一个 XY 存储器系统,可以支持需要更大吞吐量的 DSP 应用。一个基于 XY 存储器的系统一般包括多组存储器和带有指针和更新寄存器的自动化地址生成单元(AGU)。AGU 置于指令流水线中,允许一条指令执行三个数据移动、一个 MAC 操作和三个地址指针更新,支持多址指针升级模式。这种方法使用一个基于 XY 存储器的系统架构,可以实现每个周期一个 MAC 操作的有效吞吐量,显著提升性能(图 3)。因为 XY 存储器系统不需要单独加载和递增指令,还能减少代码。


图 3:有 XY 存储器的 RISC + DSP架构里的DSP MAC 操作

除了提高吞吐量和减少代码外,降低耗电量是常常被忽视的一大优势。如图 4 所示,DSP 函数通过使用 XY 存储器(EM9D)可以大幅节省电量,因为同样的函数需要的时钟周期数更少,尤其是为 RISC + DSP 架构量身定制时,允许 RISC 和 DSP 同时访问。



图 4:随着 DSP 需要的增加,有无 XY 存储器的耗电量比较

用紧密集成的存储器

物联网应用对性能和处理能力的要求不断提高,推动了从紧密集成 8 位微处理器的嵌入式系统转向基于总线的 32 位处理器嵌入式系统的发展趋势。这个趋势对系统的功耗和面积产生了负面影响,违背了物联网产品随着大规模应用变得更小更便宜的主要需求。向 32 位嵌入式处理器系统紧密集成的扩展,移除较为低效的总线基础架构,可以同时实现所有这些系统目标。处理器可以直接访问各个存储器和外部寄存器,降低延迟和需要的时钟频率,从而会降低执行这些功能所需要的电量。

降低情况的示例如图 5 所示,图中比较了基于总线的处理器子系统和紧密集成的系统处理传感器数据的用电情况。处理器核心访问辅助寄存器用一个时钟周期,而在基于总线的系统里,外部寄存器要用四个周期。

图 5:紧密集成的系统中处理传感器数据的省电情况

DMA

降低处理器系统功耗的另一种方法是使用直接存储器访问(DMA),这种方法使周边设备不用涉及 CPU 就能移动数据。要确保系统面积优化,DMA 必须面向处理器和应用进行高度优化。因为内部 DMA 移动数据进出 XY 存储器不会影响处理器通道,所以把 DMA 和多级存储器结合起来,甚至会节省更多电量。

Synopsys 的 ARC EM 系列处理器的 µDMA 法完全以物联网应用为目标,只包含这种类型的嵌入式系统需要的特性。µDMA 控制器通过让 EM内核休眠来降低电量操作,而 µDMA 围绕芯片从周边设备向存储器移动数据,或在存储器之间移动数据时,并且只在必要时才唤醒内核。另外多种的休眠模式可以用来自定义最小的可运行功耗。

软件算法加速

如上所述,物联网应用的要求不断扩张,其中一个重要的关键是安全性。不过,安全算法会使系统更复杂,而系统的功耗和面积预算已经非常紧张。通过减少时钟周期来加速安全算法可以降低功耗。对系统需要的任何常见或常用功能来说,确实如此;通过提高执行效率,用得越多越省电。

ARC EM 处理器系列使用 APEX 技术,使 SoC 设计工程师可以简化和自动化处理设计和验证常见功能的扩展,像加密软件算法或客户专用代码,从而使执行这些常用算法耗费的时间、存储器和电量更少。

图 6:使用APEX加速对传感器应用软件运行时的耗电量降低和周期数减少情况

结论

为物联网应用设计芯片时,设计工程师为了满足性能要求的不断发展,经常要考虑牺牲耗电量。设计工程师可以选择架构方法达到需要的性能而不牺牲能量效率。选择处理器架构时,关键要看灵活性和可配置性,还要能扩展以适应不断变化的应用要求。

ARC EM 系列处理器可以扩展,能提供不会过时的产品路线图,能灵活找出最佳的性能功耗比。能用 APEX 技术定制处理器,就能在物联网市场竞争中差异化你的产品。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

近日,米尔电子推出米尔基于NXP i.MX 93系列产品-MYC-LMX9X核心板及开发板。NXP i.MX 9系列在i.MX 6和i.MX 8系列产品市场验证的基础上,继承了前代产品的优点的同时,进一步提升了性能、资源...

关键字: 核心板 开发板 处理器

硕特Smart Connector应用在著名的瑞士最佳应用程序奖(Best of Swiss Apps Awards) 中荣获铜牌。 这些奖项是应用程序行业最受认可的竞赛之一,享有很高的国际认可度。

关键字: 连接器 物联网

2024年4月18日,重庆——今日,英特尔AI教育峰会暨OPS2.0全球发布活动在第83届中国教育装备展示会期间顺利举行。峰会现场,英特尔携手视源股份、德晟达等合作伙伴正式发布新一代开放式可插拔标准——OPS 2.0,并...

关键字: OPS 2.0 显卡 处理器

全新Balletto™系列无线MCU基于Alif Semiconductor先进的MCU架构,该架构具有DSP加速和专用NPU,可快速且低功耗地执行AI/ML工作负载

关键字: 处理器 微控制器 AI

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

Wxsmart是Weller的首款一体式手工焊接平台,提供全过程控制技术、最大的连接性和可追溯性,并支持物联网标准

关键字: 物联网 智能焊接

全球智能城市运动代表着城市环境设计、体验和导航方式的重大转变。这一重大变革部分是由数字化转型和物联网(IoT)技术推动的,这些技术正在将城市基础设施和城市景观重塑为智能连接中心。这一趋势的核心是符合智能城市独特需求的先进...

关键字: 数字化转型 物联网 Wi-Fi

赛诺贝斯开创性"三位一体"商业模式:领跑MarTech行业的创新引擎

关键字: 数字化 大数据 大模型 生成式AI

新型LPDDR5X是未来端侧人工智能的理想解决方案,预计将在个人电脑、加速器、服务器和汽车中得到更广泛的应用

关键字: 三星 人工智能 LPDDR5 处理器

Supermicro广泛多元的系统产品组合提供高度灵活性,可满足现今针对工作负载优化且具液冷设计的数据中心需求,并集成了新型高效核(Efficient-core)与性能核(Performance-core)处理器,这些处...

关键字: Intel MICRO SUPER 处理器
关闭
关闭