当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]近几年来,SOC为了支持更大的硬件资源,及更精确的算法,很多应用中的软件程序代码越来越大,但是售价却要越来越便宜。各家厂商无不绞尽脑汁寻找降低成本的方法。SRAM在SOC

近几年来,SOC为了支持更大的硬件资源,及更精确的算法,很多应用中的软件程序代码越来越大,但是售价却要越来越便宜。各家厂商无不绞尽脑汁寻找降低成本的方法。

SRAM在SOC上,是一个快速但单位面积较大的组件,而单位面积较大代表成本较高。有一个降低成本的方法,是将程序代码放在较慢但单位面积较小的flash或ROM上,当系统需要执行里面的某些程序代码时,才加载到内存里执行。

如果用商店来比喻的话,有一个小店租在都市里的黄金店面里,小店的展示柜很小,当客人想要看架上没有的商品时,店员才从后面较大的仓库里,把商品拿出来放到展示柜上。这里的展示柜就像SRAM,昂贵但是有效率,仓库就像flash,便宜容积大但是存取较麻烦。

本文介绍的是软件overlay的技术。除此之外,晶心科技也发展了硬件overlay的技术,使得overlay执行更快,操作更为简单。期望本文章能对使用者有所帮助,也希望读者不吝指教提供您宝贵的意见。

1. 软件Overlay技术介绍及操作

我们举一个实际例子作为说明,比方说程序代码的大小为210KB,RAM只有64KB,我们把RAM规划成一格一格的大小,比方说每4KB切成一块。每 4KB的大小可以在不同时间,更换成不同的程序代码,可以重复利用RAM的空间。程序代码储存在ROM或flash里,只有在执行之前会将函数从ROM或 flash里动态加载SRAM里。当这个函数执行完成,下一个函数要执行前,再加载下一个函数。

值得注意的是,每一格SRAM里可加载的程序代码是互斥的,比方说有些不会同时使用的功能可以放在同一格里,比方说mp3播放器,录音和播放不会同时使用,就可以规划重复利用同一格SRAM。

1.1 系统架构

请参考图表1,右边长方形是flash的内容。0x0起1MB的空间,flash里存放了程序代码和.data,及各个即将要被overlay的sections。

图表1的左边长方形是SRAM规划,地址从0x10000000开始,我们切出三格提供overlay的SRAM,分别是0x10800000, 0x10804000及0x10808000。Overlay要规划成几格,或者每一格要切成多大块,都是由使用者规划。这里的SRAM与flash的地址是以通用型Andes FPGA开发板作例子。读者设计SOC时,可以根据实际需求定义合理的地址。

程序执行时,0x10800000可以加载.ovly0或是.ovly1。0x10804000可以加载.ovly3或是.ovly2。0x10808000可以加载.ovly4或是.ovly5。

 

1.2 overlay的sag文件编写

图表2是范例sag文件。Sag文件是Andes linker script generator所需要的输入文件,执行linker script generator后,输出会产生GNU linker需要的linker script。详细语法说明可以参考Andes BSP v3.2.0 User manual第12章。

我们简单介绍图表2的语法。第1行关键词USER_SECTIONS表示后面接的这几个sections都是由使用者自定义的sections。在后面的章节,笔者会介绍如何把函数指定为这些自定义sections。

 

1.3 sag文件转成linker script

如图表3,在cygwin下执行nds_ldsag软件,将sw-ovly.sag转成sw-nds32.ld文件。参数-o sw-nds32.ld为指定输出文件名。nds_ldsag软件可以在AndeSight 2.0.1 MCU或是BSP v3.2.0里取得。

 

1.4 程序里指定函数或变量放在自定义的sections

GNU ld (linker)可连结目标文件为可执行文件,排列上的最小单位是section,基本的sections为.text,.data及.bss这3个 sections。为了达成分区overlay的功能,必须指定函数或是变量在自定义的sections上。在前一节里我们介绍了我们切出3个区域可以做 overlay,分别是OVLY0(从0x10800000起),OVLY1(从0x10804000起)及OVLY2(从0x10808000起)三个区域。指定函数overlay0放在自定义section .overlay0里,要使用__attribute__((section(".overlay0")))语法,完整写法请参考图表4a。图表4b.是另外一种写法。

 

1.5 各sections的LMA与VMA

图表6,是各个section的LMA和VMA。在这个表上,可以看.andes32_init到.sdata_w的LMA从0x0~0x29dc,这些 section的LMA是连续的。.overlay0与.overlay1做overlay,所以有共同的VMA 0x10800000。同样的,.overlay2和.overlay3,具有共同的VMA 0x10804000。.Overlay4和.overlay5,也有同样的VMA 0x18008000。

 

1.6 overlay程序的加载

前面已经介绍overlay section的sag文件写法。那么如何加载用户想要用的overlay程序呢?

请看图表7,这是overlay的执行程序代码。第5行OverlayLoad(0)表示载入section .overlay0。第6行OverlayLoad(4)表示载入section .overlay4。第7行在.overlay0被加载后,执行overlay0(),可以正常工作。

 

再来我们介绍一下Overlay manager的程序运作,Overlay manager即为图表7中的函数OverlayLoad。图表8列出Overlay manager代码段,主要做了两件事。一,修改mapped table _ovly_table,标示overlay section是mapped或是unmapped。_ovly_table的用途是让gdb知道目前加载的是哪一个section,使得gdb在 debug时,能自动切换为正确的调试信息。[!--empirenews.page--]

二,在程序执行时期将函数加载,函数ovly_copy是一个memcpy函数,将函数从LMA复制到VMA上。当OverlayLoad(0)执行完后,overlay0函数主体便存在于VMA上,可正确的执行。

 

图表9为_ovly_table的内容,要标示每一个overlay section的vma, size, lma,和是否mapped。必须要注意的一点,_ovly_table要位在一个lma等于vma的区域里。

 

2. 调试Overlay的程序

开启自动overlay调试功能的gdb命令是overlay auto。当overlay auto开启后,对于使用者来说,与一般程序的调试方法相同。

图表8的最后一行_ovly_debug_event()的用途是让gdb能把断点加在正确的地址上,这一行要写在OverlayLoad的后面。必须要有这一行,gdb的自动overlay调试才能正常。

当用户加一个断点在被overlay的区域,gdb会在函数被加载之后(即为执行完OverlayLoad),遇到_ovly_debug_event时,自动的把断点加到overlay的地址上。

3. 参考数据

Overlay Commands https://sourceware.org/gdb/onlinedocs/gdb/Overlay-Commands.html

Automatic Overlay Debugging https://sourceware.org/gdb/onlinedocs/gdb/Automatic-Overlay-Debugging.html#Automatic-Overlay-Debugging

Debugging Programs That Use Overlays

http://davis.lbl.gov/Manuals/GDB/gdb_11.html

Andes BSP v3.2.0 User Manual

Chapter 12 “Linker Script Generation”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

今年资本市场对科技企业的关注焦点已发生根本性转变,AI 不再是企业降本增效的工具,而是直接决定企业生死的关键变量,缺乏核心壁垒的软件企业正迎来 “战时状态”,行业洗牌已全面开启。

关键字: 摩根士丹利 AI 软件

爱立信正在采用人工智能优先(AI-first)的方法,并结合最新的无线接入网(RAN)硬件来构建网络,这些硬件旨在满足人工智能驱动(AI-driven)的网络需求,可以提供更强的上行链路性能、更优的总拥有成本(TC...

关键字: AI 天线 爱立信 软件

随着汽车产业向电动化、智能化、网联化加速转型,软件已从汽车的辅助组件升级为定义车辆竞争力的核心要素,其复杂度呈指数级增长。从燃油车时代简单的嵌入式控制代码,到智能汽车时代涵盖三电系统、高级辅助驾驶、车云协同的亿级行代码生...

关键字: 软件 辅助组件 嵌入式

加利福尼亚州帕洛阿尔托和台北2026年2月10日 /美通社/ -- Zettabyte与光宝科技(LiteOn)今日宣布达成一项研发合作,旨在评估一款部署于蜂窝基站或基站邻近...

关键字: TE AI 分布式 软件

广州2026年2月2日 /美通社/ -- 近日,由工业和信息化部电子第五研究所(中国赛宝实验室)主办的2025年度能力验证总结暨优秀实验室表彰大会圆满落幕。TÜV南...

关键字: 软件 物联网 测试 网络安全

上海2026年1月28日 /美通社/ -- 1月28日,领先的人工智能计算平台公司黑芝麻智能正式发布FAD2.0开放平台。此前,其核心算力平台——华山A2000高性能全场景通识辅助驾驶芯片已顺利通过美国商务部与国防部相关...

关键字: AD 模型 软件 芯片

北京2026年1月26日 /美通社/ -- 战略亮点 —— 稳健的商业势头与卓越的运营执行 第四季度所有三个业务部门的有机销售额均实现增长,其中云软件和服务事业部增长12%*。 近几年的运营改善带...

关键字: 爱立信 BSP 软件 移动网络

FactoryTalk® 制造执行系统及本地支持团队将推动电动汽车生产与人才发展,以契合沙特"2030 愿景" 上海2026年1月21日 /美通社/ -- 作为工业自动化、信息化和数字化转型领域的全球领先企业之一,罗克...

关键字: 汽车制造 电动汽车 自动化 软件

上海2026年1月20日 /美通社/ -- 近日,Lucanet蓝科大股东、全球知名软件投资机构Hg宣布以约64亿美元收购并私有化财务绩效管理巨头OneStream(纳斯达克代码:OS)。 *OneStrea...

关键字: CAN NET STREAM 软件

专为数字自主和人工智能(AI)工作负载打造,助力企业部署安全、合规、自动化的技术环境。 北京2026年1月15日 /美通社/ -- 今天,IBM宣布将推出业界首个 AI 就绪的数字自主软件IBM Sovereign C...

关键字: IBM 软件 OV CORE
关闭