当前位置:首页 > 嵌入式 > 嵌入式硬件

随着cpu速度的迅速提高,cpu与片外存储器的速度差异越来越大,匹配cpu与外部存储器的方法通常是采用cache或者片上存储器。微处理器中的片上存储器结构通常包含指令cache、数据cache或者片上存储器。对于嵌入式设备上数据密集的应用,数据cache与片上存储器相比存在以下缺陷:①片上存储器是固定的单周期访问,可在设计时(不是运行时)研究数据访问模式;而cache还要考虑不命中的情况,因而有可变的数据访问时间,执行时间的预测更加困难。②使用cache执行时间的不可预测性影响编译器的优化。③细颗粒的cache对于图像编码等的规则数据访问并不合适,因而使用cache对于嵌入式设备可能不是最优的。对于大多数应用,使用片上存储器比使用数据cache能耗平均节省约40%,芯片面积与时间的乘积仅为cache的46%,因而对于嵌入式多媒体处理器,片上ram作为数据cache的替代,功耗更低。片上存储器的有效使用对于提高嵌入式应用的速度、降低功耗具有重要的意义。

  tms320c55x(简称为“c55x”)具有极低的功耗(0.05 mw/mips),非常适合手持设备,现在已经集成至tt公司专门针对3g手机的高性能多媒体处理器上。c55x片上除了24 kb的指令cache外,还有64 kb的双端口存储器(daram)和96 kb的单端口存储器(saram)。daram和saram总共160 kb,分成20个块,每个块8 kb。本文以c55x上的视频编码器为例,讨论片上存储器的有效使用。   1 数据的片外、片上动态分配

  因为片上存储器比片外存储器具有更强的数据访问能力和更低的访问功耗,所以尽可能分配数据到片上存储器;未能分配到片上的数据可在cpu处理前转移到片上;已经转移到片上的数据,应尽可能在片上保存,直到其生命期结束,以便尽可能减少数据从片外存储器到片上存储器的数据转移。在视频编码等应用中,标量、常数相对矩阵而言,通常数量较少,可以分配到片上。若分配到片外,则在运算时直接存取片外数据,cpu流水线将会停滞。直接存储器存取(dma)可以在存储器之间、存储器与外设之间转移数据,除了dma通道参数初始化以外,dma转移数据和cpu处理数据可以并行进行。设置dma通道参数需要一定的时间,用dma来转移单个变量或常数的开销可能比直接存取更大,因此dma适合转移具有较多数据的矩阵,并不适合片外标量的转移。包含大量元素的矩阵可以分配到片外,处理前使用dma转移到片上存储器。

  局部变量由编译器分配到软件栈上,c55x具有两个软件栈——数据栈和系统栈。c55x的栈有3种工作模式,可设置成双16比特快返回模式,以减小栈所占的存储器空间,并提高其运行速度。数据栈和系统栈在函数调用及返回时同时访问,可将这两个栈分配到daram块或者不同的saram块内。

  本文中数据存储器的分配,强调从实际多媒体应用处理的基本数据块出发,分析简单、直观。多媒体算法总是将原始输入数据分成一定大小的块来处理,并产生对应该输入的最后输出。如果片上没有足够的存储器,则大量的输入数据和最后结果仅能存储在片外。对于元素较多的矩阵,可以根据算法特征,将矩阵分成若干数据子块,如h.263编码器中的宏块和搜索窗等,或者单纯根据可得到的片上存储器数最分成适当大小的子块逐个运算,然后分析数据子块的生命期和使用频率。

  这里定义数据子块的生命期为首次使用到最后一次使用之间的间隔,而通常变量的生命期为定义到最后使用之间的间隔。例如,定义整型数组int mb[384],用来存储待编码宏块的数据,图像的某个宏块的数据在该宏块编码结束后,该宏块数据的生命期也就结束}然后该数组用来存储下一宏块的数据,因而变量的生命期远比存储在该变量中的某一具体数据的生命期要长。若数据子块具有不相交的生命期,则可以共享相同的片上存储器。很多数据子块在运算中多次使用,可在首次运算前转移到片上,并尽可能保存到生命期结束,即直到这些数据不再使用为止,因而这些数据仅需要一次转移。将程序执行时间看成是由很多连续的时间间隔组成的,若在下个时间间隔内需要转移新的数据到片上供cpu处理,而片上又没有足够的存储器存储这些数据,则这时将随后需要莲续频繁使用的数据保留到片上。对于随后较少使用的数据,若片外存储器还保存有该数据的备份,则这些数据可直接覆盖,等到下次使用时再从片外存储器拷贝到片上;否则,在覆盖前将数据转移到片外。在片上分配一定的缓冲区,用来存储需要再次使用的数据,可有效地减少片外存储器的访问。对于中间结果,尽量在使用前分阶段计算,使用后释放,以缩减存储中间结果的存储器需求。通过数据的这种动态分配,既可以减小或避免访问片外慢速存储器所引起的指令延迟,又可以减少片外到片上的数据转移。

  在h.263视频编码器中,编码是按宏块顺序进行的。intra宏块编码不仅需要当前的编码宏块数据,还需要以当前宏块为中心的重建图像搜索窗。因此,根据算法特征将整帧输入图像划分成宏块,某个宏块数据在编码前转移到片上,这一宏块编码结

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭