扫描二维码
随时随地手机看文章
(2) System Loader
该部分为传统意义上的Boot Loader过程,完成硬件环境相关设置及初始化,并将操作系统载入到RAM中运行。需要注意的是,MPU本身的中断向量表须载入到内部SRAM中,其他操作系统部分可以载入到外部SDRAM中。
由于OMAP平台为双核心结构,因此 System Loader除了需要载入MPU系统本身之外,还需要配置DSP的载入及启动过程。DSP有3种启动方法:Flash引导方式与ARM载入方式,参考文献[2]对这两种方式进行了对比分析。本设计采用ARM载入方式,这样可以通过ARM动态配置DSP部分的代码,控制DSP核心的处理流程。与参考文献[2]所不同的是,本方法中DSP程序采用与MPU操作系统相同的方式存储,也存入Flash中,而不是作为常量数组编入Boot Loader程序中,这种方式较参考文献[2]中的方法更加便于管理,单独对DSP程序进行升级也更加方便,而且减小了System Loader的程序长度,更有利于多级启动方式。
因为OMAP本身的GPIO(MUPIO)有限,所以大多设计都要采用FPGA作为外围扩展控制器,用来扩展更多的控制端口以及通信端口。一般FPGA本身无法存储程序,其程序存储在片外ROM中,FPGA上电之后可以通过多种方式自行加载到ROM中运行。本设计通过MPU加载FPGA程序,并将FPGA固件程序也存储于同一Flash中,这样省去了一片FPGA专用ROM,既方便代码管理,又降低了硬件成本和设计复杂度。以XILINX公司的XC2S系列FPGA为例,其加载程序时可采用串行加载模式,选择FPGA为从模式,将OMAP本身的MCBSP配置为SPI主模式,工作于时钟停止模式,包含一个时钟周期延时,输出时钟信号高有效,采用帧同步模式,每个数据帧8 bit。给FPGA载入程序时,要将存储于Flash中的FPGA程序代码读出,由于XILINX开发工具ISE输出的HEX文件以字节(8 bit)为单位,而Flash中存储的内容以双字(32 bit)为单位(由ARM指令长度而定),因而从Flash中读出32 bit的数据之后需要按照从高到低的字节顺序发送。而且,ISE的HEX文件每字节bit排列顺序与MCBSP的传输顺序正好相反,因此每个字节内部需要将bit反向重排。
System Loader流程如图2所示,启动顺序与本小节所述顺序正好相反,这是因为FPGA一般多用于进行硬件设备的控制,所以需要最先启动;而DSP由于其自身特点,多用于数据处理工作,作为MPU的协处理器使用,因此需要在MPU操作系统启动之前做好准备。
[!--empirenews.page--] (3)Flasher
Flasher过程主要负责向Flash中烧写编译好的程序目标码,主要包括Boot Loader、MPU、DSP、FPGA等部分。采用RS232串行端口与主机相连,实现程序目标码的下载。传输协议采用大多数编译器都支持的Intel Hex格式[5]。Intel Hex格式采用ASCII字符表示方式,这样程序目标码的每个字节需要用2个ASCII字符来表示,包含冗余信息较大,而且Intel Hex格式仅含目标码的地址信息与具体内容,而无法区分目标码的类别,因而需要对Intel Hex进行扩展,以降低冗余并支持更多的操作。扩展的Hex不使用ASCII字符,而直接使用原数据格式,这样可以降低一半数据量。为了与Intel Hex格式有所区分,采用“;”作为前缀标识,格式如表1所示。同时对数据类型进一步扩展,用以区分各种目标码类别,如表2所示。
可以看出,表2中仅包括擦除各种类型目标码的指令,而没有包含写入目标码时区分类别的具体指令,这是因为写入时各种不同类型的目标码可以直接通过地址来区分,每种类型目标码都有自己单独的地址段,相互之间没有交叉。Flasher流程如图3所示,通过解析Hex记录格式,来判断命令类型,从而进行相应的操作。其中校验模式用于验证Flash中所存储的程序代码是否与串行端口上收到的数据一致。所有程序更新结束之后,通过重新启动命令复位OMAP芯片,使整个系统重新启动。
3 拷贝程序耗时对比测试
采用Intel公司RD48F3000P0ZBQ0 Flash存储器以及三星K4M56163PG移动版SDRAM与OMAP5910相连,组成OMAP5910运行所需的最小系统,OMAP运行频率144 MHz。分别采用传统启动方式(程序在Flash中运行)以及本文所述的启动方式(程序在RAM中运行)从Flash中拷贝相同长度的数据到SDRAM中,测试其耗时。每次拷贝数据量选取64 KB~8 192 KB,每种数据量每种方式测试5次,具体时间如表3所示,其中表3(a)为程序在RAM中运行时的耗时,表3(b)为程序在Flash中运行时的耗时。由表中数据对比可以看出,拷贝数据量较大时,本文中所述的RAM拷贝方式优势比较明显,有大约20%的提高,对于目前的嵌入式操作系统来说,基本内核的代码量都比较大,因而采用本文所述的方式能够带来比较大的耗时改善。
OMAP作为一种整合了ARM控制能力与DSP数据处理能力的双核心处理器已经广泛应用于各种嵌入式设备中,但大多数OMAP处理器通过外部Flash启动,既浪费时间又有较高风险。本文针对OMAP启动过程中的这一缺陷,设计的多级启动Boot Loader较之传统方式有较大的性能改善,目前已在数字集群手持终端、网络多媒体可视电话等项目中得到成功应用,并取得很好的效果。