当前位置:首页 > 工业控制 > 电子设计自动化

摘 要: 提出一种基于ARM和NAND Flash的FPGA加载配置的设计。选取Virtex-5系列的XC5VSX95T和ARM11系列的S3C6410处理器作为硬件平台,研究了利用NAND Flash自启动、以8 bit的SelectMAP模式配置FPGA的流程及实现。介绍了其配置原理、软硬件实现过程以及实现结果分析,重点分析了ARM+NAND的控制方法。该方案已在TD-LTE无线综合测试仪表中成功应用,是一套灵活和高效的FPGA配制方法。
关键词: FPGA配置;S3C6410;SelectMAP模式;NAND Flash

TD-LTE无线综合测试仪平台的主要功能是测试接收端与发射端信号的差异,即接收和发射端信号的误码率等性能的优劣,其物理层采用通用的FPGA+DSP+ARM硬件架构,具有开发周期短、可扩展性好等优点。
现场可编程门阵列FPGA是基于门阵列方式为用户提供可编程资源,其内部逻辑结构的形成是由配置数据决定的。由于SRAM的易失性,每次上电时,都必须对FPGA重新进行配置、完成下行链路OFDM信号以及底层交互相关信号的产生等功能。
对于FPGA配置,大多数是采用将配置数据存放在FPGA组成的系统上[1-2]或者将配置数据存放在使用者自己携带的外部存储器中的实现方式,后者在系统上电时需由其他外部控制器读出配置数据再传送给FPGA进行配置。本文提出在TD-LTE无线综合测试仪平台上,通过嵌入式微处理器ARM将配置数据存放于NAND Flash[3]中,由Flash上电启动读出配置数据再对FPGA进行配置。这种方法不但修改、升级简便,而且由于NAND Flash在写入数据时都需要先擦除再写入,所以具有很好的保密性[4],并且可以方便地存储大容量配置数据或多个配置数据文件等。本文介绍了TD-LTE无线综合测试仪平台上电后自动加载对FPGA器件进行配置的设计与实现的新方法,对无线TD-LTE系统的底层控制实现具有重要意义。
1 配置原理
1.1 配置模式
Xilinx公司为其FPGA系列产品提供了多种数据配置方式,在TD-LTE综合测试仪的研究中选用的是Virtex-5系列芯片XC5VSX95T。Virtex-5提供了如表1所示的几种不同的配置模式,其中的从SelectMAP模式最高可以支持32 bit总线宽度[5]。在每次芯片上电初始化完毕后,芯片将以采样模式引脚M[2:0]决定配置模式。
1.2 配置方案
本文在FPGA+ARM+NAND的硬件环境下,将ARM作为主控制器,介绍从SelectMAP模式或者从串行模式的配置方案,其中串行模式需要的I/O资源较少,但速度较慢;从SelectMAP模式需要的I/O资源较多,但速度较快。
(1)在串行配置模式下,FPGA在每个CCLK周期载入一个比特的数据,CCLK引脚由外部时钟源来驱动,而且总是每个数据字节的最高位先被写到DIN引脚。从串行配置模式需要用到的配置引脚为模式选择M[2:0]设置为111、配置时钟CCLK、配置复位PROGRAM_B、初始化状态INIT_B、配置完成DONE和配置数据D_IN。其中,ARM除了控制PROGRAM_B、INIT_B外,还需要控制时钟CCLK、配置数据在CCLK的上升沿采样一个比特。通过ARM拉低再拉高相应的GPIO产生CCLK上升沿时序,延时程序则由for循环实现,由时钟控制和比特文件的载入需要分别控制可以知道串行配置耗时是比较多的。
(2)SelectMAP模式提供了与 Virtex配置逻辑之间的一个8 bit双向数据总线接口。从SelectMAP模式支持8、16、32 bit总线宽度。为了利于系统的调试及检测方便,本文选择8 bit总线宽度。该模式所用到的配置引脚为模式选择M[2:0]、配置时钟CCLK、配置复位PROGRAM_B、配置完成DONE、配置数据8 bit并行输入DATA[0:7]和CRC[6]校验信号INIT_B、片选信号CS_B、回读信号BUSY以及从SelectMAP模式使能信号PDWR_B,其中的时钟控制信号可编程实现。在综合测试仪中,FPGA的数据线与双端口RAM的数据线共用,并且将双端口RAM的写使能作为CCLK。因此不需要单独控制,直接向双端口RAM中写数据可同时实现时钟的产生和数据的传送。
在从SelectMAP模式中使用写使能nWE作为时钟线,在传输配置信息和时钟控制上都节约了很多时间。因此,根据TD-LTE综合测试仪的设计要求并考虑到测试的方便性,采用8 bit从SelectMAP模式对XC5VSX95T进行配置是较好选择。
2 总体实现及流程
2.1 配置流程
图1给出了FPGA配置流程框图。在上电时,PROGRAM_B输入上的逻辑低电平将会复位配置逻辑,并且使FPGA保持在清空配置存储器的状态。只要PROGRAM_B引脚保持低电平,则FPGA将继续清空它的配置存储器并使INIT_B信号保持为低电平以表明配置存储器在被清空。当PROGRAM_B被释放时,FPGA将继续使INIT_B保持为低电平,直到完成清空所有的配置存储器。只要INIT_B信号变为高电平时,表明清除动作完成,配置就可以开始了。在INIT_B的上升沿,模式选择引脚M[2:0]被采样,以决定配置模式,若为110,则采用从SelectMAP模式。此后配置文件信息在CCLK的控制下由D[0:7]共8个配置引脚并行输入XC5VSX95T中。配置数据在CCLK的上升沿采样一个字节。在配置期间芯片会自动进行CRC错误检验,若发生了CRC校验错误,则INIT_B引脚将被置低。当最后的CRC校验成功完成后,FPGA进入启动时序。这个时序期间将会释放DONE引脚(变为高电平),FPGA释放全局三态(GTS),激活I/O引脚,释放全部置位复位(GSR) 和全局写使能(GWE)有效,开始执行配置区的逻辑。此后芯片进入正常工作状态。配置时序图如图2所示。

2.2 硬件设计
本系统采用的嵌入式微处理器为S3C6410[7],将FPGA配置文件下载到ARM的存储器存放入Flash中,以ARM处理器作为主设备,FPGA作为从设备。系统上电后,ARM通过读取相应的配置文件对FPGA进行配置,256 MB的DDR SDRAM作为程序运行空间,将NAND Flash中代码移至SDRAM中运行。
2.2.1 外围芯片
(1)S3C6410
S3C6410基于ARM1176JZF-S处理器核,是一类低功率、高性价比、高性能、用于手持和移动等终端设备的通用RISC处理器。其主频芯片可达667 MHz,采用64/32 bit的内部总线架构,拥有比S3C2440、S3C2410等更加丰富的接口。
在S3C6410中,由系统时钟控制逻辑生成所需要的系统时钟信号,用于CPU的ARMCLK、AXI/AHB总线外设的HCLK和APB总线外设的PCLK。本系统中,采用12 MHz的外部晶体作为S3C6410的外部时钟,ARMCLK:HCLK×2:HCLK:PCLK分别设置为553 MHz:266 MHz:133 MHz:66 MHz。
(2)NAND Flash
系统采用K9F1G08U0C型的128 MB×8 bit的NAND Flash。该芯片总共有1024块,每块有64(页)×2 GB的容量。额定电压为3.3 V,支持随机读写功能。
(3)双端口RAM
采用IDT70V28L系列的双端口RAM,其写使能nWE作为配置文件加载控制时钟CCLK。
2.2.2 硬件连接
S3C6410与XC5VSX95T以及双端口RAM主要通过CCLK、PROGRAM_B、DONE、D[0:7]和INIT_B信号线相连接,如图3所示。采用S3C6410的通用接口GPN10、GPN12、GPN13分别控制INIT_B、DONE、PRORAM_B,用ARM的外部存储器双端口RAM的写使能信号nWE控制CCLK,同时其数据线DATA[0:7]作为信息输入的D[0:7]。

2.3 软件设计
根据图2 FPGA配置时序图,主设备ARM编程要实现各信号的时序要求。ARM软件控制设计流程如图4所示,其中应用代码包含FPGA 的配置驱动。
2.3.1 比特文件的下载
对所设计的FPGA在Xilinx公司的ISE10.1软件平台上运用Verilog语言编译运行后产生4.25 MB的.bit文件。将此.bit文件通过ARM仿真器RVDS4.1的调试环境Realview Debugger加载到ARM的一段可用内存中。主要方法:在Target选项中选择Load Binary,内存选择为以DDR SDRAM的0x59 000 000作为暂时存放.bit文件起始地址的内存区。这样做的好处是不需要进行额外的下载电缆连接操作,使芯片系统重构时没有对电缆的插拔要求,只需要通过相应软件操作即可。
2.3.2 从NAND启动
将初始化代码和应用代码烧写到Flash后,ARM处理器以NAND Flash模式启动时,内置的NAND Flash控制器将访问控制接口,将其第0块前8 KB的代码自动加载到内部SRAM中,而片内SRAM被映射到地址0x0,上电后运行实现初始化硬件等基本功能。利用片内SRAM中的代码把NAND Flash中的程序代码复制到DDR SDRAM以0x51 000 000作为起始地址的内存中去,通过MMU实现0x51 000 000到0x0的映射,采用PC指针实现跳转至0x0执行应用代码。
2.3.3 对FPGA发送配置数据
在S3C6410中,通用接口的大多数引脚都是多功能引脚,可以通过端口配置寄存器选择相应的引脚功能。对于端口N,控制寄存器GPNCON用于设定引脚的输入、输出或者特殊的功能。如图3硬件连接框图所示,数据寄存器GPNDAT[10]对应GPN10引脚上的数据,在时钟产生的同时对其写1、0、1实现INIT_B的初始时序控制。NAND Flash启动完成初始化后,应用代码实现从Flash相应存储区域读出FPGA配置信息到一段可用地址(如DDR SDRAM中以0x59 000 000开始的存储区),然后从将其中的数据写到双端口RAM中,由FPGA与双端口RAM的数据线复用,完成配置数据加载到FPGA,实现配置。
由于采用了写使能信号nWE作为配置时钟CCLK,向双端口RAM的地址线中写配置信息即产生时钟,并且在nWE写使能信号的上升沿来实现数据采集的功能。
3 实现结果及分析
实现结果如图5、图6所示,图中解释了FPGA的CCLK、INIT_B、PROGRAM_B几个控制信号的变化以及部分配置数据。其中,横纵坐标分别表示时间变化和在相应时间变化中的信号采样值,纵坐标D9、D10、D11分别表示CCLK、INIT_B、PROGRAM_B,D0:D7作为数据线D[0:7]。其中时钟的产生可以通过向双端口RAM某个可用地址中写数据来实现(这里写的是0x8)。图5中,D10一段连续低电平是FPGA自动CRC校验过程,在CRC校验完毕,D10拉高后开始传送配置信息。图6为FPGA配置部分波形展开图。


SelectMAP模式中总线宽度为8 bit的配置方案在TD-LTE综合测试仪表中已经成功实现。这种配置方式也可以用在其他具有相似硬件环境的情况,如果采用16 bit或者32 bit的传输,相应地时速会成倍提高。
本文介绍的系统采用了ARM+NAND Flash的FPGA配置模式,外围利用SDRAM和DP_RAM的硬件电路,实现FPGA自动加载配置。这种方法灵活且具有保密性,修改、升级简便,可实现多任务电路结构重构和自动重载,满足自动配置的要求,同时也有益于整个系统启动,方便了整个系统启动控制,对无线TD-LTE系统的底层控制实现具有重要意义,应用范围非常广泛。
参考文献
[1] 梅安华,田建生,刘欢,等.基于PCI总线的FPGA配置系统的设计[J].计算机测量与控制,2005,13(4):375-377.
[2] 王尔申,张淑芳,胡青.嵌入式GPS接收机系统的FPGA配置方法研究[J].计算机工程与应用,2009,45(4):86-88.
[3] 128 M×8 bit NAND flash memory REV 0.2[EB].Samsung Electronics.2008.
[4] 柔性材料.数据销毁背后的16条法则[EB/OL].(2010-04-16)[2012-1-9].http://www.mcplive.cn/index.php/article/index/id/5347/page/4.htm.
[5] Xilinx, Inc.Virtex-5 FPGA Configuration User Guide[EB].UG191(v3.1) April 25,2008.
[6] Yang Wenlong,Wang Lingli,Zhou Xuegong.CRC circuit design for SRAM-Based FPGA configuration bit correction[J].IEEE,2010(11).
[7] S3C6410X RISC Microprocessor User's Manual[EB].Samsung Electronics.REV 1.10.2008.

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

Arm CPU正在从根本上推动AI变革,并造福地球。Arm架构是未来AI计算的基石。​

关键字: ARM AI

近日,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。

关键字: ARM

为了赶超云计算市场上的竞争对手,谷歌正试图通过定制的Arm服务器芯片降低云计算服务成本。

关键字: 谷歌 ARM 定制芯片

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

西班牙塞维利亚,2024年3月12日 — Teledyne Technologies旗下公司、全球成像解决方案创新者Teledyne e2v宣布扩展其Flash™ CMOS图像传感器系列,推出Flash 2K LSA,该...

关键字: 图像传感器 Flash 摄像机

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS

一直以来,riscv架构都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来riscv架构的相关介绍,详细内容请看下文。

关键字: riscv ARM riscv架构

在这篇文章中,小编将为大家带来JTAG接口与Flash的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: JTAG Flash
关闭
关闭