当前位置:首页 > 工业控制 > 电子设计自动化
[导读]摘要:阐述了片上系统(SoC)设计的发展情况和现场可编程门阵列(FPGA)的独特优势,为基于龙芯I号处理器IP核的SoC设计了FPGA验证平台,并介绍了怎样利用该平台进行软硬件协同设计、SoC系统移植、IP核验证和运行实时

摘要:阐述了片上系统(SoC)设计的发展情况和现场可编程门阵列(FPGA)的独特优势,为基于龙芯I号处理器IP核的SoC设计了FPGA验证平台,并介绍了怎样利用该平台进行软硬件协同设计、SoC系统移植、IP核验证和运行实时操作系统。

片上系统SoC(Sytem。n Chip),即是将整个系统集成在单个的芯片上。与传统的板级电路不同,SoC集成的完整系统一般包括系统级芯片控制逻辑模块、微处理器/微控制器CPU内核模块、数字信号处理器(DSP)模块、嵌入的存储器模块、与外部进行通信的接口模块、含有ADC/DAC的模拟前端模块、电源和功耗管理模块,是一个具各特定功能、服务于特定市场的软件和硅集成电路的混合体(如U LAN基带芯片、便携式多媒体芯片、DVD播放机解码芯片等)。

在SoC的设计总时间中,系统验证的时间约占70%以上。为缩短SoC的设计时间、提高设计质量,需要对验证技术进行研究开发。软硬件协同验证方法与传统的数字系统仿真验证方法不同,软硬件协同仿真验证是针对软件和硬件系统模块进行的混合模拟仿真[剑。目前大多数公司提供的开发验证系统(开发板)存在两个不足:一是开发板的性能、规模难以根据特定的设计需求灵活、自由地调节;二是开发板的功能大多数只能进行软件代码的调试,即使ARM公司提供的开发平台也只能调试部分硬件。而现场可编程门阵列(FPGA)作为集成电路设计技术的第三次重大进步的重要标志,可以使RTL综合的结果直接运行在SoC芯片上,重用性及现汤灵活性较好。因此,本文利用Altera公司的FPGA开发工具对皋于国产龙芯I号处理器IP核的SoC芯片进行ASIC流片前的系统验证,全实时方式运行协同设计所产生的硬件代码和软件代码,构建一个可独立运行、可现场监测的验证平台。

  1、基于龙芯I号处理器IP核SoC芯片

龙芯I号CPU IP核是兼顾通用及嵌人CPU特点的32位处理器内核,采用类MIPS Ⅲ指令集,具有7级流水线、32位整数单元和64位浮点单元;具有高度灵活的可配置性,方便集成的各种标准接口。图1为龙芯I号CPU IP核可配置结构,用户可根据自己的需求进行选择配置,从而定制出最适合用户应用的处理器结构。


图1龙芯I号CPU IP核可配置结构

主要的可配置模块包括:浮点部件、多媒体部件、内存管理、Cache、协处理器接口。浮点部件完全兼容MIPS的浮点指令集合,其相关的系统软件完全符合ANSI/IEEE 754-1985二进制浮点运算标准。浮点部件主要包括浮点ALU部件和浮点乘法/除法部件,用户可根据自己的实际应用选择是否添加。媒体部件复用了MIPS浮点指令的Format域,并复用了浮点寄存器堆,媒体指令集基本对应了Intel SSE媒体指令集合的各种操作。图2为基于龙芯I号CPU IP核的SoC系统架构。


图2 SoC的系统结构

该SoC芯片支持通用MIPS32指令集,主频可达266 MHz;内置MAC网络,提供MII接口;存储器接口,芯片同时支持SDRAM接口、NOR Flash/ROM和\AND Flash接口,并特置HPI接口可直接与Y0IP CODEC芯片相连;提供丰富的其他外设接凵支持,包括PC接口、UART串口、SP!接口、AC97等接口设备。提供丰富的GP10接口,能够为“网络+语音”以及工业控制应用提供高效的单芯片解决方案。

  2 FPGA验证平台的设计

2.1 FPGA的开发流程

FPGA的典型开发流程如图3所示。在图3中,逻辑仿真器主要有Modelsim、Verilog_XL等,逻辑综合器主要有LeonardoSpectrum、Synplify Pro、FPGA Ex~press/FPGA CompilerII等,FPGA厂家工具有Altera公司的Max+Plusll、Quartusll,Xilinx公司的Foundation ISE、Alliance等。设计输人主要有原理图输人和HDL输人两种方式,绝大部分设计,FPGA和ASIC的工程师都使用HDL平台。设计仿真主要包括功能仿真和网表仿真,设汁仿真需要RTL代码或综合后的HDL网表和验证程序,有时候还需要测试数据,测试数据可能是代码编译后的二进制文件或使用专门的工具采集的数据。布局布线工具利用综合生成的网表、调用模块的网表,根据布局布线目标,把设计翻译成原始的目标工艺,最后得到生成编程比特流所需的数据文件。布局布线一般需要的输人输出与调用关系如图4所示。布局布线目标包括所使用的FPGA具体型号等,约束条件包括管脚位置、管脚电平逻辑(LVTIL、LCMOS等)需要达到的时钟频率,有时包括部分模块的布局、块RAM的位置等。在一般设计中,只需要注意管脚位置和需要达到的时钟频率,逻辑端口与FPGA管脚的对应取决于PCB板的设计。


图3 FPGA的典型开发流程


图4布局布线的输入输出与调用关系

2.2验证平台的系统设计

本验证平台FPGA采用Altera公司的Cyclone ⅡEP2C70,该器件采用了TSMC领先的90 nm低电介工艺技术生产⒊支持4个可编程锁相环(PLL),提供灵活的时钟管理和频率合成能力;包含了150个18×18 bit乘法器,可以完成基本的DSP处理;高速外接存储器接口支持SRAM、DRAM\DDR、DDR2以及QDRII SItAM;支持差分和单端I/0标准,包括接收速率805 Mbis和发送速率640 Mb/s的LVDS、mlnl LVDS、LVPECL、 差分HSTL和差分SSTL及处理器、ASSP和ASIC接口的64位66 MHzPCI和PCI-X;高达260 MHz工作频率,真正的双端口工作(1个读和1个写,2个读或2个写);与133 MHz Pal_X1.0标准兼容;用户最多可用引脚622个;高达402.5 MHz性能的分层时钟网络,多达16个全局时钟线,快速串行配置时间小于100 ms;支持3.3 V、2,5 V或1.8 V多种电压,可用于视频、图像处理(如MPEG4编码和译码、视频滤波)和无线基础设各中。基于龙芯I号CPU IP核的SoC的验证平台结构如图5所示。


图5 SoC的FPGA验证平台结构

图5中,外围电路的主要功能是验证SoC中各个接口IP模块能否与龙芯I号IP核、外部接口单元、硬件驱动软件和实时操作系统协调高效地工作。由于接口(如USB接口、UART/IrDA接口、SPI和LCD接口等)电路结构比较简单,且很多资料都有介绍,在设计时,除了注意通用的设计规则和印匍电路板(PCB)布局布线外,没有特别的要求。同时,为了便于分析各个被验证的IP模块在任意时刻的状态,将Cyclone Ⅱ EP2C70的大多数I/0引脚都引出到PCB上,以方便SoC开发人员使用逻辑分析仪进行信号实时采集和分析,也可让信号发生器产生一些特定信号以供系统调试使用。该开发系统在设计PCB时还特别注意了电磁干扰的屏蔽问题。

  2.3 SoC到FPGA的系统移植

使用Altera公司的FPGA开发工具Quartusll,将SoC向Cyclone Π EP2C70(FPGA)移植的步骤如下

(1)对SoC进行修改,以适合FPGA的开发环境。修改子模块配置、RAM、FIFO等,添加PLL对所需要的时钟进行适当的分/倍频,或提高时钟信号的质量。

(2)使用Quartusll内置综合工具或专用综合工具(如常见的Synplify._pro)单独建Project,对RTL进行综合,生成网表。时钟工作频率较高的,要写综合约束条件。

(3)指定每一个输人输出信号对应的FPGA管脚和输人输出逻辑类型。

(4)编译生成的网表以生成sof文件,包括优化、适配、sof文件生成等分步骤。

(5)进行静态时序分析,检查是否满足预定的时钟频率要求,若不能满足,则重新进行第(2)步。如果多次进行步骤(2)仍不能满足时序要求,则需要根据关键路径对RTL代码进行修改。

关键路径是指延迟最大的路径,该路径的延迟限制了时钟的最大工作频率。该SoC芯片的最大工作频率在266 MHz以上,与选用的FPGA Cyclone Ⅱ EP2C70的总线时钟速度相当。

3、 VxWorks实时操作系统

本文所设计的SoC硬件平台上,最终将运行Vx-Works操作系统,作为此次嵌入式SoC硬件平台设计的软件需求和最终的验证目标。VxWorks是一个具有可伸缩、可裁减、高可靠性,同时适用于所有流行CPU平台的实时操作系统㈣。可伸缩性指VxWorks提供了超过1 800个应用编程接口(API)供用户自行选择使用;可裁减性指用户可以根据自己的应用需要对VxWorks进行配置,产生具有不同功能集的操作系统映像;可靠性指VxWorks可以提供非常安全的操作系统平台。VxWorks的基本构成组件包括BSP(Board Support Package)、微内核Wind、网络系统、文件系统及I/0系统。本文测试更关注于BSP、Wind以及I/O组件。BSP中包括硬件环境中CPU的初始化及系统各项硬件资源的安装和配置,如RAM、Clock、网络接口、中断控制器等。微内核Wind是Win ̄dRiver公司自行开发的一种嵌人式操作系统内核,该内核具有标准的嵌人式实时操作系统的基本特征。

  4、验证平台的检验

将已经成熟的AMBA总线IP核的Verilog代码通过Synplify综合,利用Altera公司的QUARTUS Ⅱ软件作布局布线,烧人Cyclone Ⅱ EP2C70,再用同样的方式将新开发的EMI IP核的Verilog代码烧入该FPGA,将其中的SDRAM控制器作为验证示例,选取其中最简单的访问方式来验证该平台能否使用。上电后,首先要对所有内存区(bank)预充电,经8个自刷新周期后需要设置访问模式,即编程模式寄存器。以上三个过程要求如下:

(1)预充电命令的发出要求:在时钟周期的上升沿处,CS、RAS、WE为低,CAS为高。

(2)自刷新命令的发出要求:在时钟周期的上升沿处,CS、RAS、CAS 禾口CKE保持低,WE为高。

(3)模式寄存器的激活:在时钟的上升沿处,RAS、CAS、CS和WE为低。

当要验证各个IP模块(包括[NT中断控制器、DMA控制器、LCD控制器和AC97控制器等)之间的协同工作时,烧入的代码较多,占用的FPGA资源也较多,再加上需要实时运行,例如播放PM3实时解码过程中,时钟至少要求60 MHz,需要工作的IP核有总线、DMA控制器、INT中断控制器、AC97控制器等,因此在这种情况下,最好使用Multi PointSynthesis的综合流程和Timing driv-en的综合与优化策略,并使用Logic一lock约束技术和人工干预布局布线,以达到预期目的。使用该平台对所开发的SoC的各个模块进行了验证,并在lO MHz~70 MHz条件下与代码前(后)仿真结果和SoC实测结果进行了比较,发现该FPGA验证平台在多模块、高速情况下,性能有所下降,如图6所示,需进一步提高综合和布局布线技术。


图6各模块实验验证结果比较

本文设计了基于国产龙芯I号处理器IP核的SoC的FPGA验证平台,介绍了怎样利用该平台进行软硬件协同设计、SoC系统移植、IP核验证和运行实时操作系统。在电压设计、模块选用甚至处理器核的选用方面都考虑了升级扩展技术,可为其他SoC的验证所借鉴。验证结果表明,基于龙芯I号CPU IP核的SoC可成功运行Linux嵌入式程序及VxWorks。



参考文献:

[1].ALUdatasheethttp://www.dzsc.com/datasheet/ALU_2089372.html.
[2].ROMdatasheethttp://www.dzsc.com/datasheet/ROM_1188413.html.
[3].GP10datasheethttp://www.dzsc.com/datasheet/GP10_1579585.html.
[4].PCBdatasheethttp://www.dzsc.com/datasheet/PCB_1201640.html.
[5].EP2C70datasheethttp://www.dzsc.com/datasheet/EP2C70_1438351.html.
[6].LVDSdatasheethttp://www.dzsc.com/datasheet/LVDS_457917.html.


来源:冬虫1次

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

近日,一则关于 AI 算力领域的消息引发行业震动!据科技网站 The Information 援引四位知情人士爆料,中国科技巨头阿里巴巴与百度已正式将自研芯片应用于 AI 大模型训练,打破了此前对英伟达芯片的单一依赖。

关键字: AI 算力 阿里 百度 芯片 AI模型

上海2025年9月5日 /美通社/ -- 由上海市经济和信息化委员会、上海市发展和改革委员会、上海市商务委员会、上海市教育委员会、上海市科学技术委员会指导,东浩兰生(集团)有限公司主办,东浩兰生会展集团上海工业商务展览有...

关键字: 电子 BSP 芯片 自动驾驶

9月1日消息,继小鹏、零跑后,现在小米汽车也宣布了8月的交付量。

关键字: 小米汽车 芯片

当地时间 8 月 22 日,美国芯片制造商英特尔公司宣布与美国联邦政府达成协议,后者将向英特尔普通股投资 89 亿美元,以每股 20.47 美元的价格收购 4.333 亿股英特尔普通股,相当于该公司 9.9% 的股份。

关键字: 英特尔 半导体 芯片

在当今数字化时代,人工智能(AI)和高性能计算(HPC)的迅猛发展对 GPU 芯片的性能提出了极高要求。随着 GPU 计算密度和功耗的不断攀升,散热问题成为了制约其性能发挥的关键因素。传统的风冷方案已难以满足日益增长的散...

关键字: 人工智能 高性能计算 芯片

8月20日消息,博主数码闲聊站暗示,9月底大概率只有小米16系列会亮相,其它骁龙8 Elite 2旗舰、天玑9500旗舰新品都将排到10月份,新机大乱斗会在国庆假期之后开始。

关键字: 小米雷军 芯片

8月21日消息,据媒体报道,英伟达宣布将自研基于3nm工艺的HBM内存Base Die,预计于2027年下半年进入小规模试产阶段,此举旨在弥补其在HBM领域的技术与生态短板。

关键字: 英伟达 黄仁勋 芯片 显卡

继寻求收购英特尔10%的股份之后,近日又有消息称,特朗普政府正在考虑通过《芯片法案》资金置换股权的方式,强行收购美光、三星、台积电三大芯片巨头的股份。若此举落地,美国政府将从“政策扶持者”蜕变为“直接股东”,彻底重塑全球...

关键字: 芯片 半导体

在集成电路设计流程中,网表作为连接逻辑设计与物理实现的关键桥梁,其分模块面积统计对于芯片性能优化、成本控制和资源分配具有重要意义。本文将详细介绍如何利用 Python 实现网表分模块统计面积的功能,从网表数据解析到面积计...

关键字: 网表 芯片 分模块

8月19日消息,封禁4个多月的H20为何突然又被允许对华销售,这其实是美国设计好的。

关键字: 英伟达 黄仁勋 芯片 显卡
关闭