当前位置:首页 > EDA > 电子设计自动化
[导读]摘要:介绍了RBF神经网络,并采用CORDIC算法实现了其隐层非线性高斯函数的映射。同时,为缩减ROM表的存储空间并提高查表效率,本设计还采用了基于STAM算法的非线性存储。最后,以Altera公司开发的EDA工具QuarlusⅡ作

摘要:介绍了RBF神经网络,并采用CORDIC算法实现了其隐层非线性高斯函数的映射。同时,为缩减ROM表的存储空间并提高查表效率,本设计还采用了基于STAM算法的非线性存储。最后,以Altera公司开发的EDA工具QuarlusⅡ作为编译、仿真平台,采用Cyclone系列中的EP1C6Q 240C8器件,实现了RBF神经网络在FPGA上的实现,并以XOR问题为算例进行硬件仿真,得出仿真结果与理论值一致。
关键词:RBF神经网络;FPCA;CORDIC;STAM

    人工神经网络广泛应用于图像处理、模式识别和自动控制等领域。但是,传统的基于软件实现的神经网络,存在并行程度低、速度慢,计算速度无法满足实时性的需求,造成了理论研究与实际应用脱节。因此,神经网络的硬件实现是神经网络研究的基本问题之一。神经网络的硬件实现的最大特点就是体现了系统的并行性,处理速度快,易于满足实时性要求。另外,算法的复杂程度以及在实际工程中应用的可行性仍需要通过硬件的实现效果来检验。因此,神经网络的硬件实现意义重大。

1 RBF神经网络的简介
   
径向基函数(Radial Basis Function,RBF)网络是由Moody J和Darken C于20世纪80年代末提出的一种神经网络结构,是一种有监督的神经网络。它是借鉴生物机制中的局部凋节及交叉接受区域知识的基础上提出的一种采用局部接受域来执行函数映射的人工神经网络。RBF网络最基本的构成包括3层,其结构如图1所示,其中每一层都有着完全不同的作用。


    输入层由一些源点(感知单元)组成,他们将网络与外界环境连接起来;第二层是网络中仅有的一个隐层,它的作用是进行从输入空间到隐层空间的非线性变换。隐层节点中的作用函数(基函数)对输入信号将在局部产生响应,也就是说,当输入信号靠近基函数的中央范围时,隐层节点将产生较大的输出,由此看出这种网络具有局部逼近能力。输出层是线性的,它为作用于输入层的激活模式(信号)提供响应。
    径向基函数有多种形式,如:二次型、逆二次型或Gauss型等。若采用高斯函数作为径向基函数,则神经元的输出为:
   
    上式中,m是隐含层结点数;‖·‖是欧几里德范数;Ci和σi分别为与每个隐含层节点相关的参数向量的中心和宽度;ωi是第i个基函数与输出结点的连接权值。

2 RBF网络的FPGA实现
2.1 RBF单元中心Ci和半径σi的确定
   
对各RBF的中心及半径的确定通常有以下两种方式:
    1)根据经验选中心。只要训练样本的分布能代表所给问题,可根据经验选定均匀分布的m个中心,其间距离为d,则高斯函数的方差(即半径σi)为,其中m为中心数。
    2)用聚类方法,把样本聚成几类,以类中心为各RBF函数的中心。
    首先,中心Ci确定。采用k-均值聚类分析技术确定Ci。找出有代表性的数据点(不一定位于原始数据点)作为RBF单元中心,从而极大地减少隐RBF单元数目,降低网络复杂化程度。利用k-均值算法获得各个聚类中心后,即可将之赋给各RBF单元作为RBF的中心。
    然后,半径σi的确定。半径σi决定了RBF单元接受域的大小,对网络的精度有极大的影响。半径选择的原则是使得所有RBF单元的接受域之和覆盖整个训练样本空间。
    通常应用k-均值聚类法后,对每个聚类中心Ci可以令相应的半径σi等于与其属于该类的训练样本之间的平均距离,即
   
2.2 调节权矩阵W
   
这里权W是指输出层和隐层之间的权值,可以采用线性最小二乘法和梯度法来调节权矩阵W。
   
    由于输出为线性单元,因而可以确保梯度算法收敛于全局最优解。所以,在本设计中采用梯度法来修改权值W。
2.3 隐层非线性函数映射的实现
    RBF神经网络隐层中的映射函数为高斯函数,为非线性函数。而非线性函数在硬件上实现往往比较复杂,难度较大。通常实际工程中采用查表法或迭代法来近似模拟这些非线性函数,查表法较迭代法虽在结构和运算复杂度上有明显降低,但在精度上也会明显降低。若要提高精度,只能增加表的大小,但增加表的大小,直接带来的影响就是会加大存储空间和降低查表效率,所以,在FPGA上采用何种方法实现高斯函数的存储达到精度和效率之间的平衡就至关重要。
    高斯函数表达式为
   
    其中,可以看作是方差为1的高斯函数,而当方差固定时,高斯函数的形状不会发生变化,只是位置上会发生平移,此时我们可以采用查表法来解决该部分的非线性映射,为进一步提高查表效率、压缩ROM表的存储空间,在这里采用STAM(Symmetric Table Loo kup Addition Method)算法实现数据的非线性存储;另外,部分中心固定,而且维持在一定范围,可以采用CORDIC迭代法来实现该部分的函数计算。
2.3.1 STAM算法
    STAM算法的主体思想是先产生系数,然后利用系数的对称性减小ROM表的大小。在该算法中先把输入X分为m+1个部分:x0,x1,…,xm。则f(x)可以近似为
   
    该种方法虽然在某种程度上使得查找表的数量增加了,但每个表的大小却大大减小了,整体上查找表还是减少了,效率上也相应提高了。

    式(13)构造的查找表a0(x0,x1),其输入值的位数为n0+n1。式(14)所构造的其余m-1个查找表ai-1(x0,xi),由于δi被定义为xi的取值区间的中间点,故查找表中的系数值具有对称性,即ai-1(x0,xi)与ai-1(x0,2δi-xi)互为补码,其输入值的位数可以减为n0+n1-1,从而使这m-1个查找表的存储空间节省了一半。
2.3.2 CORDIC迭代法
   
坐标旋转计算机(CORDIC:Coordinate Rotation Digital Computer)由Voider.J于1959年提出,1971年J.S.Wahher提出统一CORDIC算法。
    该算法是用于计算一些常用的非线性函数的循环迭代算法。其基本思想是用一系列与运算基数相关的角度的不断偏摆从而逼近所需旋转的角度,从而达到非线性函数的逼近。
    由CORDIC算法可知,计算指数函数exp(x)的迭代公式为:

    在实现指数函数exp时,采用MATLAB仿真与CORDIC迭代结合的方式。因为迭代过程中有限字长的截断将造成截断误差,所以如果CORDIC输入数据为N bit,则x,y迭代过程需log2(N)的保护位。具体迭代过程为:首先,把CORDIC输入数据映射到CORDIC迭代收敛区间,并根据相应数值的某位数字寻址查表;然后,以为z路径的初始值按公式(15)进行CODIC迭代,直到满足迭代次数,此时得到x1为Kh·exp(zin)。
2.4 系统整体设计框图
    RBF神经网络训练部分的系统框图如图2所示。



3 系统仿真
   
本实验以Altera公司开发的EDA工具QuartusⅡ作为编译、仿真平台,选用Cyclone系列中的EP1C6Q240C8器件。且以经典非线性问题XOR问题为算例。仿真结果如表1所示。



4 结束语
    FPGA作为一种可编程资源,在提高设计灵活性及加快算法效率上,比较适合硬件实现神经网络,可以加快。而文中采用STAM算法,可以有效地节省存储空间,且CORDIC迭代算法实现了RBF网络中的非线性高斯映射函数,所耗资源较少,适合于作为硬件实现网络的算法。从经典非线性XOR算例在基于文中所设计的RBF网络中有较好结果,不仅精度上得到较满意的结果,且网络的总体误差也较小。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

上海2024年4月17日 /美通社/ -- 在2024 F1中国站即将拉开帷幕之际,高端全合成润滑油品牌美孚1号今日举办了品牌50周年庆祝活动。三届F1年度车手总冠军马克斯•维斯塔潘也亲临现场,共同庆祝这一里程...

关键字: BSP 汽车制造 行业标准 产品系列

北京2024年4月17日 /美通社/ -- 2024年4月13日,由北京康盟慈善基金会主办的"县域诊疗,规范同行"——肿瘤诊疗学术巡讲项目首站在广州隆重召开。本次会议邀请全国多位肺癌领域专家和县域同道...

关键字: AI技术 医疗服务 BSP 互联网

海口2024年4月16日 /美通社/ -- 4月14日,在中法建交60周年之际,科学护肤先锋品牌Galenic法国科兰黎受邀入驻第四届中国国际消费品博览会(以下简称"消博会")法国馆。Galenic法...

关键字: NI IC BSP ACTIVE

上海2024年4月17日 /美通社/ -- 每年4月17日是世界血友病日。今年,世界血友病日以"认识出血性疾病,积极预防和治疗"为主题,呼吁关注所有出血性疾病,提升科学认知,提高规范化诊疗水平,让每一位出血性疾病患者享有...

关键字: VII 动力学 软件 BSP

伦敦2024年4月16日 /美通社/ -- ATFX宣布任命Siju Daniel为首席商务官。Siju在金融服务行业拥有丰富的经验和专业知识,曾在全球各地的高管职位上工作了19年以上。Siju之前担任FXCM首席商务官...

关键字: NI AN SI BSP

Bluespec支持加速器功能的RISC-V处理器将Achronix的FPGA转化为可编程SoC

关键字: RISC-V处理器 FPGA SoC

为无处不在的端侧设备插上AI的翅膀,AMD发布第二代Versal™ 自适应 SoC

关键字: AMD FPGA 自适应SoC AI 边缘计算

Pmod接口可以说是数字电路板的连接革命。随着科技的飞速发展,数字电路板间的通信与连接技术也在不断创新和进步。Pmod接口,作为一种新兴的数字接口标准,正逐渐成为数字电路板间通信的桥梁,为电子设备的连接和通信带来了革命性...

关键字: pmod接口 FPGA 数字电路板

近日举办的GTC大会把人工智能/机器学习(AI/ML)领域中的算力比拼又带到了一个新的高度,这不只是说明了通用图形处理器(GPGPU)时代的来临,而是包括GPU、FPGA和NPU等一众数据处理加速器时代的来临,就像GPU...

关键字: FPGA AI 图形处理器
关闭
关闭