当前位置:首页 > 公众号精选 > 芯榜
[导读]最近为什么越来越多的研究开始利用FPGA作为CNN加速器?FPGA与CNN的相遇究竟能带来什么神奇效果呢?原来,FPGA拥有大量的可编程逻辑资源,相对于GPU,它的可重构性以及高功耗能效比的优点,是GPU无法比拟的;同时,基于OpenCL的高层次综合工具,可以为CNN在FPGA上的实现提供快速的验证和实现流程。


最近为什么越来越多的研究开始利用FPGA作为CNN加速器FPGACNN的相遇究竟能带来什么神奇效果呢?原来,FPGA拥有大量的可编程逻辑资源,相对于GPU,它的可重构性以及高功耗能效比的优点,是GPU无法比拟的;同时,基于OpenCL的高层次综合工具,可以为CNN在FPGA上的实现提供快速的验证和实现流程。

在众多的该类研究里面,由北京交通大学王东老师带领他的团队所设计的开源PipeCNN模型最为突出, 该模型是一种基于OpenCLFPGA加速算法设计大规模卷积神经网络(CNN模型。主要目标是在FPGA上提供基于OpenCL的通用且高效的CNN加速器设计。这种设计模型被广泛应用于图像分类、视频分析和语音识别等领域。PipeCNN在性能和硬件资源方面都具有很好的可扩展性,可以部署在各种FPGA平台上。该设计可谓是给FPGA 用戶带来强大的AI帮手

王东老师团队提出的PipeCNN模型是一种具有流水线內核的高效硬件架构, 在OpenCL的异构并行计算框架下,设计了卷积(Convolution),池化(Pooling), 局部响应归一化(LRN)和Data Mover 等Kernel。此架构FPGA內实现能有效的减少內存占用带宽要求,而提高效能。以下是来自王东老师 FPT 会议论文里面 PipeCNN 架构框图:

他们在FPT 会议论文里面对不同FPGA平台的性能、成本和功耗进行了总结

在表中可以看到, 对于AlexNet 模型,  PipeCNN实现的最佳性能是在DE5a-net平台上, 平均速度为200 fps(5ms / img)。而单纯使用安装Caffe工具的电脑上(Intel i5-4690K CPU, 64GB 存储)执行AlexNet和VGG-16的运行时间则分别为189毫秒和1547毫秒。我们对比一下可以看到使用基于FPGA的加速器对AlexNet 模型相对于CPU可以实现高达37倍的性能。

王东老师团队带着PipeCNN设计成果参加了2018 Innovate FPGA全球创新大赛在大中华区决赛现场,团队成功演示了如下这些应用
1ImageNet图像分类:基于AlexNet网络对ImageNet数据集进行实时分类


2)基于摄像头的物体识别:通过摄像头采集目标物体图像,并对其进行识别


3)人脸识别:基于VGG-16网络对给定人脸进行实时的识别


4)目标检测:基于Faster R-CNN网络在分类图像的同时把物体用矩形框圈出来。

如下是来自区域赛当时演示的照片,让大家一起来感受下现场吧:


王东老师的 PipeCNN 项目已在github上开源,因此可以被研究人员用作探索新硬件架构的通用框架,也可以被高校教师作为与FPGA相关的任何学术课程的自定义设计示例。在Innovate FPGA创新大赛的大中华区决赛现场上, 便同时有两支决赛队伍使用到开源PipeCNN模型进行图片辨识,参赛队伍们表示,使用PipeCNN设计,大幅度减少他们关于深度学习这块工作的开发时间,还能达到期望的目标效能,特别感谢这个开源PipeCNN设计。目前PipeCNN这一研究成果的应用已被全球很多用户所采用并在各种友晶科技的开发板(例如DE1-Soc/DE5a-Net)上运用起来

最后该成果在Innovate FPGA全球创新大赛-大中华区决赛中荣获特等奖将代表大中华区前往美国硅谷参加全球总决赛。该队伍将与来自全球各赛区产生出的11支队伍一较高下,期待他们取得好成绩。

Innovate FPGA全球创新大赛全球总决赛将于815于英特尔美国硅谷总部盛大举行,此次代表大中华区的队伍由北京交通大学王东老师团队、武汉大学常胜老师团队以及重庆大学何伟、林英撑老师团队组成,让我们一起为大中华区代表对打Call!


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月25日 我们的客户选择亚马逊云科技运行他们的关键应用程序和最敏感的数据。每天,世界上发展最快的初创公司、最大的企业和最值得信赖的政府机构都选择亚马逊云科技作为技术基础设施平台。他们之所以选择亚马逊云...

关键字: GPU 计算 生成式AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

近日媒体Business Insider透露称,微软目前正在疯狂囤货GPU,目标在2024年12月前达到180万片。微软本次采购的 GPU 主要来自英伟达公司,不过微软也计划采购 AMD 等其它公司的 GPU 进行扩充。

关键字: 微软 GPU

Apr. 16, 2024 ---- NVIDIA新一代平台Blackwell,包含B系列GPU及整合NVIDIA自家Grace Arm CPU的GB200等。TrendForce集邦咨询指出,GB200的前一代为GH2...

关键字: CPU GPU

Bluespec支持加速器功能的RISC-V处理器将Achronix的FPGA转化为可编程SoC

关键字: RISC-V处理器 FPGA SoC

为无处不在的端侧设备插上AI的翅膀,AMD发布第二代Versal™ 自适应 SoC

关键字: AMD FPGA 自适应SoC AI 边缘计算

联发科官方近日宣布,天玑开发者大会(MDDC 2024)将于5月7日在深圳隆重开幕。此次大会以“AI予万物”为核心议题,旨在汇聚全球开发者智慧,共同探讨AI技术在多元领域的应用前景与发展动向。届时,众多行业领袖与资深专家...

关键字: 生成式AI GPU 天玑

4月9日消息,据媒体报道,马斯克最近表示,首艘无人驾驶的星舰将会在五年内登陆火星,或将在接下来的七年内实现第一批人类登陆火星。

关键字: 马斯克 AI 特斯拉 GPU

Pmod接口可以说是数字电路板的连接革命。随着科技的飞速发展,数字电路板间的通信与连接技术也在不断创新和进步。Pmod接口,作为一种新兴的数字接口标准,正逐渐成为数字电路板间通信的桥梁,为电子设备的连接和通信带来了革命性...

关键字: pmod接口 FPGA 数字电路板
关闭