当前位置:首页 > 工业控制 > 电子设计自动化
[导读] 2017年5月4日,中国上海——楷登电子今日正式公布业界首款独立完整的神经网络DSP —Cadence® Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。如需了解更多内容,请参访www.cadence.com/go/visionc5。

 2017年5月4日,中国上海——楷登电子今日正式公布业界首款独立完整的神经网络DSP —Cadence® Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。如需了解更多内容,请参访www.cadence.com/go/visionc5。

随着神经网络应用的日益深入和复杂,对计算的要求也与日俱增;同时,神经网络的自身架构在不断更新换代,新网络、新应用和新市场也层出不穷。上述趋势之下,业界亟需一款针对嵌入式系统量身定制的高性能、通用型神经网络解决方案,不仅应该具备极低的功耗,还应拥有高度的可编程能力,以适应未来变化,降低风险。

神经网络DSP vs. 神经网络加速器

基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。

Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。

“我们的很多客户都在纠结如何选择理想的神经网络平台,毕竟一款产品的开发可能耗时数年,”Cadence公司Tensilica事业部市场高级总监Steve Roddy表示。“随时在线(always-on)嵌入式系统的神经网络处理器不仅需要低功耗和较快的图像处理速度,灵活性和永不过时(future-proof)的前瞻性也必不可少。目前的平台都不够理想,客户亟需一个全新的解决方案。Vision C5 DSP通用型神经网络DSP应运而生,它集成方便、使用灵活,功耗能效较CNN加速器、GPU和CPU也更为出色。”

“现实世界中的深度学习应用数量庞大,种类繁多,对计算的要求非常苛刻,”嵌入视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“Vision C5 DSP作为神经网络专用编程处理器,可以帮助我们在低成本、低功耗设备上应用深度学习技术。”

Vision C5 DSP的参数与性能

依托独立引擎,Vision C5 DSP具备领先的神经网络性能:

· 不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量

· 1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能

· 128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构

· 专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力

· 内置iDMA和AXI4总线接口

· 使用与Vision P5和P6 DSP一致的经验证软件工具包

· 基于业界知名的AlexNet CNN Benchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。

Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。

Cadence正与多家早期客户展开合作。如需了解Vision C5 DSP的详细内容,请联系您的Cadence销售代表。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

深度学习需要大量的计算。它通常包含具有许多节点的神经网络,并且每个节点都有许多需要在学习过程中必须不断更新的连接。换句话说,神经网络的每一层都有成百上千个相同的人工神经元在执行相同的计算。

关键字: 机器学习 神经网络 TensorFlow

人工神经网络(Artificial Neural Network,即ANN )是从信息处理角度对人脑神经元网络进行抽象,是20世纪80年代以来人工智能领域兴起的研究热点,其本质是一种运算模型,由大量的节点(或称神经元)之...

关键字: 人工智能 信号 神经网络

许多人工智能计算机系统的核心技术是人工神经网络(ANN),而这种网络的灵感来源于人类大脑中的生物结构。通过使用连接的“神经元”结构,这些网络可以通过“学习”并在没有人类参与的情况下处理和评估某些数据。神经网络提供了位于托...

关键字: 人工智能 神经网络 神经元

1956年,美国Dartmouth大学举办的一场研讨会中提出了人工智能这一概念。

关键字: 人工智能 吸尘器 神经网络

米尔 MYD-Y6ULX-V2 开发板,基于 NXP i.MX6UL/i.MX6ULL处理器,该开发板被米尔称之为经典王牌产品。本次测试目标是在此开发板上进行神经网络框架ncnn的移植与测试开发,测试ncnn在此开发板上...

关键字: 米尔电子 嵌入式 神经网络

人工智能的不断发展和越来越广泛的应用,将相应地需要更先进和可扩展的基础设施来支持其开发和部署。人工智能基础设施投资的一个关键领域将是专门的数据基础设施,如矢量数据库,其设计用于存储和处理现代ML模型生成的大量数据。Lib...

关键字: 人工智能 神经网络 智慧名城

AutoEncoder的基本思想是利用神经网络来做无监督学习,就是把样本的输入同时作为神经网络的输入和输出。本质上是希望学习到输入样本的表示(encoding)。早期AutoEncoder的研究主要是数据过于稀疏、数据高...

关键字: 自编码器 机器学习 神经网络

深度学习是近10年机器学习领域发展最快的一个分支,由于其重要性,三位教授(Geoffrey Hinton、Yann Lecun、Yoshua Bengio)因此同获图灵奖。深度学习模型的发展可以追溯到1958年的感知机(...

关键字: 深度学习 神经网络 机器学习

虽然人工智能 (AI) 模型变得越来越先进,但在传统计算机硬件上训练和运行这些模型非常耗能。因此,世界各地的工程师一直在尝试创建替代的、受大脑启发的硬件,以更好地支持人工智能系统的高计算负载。

关键字: 硅忆阻突触 神经网络 人工智能

摘要:我国高校作为电能的主要耗用者之一,存在大量使用大功率设备、学生节电意识差等问题。对高校用电量进行预测可以为高校配电网的配电计划工作提供数据参考,达到调节电量输送、节约能源的目的。鉴于此,对厦门大学漳州校区58幢宿舍...

关键字: 校园宿舍 时间序列 神经网络
关闭
关闭