当前位置:首页 > 嵌入式 > 嵌入式新闻
[导读] 内容提要:·完整独立的DSP核心,全面支持各级神经网络层·芯片面积不到1mm2,计算速度可达每秒1 TeraMAC (TMAC)·通用的可编程解决方案,为未来而生,

 内容提要:

·完整独立的DSP核心,全面支持各级神经网络层

·芯片面积不到1mm2,计算速度可达每秒1 TeraMAC (TMAC)

·通用的可编程解决方案,为未来而生,满足不断演进的技术需求

·为视觉设备、雷达/光学雷达和融合传感器应用度身优化

楷登电子(美国Cadence公司)今日正式公布业界首款独立完整的神经网络DSP —Cadence® Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。

随着神经网络应用的日益深入和复杂,对计算的要求也与日俱增;同时,神经网络的自身架构在不断更新换代,新网络、新应用和新市场也层出不穷。上述趋势之下,业界亟需一款针对嵌入式系统量身定制的高性能、通用型神经网络解决方案,不仅应该具备极低的功耗,还应拥有高度的可编程能力,以适应未来变化,降低风险。

神经网络DSP vs. 神经网络加速器

基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。

Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。

“我们的很多客户都在纠结如何选择理想的神经网络平台,毕竟一款产品的开发可能耗时数年,”Cadence公司Tensilica事业部市场高级总监Steve Roddy表示。“随时在线(always-on)嵌入式系统的神经网络处理器不仅需要低功耗和较快的图像处理速度,灵活性和永不过时(future-proof)的前瞻性也必不可少。目前的平台都不够理想,客户亟需一个全新的解决方案。Vision C5 DSP通用型神经网络DSP应运而生,它集成方便、使用灵活,功耗能效较CNN加速器、GPU和CPU也更为出色。”

“现实世界中的深度学习应用数量庞大,种类繁多,对计算的要求非常苛刻,”嵌入视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“Vision C5 DSP作为神经网络专用编程处理器,可以帮助我们在低成本、低功耗设备上应用深度学习技术。”

Vision C5 DSP的参数与性能

依托独立引擎,Vision C5 DSP具备领先的神经网络性能:

·不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量

·1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能

·128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构

·专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力

·内置iDMA和AXI4总线接口

·使用与Vision P5和P6 DSP一致的经验证软件工具包

·基于业界知名的AlexNet CNN Benchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。

Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。

Cadence正与多家早期客户展开合作。如需了解Vision C5 DSP的详细内容,请联系您的Cadence销售代表。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

上海2024年4月17日 /美通社/ -- 当自然故土与科技绿洲激情碰撞,未来将迸发怎样的色彩?橙色,诞生自旭日光辉与苍茫大地,它是熊熊燃烧的炽火,也是浮想联翩的异次元,唤醒了我们对世界的无尽绮想,象征着人类、自然、科技...

关键字: 汽车 中国汽车 汽车产业 灯光

2024 年 4 月 24 日,中国上海——数字成像雷达芯片技术头部企业 Uhnder 宣布推出全新成像雷达解决方案 S81。S81 是一款高度集成的单芯片解决方案,支持多达 96 个 MIMO 通道,且基于领先的数字编...

关键字: Uhnder 汽车 4D 数字成像 雷达芯片

汽车电气化推动了电子保险丝“eFuse”取代机械继电器和熔断器,以实现更紧凑、更高效的解决方案。NIV3071 eFuse 可保护下游电路免受过流、过温和接地短路事件的影响,并可通过开漏 FAULT 引脚提供故障指示器。...

关键字: 汽车 电气化 电子保险丝

德国埃朗根2024年4月16日 /美通社/ -- Elektrobit 今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成现代微控制器新一代硬件加速器的软件产品,可应用于先进的汽车电子/电气架...

关键字: 汽车 软件 硬件加速 通信网络

该实验室的创新技术能够增强人工智能边缘解决方案,提高神经网络能力

关键字: 人工智能 神经网络

机器学习将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对机器学习的相关情况以及信息有所认识和了解,详细内容如下。

关键字: 机器学习 神经网络 支持向量机

业内消息,近日网传有理想汽车员工透露公司即将裁员,有一张截图内容显示目前公司状态是:“新offer全部暂停审批;17岗以上会有少量股票,但可能与绩效等考评挂钩,低绩效无法套现;全部预算缩减30%以上,目前人员架构按照年销...

关键字: offer 裁员 汽车 理想汽车

基于氮化镓器件的逆变器参考设计(EPC9193)让您实现具有更高性能的电机系统,其续航里程更长、精度更高、扭矩更大,而且同时降低了系统的总成本。

关键字: 氮化镓器件 无人机 机器人

深度学习需要大量的计算。它通常包含具有许多节点的神经网络,并且每个节点都有许多需要在学习过程中必须不断更新的连接。换句话说,神经网络的每一层都有成百上千个相同的人工神经元在执行相同的计算。

关键字: 机器学习 神经网络 TensorFlow

随着电力电子技术的快速发展,NC稳压电源作为重要的电力供应设备,在各个领域得到了广泛应用。然而,在实际使用过程中,NC稳压电源三相不平衡问题时常出现,这不仅影响了电源的稳定性和可靠性,还可能对用电设备造成损害。因此,研究...

关键字: 电力电子 汽车 电力系统
关闭
关闭