日前,瑞萨科技公司(Renesas Technology Corp.)宣布,已开发出一种适用于图像和音频多媒体数据处理的基于矩阵架构的大规模平行处理器。
这款创新配置的处理器是一个大规模平行可编程的器件*1,具有紧凑的2,048个处理单元和1Mb SRAM,它可以在200MHz的时钟频率下实现40GOPS(每秒运行10亿次)的性能。
瑞萨科技的研究人员在于2月5日开始在旧金山举行的2006年IEEE国际固态电路会议(ISSCC)上披露了该器件的细节。
图像和音频多媒体数据处理能力对数字家电和其他电子产品至关重要,其中包括诸如快速傅立叶变换、卷积和绝对值差分运算求和相结合的复杂运算。迄今为止,对这些运算的处理通常是使用硬连接逻辑电路或专门用于数字信号处理的DSP(数字信号处理器)。然而,最近诸如图像应用的像素数迅速增加的多媒体应用的戏剧性进展,增加了改善多媒体数据处理性能的需求。与此同时,为了简化对各种多媒体数据标准的支持,利用可编程器件实现这种处理的需求也在日益增长。
改善处理性能的一种方式是通过使用更精细的半导体工艺来提高工作频率。然而,在继续保持更低功耗的同时获得性能方面的重要改善,并利用传统的DSP和类似的架构实现所需的性能是很困难的。虽然粗粒度MIMD(多指令多数据)处理器已经发布,它可作为一种提高处理性能的架构,不过它也存在降低功耗的问题。
为了解决这些问题,瑞萨科技利用源于DSP或MIMD类型处理器的一种独特的存储器技术开发了一种矩阵型处理器。
这种新型处理器是细粒度SIMD(单指令多数据)类型的大规模平行可编程器件,它具有以下的结构特点。
1. 基本配置:2位处理单元(PE)和作为专用数据寄存器的512位SRAM
2. 2,048个PE和总共1Mb的SRAM,以及与PE之间的紧密连接
这种处理器提高性能的关键在于如何有效地使处理单元独立工作。同时,布局和处理单元及数据寄存器的连接是降低占板面积和功耗的重要因素。
这些问题是通过以下技术解决的。
(1) 数据寄存器与PE之间的连接,以及PE之间的互连
1. H通道(水平通道)连接的PE
这是执行处理单元和数据寄存器之间数据传输的一个连接路径,包括运行的基本路径。在一个时钟周期内执行的数据传输不会产生相互的干扰。
2. V通道(垂直通道)连接的PE
这是执行PE之间数据传输的一个连接路径。V通道可以在一个固定的距离内执行PE之间的平行数据传输,这个传输路径有助于利用数字信号处理运算有效地进行基本的蝴蝶计算*2。
H通道和V通道可以实现200MHz运行条件下816Gbps(每秒千兆位)的高传输速度。
(2) PE电路配置
标准SIMD处理器存在的一个问题是其对执行条件转移无能为力。这种处理器在2位PE电路配置中采用了一种特殊的技术。每个PE有一个称为V标记的1位寄存器(有效标记),无论是H通道还是V通道的数据传输,或者是PE本身的运算,都要执行选择。利用这种方法,就可以在每个时钟周期执行一次条件转移,非常有助于加速蝴蝶计算。
(3) 双排复合的读-改-写运算SRAM电路
基本上,一个PE有2个输入和1个输出。因此,3端口数据寄存器必须使一个PE持续不断地运行,不过,为了实现这个功能,可以使用以下配置的单端口SRAM。
1. SRAM为双排内存组成。从这2个内存分别地读取2个输入数据。
2. 输出数据同时重写到用于读取的数据上,这个重写是通过一个存储器的读-改-写运算方法实现的。
因此,从读到计算,再到写的顺序可以在一个时钟周期内完成,而且数据寄存器得以在一个小占板面积中实现。
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
工作后出门最担心的就是突然来了个项目要赶,有次刚到朋友家,却突然接到电话让赶项目,电脑好说跟朋友借一下就行,但是项目的资料,所需的软件都是一个庞大的数据库。朋友见状给我推荐了一款NAS,即使是不懂技术的"小白"用户来说,...
关键字:
私有云
处理器
USB存储
凭借深度学习技术和SmartBid产品,百度国际MediaGo获得美国商业奖认可 旧金山2024年5月6日 /美通社/ -- 第22届美国商业奖(American Business Award®)近日发布获奖名...
关键字:
MEDIA
GO
SMART
BSP
2024年5月7日 – 专注于引入新品的全球半导体和电子元器件授权代理商贸泽电子 (Mouser Electronics) 即日起开售Microchip Technology的PIC32CZ CA MCU。PIC32CZ...
关键字:
MCU
工业网关
处理器
业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks 公司的合作伙伴团队与ST 共同讨论了对边缘机器学习的看法,并与 STM32 社区分享了他们的设计经验。
关键字:
AI
机器学习
处理器
Remi Pi采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31 GPU(500MHz)和视频处...
关键字:
瑞米派
处理器
上海2024年4月17日 /美通社/ -- 在2024 F1中国站即将拉开帷幕之际,高端全合成润滑油品牌美孚1号今日举办了品牌50周年庆祝活动。三届F1年度车手总冠军马克斯•维斯塔潘也亲临现场,共同庆祝这一里程...
关键字:
BSP
汽车制造
行业标准
产品系列
北京2024年4月17日 /美通社/ -- 2024年4月13日,由北京康盟慈善基金会主办的"县域诊疗,规范同行"——肿瘤诊疗学术巡讲项目首站在广州隆重召开。本次会议邀请全国多位肺癌领域专家和县域同道...
关键字:
AI技术
医疗服务
BSP
互联网
海口2024年4月16日 /美通社/ -- 4月14日,在中法建交60周年之际,科学护肤先锋品牌Galenic法国科兰黎受邀入驻第四届中国国际消费品博览会(以下简称"消博会")法国馆。Galenic法...
关键字:
NI
IC
BSP
ACTIVE
近日,米尔电子推出米尔基于NXP i.MX 93系列产品-MYC-LMX9X核心板及开发板。NXP i.MX 9系列在i.MX 6和i.MX 8系列产品市场验证的基础上,继承了前代产品的优点的同时,进一步提升了性能、资源...
关键字:
核心板
开发板
处理器
2024年4月18日,重庆——今日,英特尔AI教育峰会暨OPS2.0全球发布活动在第83届中国教育装备展示会期间顺利举行。峰会现场,英特尔携手视源股份、德晟达等合作伙伴正式发布新一代开放式可插拔标准——OPS 2.0,并...
关键字:
OPS 2.0
显卡
处理器
全新Balletto™系列无线MCU基于Alif Semiconductor先进的MCU架构,该架构具有DSP加速和专用NPU,可快速且低功耗地执行AI/ML工作负载
关键字:
处理器
微控制器
AI
上海2024年4月17日 /美通社/ -- 每年4月17日是世界血友病日。今年,世界血友病日以"认识出血性疾病,积极预防和治疗"为主题,呼吁关注所有出血性疾病,提升科学认知,提高规范化诊疗水平,让每一位出血性疾病患者享有...
关键字:
VII
动力学
软件
BSP
伦敦2024年4月16日 /美通社/ -- ATFX宣布任命Siju Daniel为首席商务官。Siju在金融服务行业拥有丰富的经验和专业知识,曾在全球各地的高管职位上工作了19年以上。Siju之前担任FXCM首席商务官...
关键字:
NI
AN
SI
BSP
新型LPDDR5X是未来端侧人工智能的理想解决方案,预计将在个人电脑、加速器、服务器和汽车中得到更广泛的应用
关键字:
三星
人工智能
LPDDR5
处理器
全球领先的科技公司默克推出了同类产品中首个经验证的全新一体化遗传稳定性分析。 Aptegra™ CHO遗传稳定性检测利用全基因组测序和生物信息学,显著加快了客户的生物医药安全性测试,从而帮助加快了客户进入商业生产的步伐。...
关键字:
稳定性分析
BSP
人工智能
Supermicro广泛多元的系统产品组合提供高度灵活性,可满足现今针对工作负载优化且具液冷设计的数据中心需求,并集成了新型高效核(Efficient-core)与性能核(Performance-core)处理器,这些处...
关键字:
Intel
MICRO
SUPER
处理器
亿道信息旗下品牌ONERugged刚刚上新了四款高性价比三防平板电脑,分别是M87J和M81T两款8寸机型,以及M17J和M11T两款10.1寸机型。作为一站式加固计算机品牌,ONERugged一直以打造坚固耐用的三防终...
关键字:
平板电脑
处理器