当前位置:首页 > 原创 > 刘岩轩
[导读] ”我们是一家纯技术推导出来的公司。“加速云CEO邬钢在此次发布会上多次强调这一点。而一家技术推导出来的公司都有什么特点呢?从邬刚的分享中可以看出来,加速云非常清楚自己要做什么,而且毫不张扬,脚踏

“我们是一家纯技术推导出来的公司。”加速云CEO邬钢在此次发布会上多次强调这一点。而一家技术推导出来的公司都有什么特点呢?从邬刚的分享中可以看出来,加速云非常清楚自己要做什么,而且毫不张扬,脚踏实地。在近日北京召开的新品发布会上,加速云一举发布了多款硬件产品和IP。让我们一起来了解一下。

邬总.jpg

瞄准异构计算前景

“2014年按照英特尔的发展,下一步一定是异构计算。”邬刚分享到,“英特尔早先曾在工业领域推出过X86+FPGA的方案,但是并没有推开。”邬刚早就洞察到,英特尔将会在异构计算方面投入更多,而我们都知道FPGA的门槛较高,因此生态的建设尤为重要。尤其是在很多应用领域的工程师,并不十分清楚FPGA需要如何进行开发。在2015年的IDF大会上,英特尔宣布将推出一款X86+FPGA的处理器,这时候邬刚认为时机到了,因此开始全力着手进行这方面的开发。

如果你仅从名字上来判断,可能会觉得这是一家专门搞云服务的公司。其实不然,加速云应该说是一家拥有很多IP的硬件公司。邬刚先生表示,在国内这种环境下,单纯做IP并不容易,需要与硬件进行绑定。在加速云的团队里面,既要有很强的算法能力,又要有非常强的工程化的能力。这也是加速云与其它公司相比比较特殊的一点。

在此次发布会上,加速云是首次面向媒体发声,一举推出了两大系列的硬件加速产品(SC-OPS,SC-VPX),两个IP库(FDNN,FBLAS)和三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案),下面笔者来给大家简单介绍一番。

全球首张Stratix10加速卡和VPX刀片加速平台

SC-OPS是加速云推出的一款FPGA加速卡,同时这也是世界上第一款使用了14nm工艺Stratix10的加速卡。据邬刚介绍,加速云属于英特尔TOP 10的支持客户之一,因此可以在Stratix10刚流片时候就可以拿到芯片开始进行设计,这也是其竞争力之一。

SC-OPS集成2753K LE资源和9.2T FLOPS单精度浮点计算能力。单板支持2个40G光口或者电口,支持板间通讯以及设备间级联;板载8个DDR4通道, 支持高带宽和大容量的存储访问。

5a71664bc5d20.png

VPX加速系统是一个定制的专用系统。VPX是一个标准,在整个系统中有主控和业务卡。主控主要用来做配置管理和通信用,业务卡来做数据处理。VPX主要定位于数字信号处理和高性能计算领域。据邬刚介绍,这一张卡最多可以有两个Stratix10,有可以插5张卡的和插10张卡的机框;加速云曾经做过一台可以插16张OPS卡的超算去换天河,比例非常可观。

5a7175279f4f6.jpg

据悉,VPX单板支持24个200维双精度线性方程求解,相当于360台至强服务器,一个6U整机相当于3600台至强服务器。

深度学习加速库FDNN和高性能计算加速库FBLAS

"硬件是载体,IP才是核心。FPGA是一张白纸,有了IP,你可以把它画成清明上河图或者其它。“邬刚如是来形容IP的重要性。

深度学习加速库FDNN是国内首个支持通用卷积神经网络的FPGA加速库,基于RTL级代码,可以提供很高的性能和灵活配置特性。如果把FDNN单独开片的话可以看作是一个类似于谷歌TPU的东西。高性能计算加速库FBLAS是业界更高性能的RTL级数学加速库。

5a718594579ee.png

据邬刚介绍,FPGA原厂对于特定行业的理解并没有那么深刻,而特定行业的开发者对于FPGA的应用也有一定困难。对于半导体厂商来讲,也不是每个行业都很懂,也不可能投入那么多的工程师。比如专门设置一个团队搞深度学习,这个不现实。因此原厂更希望提供一些基础的东西,然后找一个第三方来帮他们把行业内的IP都做好,加速云就是它的第三方。加速云做的IP比普通的IP层次还要高一些,普通的IP比如做一个DDS,做一个接口,做一个协议。加速云的IP是基于行业特点开发而来,可以让大家在FPGA的开发上更加易用。

5a7185e06e4bc.png

在异构计算领域,加速云走的很快,而且脚踏实地。异构计算的前景已经得到了业界的普遍认可,目前加速云已经积累了很多专用的IP,如果有来者想要赶超,必要要搭上时间再开发一遍。邬刚表示:“想干这件事,先花两年把IP做出来再说,我都已经花了两年做完了,这就是门槛。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

Bluespec支持加速器功能的RISC-V处理器将Achronix的FPGA转化为可编程SoC

关键字: RISC-V处理器 FPGA SoC

为无处不在的端侧设备插上AI的翅膀,AMD发布第二代Versal™ 自适应 SoC

关键字: AMD FPGA 自适应SoC AI 边缘计算

Pmod接口可以说是数字电路板的连接革命。随着科技的飞速发展,数字电路板间的通信与连接技术也在不断创新和进步。Pmod接口,作为一种新兴的数字接口标准,正逐渐成为数字电路板间通信的桥梁,为电子设备的连接和通信带来了革命性...

关键字: pmod接口 FPGA 数字电路板

近日举办的GTC大会把人工智能/机器学习(AI/ML)领域中的算力比拼又带到了一个新的高度,这不只是说明了通用图形处理器(GPGPU)时代的来临,而是包括GPU、FPGA和NPU等一众数据处理加速器时代的来临,就像GPU...

关键字: FPGA AI 图形处理器

当我们提到成本优化型FPGA,往往与简化逻辑资源、有限I/O和较低制造工艺联系在一起。诚然,在成本受限的系统设计中,对于价格、功耗和尺寸的要求更为敏感;但随着一系列创新应用的发展、随着边缘AI的深化,成本优化型FPGA也...

关键字: AMD FPGA Spartan 边缘计算

全球领先的高性能现场可编程门阵列(FPGA)和嵌入式FPGA(eFPGA)半导体知识产权(IP)提供商Achronix Semiconductor公司宣布,该公司参加了由私募股权和风险投资公司Baird Capital举...

关键字: FPGA 智能汽车 eFPGA

全新 FPGA 能为嵌入式视觉、医疗、工业互联、机器人与视频应用提供高数量 I/O、功率效率以及卓越的安全功能

关键字: FPGA 嵌入式视觉 机器人

Altera致力于为客户提供端到端的FPGA、易于使用的AI、软件和弹性供应链。

关键字: FPGA AI

在半导体领域,大部分对于AI的关注都集中在GPU或专用AI加速器芯片(如NPU和TPU)上。但事实证明,有相当多的组件可以直接影响甚至运行AI工作负载。FPGA就是其中之一。

关键字: FPGA AI 半导体

半导体产品老化是一个自然现象,在电子应用中,基于环境、自然等因素,半导体在经过一段时间连续工作之后,其功能会逐渐丧失,这被称为功能失效。半导体功能失效主要包括:腐蚀、载流子注入、电迁移等。其中,电迁移引发的失效机理最为突...

关键字: 半导体 电迁移 FPGA
关闭
关闭