当前位置:首页 > 公众号精选 > 信息速递
[导读]21ic 获悉,昨天 Meta 宣布将推出第一代自研的 AI 推理加速芯片(MTIA v1)以满足 Meta 内部 AI 开发与应用的需要,MTIA v1 芯片在架构方面由 PE 运算单元、片上缓存、片外缓存、传输接口、控制单元等组成。

21ic 获悉,昨天 Meta 宣布将推出第一代自研的 AI 推理加速芯片(MTIA v1)以满足 Meta 内部 AI 开发与应用的需要,MTIA v1 芯片在架构方面由 PE 运算单元、片上缓存、片外缓存、传输接口、控制单元等组成。

据悉,该芯片是一款于 2020 年开始设计的 ASIC 芯片,通过编程可同时执行一项或多项任务,采用台积电 7nm 制程工艺打造,运行频率为 800MHz,TDP 为 25W,INT8 整数运算能力为 102.4 TOPS,FP16 浮点数运算能力为 51.2 TFLOPS,预计将于 2025 年推出。

该芯片在元训练和推理加速器上备了运行系统固件的专用控制子系统,固件管理可用的计算和内存资源,通过专用主机接口与主机通信,并协调加速器上的作业执行。内存子系统使用 LPDDR5 作为片外 DRAM 资源,可扩展至 128 GB。该芯片还有 128 MB 的片上 SRAM,由所有 PE 共享,为频繁访问的数据和指令提供更高的带宽和更低的延迟。

此外,该网格包含以 8x8 配置组织的 64 个 PE。PE 相互连接,并通过网状网络连接到内存块。网格可以作为一个整体来运行一个作业,也可以分成多个可以运行独立作业的子网格。

每个 PE 配备两个处理器内核(其中一个配备矢量扩展)和一些固定功能单元,这些单元经过优化以执行关键操作,例如矩阵乘法、累加、数据移动和非线性函数计算。处理器内核基于 RISC-V 开放指令集架构 (ISA),并经过大量定制以执行必要的计算和控制任务。

每个 PE 还具有 128 KB 的本地 SRAM 内存,用于快速存储和操作数据。该架构最大限度地提高了并行性和数据重用性,这是高效运行工作负载的基础。该芯片提供线程和数据级并行性(TLP 和 DLP),利用指令级并行性 (ILP),并通过允许同时处理大量内存请求来实现大量的内存级并行性 (MLP)。

Meta 官网表示,AI 工作负载在 Meta 中无处不在,构成了广泛用例的基础,包括内容理解、Feed、生成 AI 和广告排名。这些工作负载在 PyTorch 上运行,具有一流的 Python 集成、急切模式开发和 API 的简单性。

深度学习推荐模型 ( DLRM ) 对于改善跨 Meta 服务和应用程序的体验尤其重要。但随着这些模型的规模和复杂性增加,底层硬件系统需要提供呈指数级增长的内存和计算能力,同时保持高效。

对于以 Meta 规模所需的效率水平运行的特定推荐工作负载,GPU 并不总是最佳选择。我们应对这一挑战的解决方案是设计一系列特定于推荐的元训练和推理加速器 (MTIA) ASIC。Meta 根据下一代推荐模型的要求共同设计了第一代 ASIC,并将其集成到 PyTorch 中以创建一个完全优化的排名系统。

此外,Meta 声称保持了 PyTorch 急切模式开发提供的用户体验和开发人员效率。随着继续支持 PyTorch 2.0,开发人员效率是一段旅程,它增强了 PyTorch 在编译器级别(引擎下)的运行方式。

Meta 推出自研 AI 运算芯片:MTIA v1

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着信息技术的快速发展,市场对芯片的需求越来越大,中国芯片行业自20世纪80年代开始起步,经过近40年的努力,也进入了一个新的时代,芯片国产化乃未来发展的大势所趋。米尔电子作为行业领先的嵌入式模组厂商,紧跟国产化芯片的发...

关键字: 芯片 嵌入式模组 开发板

据业内信息,随着地缘政治局势以及全球通胀等因素的不断加剧,导致消费电子产品销量暴跌,进而使得半导体销量下滑和芯片需求减弱,业内调查机构 DIGITIMES Research 预计 2023 年全球代工行业收入将下降 9....

关键字: 晶圆代工 半导体 芯片

据业内消息,得益于生成式人工智能带来的 AI 投资热潮,昨天博通公司(Broadcom)预测今年第三季度的收入将高于市场预期。

关键字: AI 博通公司

5月31日,荣耀全资控股的上海荣耀智慧科技开发有限公司正式成立。该公司经营范围除了技术服务、技术开发、信息系统集成服务、电子产品销售、通信设备销售、软件开发之外,还包括集成电路芯片及产品销售、集成电路设计等。由此,这也引...

关键字: 荣耀 芯片 半导体

WOT全球技术创新大会将于6月16日-17日召开,本届WOT不仅囊括2023年最火的技术——AIGC、大模型、大算力,还有被技术人永恒关注的热点话题——多云实践、业务架构演进、效能提升。

关键字: AI 云计算 大数据

据悉,黄仁勋昨天出席台北电脑展主题演讲后,今天再度现身与全球记者及分析师进行问答,共有约 150 名来自国内外记者及分析师出席。

关键字: 英特尔 人工智能 芯片

RISC-V的开放性允许定制和扩展基于 RISC-V 内核的架构和微架构,以满足特定需求。这种对设计自由的渴望也正在将验证部分的职责转移到不断壮大的开发人员社群。然而,随着越来越多的企业和开发人员转型RISC-V,大家才...

关键字: RISC-V 处理器 芯片

据业内信息报道,昨天英伟达的市值已经突破万亿美元达到 1.02 万亿美元,成为全球第一家市值超过万亿美金的芯片制造商,成为了类似了亚马逊、苹果以及微软这类巨头所组成的万亿美元市值阵营中的一员。

关键字: 英伟达 芯片

据最新消息,Intel计划在2025年之前推出1.8纳米的工艺。然而,目前尚未有官方消息证实该工艺是否能够在明年量产。

关键字: 英特尔 英伟达 芯片

据报道,美国科技公司英伟达(Nvidia)的市值于2023年5月30日突破万亿美元。这使得英伟达成为全球第六个市值达到这一水平的公司。

关键字: 英伟达 GPU 芯片

信息速递

592 篇文章

关注

发布文章

编辑精选

技术子站

关闭