当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]为了加速 AI 训练、推理的发展,英伟达(NVIDIA)、英特尔(Intel)以及 Arm 近日携手发布了“FP8 Formats for Deep Learning”白皮书,希望能通过 8 位浮点运算的格式来改善运算性能,并将其作为 AI 通用的交换格式,提升深度学习训练与推理速度。目前该白皮书也已提交给了电气与电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。

为了加速 AI 训练、推理的发展,英伟达(NVIDIA)、英特尔(Intel)以及 Arm 近日携手发布了“FP8 Formats for Deep Learning”白皮书,希望能通过 8 位浮点运算的格式来改善运算性能,并将其作为 AI 通用的交换格式,提升深度学习训练与推理速度。目前该白皮书也已提交给了电气与电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。

FP8 格式之所以重要的原因有很多,其中最重要的是,到目前为止,AI 推理之间存在一种分裂,以整数格式(通常为 INT8,但有时为 INT4)以低精度完成,与 AI 训练以 FP16、FP32 或 FP64 精度完成,HPC 以 FP32 或 FP64 精度完成。NVIDIA和 Intel 都认为 FP8 不仅可以用于推理,在某些情况下还可以用于 AI 训练,从而从根本上提高其加速器的有效吞吐量。

AI芯片企业Graphcore 也正在推动 IEEE 采用供应商为 AI 设计的 FP8 格式作为其他所有人都可以使用的标准。此外,AMD 和高通也支持将FP8格式作为标准格式,以帮助降低云和边缘的训练和推理成本。”

NVIDIA官方再度公布的最新消息显示,美国政府对NVIDIA继续开发H100集成电路的出口、再出口和国内转让的许可进行了授权。这也意味着NVIDIA无需将某些业务转移到中国境外。另外该授权还允许NVIDIA在2023年3月1日前为A100 GPU的美国客户提供必要的出口支持(这里应该指的是在大陆的美国客户);同时,授权A100和H100在2023年9月1日之前通过NVIDIA的香港公司履行订单和物流。

虽然,NVIDIA A100/H100系列产品在美国给出的“缓冲期”之内仍然可以通过其香港公司对中国大陆的出口,但是“缓冲期”过后,则必须有美国政府的许可才能出口。因此,一些大陆客户为了保障供应,赶在“缓冲期”内加大了A100/H100的采购量,也并不奇怪。

需要指出的是,从美国的禁令来看,只要性能小于A100的产品的都是能够正常对国内出货的。那么鉴于国内市场的庞大需求,NVIDIA完全是有能力、也有动机来专门为中国市场推出一款性能略低于A100的产品,比如搞个A90来规避美国的出口许可机制,同时又能满足国内的需求。预计“缓冲期”过后,NVIDIA有可能会推出相应的产品。

尽管NVIDIA的游戏业务收入在2022年二季度出现严重下滑,但是在独立GPU市场(包括AIB 合作伙伴显卡), NVIDIA仍保持着79%的份额,稳居第一。根据市场研究机构Jon Peddie Research的最新数据显示,2022年二季度,全球独立GPU市场出货量较去年同期增长 2.4% 至 1040 万台,但是较一季度环比则下滑了22.6%。NVIDIA在独立GPU的显卡市场出货量虽然同比增长了近3%,但是环比却下滑了19.1%。而这主要是由于PC出货量及虚拟币挖矿需求下滑所引起的。

NVIDIA公司(纳斯达克代码:NVDA)是全球可编程图形处理技术领袖。与ATI(后被AMD收购)齐名,专注于打造能够增强个人和专业计算平台的人机交互体验的产品。公司的图形和通信处理器拥有广泛的市场,已被多种多样的计算平台采用,包括个人数字媒体PC、商用PC、专业工作站、数字内容创建系统、笔记本电脑、军用导航系统和视频游戏控制台等。NVIDIA全球雇员数量超过4000人。全球各地众多OEM厂商、显卡制造商、系统制造商、消费类电子产品公司都选择NVIDIA的处理器作为其娱乐和商用解决方案的核心组件。在PC应用领域(例如制造、科研、电子商务、娱乐和教育等),NVIDIA公司获奖不断的图形处理器可以提供出色的性能和鲜锐的视觉效果。其媒体和通信处理器能够执行宽带连接和通信应用中要求十分苛刻的多媒体处理任务,并在音频应用能力方面取得突破。NVIDIA产品和技术的基础是NVIDIA ForceWare,这是一种综合性软件套件,能够实现业内领先的图形、音频、视频、通信、存储和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce图形芯片和NVIDIA nForce平台解决方案的各类台式和移动PC的工作效率、稳定性和功能。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

Arm CPU正在从根本上推动AI变革,并造福地球。Arm架构是未来AI计算的基石。​

关键字: ARM AI

近日,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。

关键字: ARM

4月17日消息,Intel官方宣布,工程师内部研发了一种新的AI增强工具,可以让系统级芯片设计师原本需要耗费6个星期才能完成的热敏传感器设计,缩短到区区几分钟。

关键字: Intel 芯片 1.8nm

Supermicro广泛多元的系统产品组合提供高度灵活性,可满足现今针对工作负载优化且具液冷设计的数据中心需求,并集成了新型高效核(Efficient-core)与性能核(Performance-core)处理器,这些处...

关键字: Intel MICRO SUPER 处理器

Intel日前举办了Vision 2024年度产业创新大会,亮点不少,号称大幅超越NVIDIA H100的新一代AI加速器Gaudi 3、品牌全新升级的至强6、AI算力猛增的下一代超低功耗处理器Lunar Lake,都吸...

关键字: Intel 芯片 1.8nm

4月12日消息,Intel日前发布了LGA1851独立封装接口的酷睿Ultra处理器,代号Meteor Lake-PS,但不是给消费市场用的,而是面向嵌入式和边缘计算。

关键字: Intel 芯片

为了赶超云计算市场上的竞争对手,谷歌正试图通过定制的Arm服务器芯片降低云计算服务成本。

关键字: 谷歌 ARM 定制芯片

AI的纷争越来越激烈,老黄跟苏妈都相继推出了自家的AI加速器。不过大家似乎忘记了还有一个芯片巨头——Intel。

关键字: Intel 芯片 1.8nm

4月10日消息,Intel Vision 2024产业创新大会上,Intel宣布面向数据中心、云和边缘的下一代至强处理器品牌焕新,升级为“至强6”(Xeon 6),此前代号Sierra Forest、Granite Ra...

关键字: Intel 芯片 1.8nm

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM
关闭