当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]为了加速 AI 训练、推理的发展,英伟达(NVIDIA)、英特尔(Intel)以及 Arm 近日携手发布了“FP8 Formats for Deep Learning”白皮书,希望能通过 8 位浮点运算的格式来改善运算性能,并将其作为 AI 通用的交换格式,提升深度学习训练与推理速度。目前该白皮书也已提交给了电气与电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。

为了加速 AI 训练、推理的发展,英伟达(NVIDIA)、英特尔(Intel)以及 Arm 近日携手发布了“FP8 Formats for Deep Learning”白皮书,希望能通过 8 位浮点运算的格式来改善运算性能,并将其作为 AI 通用的交换格式,提升深度学习训练与推理速度。目前该白皮书也已提交给了电气与电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。

FP8 格式之所以重要的原因有很多,其中最重要的是,到目前为止,AI 推理之间存在一种分裂,以整数格式(通常为 INT8,但有时为 INT4)以低精度完成,与 AI 训练以 FP16、FP32 或 FP64 精度完成,HPC 以 FP32 或 FP64 精度完成。NVIDIA和 Intel 都认为 FP8 不仅可以用于推理,在某些情况下还可以用于 AI 训练,从而从根本上提高其加速器的有效吞吐量。

AI芯片企业Graphcore 也正在推动 IEEE 采用供应商为 AI 设计的 FP8 格式作为其他所有人都可以使用的标准。此外,AMD 和高通也支持将FP8格式作为标准格式,以帮助降低云和边缘的训练和推理成本。”

NVIDIA官方再度公布的最新消息显示,美国政府对NVIDIA继续开发H100集成电路的出口、再出口和国内转让的许可进行了授权。这也意味着NVIDIA无需将某些业务转移到中国境外。另外该授权还允许NVIDIA在2023年3月1日前为A100 GPU的美国客户提供必要的出口支持(这里应该指的是在大陆的美国客户);同时,授权A100和H100在2023年9月1日之前通过NVIDIA的香港公司履行订单和物流。

虽然,NVIDIA A100/H100系列产品在美国给出的“缓冲期”之内仍然可以通过其香港公司对中国大陆的出口,但是“缓冲期”过后,则必须有美国政府的许可才能出口。因此,一些大陆客户为了保障供应,赶在“缓冲期”内加大了A100/H100的采购量,也并不奇怪。

需要指出的是,从美国的禁令来看,只要性能小于A100的产品的都是能够正常对国内出货的。那么鉴于国内市场的庞大需求,NVIDIA完全是有能力、也有动机来专门为中国市场推出一款性能略低于A100的产品,比如搞个A90来规避美国的出口许可机制,同时又能满足国内的需求。预计“缓冲期”过后,NVIDIA有可能会推出相应的产品。

尽管NVIDIA的游戏业务收入在2022年二季度出现严重下滑,但是在独立GPU市场(包括AIB 合作伙伴显卡), NVIDIA仍保持着79%的份额,稳居第一。根据市场研究机构Jon Peddie Research的最新数据显示,2022年二季度,全球独立GPU市场出货量较去年同期增长 2.4% 至 1040 万台,但是较一季度环比则下滑了22.6%。NVIDIA在独立GPU的显卡市场出货量虽然同比增长了近3%,但是环比却下滑了19.1%。而这主要是由于PC出货量及虚拟币挖矿需求下滑所引起的。

NVIDIA公司(纳斯达克代码:NVDA)是全球可编程图形处理技术领袖。与ATI(后被AMD收购)齐名,专注于打造能够增强个人和专业计算平台的人机交互体验的产品。公司的图形和通信处理器拥有广泛的市场,已被多种多样的计算平台采用,包括个人数字媒体PC、商用PC、专业工作站、数字内容创建系统、笔记本电脑、军用导航系统和视频游戏控制台等。NVIDIA全球雇员数量超过4000人。全球各地众多OEM厂商、显卡制造商、系统制造商、消费类电子产品公司都选择NVIDIA的处理器作为其娱乐和商用解决方案的核心组件。在PC应用领域(例如制造、科研、电子商务、娱乐和教育等),NVIDIA公司获奖不断的图形处理器可以提供出色的性能和鲜锐的视觉效果。其媒体和通信处理器能够执行宽带连接和通信应用中要求十分苛刻的多媒体处理任务,并在音频应用能力方面取得突破。NVIDIA产品和技术的基础是NVIDIA ForceWare,这是一种综合性软件套件,能够实现业内领先的图形、音频、视频、通信、存储和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce图形芯片和NVIDIA nForce平台解决方案的各类台式和移动PC的工作效率、稳定性和功能。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

市场分析公司Canalys的分析师认为,鉴于目前Arm的架构进步如此之快,以Arm架构的处理器将在短短四年内抢占PC市场的相当大的份额和云服务器市场的一半。

关键字: ARM PC 处理器

11月23日消息,据市场研究公司Omdia最新数据,最大的存储芯片制造商三星电子在第三季度营收大幅下滑,失去全球半导体销冠宝座。

关键字: Intel 2nm 芯片

Supermicro 多元的 X13 产品组合包含SuperBlade®、Hyper、BigTwin®、GrandTwin™、SuperEdge、F...

关键字: Intel MICRO SUPER 处理器

据业内相关消息,预计ARM公司在明年Q1季度进行IPO可能会推迟。

关键字: ARM IPO 软银

据业内信息报道,近日Intel重启代工业务的主帅Randhir·Thakur正在准备离职,Intel发出声明表示,Randhir·Thakur已决定离开他的职位,追求公司外部的机会,但是会待到明年第一季度结束,以确保顺利...

关键字: Intel 晶圆代工

据业内消息,在近日举办的Snapdragon技术峰会中,高通公司公布了新一代定制ARM内核Oryon。

关键字: 高通公司 ARM 内核 Oryon

美国加利福尼亚州圣克拉拉——太平洋时间2022年11月16日——NVIDIA公司(纳斯达克代码:NVDA)宣布,截至2022年10月30日的第三季度收入为59.3亿美元,较去年同期下降17%,较上一季度下降12%。

关键字: NVIDIA 财务报告

据业内信息报道,苹果Tim·Cook在之前的一个内部会议上表示,未来苹果将转移部分芯片制造到亚利桑那州的一家工厂。

关键字: 台积电 芯片 苹果 处理器 Intel

今日,以“加速,让创新有迹可循”为主题的2022英特尔®FPGA中国技术周于线上拉开帷幕。期间,英特尔披露了其最新推出的基于Intel 7制程工艺的Agilex D系列和Sundance Mesa系列的FPGA的相关细节...

关键字: 英特尔 FPGA Intel

据业内消息, Intel计划明年首发14代酷睿,但是近日有消息称,基于Intel自家的Intel 20A工艺的Arrow Lake已经有内测芯片流片,而该芯片就是15代酷睿。

关键字: 15代酷睿 Intel 2nm

嵌入式硬件

11986 篇文章

关注

发布文章

编辑精选

技术子站

关闭