当前位置:首页 > 芯闻号 > 充电吧
[导读]作为CPU界的王者,Intel对高性能GPU市场一直没有死心,1998年就推出了i740独显,12年后又推出Larrabee,22年后的今天又重燃战鼓,推出了Xe GPU架构。 Intel重新杀入高性

作为CPU界的王者,Intel对高性能GPU市场一直没有死心,1998年就推出了i740独显,12年后又推出Larrabee,22年后的今天又重燃战鼓,推出了Xe GPU架构。

Intel重新杀入高性能GPU市场的传闻已久,并挖来了AMD RTG部门前主管、首席架构师Raja Koduri坐镇GPU业务,这次是否会不一样呢?

今天的2020年架构日上,Intel终于详细地解开了Xe GPU的面纱,这里我们就来管中窥豹一探Intel历时多年重新打造的GPU架构。

对于Xe架构,我们之前的报道已经多次提到Intel对它的期望是希望用一种架构去满足多种使用场景,从笔记本到游戏卡再到高性能超算,都是Xe架构,推动GPU算力从万亿次(TFLOPS)向千万亿次(PFLOPS)迈进。

Intel Xe架构总览:一种架构通杀四方、适应AI、云时代

对于Xe GPU架构,官方的定义是“并行矢量矩阵架构”,已经突出了这个架构的特点,那就是高度并行,适合扩展多种场景。

Xe GPU架构有三大重点—;—;软件第一、并行第二,同时适应全新的工作负载,比如AI、视觉云计算等等,这也是Intel作为GPU后来的一个优势,研发GPU架构的时候可以不用照顾太多之前的积累,直接面向未来潜力巨大的场景,比如AI、云计算等等。

Xe GPU希望用一个架构统一所有应用场景,不过实际情况还是很复杂的,不同场景对性能、功耗的要求不同,可以细分为集成+低能耗、中端、发烧级、数据中心/AI、HPC百亿亿次计算等等。

在这些细分场景中,Intel打造了三种不同的架构—;—;Xe LP低功耗、Xe HP高性能、Xe HPC,不过实际上已经扩展到了四种,后面会再详细说。

虽然有三四种不同的架构,不过Intel现在做的主要是两种—;—;适用于HPC的Xe HPC及低功耗的Xe LP,后者适合核显、笔记本及低端独显,包括之前曝光最多的DG1显卡。

Intel Xe GPU架构详解:EU、存储、AI、显示、视频单元全都改了

目前进度最好的还是Xe LP低功耗版,Xe GPU的结构介绍都是基于Xe LP的,具体如下:

Xe LP架构简单来说就是在提升FLOPS浮点性能的同时,还要考虑功耗,所以能效很重要,性能及能效兼顾。

提升性能就要提升计算规模,Xe架构在Gen11基础上全面提升了执行单元的规模,EU单元从Ice Lake处理器上的Gen11核显最多64个提升到了96个,每周期Texel纹理、Pixel像素渲染能力也从32、16提升到48、24,总体性能1.5倍于目前Gen11显卡水平。

考虑到Gen11的规模实际上已经是目前Gen9.5的2倍多,理论上Tiger Lake上的Gen12核显性能是现有核显的至少3倍。

能效方面,在同样的电压下,Xe LP GPU的频率大幅提升,从之前1.1GHz左右提升到了1.7GHz,还有其他手段一起降低了功耗,能效也全面改进了。

下面就是Gen11与Xe架构EU单元的具体对比了。

存储单元方面,Xe LP GPU的改变也不小,L1新增了数据缓存,并支持端对端压缩,L3缓存从Gen11的3MB大幅提升到16MB,同时GTI(Graphics Technology Interface 图形技术接口)带宽翻倍。

在AI上,Xe架构之前的GPU主要是支持FP32、FP16及Int16浮点,而Xe GPU开始支持INT8指令,AI性能是FP32的4倍。

多媒体引擎上,Xe GPU架构的解码、编码带宽翻倍,支持AV1加速,同时支持4K/8K60播放,还有HDR、杜比音效等等。

显示输出方面,Xe GPU支持4屏扩展,支持双eDP,接口支持DP 1.4、HDMI 2.0、TBT4及USB4,并支持8K UHD输出,还有360Hz高刷、自适应Sync,全面达到顶级水平。

为何说软件第一?Intel Xe GPU驱动及软件优化

前面提到Xe GPU架构的时候,Intel第一个强调的是软件,很多人可能并不理解,实际上Intel这次是抓到重点了,软件支持是GPU最容易翻车的地方,Intel的核显GPU多年来理论性能不弱,但是游戏表现一言难尽,就是驱动和优化是最大的锅。

这次Intel对软件及驱动的重视终于提上来了,这也跟Raja Koduri本人的风格有一定关系,2013年他回到AMD的时候,当年AMD第一个改革的就是催化剂驱动,全面放弃之前的界面及设计,变成了现在的肾上腺素Adrenalin驱动。

在图形软件方面,不同场景下的GPU面对的挑战也是不同的,3D渲染、计算、多媒体、性能、稳定性等等都很重要。

在驱动及编译器效率上,Xe GPU改变了调度设计,支持AI优化指令,降低了DX11中的驱动开销(overhead),减少了API延迟等等。

针对GPU优化,Xe GPU可以自适应优化,在后台就最大化GPU性能。

Xe GPU还支持了VRS可变帧率渲染,根据渲染场景的不同来选择降低或者提升渲染内容,之前在Ice Lkae的Gen11上首先应用了。

还有就是IGCC控制面板,这里面提供了不少游戏辅助弓箭手,包括截屏、锐化、直播等等,如果大家用过NVIDIA的GFE及AMD的RIS,就知道Intel这是在一比一的致敬两位对手了,这对游戏玩家来说也是好事。

最后就是游戏支持,这个才是考验GPU厂商的关键,目前已经得到英雄萨姆4、GRID、Gear Tactics、Ring of Elysium、Chvalry II等游戏支持的,这个只能慢慢来了。

Intel Xe GPU产品线:Xe LP首发三款、One More Thing惊喜亮相

在尾声阶段,来看看Intel Xe GPU最终的产品线,目前主要是Xe LP及Xe HPC两个架构有结果,其中LP架构会有三款产品。

最快见到的Tiger Lake处理器上的Gen12核显,然后就是DG1,这个是针对移动内容创造者的,还有就是针对服务器的SG1,后两者规格应该差不多。

然后就是One More Thing了,前面说到了Xe GPU有LP、HP及HPC三种,现在Intel又增加了一个选择—;—;Xe HPG,专门为发烧级游戏玩家设计的。

Xe HPG最大的特点就是支持RT光线追踪,硬件光追这个未来游戏的最大卖点也追上来了,至此AMD、NVIDIA及Intel三家都明确了支持光追了。

现在Xe GPU的架构就变成了Xe LP、Xe HPG、Xe HP及Xe HPC四大金刚了,未来会覆盖核显到HPC超算在内的多个场景。

最最后就是四款GPU架构的工艺及封装了,Xe LP会使用Intel的10nm SuperFin工艺,Xe HPG及Xe HP则是增强版10nm SuperFin工艺,其中Xe HP还会使用EMIB 2.5D封装技术。

在往上,Xe HPC的计算卡之前原定是7nm工艺首发,现在随着7nm延期,也退回到了10nm SuperFin工艺了,不过封装技术是最先进的Foveros及Co-EMIB。

总之,今天公布的Xe架构可以让大家过过瘾,然而这些东西依然是纸面上的,停留在架构上的,有关DG1显卡、HPG光追卡的最终规格、性能、价格、上市时间等信息还得等等,最快也要年底左右了

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

在下述的内容中,小编将会对显卡的相关消息予以报道,如果显卡是您想要了解的焦点之一,不妨和小编共同阅读这篇文章哦。

关键字: 显卡 独立显卡

以下内容中,小编将对显卡驱动的相关内容进行着重介绍和阐述,希望本文能帮您增进对显卡驱动的了解,和小编一起来看看吧。

关键字: 显卡 驱动 显卡驱动

一直以来,显卡都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来显卡的相关介绍,详细内容请看下文。

关键字: 显卡 显卡交火

3月20日消息,全球最强AI芯片GB200横空出世,使得这届GTC 2024大会热度空前,也让英伟达创始人兼CEO黄仁勋再一次成为全球焦点人物。

关键字: 英伟达 GPU 芯片

The Weather Company 和台湾气象部门成为首批采用全新 Earth-2 云 API 的机构,使用 AI 加速全球气候和天气高分辨率模拟和可视化,突破性地实现 2 公里尺度

关键字: AI 数字孪生 GPU

3月19日消息,在英伟达年度 GTC 开发者大会上,黄仁勋宣布推出推出了Project GR00T人型机器人项目,其中就包括全球首款人型机器人基础模型。

关键字: 英伟达 GPU 芯片

3月19日消息,在英伟达GTC 2024大会上,英伟达CEO黄仁勋宣布推出新一代GPU Blackwell。

关键字: 英伟达 GPU 芯片

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink可将多达 576 块 Blackwell...

关键字: 生成式 AI 超级计算 GPU

NVIDIA cuLitho 可将半导体制造中高度计算密集型的工作负载加快 40-60 倍,并为业界带来全新的生成式 AI 算法

关键字: 生成式 AI 半导体 GPU

全新 NVIDIA NIM 和 GPU 加速的微服务专为生物、化学、影像和医疗数据开发,并在 NVIDIA DGX 云中运行

关键字: 生成式 AI GPU 数字医疗
关闭
关闭