当前位置:首页 > 单片机 > 单片机
[导读]我们经常看到一些网友提问,其中就有问到“同样是T880,MP4和MP12有什么区别”,以及“为什么三星处理器的GPU就比海思和联发科更受待见”。这两个问题其实是共通的,本文中笔者就来详细解读一下相关的概念。

我们经常看到一些网友提问,其中就有问到“同样是T880,MP4和MP12有什么区别”,以及“为什么三星处理器的GPU就比海思和联发科更受待见”。这两个问题其实是共通的,本文中笔者就来详细解读一下相关的概念。

本文部分图片来自网络,向相关版权方致敬。

GPU是什么?

 

 

事实上在笔者写过的科普文里面已经不是第一次提及GPU的基本概念了,这里为了内容的完整性就先简单重复一下。GPU即图形处理器(Graphics Processing Unit),就是显卡的核心处理单元,本质上是强调高性能高强度大规模多线程浮点运算的处理器单元。

 

 

具体来说,GPU就是基于硬件加速思想,专门为图形加速任务和类似原理的用途所构建的专用处理器,和作为通用处理平台的CPU有着本质的不同,无论是基本构造还是运行方式。其中比较重要的一点在于我们知道CPU的规模翻倍,也就是核心数翻倍并不一定会大幅提高性能,尤其是对于受强调的单线程毫无贡献,但GPU相反,以用户视角而言,同频同架构,规模翻倍就可以认为是性能翻倍。

 

 

MP、ALU与核心数的区别:

接下来我们就说说大家关心的核心数的问题。对于核心数我们更熟悉的还是CPU那边的定义,一个核心对应一个逻辑线程,而对于手机在内的移动平台而言,因为都基于ARM指令集,即便是有不少的自主架构,同期同档次的产品也是可以同台竞技,因为各自的核心之间并不会有太离谱的差异。

 

 

然而GPU则不同,因为各家厂商都拥有独立迭代的图形技术体系,这就意味着即便核心二字十分生动形象,其实也不能用从CPU那边借来的“核心数”概念来直接衡量,因为厂商完全可以自己定义核心,这样同代同档产品的核心数很可能就会有几个数量级的区别,完全失去了横行比较的意义。

 

 

目前为止,我们最常见的核心数所对应的概念是MP,出现在ARM Mali系列的GPU上,三星、海思、联发科等SOC厂商都是它的客户。具体而言,MP指的是“可独立运行和销售的基本规模”(实际是按照shader core的数量),对应的是ARM对外授权的销售需要,即依照GPU吃规模的特点,通过对shader核心进行有限数量的重复叠加,来满足客户们不同档次的需求,同时节省自家的研发和宣传成本。这样在同样核心的基础上,比如都是T880,粗略估算,T880MP4就是基本型T880MP1的4倍性能,而T880MP12则是12倍。

特别需要注意的是,由于Mali近些年的产品型号都以0结尾,这样也有另一种后面不接MP的简写,即T880MP4写作T884,T880MP12写作T8812。然而在某些地方比如一些OTT盒子的店家宣传上,这种写法被错误使用于虚假宣传,比如写成T884MP4实际4核但对外号称16核,这种则需要各位冷静辨明。

 

 

此外,在Mali 400和450系列上,由于彼时是顶点和像素处理器分开而非现行的shader core统一渲染,一般只计算像素处理器的数量,或者将顶点和像素处理器分开计算。

 

 

而在另外一家大厂,即Imagination的PowerVR系列上也有类似的计算方式,但除了5XT系列,都是将核心数融入产品型号的第二位数,即PowerVR 6230、GT7600等即分别是双核心和6核心。

 

 

至于高通则是另一种做法,由于它的Adreno系列GPU只供给自家的骁龙SOC,完全的自产自销就没有像前面两位那样按照基础规模分级的必要,故而高通一直不宣传核心数,外界只知道型号,给人一种只靠单核打天下的印象。当然了解GPU基本构造的人当然知道Adreno肯定是多核规模,只是计算起来仅能通过数ALU即算术逻辑单元的方式进行,比如目前当红的Adreno530就是256ALU。

 

 

那有没有直接计算ALU还宣传出来的厂商呢?当然有,就是以桌面GPU出名的厂商NVIDIA,自家Tegra4的72核和TegraK1的192核宣传都是直接以ALU(CUDA)计数,看起来很吓人。当然必须强调的是,其实别家定义的一个核心内也会包含一定数量的ALU,直接比较数量根本无法对应GPU实际规模上的不同,自然也毫无意义。事实上横向判断性能高低最好还是通过图形跑分。

规模、频率和能耗比:

无论是核心数还是ALU,最终指向的还是GPU的规模。那么除此之外还有什么会影响GPU的性能呢?当然还有频率,这里任何类型的处理器定义都一样,是指驱动处理器运行的时钟脉冲信号在单位时间内发射的数量,通常一次脉冲对应一次完整的核心计算,因此也可以视为处理器的性能跟随频率线性增减。

 

 

举个例子,海思麒麟950的GPU是T880MP4@900MHz,而换算到满血Exynos 8890的MP12规模,对等性能大约需要300MHz,即在一定范围内,少核高频可以做到和多核低频一样的性能,毕竟8890实际在650MHz,是K950的两倍有余。然而高频会带来一个问题,即能耗比的降低,随着频率的提升,功耗的增加要比性能快得多,而同样的性能下,少核高频的耗能也要明显高于多核低频。

为什么海思和联发科不受待见?

这就可以解答为什么三星处理器的声望要高于海思和联发科,正是因为在旗舰平台上,三星是秉承和高通一样的大规模低频率的策略,而海思和联发科则相反。少核高频带来了更大的功耗和发热,好处则是节省成本,毕竟只需要改时钟不需要花钱买额外的晶体管,显然这说明海思和联发科过于抠门,不如三星堆料良心。

 

 

此外无节制的高频还是一种恶性循环,因为带来的额外功耗造成发热,会使机体更早触碰到温控限制而导致降频,使处理器的性能下降,所以频率不是随意提升的,要看制程工艺具体的可承受情况而定。华为海思麒麟960和联发科Helio X20系列的GPU性能被人诟病的缘由就是如此。

【文章转载自网络,版权归原作者所有,若有侵权请联系删除】

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

据韩媒《朝鲜日报》消息,三星集团已确认已决定将适用于三星电子等部分关联公司的“高管每周工作 6 天”扩大到整个集团。三星子公司的人力资源团队直接通过口头、群聊和电子邮件向高管传达了这一新政,而非正式信函的形式。

关键字: 三星

近日,米尔电子推出米尔基于NXP i.MX 93系列产品-MYC-LMX9X核心板及开发板。NXP i.MX 9系列在i.MX 6和i.MX 8系列产品市场验证的基础上,继承了前代产品的优点的同时,进一步提升了性能、资源...

关键字: 核心板 开发板 处理器

近日媒体Business Insider透露称,微软目前正在疯狂囤货GPU,目标在2024年12月前达到180万片。微软本次采购的 GPU 主要来自英伟达公司,不过微软也计划采购 AMD 等其它公司的 GPU 进行扩充。

关键字: 微软 GPU

近日有韩媒称,由于薪资谈判破裂,劳资双方未能缩小对涨薪的意见分歧,三星电子全国工会(NSEU)即日起将发起公司成立以来首次集体行动,工会当天在华城市(Hwaseong)京畿道华城园区的组件研究大楼(DSR)前举行文化活动...

关键字: 三星

2024年4月18日,重庆——今日,英特尔AI教育峰会暨OPS2.0全球发布活动在第83届中国教育装备展示会期间顺利举行。峰会现场,英特尔携手视源股份、德晟达等合作伙伴正式发布新一代开放式可插拔标准——OPS 2.0,并...

关键字: OPS 2.0 显卡 处理器

美国商务部日前宣布,将向三星提供64亿美元的资助,用于在德克萨斯州建设芯片工厂。

关键字: 芯片工厂 芯片资助 三星

全新Balletto™系列无线MCU基于Alif Semiconductor先进的MCU架构,该架构具有DSP加速和专用NPU,可快速且低功耗地执行AI/ML工作负载

关键字: 处理器 微控制器 AI

新型LPDDR5X是未来端侧人工智能的理想解决方案,预计将在个人电脑、加速器、服务器和汽车中得到更广泛的应用

关键字: 三星 人工智能 LPDDR5 处理器

Supermicro广泛多元的系统产品组合提供高度灵活性,可满足现今针对工作负载优化且具液冷设计的数据中心需求,并集成了新型高效核(Efficient-core)与性能核(Performance-core)处理器,这些处...

关键字: Intel MICRO SUPER 处理器
关闭
关闭