当前位置:首页 > 原创 > 刘岩轩
[导读]AIGC时代给数据中心算力提出了新的挑战,为了实现更大规模的模型计算,数据中心需要更强大的算力芯片和更多的并行策略,这分别意味着更高的系统功耗和通信带宽。

AIGC时代给数据中心算力提出了新的挑战,为了实现更大规模的模型计算,数据中心需要更强大的算力芯片和更多的并行策略,这分别意味着更高的系统功耗和通信带宽。

近年来随着AI应用的发展,数据中心的架构也发生了变化。传统数据中心以服务器为架构的,而现在AI应用正在促使数据中心转向AI服务器。AI服务器与传统服务器的最主要的区别在于内部配置了更多的以算力为主导的GPU板卡。在两三年前,数据中心的加速卡大多是CPU的PCIe卡,主要进行一些推理运算;但在近一两年随着AI的概念爆火,大模型训练任务成为主流,OAM卡的出货量爆增。这些GPU加速卡对于电源IC提出了更高功率、更高动态响应和更高功率密度的要求。

相比于传统的PCIe卡,OAM卡提供了更高的能效比和更强的计算能力,但同时也需要更高的功率支持。举例而言,一张英伟达OAM卡的尺寸大小不足以半张A4纸,但是功率可以达到700W甚至更高。因此随着AIGC的不断深化,数据中心的功率密度越来越高。此外,GPU加速卡比CPU计算卡对于动态响应的要求更高。更快的动态响应将会直接影响整个主芯片的性能,关系到主芯片算力是否能够发挥到极致。

在我们迈向AGI的过程中,数据中心的高性能AI芯片的供电需求挑战不断提高,而所有的这些挑战,都落到了给AI芯片供电的电源IC身上。为了应对这一系列的挑战,英飞凌于近日推出了全新的智能DC-DC POL芯片 TDA388xx系列产品,该芯片集成了英飞凌独有的OptiMOS MOSFET以及Fast COT(快速恒定导通时间)引擎。

“据统计,在一块服务器级GPU加速卡上的DC-DC用量将超过60颗,这个数量是服务器的CPU板子上的1.5倍。”英飞凌科技大中华区电源与传感系统事业部 应用管理经理 董唯一 分享到,“除了今天要给大家介绍的POL,即集成了控制器和MOSFET的DC-DC以外,其实还有传统的数字控制器和Power Stage(功率级),这些产品不仅占板面积很大,并且整个对于效率的影响,对于主芯片性能的影响都是极大的,如果AI芯片想发挥出最高的功效,周围的电源IC一定是非常重要的。”


TDA388xx系列:单晶圆的POL功率模块

TDA388xx系列是英飞凌面向服务器、AI、数据通信、电信和存储市场推出的同步降压稳压器产品,内部集成了POL、电感和其他无源组件,因此也可以看作是一个单晶圆的IPOL功率模块。该系列产品共有四款降压稳压器(TDA38812、TDA38813、TDA38825 和 TDA38826),其中TDA38825和TDA38826是20A的输出电流,而TDA38812和TDA38813则是12A的输出电流。

据了解,此次英飞凌推出的全新DC-DC POL芯片,具备五大特点:第一,可变换频率,600KHz~1MHz之间可调节;第二,软启动时间极短,最快为1毫秒;第三,控制模式从voltage mode转到了current mode;第四,具有电源良好输出指示信号;第五,这是一个单晶圆的产品,具备更高性价比。

董唯一表示,相比其他竞品,TDA388xx系列具备很高的性能。因为内部集成了FAST COT的引擎,可以让客户在该产品的调试过程中可以更便捷高效;而较宽的输入输出电压范围(输入2.7V-16V,输出0.6V-5.5V),则可以覆盖市面上绝大多数的目标应用中的AI芯片的供电需求。

值得一提的是,该产品仍采用难了市面上的通用的QFN-21(3 mm x 4 mm)封装形式,这让客户更容易在PCB较小改动的前提下实现芯片替换,方便客户提前准备好供应链稳健的替代选型方案。

不止于此,TDA388xx系列还可以搭配英飞凌的数字控制器和Power Stage产品,为客户提供一个完整的系统级解决方案。这可以帮助客户在基于系统层次的理解上去设计,并有效帮助其实现系统性能提升。

据英飞凌科技大中华区电源与传感系统事业部 高级主任工程师 吴炼 介绍,该系列POL产品采用的英飞凌自有专利的FAST COT架构,带有内部的谐波补偿,不需要外围的参数调节就可以实现非常小的纹波,整个动态的响应非常快,可以对高性能需求实现快速响应。“当有动态负载,电压过冲跟下冲,我们这边可以很快调回来,不会有缺陷的问题。”

而单晶圆的设计,相当于把控制器、Driver、包括上下管放在一个晶圆里。相比起多晶圆的设计而言,能够提供更低的成本,而良率、可靠性和散热等挑战也同样存在。英飞凌通过多年在制造封装上的沉淀,通过客服克服一系列的制造挑战,在单晶圆上实现了高达20A的承载能力,从而提供了单晶圆的集成POL DC-DC产品,为业界提供了更具性价比的选择。


走向AI数据中心,电源IC的价值凸显

当我们提起数据中心的转变,从服务器架构转向GPU为主的AI数据中心,更多的关注点都在于提供核心算力的CPU、GPU、TPU和专用ASIC等,而对于电源IC似乎不太重视。然而在董唯一看来,电源是为主芯片“输送养料的支撑骨血”,若无很好的电源IC器件和电源电路设计,主芯片也就难以发挥出真正强大的AI性能。“很多服务器的数据中心都会有一些软件崩溃、宕机这种情况的发生,这种发生有可能是外界的因素,也有可能产生电源问题导致的宕机,这也是为什么电源设计在CPU中很重要。”董唯一解释到。

而英飞凌一直密切关注着数据中心的供电需求的变化,一直跟随业界需求推出更新迭代的POL系列产品。从很早的英特尔VR11系列处理器的供电就开始进行相关产品的研发,其MOSFET工艺也在不断地迭代升级,从电压控制型进化到现在的COT控制,从更大的封装演变成现在的3x4mm的小封装。英飞凌的Power IC一直支撑着数据中心功率密度的增长,而这种长久的支撑力来自其三大优势。

首先,当前的数据中心的PSU(Power Supply Unit)拥抱碳化硅和氮化镓技术已经是一个趋势,而英飞凌已经有了从前道到后道的垂直供应链支撑和相关产品技术。其次,英飞凌非常先进的后道封装工艺,未来还可以进一步在电源IC中实现电感集成的IC,这样可以进一步缩小芯片的面积,进而帮助客户实现系统整体功率密度提升。第三,英飞凌拥有完备的电源IC产品布局和智能软件支持,比如电源保护、DC-DC 电源等,能够给客户提供系统级的解决方案,这些产品支撑着英飞凌推动数据中心的电源供电走向数字化和低碳化。

满足当下的应用需求的同时,英飞凌也在积极和业界领先客户一起探讨AI发展将会给电源行业带来哪些新的变革。例如第三代化合物半导体的渗透、从传统供电走向垂直供电等,都是未来电源技术发展的重点。但不论是何种技术趋势,都是来自于应用端的客户需求的推动。对于电源IC产品而言,时刻满足客户的供电需求,从市场给出的趋势才是关键。

“对于很多AI客户来说,他们也无法预测下一代的产品究竟会变成什么样子,但是他们认为符合客户的就是符合这个市场的。英飞凌也同意这个观点,我们会更紧密的跟客户,跟行业翘楚进行配合和沟通,来制定我们产品的发展方向。”董唯一解释到。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

美光 2500 SSD 采用业界领先的 QLC NAND,性能远超竞品

关键字: 数据中心 SSD NAND

北京——2024年4月25日 我们的客户选择亚马逊云科技运行他们的关键应用程序和最敏感的数据。每天,世界上发展最快的初创公司、最大的企业和最值得信赖的政府机构都选择亚马逊云科技作为技术基础设施平台。他们之所以选择亚马逊云...

关键字: GPU 计算 生成式AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

【2024年4月22日,中国上海讯】近日,英飞凌宣布其首个向客户开放使用的实验室——“英飞凌电源应用实验室”在位于上海张江的英飞凌大中华区总部正式启动。该电源应用实验室将帮助英飞凌客户更高效地孵化电源及各类消费电子项目的...

关键字: 英飞凌 电源应用实验室

近日媒体Business Insider透露称,微软目前正在疯狂囤货GPU,目标在2024年12月前达到180万片。微软本次采购的 GPU 主要来自英伟达公司,不过微软也计划采购 AMD 等其它公司的 GPU 进行扩充。

关键字: 微软 GPU

Apr. 16, 2024 ---- NVIDIA新一代平台Blackwell,包含B系列GPU及整合NVIDIA自家Grace Arm CPU的GB200等。TrendForce集邦咨询指出,GB200的前一代为GH2...

关键字: CPU GPU

本文介绍ADI公司为开放计算项目(OCP)开放机架第3版(ORV3)备用电池单元(BBU)的电池管理系统(BMS)开发的算法。BMS是任何数据中心BBU必不可少的设备,其主要作用是通过监视和调节电池包的充电状态(SOC)...

关键字: 电池管理系统 开放计算 数据中心

联发科官方近日宣布,天玑开发者大会(MDDC 2024)将于5月7日在深圳隆重开幕。此次大会以“AI予万物”为核心议题,旨在汇聚全球开发者智慧,共同探讨AI技术在多元领域的应用前景与发展动向。届时,众多行业领袖与资深专家...

关键字: 生成式AI GPU 天玑

4月9-11日,2024深圳国际大数据与存储峰会将在深圳福田会展中心举办。得瑞领新作为本次峰会的重要参与者之一,将分享其数据存储领域的最新研究成果及赋能客户业务提升的应用案例,诚邀您莅临参会。

关键字: 大数据与存储峰会 得瑞领新 数据中心 数据安全
关闭