“没有电源就没有AI”,英飞凌谈AI服务器的供电架构变革
扫描二维码
随时随地手机看文章
生成式AI的爆发式增长正重塑数据中心生态,供电系统成为支撑算力革命的基石。据国际能源署(IEA),2023至2030年间,数据中心能耗将激增165%,而AI服务器机架功耗已从10kW飙升至120kW以上,单GPU功耗甚至逼近2kW。这种高功率密度需求对电源效率、散热设计和可靠性提出前所未有的挑战。
作为全球功率半导体领导者,英飞凌科技(InfineonTechnologies)凭借碳化硅(SiC)、氮化镓(GaN)和垂直供电(VPD)等关键技术,引领AI服务器电源架构变革。
“面对AI运算耗电比例的不断上升,提升电源效率与功率密度已成为当务之急。也可以说‘没有电源就没有AI’,这充分体现了电源在AI系统中的重要性。”
近日21ic有幸采访到了英飞凌消费、计算与通讯业务大中华区服务器电源应用市场经理陈世伟,他深入剖析了AI数据中心供电技术的痛点与未来,揭示英飞凌如何通过创新器件和系统级解决方案赋能AI时代。
英飞凌消费、计算与通讯业务大中华区服务器电源应用市场经理陈世伟
21ic:AI服务器相较传统服务器的电源需求有何独特要求?高功率密度如何影响电源设计?英飞凌的芯片如何助力高功率PSU实现高效能?
AI服务器通常需要更高的功率来支持其高性能计算和处理能力,这是由于它们需要运行复杂的算法和处理大量数据。
与传统服务器相比,AI服务器的电源要求有几个关键差异。首先,AI服务器通常需要更高的功率来支持庞大的算力,如GPU和TPU。这些组件需要更多的电力来运行,这使得电源的设计变得更加复杂。其次,AI服务器通常需要更高的效率和可靠性,因为它们需要24/7运行并处理大量数据。最后,AI服务器的电源需要能够适应不断变化的负载和功率需求,这使得电源的设计需要更加灵活和可扩展。
(图片来源于IEA)
高功率需求对电源的设计有着重大影响。首先,电源需要能够提供更高的电压和电流,这需要更高的功率密度和更高效的设计。其次,电源需要能够处理高功率下产生的热量,这需要更好的散热设计。最后,电源需要能够提供更高的可靠性和冗余性,以确保AI服务器的正常运行。
英飞凌的芯片可以支持更高功率的PSU(电源)通过提供高效和可靠的功率管理解决方案。此外, 英飞凌除了可以提供传统MOSFET外,也提供SiC、IGBT、GaN 等不同的功率器件。面对目前高功率密度的要求,英飞凌能够采用合适的器件,有效提升功率密度,从而使电源的设计更加紧凑和高效。同时,英飞凌的控制器和驱动器可以提供高精度和高可靠性的功率管理功能,这使得电源的设计更加稳定和可靠。
(图片来源于英飞凌官网)
21ic:BBU(备用电池单元)在AI服务器瞬时断电保护中的作用日益重要,电源芯片需要在哪些方面加强,才能提升BBU的快速响应和可靠性?
除了在电源架构方面的革新,考虑到AI服务器如果发生断电可能付出的代价(每小时停机损失可达100万至500万美元),英飞凌也公布了一套完整的AI数据中心电池备用单元模块(BBU)产品发展蓝图,涵盖4kW到12kW方案,具备高效率与可靠、可扩充的电源转换能力,以及高出业界平均水平四倍的功率密度。在确保供电不间断之外,BBU还能够提供过滤和调节电源供应的功能,保护敏感的AI运算硬件免受电压突波、浪涌等电源异常情况的冲击。
(图片来源于英飞凌官网)
其中,5.5kW BBU采用英飞凌独家拓扑结构结合Si与GaN技术,而业界首创的12 kW系统则配备多张4 kW电源转换卡,搭载英飞凌PSOC微控制器、40V与80V OptiMOS以及EiceDRIVER栅极驱动器。
21ic:液冷成为AI服务器趋势,AI服务器中的电源需要和散热系统进行协同设计。请问英飞凌的芯片如何适配高功率电源系统的热管理需求?
根据国际能源署(IEA)数据,数据中心目前占全球能耗的2%。随着AI发展加速,预计在2023至2030年间,数据中心的电力需求将增长165%。因此,提升从电网到主板核心的电源转换效率与功率密度,是进一步提高计算性能并降低总拥有成本(TCO)的关键。
(图片来源于IEA)
*创新的OptiMOS™ TDM2454xx四相功率模块*
OptiMOS™ TDM2454xx四相功率模块实现了真正的垂直供电(VPD),并提供行业领先的2安培/平方毫米电流密度。该模块延续了英飞凌去年推出的OptiMOS™ TDM2254xD和TDM2354xD双相功率模块,为加速计算平台提供卓越的功率密度。
(图片来源于英飞凌官网)
在传统水平供电系统中,电流在电路板到ASIC之间流动时,会因为电流经过PCB路径而产生传导损耗。随着ASIC电源需求的增加,电流的提升会导致明显的功率损耗。然而,垂直供电可以大幅缩短传输路径,降低传导损耗,从而提升系统性能。
这种改进的关键在于减少电流通过的阻抗,垂直供电设计通常能够实现更短、更直接的电源连接,从而降低功率损耗。这种方式对于高性能应用尤其重要,因为在这些应用中,电源的稳定性和效率直接影响到整体系统的表现。
*三维设计与先进技术的结合*
英飞凌采用三维设计方式,结合业界领先的功率器件和封装技术,凭借深厚的系统底蕴,提供高性能的节能计算解决方案,这进一步支持了推动数字化和低碳化的企业使命。
通过采用英飞凌强大的OptiMOS™ 6沟槽式技术功率组件和嵌入式芯片封装,OptiMOS™ TDM2454xx模块提供优异的电气和散热性能。同时,创新的超薄电感设计技术不断提升VPD系统性能和质量的极限。此外,OptiMOS™ TDM2454xx的结构设计有利于模块化拼接,改善电流传导,进一步提升电气、散热和机械性能。
(图片来源于英飞凌官网)
该模块在四相电源中最高支持280A电流,并在仅10x9 mm²的小型封装内整合了嵌入式电容层,结合英飞凌的XDP™控制器,可以实现稳定耐用的高电流密度功率解决方案。通过这些创新,英飞凌为未来的计算需求提供了强有力的支持。
21ic:AI数据中心增长潜力很大,但而电源部分在其中的价值占比目前不足10%。英飞凌如何看待这一市场的未来发展趋势?
随着生成式AI应用的持续升温,全球对高性能计算(HPC)的需求快速增长。尽管业界的焦点多集中于处理器技术的进展,但数据中心与AI服务器的电源系统正面临前所未有的挑战。电力需求的激增促使电源设计向高电压、高功率密度发展,同时必须提升转换效率、缩小外形尺寸,并符合日益严格的节能与可持续标准,同时保持合理的运营成本。
目前,电源在整体系统中所占的比例可能看似不高,但随着AI服务器运算能力的提高,单一GPU的功耗已经达到700W,甚至上升至1.5kW、2kW。整体AI服务器机柜的功耗也从传统服务器的10kW攀升至120kW以上。这一趋势表明,面对AI运算耗电比例的不断上升,提升电源效率与功率密度已成为当务之急。也可以说“没有电源就没有AI”,这充分体现了电源在AI系统中的重要性。
*英飞凌的全面电源管理解决方案*
英飞凌凭借其在功率半导体设计、制造与电源系统应用的深厚技术实力,提供从电网到主板处理器的完整电源管理解决方案。这些解决方案涵盖硅(Si)、碳化硅(SiC)和氮化镓(GaN)三大主流材料,为AI运算基础设施提供高效、可靠、可扩展且具有成本效益的电力传输。
通过这些创新,英飞凌致力于为快速发展的AI技术提供强有力的支持,确保电源系统能够满足未来计算需求的挑战。
21ic:在800V HVDC这样的前沿电源架构的探索阶段中,作为芯片厂商参与到其中,英飞凌的核心价值、贡献及影响力体现在哪些方面?
AI算力的增长与技术演进正在以前所未有的速度进行,这对能源需求与AI服务器生态系统带来了重大挑战。半导体处于AI的核心,协助驱动、收集、处理和管理AI系统运作所需的大量数据。
(图片来源于英飞凌官网)
英飞凌专注于考虑整个生态系统的能源效率,特别是从电网到主板核心的电源管理,以支撑AI的功能运作。通过与生态系统合作伙伴的密切合作,提升AI服务器的可靠性,降低碳排放和总体拥有成本(TCO),从而实现AI可持续发展的未来。
随着服务器架构过渡至高压直流(HVDC)供电设计,整个电源流程管理需要重新设计。凭借在电源系统领域的丰富经验,英飞凌提供了一系列AI服务器电源管理解决方案,包括硅(Si)、碳化硅(SiC)和氮化镓(GaN)技术。这些解决方案确保每个阶段的最佳电源转换,并降低供电网络(PDN)的损耗。
通过这些努力,英飞凌致力于推动创新,确保AI服务器能够高效、可靠地支持未来的计算需求。
21ic:您认为800V HVDC会在多长时间内成为AI数据中心主流?48V架构会否继续主导?英飞凌如何为未来电源架构做准备?
当前,AI数据中心的功耗与电源架构正在快速演变,这主要是由于大型AI训练集群(特别是GPU/加速器服务器)对于功率密度、效率与配电距离的要求不断提升。
·从短期来看,48V架构依然成熟,因其技术成熟度高、供应链完整且已有大量实际部署案例。
·从中期来看,800V高压直流(HVDC)技术可能在部分新建或超大规模的AI数据中心中进行试点应用,特别是那些需要长距离配电和极高功率需求的场景。
·从长期来看,若标准化、安全规范与配套生态系统进一步成熟,800V架构有望在高端AI数据中心中占据显著比例。然而,全面取代48V架构可能仍需更长的时间。
随着AI算力的持续增长,英飞凌将继续发挥在AI服务器生态圈中的重要角色,持续与全球及各生态系统的合作伙伴携手共进。共同定义并开发更高能效的AI服务器电源解决方案,以助力客户迎接AI时代的能源挑战,实现AI运算的可持续未来。通过这些努力,英飞凌致力于推动电源系统的创新,确保其能够满足未来计算需求的变化与挑战。