

新闻资讯
知识专栏传统的电网到机架系统将电力从变电站传输到服务器,中间要经过多个电力转换阶段,这些阶段会引入电力损耗并降低整体效率。采用不同的方法,即让配电靠近机架,可以减少转换次数及其复杂性,从而缩短能源与负载点之间的物理距离和功能距离。
人工智能应用(想想生成式AI的爆发)和高性能计算的日益普及加速了向这种方法的转变,这些应用通常使每个机架的功率超过100千瓦。尽管交流基础设施可以管理这样的功率水平,但代价是电缆布线、保护和分配要求越来越繁重。因此,将高压配电更靠近使用点,可以实现更高的计算密度,减少传统架构中典型的损耗和瓶颈。
高压直流配电
为了支持每机架不断增长的功率密度,有必要改进数据中心数十年来使用的传统低压配电模式。对于相同的输出功率,较低的电压需要较高的电流,这会导致电阻性损耗增加,并需要使用更大的导体。

图1
该领域最重要的创新之一是采用高压直流配电架构,例如400V直流或800V直流。使高压配电位于机架附近或相邻位置,可以减少循环电流,减小电缆横截面,并减少电源链中低频变压器的使用,从而实现比传统架构更高的效率。
英伟达提出的并在2025年开放计算项目全球峰会上展示的800V直流架构,代表了面向超高密度数据中心的电源系统迈出的重要一步。这种架构旨在支持兆瓦级功率的机架,它将交-直流转换移至上游,并将高压直流电力分配给机架,再由机架内的高效转换器为加速器执行最终的电压调节。
像英伟达提出的这种高压直流解决方案,由于减少了配电网络中的损耗并优化了转换链,可以将端到端能源效率提高约5%(预估)。在更高电压下运行系统意味着需要更低的电流,这直接降低了铜缆成本,并使整体布线的设计和安装大为简化。最重要的是,在应对AI工作负载中常见的突然负载峰值时,部署本地储能可以真正发挥重要作用。
宽禁带半导体
通过在电源链中消除不必要的转换步骤,高压直流配电减少了累积能量损耗。这使得它在处理加速器设施中常见的高强度、波动性负载时效率大大提高。
然而,高压总线的采用对功率器件提出了严格要求,这些器件必须保证高击穿电压鲁棒性、即使在高电压变化率下也能实现低开关损耗、以及在更高结温下稳定运行,同时在日益缩小的空间内实现高功率密度。

图2
碳化硅和其他宽禁带半导体对于前端级和高压隔离型转换器至关重要。这归根结底是物理原理:碳化硅提供了低得多的导通电阻和更小的反向恢复电荷,其优值系数明显优于标准硅。这在实践中带来的好处是,能够推动实现高效拓扑结构,例如无桥功率因数校正和谐振转换器,这些转换器可以在更高的开关频率下运行而不会降低效率。
氮化镓在高速开关应用中提供了卓越的性能,因为它能够在极快的开关速度下保持低动态损耗。通过将这些转换器放置得更靠近负载,可以显著缩小电感器和电容器的尺寸。其结果是一个更加紧凑的系统,能够以硅器件无法企及的从容度来处理快速瞬变。
基于碳化硅/氮化镓的设计中更高的开关频率有助于减小电容器和电感器的占板面积。然而,这需要精心设计布局和适当的隔离水平,以管理电磁干扰并严格控制快速的开关边沿。
在面向高密度数据中心的高压直流架构中,这些器件实现了更短、更优化的转换链,能够维持高峰值电流和快速功率变化率,这是为具有极强动态特性的AI负载供电的关键要素。
电源侧车
随着器件和材料的发展,配电的物理结构也在发生变化,电源侧车概念应运而生。最新的架构不是在每个服务器机箱内分配相对较小的电源,而是倾向于将电源转换分解到集成在机架内或放置在机架侧面的专用模块中,从而可以更有效地集中进行转换、配电和电源管理。
将体积较大的功率级移出节点,为高性能加速器腾出了空间。它还将热量输出集中在专门设计用于集成液冷的区域,而不是将所有组件塞进风冷机架空间内,从而简化了冷却策略。
在电源链下游的机架级别,像垂直供电这样的方法则更进一步,将电压调节器尽可能靠近处理器封装,甚至直接置于其下方。这个想法简单但有效:缩短电源路径可减少寄生电感,并有助于在电流瞬变(可能轻松超过每器件千安培)发生时保持稳定。
消除表面 bulky 的铜迹线还释放了原本浪费的空间,现在可以将其有效地用于HBM内存和高密度光互连。另一个好处是,保持电源和数据路径更好地分离,极大地有助于改善信号完整性和控制电磁干扰。

图3
电源侧车在电网到机架架构中扮演着重要角色,作为几个关键功能的中心枢纽:高功率级别的交-直流或直-直流转换、保护、监控和负载分配。在更高电压下运行意味着更低的循环电流,这反过来又减少了I²R损耗,并削减了布线所需的铜缆数量,这对提高系统整体效率意义重大。
在许多实际部署中,侧车还用作机架级储能的载体,电池或暂降补偿模块是最常见的选择,其容量设计用于应对短暂停电和吸收突然的负载波动。这减轻了上游电源基础设施的压力,并提供了一层运营韧性,而不必与数据中心已有的集中式不间断电源系统产生冲突。
电源侧车的一个例子是Mount Diablo架构,它将机架的电源和计算组件分离开来。这种电源机架方法基于谷歌、Meta和微软制定的开放计算项目规范,旨在支持每个机架功率高达1MW的AI工作负载。
冷却系统
现代高密度数据中心的热回收策略越来越多地依赖于液冷系统,例如直接-to-芯片和浸没式液冷,这些系统在比空气系统更高的流体温度下提取热量,使得热能更容易被重复利用。
借助专用热交换器,这些热量可以集成到区域供暖网络或用于工业过程,将数据中心转变为对周边基础设施有用的能源回收来源。在一些尖端架构中,回收的热能被用于驱动吸收式制冷机或辅助自然冷却系统,从而降低设施的总能耗。
垂直供电技术的引入间接有助于优化直接-to-芯片液冷系统的热设计,减少了芯片封装周围电源组件的占地面积,使冷却板能够专注于处理器和高带宽内存,改善了热接触质量和流量分布均匀性。
在要求最苛刻的设置中,双面冷却成为一种可行且有时是必需的选择。基本思想是,主冷却板处理芯片裸片的热负载,而相对侧专用解决方案则负责处理来自电源模块或封装基板的散热。
通过这种方式分离热路径可以防止热源相互干扰,从而实现更稳定的整体运行条件。也许最重要的是,它可以防止来自转换器的废热渗入专用于处理器的流体回路中,这看起来可能是一个小细节,但对于系统在持续负载下的性能一致性有着非常实际的影响。