集邦咨询TrendForce最新研究指出,英伟达(NVIDIA)的GB200整柜式方案(Rack)由于在高速互联界面和热设计功耗(TDP)等方面显著高于市场主流,供应链需要更多时间进行调整和优化,预计最快要到2025年第二季度才能大规模量产。
GB Rack方案(包括GB200和GB300)因技术复杂度高、成本高等特点,主要客户将是大型云服务提供商(CSP)、Tier-2数据中心、国家主权云和学术研究机构等需要高性能计算(HPC)/人工智能(AI)应用的单位。英伟达大力推广下,GB200 NVL72机柜有望在2025年成为主流方案,市场份额接近80%。
为了提升AI/HPC服务器系统整体计算性能,英伟达开发了NVLink高速互联技术。GB200采用第五代NVLink,带宽远超目前的PCIe 5.0标准。2024年市场主流的HGX AI服务器每柜TDP高达60-80KW,而GB200 NVL72每柜TDP则达到140KW,是前者的两倍,因此行业正在积极采用液冷散热解决方案。
由于GB200 Rack系统规格较高,市场上曾有部分零部件达不到要求导致延迟发货的风险。集邦咨询调查显示,Blackwell GPU芯片的出货情况基本符合预期,2024年第四季度少量出货,2025年第一季度后逐季放量。但由于AI服务器系统需要供应链各环节持续调整,今年底的出货量可能低于预期,因此2025年GB200整机柜的出货高峰将略微推迟。
传统风冷散热已无法满足GB200 NVL72的TDP需求,液冷技术成为必需。随着GB200 Rack方案在2024年底开始小批量出货,相关厂商也在加大液冷散热零部件的研发力度,例如冷却分配单元(CDU)供应商正在通过扩大机柜尺寸和采用更高效的冷板来提升散热效能。集邦咨询表示,目前Sidecar CDU的散热能力主要集中在60-80KW,未来有望达到两倍甚至三倍以上。更高效的液对液(L2L)型in-row CDU方案散热能力已超过1.3MW,未来也将持续提升,以满足不断增长的算力需求。
幽夜之影
回复看完这篇文章,对英伟达的GB200有了更清晰的了解,特别是它对液冷散热技术的需求和供应链的挑战。感觉未来高性能计算对散热技术的要求会越来越高。
GalaxyTraveler
回复了解到英伟达GB200大规模量产要到2025年Q2,主要受制于高功耗和高速互联技术带来的供应链挑战。液冷散热技术成为关键,看来未来AI服务器的能耗和散热问题将是行业重点关注方向。
DarkRider
回复没想到英伟达的GB200量产要推迟到2025年第二季度,看来高性能计算的升级换代没那么快。液冷散热技术成为必需品,也侧面反映了算力需求的爆炸式增长。这篇文章让我了解到AI服务器领域的最新技术发展和市场趋势,特别是NVLink和液冷技术的应用。