硅芯片技术详解
一、B200 GPU芯片特性
在晶体管数量上,B200展现了显著的提升,拥有高达2080亿个晶体管,远超H100与H200的800亿个。这一进步不仅提升了芯片的封装密度,同时也带来了散热与功耗管理的新挑战。B200还引入了创新的FP4计算精度,其位宽较FP8更低,使得峰值算力能够达到18P。同时,B200也支持FP6精度,其位宽位于FP4与FP8之间。此外,通过采用Nvidia High Bandwidth Interface技术,B200的两个Die能够实现高达10TB/s的高速连接。每个Die配备了4个24GB的HBM3e堆栈,使得整个Cuda GPU拥有192GB的内存,并提供了8TB/s的内存带宽。
二、NVLink芯片的革新
第五代NV-Link芯片带来了显著的性能提升,其双向带宽达到了惊人的1.8TB/s,这是通过18个链接,每个链接50GB/s的双向带宽以及双倍的数据传输实现的。这一性能是Hopper GPU所使用的第四代NV-Link的两倍。此外,新款NVLink芯片最多可以支持576个GPU的连接,相较于上一代的256个有了显著的提升。
三、NVSwitch芯片的进步
第四代NVSwitch芯片的全双工带宽高达7.2TB/s,这是上一代产品的两倍,从而确保了更高效的数据传输与处理能力。
四、DPU与CPU的动态
值得注意的是,本次更新并未涉及DPU与CPU的升级,这意味着这两部分将保持其现有的性能与特性。
服务器解决方案概览
HGX B200提供了一机八B200的整机解决方案,每个B200的功耗为1000W。而HGX B100则提供了一机八B100的解决方案,每个B100的功耗为700W。
GB200 SuperPOD 服务器详解
GB200 superchip集成了2个CPU与4个B200,采用1U的compute tray设计,并配备了液冷系统。GB200 NVL72则包含了18个这样的compute tray,总计72个B200,以及9个Switch Tray,总计18个Switch。最终,GB200 superPOD汇聚了高达576个B200 GPU,与H100相比,其在训练性能上提升了4倍,推理性能提高了30倍,同时能效也提升了25倍。
基于Blackwell架构的GPU技术规格
全部评论 (0)