Nvidia B100/B200/GB200 关键技术解读-有驾

Nvidia B100/B200/GB200 关键技术解读

芒果西柚esr

发布时间：2024-09-08 23:40

硅芯片技术详解

一、B200 GPU芯片特性

在晶体管数量上，B200展现了显著的提升，拥有高达2080亿个晶体管，远超H100与H200的800亿个。这一进步不仅提升了芯片的封装密度，同时也带来了散热与功耗管理的新挑战。B200还引入了创新的FP4计算精度，其位宽较FP8更低，使得峰值算力能够达到18P。同时，B200也支持FP6精度，其位宽位于FP4与FP8之间。此外，通过采用Nvidia High Bandwidth Interface技术，B200的两个Die能够实现高达10TB/s的高速连接。每个Die配备了4个24GB的HBM3e堆栈，使得整个Cuda GPU拥有192GB的内存，并提供了8TB/s的内存带宽。

二、NVLink芯片的革新

第五代NV-Link芯片带来了显著的性能提升，其双向带宽达到了惊人的1.8TB/s，这是通过18个链接，每个链接50GB/s的双向带宽以及双倍的数据传输实现的。这一性能是Hopper GPU所使用的第四代NV-Link的两倍。此外，新款NVLink芯片最多可以支持576个GPU的连接，相较于上一代的256个有了显著的提升。

三、NVSwitch芯片的进步

第四代NVSwitch芯片的全双工带宽高达7.2TB/s，这是上一代产品的两倍，从而确保了更高效的数据传输与处理能力。

四、DPU与CPU的动态

值得注意的是，本次更新并未涉及DPU与CPU的升级，这意味着这两部分将保持其现有的性能与特性。

服务器解决方案概览

HGX B200提供了一机八B200的整机解决方案，每个B200的功耗为1000W。而HGX B100则提供了一机八B100的解决方案，每个B100的功耗为700W。

GB200 SuperPOD 服务器详解

GB200 superchip集成了2个CPU与4个B200，采用1U的compute tray设计，并配备了液冷系统。GB200 NVL72则包含了18个这样的compute tray，总计72个B200，以及9个Switch Tray，总计18个Switch。最终，GB200 superPOD汇聚了高达576个B200 GPU，与H100相比，其在训练性能上提升了4倍，推理性能提高了30倍，同时能效也提升了25倍。

基于Blackwell架构的GPU技术规格

全部评论（0）

暂无评论

Nvidia B100/B200/GB200 关键技术解读

全部评论 （0）

热门推荐

全部评论（0）