NVIDIA Blackwell GPU 在 MLPerf Training 6.0 基准测试中占据主导地位
NVIDIA 的 Blackwell GPU 架构再次证明了其在 AI 基础设施中的主导地位,在 2026 年 6 月 16 日发布的 MLPerf Training 6.0 基准测试中横扫所有类别。Blackwell 平台在所有七项基准测试中提供了最快的训练时间,扩展至前所未有的 8,192 个 GPU,并且仍然是唯一覆盖套件中每项工作负载的提交。
这一成就凸显了 NVIDIA 在推动 AI 计算能力、可扩展性和可靠性方面的承诺。主要亮点包括 NVIDIA 的 GB300 NVL72 系统比其 GB200 NVL72 前代产品的训练时间快多达 1.6 倍,这得益于第五代 NVLink Switch 和 NVFP4 低精度训练的应用。
无与伦比的训练性能
MLPerf 6.0 引入了新的专家混合(MoE)基准测试,包括 DeepSeek-V3 671B 和 GPT-OSS-20B,反映了 MoE 架构在 AI 研究中的重要性日益提高。NVIDIA 的 Blackwell GPU 不仅创造了最快的训练记录,还展示了其处理 MoE 模型复杂通信需求的能力,这要归功于 NVLink 卓越的带宽能力。
值得注意的是,NVIDIA 的 GB300 NVL72 展现了显著的性能提升,这得益于更高的计算密度、扩展的内存容量以及增强的能源效率。这些创新凸显了 NVIDIA 自 2024 年推出 Blackwell 架构以来,持续进行的硬件和软件协同设计。
突破极限的扩展能力
在可扩展性方面,NVIDIA 达到了前所未有的水平,在一个由 8,192 个 GPU 组成的集群上训练了庞大的 6710 亿参数 DeepSeek-V3 MoE 模型。这一壮举得益于 NVIDIA 的 Quantum InfiniBand 和 Spectrum-X 以太网网络解决方案,使数据中心能够构建针对特定需求优化的大规模集群。
合作伙伴如 Microsoft Azure 和 CoreWeave 也发挥了关键作用。Azure 使用基于 Blackwell 的 GPU 以 7.07 分钟的时间实现了 Llama 3.1 405B 的最快训练时间,而 CoreWeave 利用 Spectrum-X 以太网为 DeepSeek-V3 提供了创纪录的时间。这些贡献展示了 NVIDIA 基础设施在应对苛刻 AI 工作负载中的生态系统级别的采用。
市场背景和投资者意义
NVIDIA 在 MLPerf 6.0 中的强劲表现进一步巩固了其在 AI 硬件领域的领导地位,这对公司而言是一个关键的增长驱动力。截至 2026 年 6 月 16 日,NVIDIA 的股票(NASDAQ: NVDA)交易价格为 209.28 美元,市值达 5.1 万亿美元。这一估值反映了投资者的持续信心,这种信心源于 Blackwell 架构在数据中心、云提供商和企业平台中的广泛采用。
最近的举措,例如将 RTX Pro 6000 Blackwell GPU 的价格提高 55%,至 13,250 美元,表明了 AI 加速市场的强劲需求和定价能力。同时,NVIDIA 在美国制造领域的扩展,例如其在 2025 年底于亚利桑那州生产的首个 Blackwell 晶圆,使公司能够正面应对地缘政治和供应链挑战。
展望未来
MLPerf 6.0 的结果凸显了 NVIDIA 在规模上支持前沿 AI 模型的能力,这是业界竞相开发更大、更复杂系统的关键因素。在 CoreWeave 和 Google Cloud 等合作伙伴报告使用 Blackwell GPU 实现高达 3 倍的训练速度提升的情况下,该架构有望继续成为下一代 AI 基础设施的支柱。
对于交易者来说,NVIDIA 在 MLPerf 基准测试中的表现强化了其在 AI 硬件市场中的竞争壁垒。投资者应关注有关 Blackwell 采用情况的进一步更新以及公司下一代架构路线图的消息,这可能会维持其估值的增长轨迹。