NVIDIA Blackwell GPU 在 MLPerf Training 6.0 基准测试中占据主导地位

NVIDIA 的 Blackwell GPU 架构再次证明了其在 AI 基础设施中的主导地位，在 2026 年 6 月 16 日发布的 MLPerf Training 6.0 基准测试中横扫所有类别。Blackwell 平台在所有七项基准测试中提供了最快的训练时间，扩展至前所未有的 8,192 个 GPU，并且仍然是唯一覆盖套件中每项工作负载的提交。

这一成就凸显了 NVIDIA 在推动 AI 计算能力、可扩展性和可靠性方面的承诺。主要亮点包括 NVIDIA 的 GB300 NVL72 系统比其 GB200 NVL72 前代产品的训练时间快多达 1.6 倍，这得益于第五代 NVLink Switch 和 NVFP4 低精度训练的应用。

无与伦比的训练性能

MLPerf 6.0 引入了新的专家混合（MoE）基准测试，包括 DeepSeek-V3 671B 和 GPT-OSS-20B，反映了 MoE 架构在 AI 研究中的重要性日益提高。NVIDIA 的 Blackwell GPU 不仅创造了最快的训练记录，还展示了其处理 MoE 模型复杂通信需求的能力，这要归功于 NVLink 卓越的带宽能力。

值得注意的是，NVIDIA 的 GB300 NVL72 展现了显著的性能提升，这得益于更高的计算密度、扩展的内存容量以及增强的能源效率。这些创新凸显了 NVIDIA 自 2024 年推出 Blackwell 架构以来，持续进行的硬件和软件协同设计。

突破极限的扩展能力

在可扩展性方面，NVIDIA 达到了前所未有的水平，在一个由 8,192 个 GPU 组成的集群上训练了庞大的 6710 亿参数 DeepSeek-V3 MoE 模型。这一壮举得益于 NVIDIA 的 Quantum InfiniBand 和 Spectrum-X 以太网网络解决方案，使数据中心能够构建针对特定需求优化的大规模集群。

合作伙伴如 Microsoft Azure 和 CoreWeave 也发挥了关键作用。Azure 使用基于 Blackwell 的 GPU 以 7.07 分钟的时间实现了 Llama 3.1 405B 的最快训练时间，而 CoreWeave 利用 Spectrum-X 以太网为 DeepSeek-V3 提供了创纪录的时间。这些贡献展示了 NVIDIA 基础设施在应对苛刻 AI 工作负载中的生态系统级别的采用。

市场背景和投资者意义

NVIDIA 在 MLPerf 6.0 中的强劲表现进一步巩固了其在 AI 硬件领域的领导地位，这对公司而言是一个关键的增长驱动力。截至 2026 年 6 月 16 日，NVIDIA 的股票（NASDAQ: NVDA）交易价格为 209.28 美元，市值达 5.1 万亿美元。这一估值反映了投资者的持续信心，这种信心源于 Blackwell 架构在数据中心、云提供商和企业平台中的广泛采用。

最近的举措，例如将 RTX Pro 6000 Blackwell GPU 的价格提高 55%，至 13,250 美元，表明了 AI 加速市场的强劲需求和定价能力。同时，NVIDIA 在美国制造领域的扩展，例如其在 2025 年底于亚利桑那州生产的首个 Blackwell 晶圆，使公司能够正面应对地缘政治和供应链挑战。

展望未来

MLPerf 6.0 的结果凸显了 NVIDIA 在规模上支持前沿 AI 模型的能力，这是业界竞相开发更大、更复杂系统的关键因素。在 CoreWeave 和 Google Cloud 等合作伙伴报告使用 Blackwell GPU 实现高达 3 倍的训练速度提升的情况下，该架构有望继续成为下一代 AI 基础设施的支柱。

对于交易者来说，NVIDIA 在 MLPerf 基准测试中的表现强化了其在 AI 硬件市场中的竞争壁垒。投资者应关注有关 Blackwell 采用情况的进一步更新以及公司下一代架构路线图的消息，这可能会维持其估值的增长轨迹。

NVIDIA Blackwell GPU 在 MLPerf Training 6.0 基准测试中占据主导地位

无与伦比的训练性能

突破极限的扩展能力

市场背景和投资者意义

展望未来

Read More