NVIDIA Vera Rubin进入全面生产，重新定义AI基础设施

NVIDIA宣布其Vera Rubin平台正在全面投产，定位为全球下一代“代理型AI”工厂的骨干架构。此次宣布是在GTC台北期间发布的，强调了该平台能够在规模上提供比上一代NVIDIA Grace Blackwell架构高10倍的代理吞吐量。首次出货计划于今年秋季开始。

Vera Rubin是NVIDIA迄今为止最集成的AI基础设施，结合了七个尖端组件，例如Vera CPU、Rubin GPU和Spectrum-6以太网交换机，将其整合到一个机架级系统中。旗舰型号NVL72配置包含72个GPU，集成于高度优化的超级计算机机架中，旨在以前所未有的效率支持复杂的推理和生成式AI工作负载。

“代理型AI是一种全新的工作负载。一条提示可以启动一段包含推理、检索、工具使用和响应生成的千步之旅。”NVIDIA创始人兼首席执行官黄仁勋说道。“Vera Rubin正是为这一时刻而设计——这是一个为下一次工业革命提供规模化智能的AI工厂引擎，具备所需的性能、效率和安全性。”

全球范围内扩展AI工厂

Vera Rubin平台已经被广泛采用，目前在台湾有超过150个合作伙伴，在全球30个国家有350家工厂加速生产。戴尔、HPE、联想和Supermicro等业界巨头是采用Vera Rubin加速AI运营的系统构建商之一。该平台的开源MGX设计允许在多种AI工作负载中灵活应用，使其成为超大规模企业和云服务提供商的游戏规则改变者。

该平台的一项关键创新是NVIDIA Spectrum-X以太网光子技术，这是一种封装光学交换机技术，与传统网络解决方案相比，可提升5倍的电源效率并将AI部署时间减少1.3倍。这一网络突破使创建“百万GPU工厂”成为可能，用于大规模AI部署，Oracle云基础设施和CoreWeave等公司是早期采用者之一。

市场和战略意义

通过Vera Rubin平台，NVIDIA正加倍努力巩固其在AI生态系统中的主导地位。通过将计算、网络和存储整合到统一的系统中，该公司将数据中心从传统的计算集群转变为全功能的AI工厂。这种方法解决了功耗、内存带宽和多代理性能等关键瓶颈——这些对于万亿参数AI模型和实时推理任务至关重要。

该平台的潜力在其成本效率中得以体现。NVIDIA声称，与之前的系统相比，Vera Rubin在AI推理方面的每个token成本降低了多达10倍。这可能显著减少像OpenAI、Anthropic和Meta这样的大型AI实验室的运营成本，这些实验室已经计划部署该平台以训练多模态模型并支持长上下文AI工作负载。

规模化的安全性与性能

安全性是Vera Rubin系统的另一大基石。它集成了NVIDIA的保密计算技术，创建了一个可信执行环境，在高速互连中加密数据并确保防篡改操作。随着AI工厂处理专有和受监管数据，这种安全性变得越来越重要。

该平台还集成了NVIDIA DOCA软件层，该软件层执行零信任策略、运行时威胁检测以及高达800Gb/s速率的端到端加密。这确保了在规模化运维中的强大多租户隔离和操作可靠性——这是企业在全球范围内部署AI基础设施所需的关键功能。

未来展望

随着Vera Rubin的生产出货将于今年秋季开始，NVIDIA在AI基础设施领域的市场主导地位似乎将进一步巩固。该平台无与伦比的效率和可扩展性承诺可能进一步推动其已经高企的估值，截至2026年5月，该公司的市值已达5.15万亿美元。

对于交易者和投资者来说，NVIDIA通过从芯片到系统控制AI堆栈的战略可能成为长期催化剂。随着AI的加速普及，Vera Rubin平台可能确立其作为AI工厂黄金标准的地位，使NVIDIA成为下一波技术创新浪潮中的关键玩家。

NVIDIA Vera Rubin进入全面生产，重新定义AI基础设施

全球范围内扩展AI工厂

市场和战略意义

规模化的安全性与性能

未来展望

Read More