Skip to main content

NVIDIA Vera Rubin 全面投产:智能体AI工厂时代正式开启

· 6 min read
AI Compute Cards Wiki Editorial
Industry Research Team

2026年6月1日,NVIDIA创始人兼首席执行官黄仁勋在COMPUTEX 2026(台北国际电脑展)上正式宣布:Vera Rubin平台全面投产。这标志着AI硬件从"离散加速器"向"整体化AI工厂"的根本性范式转变。

核心亮点

  • Rubin GPU:下一代AI计算芯片,FP4算力是Blackwell的3.6×
  • Vera CPU:88个自定义Arm核心(176线程),替代Grace CPU
  • NVLink 6:GPU间互联带宽达260 TB/s(相比Blackwell翻倍)
  • CX8 SuperNIC:800Gb/s网络,ConnectX-9链路达28.8 TB/s
  • HBM4显存:单芯片288GB,带宽13 TB/s
  • 智能体吞吐量:相比Grace Blackwell提升10×

Vera Rubin 平台完整规格

Vera Rubin不是一个单独的GPU,而是一个完整的AI工厂平台,包含7款芯片:

芯片名称类型用途
Rubin GPU主力AI计算芯片训练+推理
Rubin Ultra GPU旗舰版超大尺度推理
Vera CPU配合Rubin的CPUHost CPU + 数据预处理
NVLink 6互联芯片GPU间高速互联(260 TB/s)
CX8 SuperNIC网卡800Gb/s网络
XDR 800G 交换机数据中心网络跨机架通信
Rubin平台POD整机柜预配置的AI工厂(144 GPU)

Rubin GPU 详细规格(推测)

参数Rubin GPURubin UltraBlackwell (B200)
架构RubinRubin UltraBlackwell
制程TSMC 3nm(推测)TSMC 3nmTSMC 4NP
显存288GB HBM4288GB HBM4E(推测)192GB HBM3e
显存带宽13 TB/s13+ TB/s8 TB/s
FP4 算力~3,600 TFLOPS(推测)~5,000 TFLOPS(推测)2,250 TFLOPS
TDP1,000W(推测)1,200W(推测)700-1000W
互联NVLink 6(260 TB/s)NVLink 6NVLink 5(1800 GB/s)
量产时间2026 Q32027 下半年2024 Q4

📌 :Rubin具体规格尚未完全公开,上表部分为推测值。

Vera CPU:替代Grace的新一代Host CPU

Vera CPU是NVIDIA自研的Arm架构CPU,取代此前的Grace CPU:

参数Vera CPUGrace CPU
核心数88核(176线程)72核(144线程)
架构自定义Armv9(推测)Arm Neoverse V2
接口NVLink 5.0(1.8 TB/s)NVLink 4.0(900 GB/s)
TDP~500W(推测)350-500W
用途AI工厂Host CPU超算/AI Host

关键升级:Vera与Rubin GPU的协同设计,使其在计算、数据加载、预处理上实现端到端优化,对标Google TPU 8t的Arm Axion集成。

与Blackwell的性能对比

NVIDIA官方宣称,在相同POD配置(144个GPU芯片)下:

指标Grace Blackwell (GB200 NVL72)Vera Rubin NVL144提升
FP4 算力1.1 PFLOPS3.6 PFLOPS3.3×
显存容量288GB×72 = 20.7TB288GB×144 = 41.4TB
显存带宽8 TB/s×7213 TB/s×144~3.3×
NVLink 带宽1800 GB/s×72260 TB/s(全POD)~2×
智能体吞吐量基准10×10×
每瓦性能基准25×(与单独CPU比)25×

💡 为何是"10×智能体吞吐量"? 智能体AI(Agentic AI)工作负载与训练/推理不同:一个提示词可能触发包含推理、检索、工具调用、响应生成的多个环节,涉及数千个步骤。Rubin平台专为这种长链条、高并发工作负载优化。

MGX 第三代机架级系统

Vera Rubin采用MGX第三代开源机架级系统设计:

  • 五机架协同:Vera Rubin NVL72系统 + Vera CPU + Groq 3 LPX + Vera BlueField-4 STX存储 + Spectrum-6 SPX以太网
  • 全球供应链:30个国家、350+工厂、数百家合作伙伴(Dell、HPE、Lenovo、Supermicro、Asus、Foxconn等)
  • Spectrum-X 以太网硅光技术:全球首款基于CPO(光电一体化封装)、支持200Gb/s SerDes的交换机,现已量产

量产时间表

时间事件
2026年1月CES 2026首次公布Rubin平台
2026年6月1日COMPUTEX 2026宣布全面投产
2026年秋季Vera Rubin正式启动量产并开始出货
2027年下半年Rubin Ultra发布(HBM4E升级)
2028年Feynman架构(下一代)

AI工厂:从卖芯片到卖"智能生产线"

黄仁勋在发布会上说了一句让业界震动的话:

"Rubin的Agentic AI吞吐量,是Blackwell的10倍。Rubin是一个完整的AI工厂平台。"

这标志着NVIDIA商业模式的根本转变:

  • 过去:卖GPU(H100/B200),客户自己搭建系统
  • 现在:卖"AI工厂成套解决方案"(Vera Rubin POD),包含GPU、CPU、网络、存储、软件栈
  • 未来:成为全球AI基础设施的"台积电"(提供智能生产能力)

与竞品对比

厂商产品定位优势劣势
NVIDIAVera RubinAI工厂整体方案生态最完整、软件最成熟价格昂贵、功耗极高
AMDMI455X(MI400系列)训练竞品性价比、开放生态软件生态差距
GoogleTPU 8i/8t云上训练/推理与Gemini深度集成仅Google Cloud
华为昇腾910C/950国产替代中国本土化、昇思框架受出口管制影响

行业影响

  1. AI实验室:Frontier模型训练时间从"数月"缩短到"数周"
  2. 云服务商:必须决定是否采购Vera Rubin POD(与自研芯片战略冲突)
  3. 超大规模数据中心:AI工厂成为新的竞争维度(谁有最强算力,谁就能训练最强模型)
  4. 国产芯片:昇腾910C/950、寒武纪MLU590等必须在2026-2027年追上Blackwell,否则差距将扩大到Rubin时代

相关芯片

参考资料


本文基于NVIDIA官方公告及公开资料整理,部分规格为推测值,以官方最终发布为准。