跳到主要内容

NVIDIA Rubin R200

NVIDIA Rubin R200 是 NVIDIA 在 2026 年 GTC 大会发布的新一代 AI GPU,采用台积电 3nm 制程,集成 3360 亿晶体管,配备 288GB HBM4 显存,FP4 推理算力达 50 PFLOPS,全面接替 Blackwell 架构。

核心规格

规格参数
GPU 架构Rubin 架构(MCM 多芯片模块设计)
制程工艺台积电 3nm(4NP 定制工艺)
晶体管数量3360 亿
FP4 推理算力50 PFLOPS
FP8 训练算力35 PFLOPS
FP16 算力推测 ~25 PFLOPS
FP32 算力130 TFLOPS
FP64 算力200 TFLOPS
INT8 算力推测 ~100 PFLOPS
显存容量288 GB
显存类型HBM4
显存带宽22 TB/s
互联技术NVLink 6(单向 3.6 TB/s)
TDP1800-2300W(必须液冷)
发布时间2026 年 3 月 17 日
量产时间2026 年下半年
定价单 NVL72 机柜 350-400 万美元

架构与规格

Rubin R200 采用多芯片模块(MCM)设计,核心包含:

  • 2 颗计算 die(GPU 核心)
  • 2 颗 I/O die(负责 HBM 控制器与 NVLink 物理层)
  • 8 颗 HBM4 显存堆栈

关键技术创新

  1. 第三代 Transformer Engine

    • 支持硬件级自适应精度压缩
    • 不需要重写模型代码即可动态切换精度(FP4/FP6/FP8/FP16/BF16/TF32/FP32/FP64)
  2. NVLink 6 互联

    • 单 GPU 全互联带宽 3.6 TB/s(双向)
    • NVL72 机柜总带宽 260 TB/s
  3. HBM4 显存

    • 容量 288GB(相比 Blackwell B200 的 192GB HBM3e 提升 1.5 倍)
    • 带宽 22 TB/s(相比 Blackwell B200 的 8 TB/s 提升 2.75 倍)

性能对比

对比项Blackwell B200Rubin R200提升比例
晶体管数2080 亿3360 亿1.6 倍
显存容量192GB HBM3e288GB HBM41.5 倍
显存带宽8 TB/s22 TB/s2.75 倍
NVLink 带宽1.8 TB/s3.6 TB/s2 倍
FP4 推理算力~10 PFLOPS50 PFLOPS5 倍
TDP1000W1800-2300W1.8-2.3 倍

平台配置

Vera Rubin NVL72

  • 72 颗 Rubin R200 GPU
  • 36 颗 Vera CPU
  • 总算力:FP4 ~3.6 EFLOPS
  • 总显存:20.7 TB HBM4
  • 总带宽:1.58 PB/s
  • TDP:~180kW(必须全液冷)
  • 定价:350-400 万美元

Vera Rubin NVL144(规划中)

  • 144 颗 Rubin R200 GPU
  • 72 颗 Vera CPU
  • 总算力:FP4 ~7.2 EFLOPS
  • 大模型推理成本:降至 Blackwell 平台的 1/10

量产与交付

  • 量产时间:2026 年下半年开始量产
  • 首批客户:AWS、Azure、Google Cloud、Oracle 云
  • 自建机房用户:2027 年第一季度可采购
  • 合作伙伴产品:2026 年下半年上市交付

应用场景

Rubin R200 面向数据中心与超算场景,适用于:

  • 万亿参数大模型训练
  • 高性能 AI 推理(低延迟、高吞吐)
  • 强化学习(RL)与代理式 AI
  • 科学计算与 AI 工厂

参考资料