跳到主要内容

NVIDIA Rubin R200

NVIDIA Rubin R200 是 NVIDIA 在 2026 年 GTC 大会发布的新一代 AI GPU，采用台积电 3nm 制程，集成 3360 亿晶体管，配备 288GB HBM4 显存，FP4 推理算力达 50 PFLOPS，全面接替 Blackwell 架构。

核心规格

规格	参数
GPU 架构	Rubin 架构（MCM 多芯片模块设计）
制程工艺	台积电 3nm（4NP 定制工艺）
晶体管数量	3360 亿
FP4 推理算力	50 PFLOPS
FP8 训练算力	35 PFLOPS
FP16 算力	推测 ~25 PFLOPS
FP32 算力	130 TFLOPS
FP64 算力	200 TFLOPS
INT8 算力	推测 ~100 PFLOPS
显存容量	288 GB
显存类型	HBM4
显存带宽	22 TB/s
互联技术	NVLink 6（单向 3.6 TB/s）
TDP	1800-2300W（必须液冷）
发布时间	2026 年 3 月 17 日
量产时间	2026 年下半年
定价	单 NVL72 机柜 350-400 万美元

架构与规格

Rubin R200 采用多芯片模块（MCM）设计，核心包含：

2 颗计算 die（GPU 核心）
2 颗 I/O die（负责 HBM 控制器与 NVLink 物理层）
8 颗 HBM4 显存堆栈

关键技术创新

第三代 Transformer Engine
- 支持硬件级自适应精度压缩
- 不需要重写模型代码即可动态切换精度（FP4/FP6/FP8/FP16/BF16/TF32/FP32/FP64）
NVLink 6 互联
- 单 GPU 全互联带宽 3.6 TB/s（双向）
- NVL72 机柜总带宽 260 TB/s
HBM4 显存
- 容量 288GB（相比 Blackwell B200 的 192GB HBM3e 提升 1.5 倍）
- 带宽 22 TB/s（相比 Blackwell B200 的 8 TB/s 提升 2.75 倍）

性能对比

对比项	Blackwell B200	Rubin R200	提升比例
晶体管数	2080 亿	3360 亿	1.6 倍
显存容量	192GB HBM3e	288GB HBM4	1.5 倍
显存带宽	8 TB/s	22 TB/s	2.75 倍
NVLink 带宽	1.8 TB/s	3.6 TB/s	2 倍
FP4 推理算力	~10 PFLOPS	50 PFLOPS	5 倍
TDP	1000W	1800-2300W	1.8-2.3 倍

平台配置

Vera Rubin NVL72

72 颗 Rubin R200 GPU
36 颗 Vera CPU
总算力：FP4 ~3.6 EFLOPS
总显存：20.7 TB HBM4
总带宽：1.58 PB/s
TDP：~180kW（必须全液冷）
定价：350-400 万美元

Vera Rubin NVL144（规划中）

144 颗 Rubin R200 GPU
72 颗 Vera CPU
总算力：FP4 ~7.2 EFLOPS
大模型推理成本：降至 Blackwell 平台的 1/10

量产与交付

量产时间：2026 年下半年开始量产
首批客户：AWS、Azure、Google Cloud、Oracle 云
自建机房用户：2027 年第一季度可采购
合作伙伴产品：2026 年下半年上市交付

应用场景

Rubin R200 面向数据中心与超算场景，适用于：

万亿参数大模型训练
高性能 AI 推理（低延迟、高吞吐）
强化学习（RL）与代理式 AI
科学计算与 AI 工厂

参考资料

核心规格
架构与规格
- 关键技术创新
性能对比
平台配置
- Vera Rubin NVL72
- Vera Rubin NVL144（规划中）
量产与交付
应用场景
参考资料