NVIDIA Vera CPU
NVIDIA Vera CPU 是 NVIDIA 在 2026 年 GTC 大会发布的 AI 专用 CPU,采用 88 个自研 Olympus 核心,支持 Armv9.2 指令集,配备最高 1.5TB LPDDR5X 内存,内存带宽达 1.2 TB/s,作为 Vera Rubin 平台的主机 CPU,负责数据搬运调度、内存管理与系统控制编排。
核心规格
| 规格 | 参数 |
|---|---|
| CPU 架构 | ARM 架构(Olympus 核心) |
| 指令集 | ARMv9.2(完全兼容) |
| 核心数量 | 88 个 Olympus 核心 |
| 线程数量 | 176 个线程(空间多线程) |
| 单核性能 | 前代产品的 2 倍 |
| 最大内存容量 | 1.5 TB(LPDDR5X) |
| 内存带宽 | 1.2 TB/s |
| 互联技术 | NVLink-C2C(1.8 TB/s) |
| 片上互连 | 第二代 NVIDIA SCF(3.4 TB/s 对分带宽) |
| TDP | 未公开(推测 350-500W) |
| 发布时间 | 2026 年 3 月 17 日 |
| 量产时间 | 2026 年下半年 |
架构与规格
Vera CPU 采用单体计算芯片设计,避免跨小芯片通信延迟,可在所有核心满载时保持稳定的延迟和吞吐量,性能可预测性强。
关键技术创新
-
88 个自研 Olympus 核心
- 支持空间多线程技术(176 个线程)
- 单核心性能为前代产品的 2 倍
- 能效表现行业领先
-
全球首款支持 FP8 精度的 CPU
- 完全兼容 ARMv9.2 指令集
- 硬件级 FP8 计算支持
-
第二代 NVIDIA SCF(可扩展一致性结构)
- 提供 3.4 TB/s 对分带宽
- 片上网格 + 统一缓存
- 可无延迟扩展 88 个核心
-
NVLink-C2C 互联
- 相干带宽可达 1.8 TB/s
- 实现 CPU 之间、CPU 与 GPU 之间的无缝数据共享
- 支持统一内存系统
-
全机密计算
- 支持硬件级强制安全隔离
- 可对敏感数据和代码实现保护
内存子系统
- 最大内存容量:1.5 TB(是上一代产品的 3 倍)
- 内存类型:LPDDR5X
- 内存带宽:1.2 TB/s(相比传统 CPU 带宽翻倍、功耗减半)
配套平台
Vera Rubin NVL72
- 72 颗 Rubin R200 GPU
- 36 颗 Vera CPU
- 总内存:54 TB LPDDR5X
- TDP:~180kW(必须全液冷)
HGX Rubin NVL8
- 8 颗 Rubin R200 GPU
- 2 颗 Vera CPU
- 面向中小规模 AI 训练与推理
部署形态
-
高密度液冷 Vera CPU 机架
- 基于 NVIDIA MGX 构建
- 最大可集成 256 个 Vera CPU
- 支持同时运行超过 2.25 万个并发环境
- 面向 AI 工厂规模的强化学习和代理式 AI 场景
-
标准服务器配置
- 支持双插槽、单插槽标准配置
- 可适配通用数据中心需求
-
独立 CPU 平台
- 可作为高性能独立 CPU 使用
- 支持超大规模云、数据分析、存储、企业业务、HPC 等负载
性能优势
- 软件环境运行速度:相比传统架构 CPU 提升最高 50%
- 效率:是传统架构 CPU 的 2 倍
- 强化学习评估周期:满负载情况下可缩短 50%
- AI 工作流:与 NVIDIA GPU 无缝协作,保障 AI 工作流全速运行
应用场景
Vera CPU 专为AI 时代设计,适用于:
- 强化学习(RL)与代理式 AI
- 数据中心主机 CPU(数据搬运调度、内存管理、系统控制编排)
- 超大规模云
- 数据分析与存储
- 企业业务与 HPC