跳到主要内容

NVIDIA Vera CPU (2026)

Vera CPU 是 NVIDIA 在 **GTC 2026(2026 年 3 月)**正式发布的自研 Arm 架构 CPU,作为 Vera Rubin 超级计算平台的核心组成部分。它是全球首款原生支持 FP8 精度的 CPU,专为 **Agentic AI(智能体 AI)**推理与强化学习设计。

核心规格

项目参数
架构NVIDIA 自研 Arm 架构,兼容 Armv9.2 指令集
核心数88 核
线程数176 线程(NVIDIA 空间多线程技术)
发布时间2026 年 3 月(GTC 2026)
量产时间2026 年 Q3(随 Rubin 平台出货)

内存与带宽

项目参数
内存类型LPDDR5X
最大容量1.5 TB(单颗)
内存带宽1.2 TB/s
Vera Rubin NVL72 总计36 颗 Vera CPU 共 54 TB LPDDR5X 系统内存

CPU-GPU 互联

项目参数
互联技术NVLink-C2C(第二代)
相干带宽1.8 TB/s(CPU-GPU 之间)
对比 PCIe Gen6带宽是 PCIe Gen6 的 7 倍
架构优势统一内存寻址,CPU 与 GPU 共享虚拟地址空间

AI 推理性能

Vera CPU 针对 AI 推理管道进行了专项优化:

  • 全球首款原生 FP8 CPU:每个核心配备 6 个 128 位 SVE2 SIMD 单元
  • 数据处理性能:是上一代 Grace CPU 的 2 倍
  • 智能体推理:单机架 256 颗液冷 Vera CPU 可同时运行 22,500 个并行 CPU 沙箱
  • 长上下文支持:1.5 TB 大容量内存可缓存超长上下文(1M+ token)

Vera Rubin 平台整合

Vera CPU 与 Rubin GPU 采用 **共同封装(CoWoS-L)**设计:

┌─────────────────────────────────────────────┐
│ Vera Rubin NVL72 机架(单机架) │
├─────────────────────────────────────────────┤
│ 36 × Vera CPU + 72 × Rubin R100 GPU │
│ NVLink-C2C 1.8 TB/s 全互连 │
│ 总计:54 TB LPDDR5X + 576 GB HBM4 │
└─────────────────────────────────────────────┘

适用场景

场景说明
Agentic AI 推理多步骤推理、工具调用、环境交互的复杂计算
强化学习高吞吐 CPU 沙箱并行模拟
LLM 训练混专家(MoE)模型训练,仅需 1/4 数量 GPU 达到 Blackwell 同等性能
数据预处理数据压缩/解压、分词、特征工程

竞品对比

对比项Vera CPUGrace CPU(上一代)AMD EPYC 9005
核心数8872192
架构Armv9.2 自研Armv9 自研x86-64 (Zen 5)
内存LPDDR5X 1.5TBLPDDR5X 960GBDDR5 6TB
内存带宽1.2 TB/s1.0 TB/s~0.6 TB/s
CPU-GPU 互联NVLink-C2C 1.8 TB/sNVLink-C2C 900 GB/sPCIe Gen6 256 GB/s

参考来源

相关芯片