Skip to main content

AMD Instinct MI300A (APU)

产品概述

AMD Instinct MI300AAPU 架构的 AI 训练卡,GPU + CPU 集成封装,与 Apple M-Series 类似的统一内存架构。在 MI300X(纯 GPU)基础上加入 24 核 Zen 4 CPU,共享 128GB HBM3 内存池。

HPC 性能怪兽1.5 PFLOPS FP8 / 2.5 PFLOPS FP16全球首款 Exascale 超级计算机 El Capitan(劳伦斯利弗莫尔国家实验室)即使用 44,000+ 颗 MI300A。

核心规格

项目参数
架构CDNA 3 + Zen 4(APU)
制程TSMC 5nm + 6nm Chiplet
GPU 流处理器14,592(228 CUs)
CPU 核心24 核 Zen 4(×4 CCD)
统一内存128 GB HBM3(CPU+GPU 共享)
内存带宽5.3 TB/s
FP16 算力1.5 PFLOPS(密集) / 2.5 PFLOPS(稀疏)
FP8 算力1.5 PFLOPS(密集) / 2.5 PFLOPS(稀疏)
INT81.5 POPS
TDP600 W
接口PCIe Gen5 ×16 + Infinity Fabric
互联Infinity Fabric 4(896 GB/s)
首发2024-01(El Capitan 部署)
价格$15,000-$20,000(OEM)

APU 架构详解

统一内存优势

  • CPU + GPU 共享 128GB HBM3(无需数据拷贝)。
  • 5.3 TB/s 带宽(HBM3e 标称 5.3 TB/s)。
  • 适合 HPC 数值模拟(CPU 部分处理逻辑、GPU 部分处理并行计算)。

Chiplet 设计

  • 3 个 5nm SoC Chiplet(GPU + I/O)
  • 6 个 6nm IOD Chiplet(内存控制器 + Infinity Fabric)
  • 24 核 Zen 4 CPU 分布于 SoC 上
  • 主动 Interposer 互连

与 MI300X 对比

指标MI300AMI300X
CPU24 核 Zen 4
内存128GB HBM3192GB HBM3
带宽5.3 TB/s5.3 TB/s
FP161.5 PFLOPS1.5 PFLOPS
TDP600W750W
适用HPC + AI纯 AI

El Capitan 超级计算机

  • 2024 全球超算 TOP500 #1(2024-11)
  • 1.742 ExaFLOPS FP64(双精度)
  • 44,544 颗 MI300A
  • 耗电 ~30 MW(vs 顶级 x86 超算 50+ MW)
  • HPC 任务:核武器模拟、气候变化、材料科学

厂商信息

项目内容
厂商AMD
产品页https://www.amd.com/en/products/accelerators/instinct-mi300a.html
OEM 价格$15,000-$20,000
目标市场HPC、Exascale、AI 训练

适用场景

  • HPC + AI 联合(El Capitan 类超算)
  • ✅ 数值模拟 + ML 混合(气候、材料、生命科学)
  • ✅ 大模型训练(192GB 版本 MI300X 替代)
  • ✅ 需要 CPU 加速的图神经网络
  • ❌ 纯 LLM 推理(应使用 MI300X 或 H100)
  • ❌ 边缘部署(600W TDP)

相关卡