Skip to main content

AMD Instinct MI350X / MI355X (CDNA 4)

产品概述

AMD Instinct MI350 系列于 2025 年 6 月 12 日发布,是 AMD 最新的旗舰 AI 加速器,基于 CDNA 4 架构288GB HBM3e 显存,8 TB/s 带宽,FP16 算力高达 2.5 PFLOPS。MI350 引入原生 MXFP4 和 MXFP6 数据类型支持,对标 NVIDIA Blackwell。

核心规格

项目MI350XMI355X
架构CDNA 4CDNA 4
显存288 GB HBM3e288 GB HBM3e
带宽8 TB/s8 TB/s
LLC256 MB256 MB
FP6472.1 TFLOPS78.6 TFLOPS
FP16 Matrix2.3 PFLOPS2.5 PFLOPS
MXFP84.6 PFLOPS5.0 PFLOPS
MXFP69.2 PFLOPS10.1 PFLOPS
MXFP49.2 PFLOPS10.1 PFLOPS
TDP750 W1,400 W(液冷)
散热风冷液冷(DLC)
PCIeGen 5Gen 5

厂商信息

项目内容
制造商AMD, Inc.
官网https://www.amd.com
产品页https://www.amd.com/en/products/accelerators/instinct/mi350.html
发布2025 年 6 月 12 日
ROCm 7同步发布

MI350 平台 (UBB 2.0)

平台配置
8× MI350X2.3 TB HBM3E,64 TB/s 聚合带宽,18.5 PFLOPS FP16
8× MI355X2.3 TB HBM3E,64 TB/s 聚合带宽,20.1 PFLOPS FP16
超大规模128× 液冷 MI355X(16 UBB 8 卡托盘)

MI350 vs Blackwell 对比

指标MI355XB200GB200 (186GB)
显存288 GB192 GB186 GB
带宽8 TB/s8 TB/s8 TB/s
FP8 算力10.1 PFLOPS(MXFP6)9 PFLOPS9 PFLOPS
FP4 支持✓ MXFP4✓ 原生✓ 原生

关键差异:MI355X 显存更大(+50%),B200 FP4 算力更高(18 PFLOPS vs MI355X 10.1 PFLOPS)。

关键特性

  • MXFP4 / MXFP6 原生支持:微缩浮点格式
  • 4× 上一代 AI 算力(AMD 官方)
  • 35× 上一代推理性能
  • CDNA 4 架构(N3P 工艺 XCD)
  • ROCm 7:新增 pip install rocm 简易安装

适用场景

  • 万亿参数 LLM 训练与推理
  • 长上下文推理
  • MoE 模型(Mixtral、Llama 4)
  • HPC 与 AI 混合负载

相关产品对比