Skip to main content

MetaX 沐曦 曦云 C500 (2022)

产品概述

曦云 C500 是沐曦集成电路于 2022 年发布的首款训推一体通用 GPU,基于自研 XCORE 1.0 架构设计,配备 64GB HBM2e 显存,支持 FP64/FP32/TF32/FP16/BF16/INT8 多精度混合计算,FP16 算力 280 TFLOPS,INT8 算力 560 TOPS,接口支持 PCIe Gen5MetaXLink 多卡互联,是沐曦"曦云"C 系列的首款产品。

定位训推一体 GPU,兼顾 AI 训练和推理场景,性能优于 NVIDIA H20(据第三方评测)。

核心规格

项目参数
架构自研 XCORE 1.0(数十个核心 IP)
制程未公开(推测 7nm)
FP3254 TFLOPS(矢量 18 + 矩阵 36)
TF32140 TFLOPS
FP16280 TFLOPS
BF16280 TFLOPS
INT8560 TOPS
显存容量64 GB HBM2e
显存带宽未公开(推测 ~1.6 TB/s)
TDP350 W(推测)
互联MetaXLink(7 个高速互连接口,最多 64 卡互联)
接口PCIe Gen5 + MetaXLink
FP64 支持✅(科学计算/气象预测)
发布2022 年
量产2023 年起
软件栈MXMACA(兼容 CUDA,迁移成本降低 90%)

⚠️ 规格说明:制程、TDP、显存带宽官方未完整公开,以沐曦后续官方数据表为准。

曦云C系列产品线

产品架构显存FP16 TFLOPS发布状态
曦云C500XCORE 1.064GB HBM2e280 TFLOPS2022在售
曦云C550XCORE 1.x未公开未公开2024在售
曦云C588XCORE 1.x未公开未公开2024+在售
曦云C600XCORE 1.5144GB HBM3eFP8 1000 TFLOPS2025风险量产

与 NVIDIA H20 对比

指标曦云C500NVIDIA H20差异
FP16280 TFLOPS~300 TFLOPS-7%(接近)
INT8560 TOPS~600 TOPS-7%(接近)
显存64GB HBM2e96GB HBM3-33%
互联MetaXLinkNVLink待对比
生态MXMACA(CUDA 兼容)CUDAH20 成熟
价格约 3.89 万元/卡~20 万元/卡C500 便宜 80%

第三方评测:据公开资料,曦云 C500 系列训推一体 GPU 性能优于 H20

MXMACA 软件生态

层级工具说明
软件栈MXMACA沐曦统一计算架构
AI 框架PyTorch原生支持
分布式DeepSpeed分布式训练
CUDA 兼容自动迁移工具代码迁移成本降低 90% 以上
大模型支持国产千卡集群已验证全参数训练

适用场景

  • 国产大模型训练(280 TFLOPS FP16,64GB 显存)
  • AI 推理即服务(560 TOPS INT8)
  • 科学计算(FP64 双精度支持)
  • 气象预测(HPC 传统场景)
  • 国产智算中心(性价比优势)
  • CUDA 迁移场景(90%+ 迁移成本降低)
  • FP8 推理(未直接支持 FP8 格式)
  • 超大规模集群(MetaXLink 待验证 vs NVLink)

相关卡

参考资料