沐曦集成电路在曦云C500/C550基础上的旗舰迭代型号,2024年9月发布,采用自研XCORE 1.5架构,12nm国产工艺(中芯国际),性能对标国际主流AI训练卡。
核心规格
| 规格 | 参数 |
|---|
| 架构 | XCORE 1.5(曦和架构迭代) |
| 制程 | 12 nm(中芯国际国产工艺) |
| TDP | 350 W(预估) |
| 显存 | 64–96 GB HBM2e(预估) |
| 显存带宽 | ~1800–2000 GB/s(预估) |
| FP32 算力 | 18 TFLOPS(预估) |
| FP16 / BF16 算力 | 35 TFLOPS(预估) |
| INT8 算力 | 70 TOPS(预估) |
| 接口 | PCIe 5.0 x16(预估) |
| 互联 | MetaXLink(预估) |
| 发布 | 2024-09(预估) |
| 价格 | 未公开(预估 ¥55,000) |
技术亮点
- XCORE 1.5 架构:曦和架构的迭代升级,针对张量运算优化
- 12nm 国产工艺:中芯国际代工,推进供应链国产化
- 旗舰性能:作为C500系列的旗舰迭代,算力全面超越C550
- 全流程国产化:从架构设计到制造封装,逐步实现全国产
- MetaXLink 互连:支持多卡扩展,构建大规模训练集群
产品定位
曦云C588是沐曦C500系列的旗舰迭代型号,采用XCORE 1.5架构和12nm国产工艺,性能对标NVIDIA A100 80GB。作为C500到C600之间的过渡旗舰,C588在算力和显存带宽上均有显著提升。
与 C500/C550 对比
| 指标 | 曦云 C500 | 曦云 C550 | 曦云 C588 |
|---|
| 架构 | XCORE 1.0 | XCORE 1.0 | XCORE 1.5 |
| 制程 | 7 nm | 7 nm | 12 nm(国产) |
| FP16 算力 | 15 TFLOPS | 22.4 TFLOPS | ~35 TFLOPS(预估) |
| 显存带宽 | ~1200 GB/s | ~1600–1800 GB/s | ~1800–2000 GB/s(预估) |
| 发布时间 | 2023 | 2024 | 2024 |
| 定位 | 首款训推一体 | C500 迭代 | 旗舰迭代 |
应用场景
- 人工智能大模型训练(对标A100)
- 高性能AI推理
- 科学计算与仿真
- 数据中心AI算力基础设施
- 国产替代A100场景
参考价格
| 渠道 | 价格 | 说明 |
|---|
| 官方定价 | 未公开 | 2024年发布,预估 ¥50,000–60,000/卡 |
| 渠道预估 | ≈ ¥55,000 | 基于A100定价比例估算 |
相关产品
参考资料