产品概述
曦云 C600 是沐曦集成电路于 2025 年 10 月发布的首款全流程国产通用 GPU,基于自研 XCORE 1.5 架构,采用国产 7nm 工艺(中芯国际),集成 144GB HBM3e 显存(带宽 3.6 TB/s),FP8 峰值算力 1000 TFLOPS(对标 NVIDIA H100 的 989 TFLOPS FP8),TDP 400W,搭配 MXMACA 软件栈兼容 CUDA 生态。
是全流程国产化(IP 设计 → 晶圆制造 → 封装测试)的首款国产通用 GPU,芯片从设计到制造实现 100% 去美化。
沐曦产品线:
- 曦思 N 系列:推理芯片
- 曦云 C 系列:通用 GPU(训推一体)— C500(64GB HBM)→ C600(本页) → C700(2027 H2 规划)
- 曦彩 G 系列:图形渲染
核心规格
| 项目 | 参数 |
|---|
| 架构 | 自研 XCORE 1.5(数十个核心 IP) |
| 制程 | 7nm(中芯国际国产工艺) |
| FP8 | 1000 TFLOPS(对标 H100 989 TFLOPS) |
| FP32 | 15 TFLOPS |
| FP16 / BF16 | 支持多精度混合(具体数值未公开) |
| INT8 | 支持(具体 TOPS 未公开) |
| 显存容量 | 144GB HBM3e |
| 显存带宽 | 3.6 TB/s |
| TDP | 400W |
| 能效比 | 2.5 TFLOPS/W(FP8) |
| 互联 | MetaXLink 超节点扩展(单集群数千卡) |
| 封装 | 2.5D 先进封装(长电科技 / 通富微电) |
| EDA | 华大九天等国产方案 |
| 发布 | 2025 年 10 月 |
| 量产 | 2025 年底风险量产 |
全流程国产化
曦云 C600 是首款全链条国产通用 GPU:
| 环节 | 国产方案 | 说明 |
|---|
| IP 设计 | 沐曦自研 XCORE 1.5 | 从指令集到计算单元完全自主 |
| 晶圆制造 | 中芯国际等 | 国产 7nm 工艺 |
| 封装测试 | 长电科技、通富微电 | 2.5D 先进封装 |
| EDA 工具 | 华大九天等 | 国产 EDA 逐步导入 |
| 软件栈 | MXMACA | 自研,兼容 CUDA |
战略意义:彻底摆脱海外供应链依赖,构建安全、可靠的自主算力基础设施。
MXMACA 软件生态
| 层级 | 工具 | 说明 |
|---|
| 软件栈 | MXMACA | 沐曦统一计算架构 |
| AI 框架 | PyTorch | 原生支持 |
| DeepSpeed | 分布式训练 |
| CUDA 兼容 | 自动迁移工具 | 代码迁移成本降低 90% 以上 |
| 大模型 | 支持国产千卡集群 | 中科院合作完成多模型全参数训练 |
| 生态策略 | "1+6+X" | GPU 底座赋能金融、医疗、能源、教科研、交通、大文娱 |
厂商信息
| 项目 | 内容 |
|---|
| 公司 | 沐曦集成电路(上海)股份有限公司 |
| 南京团队 | 近百人研发团队("最强大脑") |
| 立项目期 | 2024 年 2 月(C600 立项,投资约 13.7 亿元) |
| 流片 | 2024 年 10 月 |
| 发布 | 2025 年 10 月 |
| 量产 | 2025 年底风险量产 |
| IPO 状态 | 已完成两轮问询回复,冲刺科创板 |
| 营收 | 2025 上半年 3.2 亿元,在手订单 14.3 亿元 |
| 已部署 | 25,000+ 颗 GPU |
| 定价 | C500 约 3.89 万元/卡(A100 的 1/3) |
| C700 规划 | 2027 H2 量产,超 800 亿晶体管 |
适用场景
- ✅ 国产大模型训练(千卡集群已验证全参数训练)
- ✅ 生成式 AI 推理(144GB HBM3e 超大显存)
- ✅ 国产智算中心(全流程国产化,去美化刚需)
- ✅ 政府/央企项目(自主可控强制要求)
- ✅ FP8 推理(1000 TFLOPS,对标 H100)
- ✅ CUDA 迁移场景(90%+ 迁移成本降低)
- ❌ 图形渲染(通用 GPU 但非图形专用,曦彩 G 系列更优)
- ❌ CUDA 原生生态(需通过 MXMACA 迁移)
- ❌ 量产初期供应(2025 年底才风险量产)
与 NVIDIA H100 对比
| 指标 | 曦云 C600 | NVIDIA H100 | 差异 |
|---|
| 制程 | 7nm(国产) | TSMC 4nm | H100 先进 |
| FP8 | 1000 TFLOPS | 989 TFLOPS | C600 +1% |
| FP16 | 未公开(推测 ~300 TFLOPS) | 989 TFLOPS | 待确认 |
| FP32 | 15 TFLOPS | 67 TFLOPS | H100 4.5× |
| 显存 | 144GB HBM3e | 80GB HBM3 | C600 +80% |
| 带宽 | 3.6 TB/s | 3.35 TB/s | C600 +7% |
| 能效 | 2.5 TFLOPS/W | ~1.4 TFLOPS/W | C600 有优势(FP8) |
| 生态 | MXMACA(CUDA 兼容) | CUDA | H100 成熟 |
| 价格 | 待公布(C500 为 A100 1/3) | ~$30k+ | C600 预计便宜 |
| 国产化 | ✅ 100% | ❌ | C600 独有 |
关键时间线
| 时间 | 事件 |
|---|
| 2024-02 | C600 立项(投资 13.7 亿元) |
| 2024-10 | C600 交付流片 |
| 2025-07 | C600 百度百科词条建立 |
| 2025-10 | C600 南京正式发布(本页) |
| 2025 年底 | C600 风险量产 |
| 2027 H2 | C700 目标量产 |
相关卡