产品概述
Huawei Ascend 910C 于 2025 年 4 月开始大规模量产,双小芯片(dual-chiplet)设计,将两颗 910B 计算芯片封装在一起。780 BF16 TFLOPS 算力(约为 H100 的 60%)。在 CloudMatrix 384 系统中,384 颗 Ascend 910C 组成 16 机柜的超级系统,总 BF16 算力超过 NVIDIA GB200 NVL72。
核心规格
| 项目 | 参数 |
|---|
| 架构 | Da Vinci(双小芯片) |
| 制程 | 7nm 级(含 SMIC 国产化) |
| 小芯片数 | 2×(2× Ascend 910B 计算芯片) |
| HBM | 8× HBM2E 模块 |
| BF16 算力 | 780 TFLOPS(约 H100 的 60%) |
| 总内存容量 | ~128 GB(双芯片) |
| TDP | ~310 W(双芯片) |
CloudMatrix 384 系统
| 项目 | 配置 |
|---|
| 芯片数 | 384 颗 Ascend 910C |
| 机柜数 | 16(12 计算 + 4 网络) |
| HBM 总量 | ~49 TB(128GB × 384) |
| 互联 | 全光网状,6,912 LPO 光模块 |
| 总 BF16 算力 | ~300 PFLOPS(系统级) |
厂商信息
关键特性
- 双小芯片设计:7nm 工艺堆叠
- 无中心 I/O die:2 个计算芯片直接封装
- HBM2E × 8:苏三星供应
- 通过 CoAsia、Faraday 等中介规避出口管制
DeepSeek 性能参考
- DeepSeek 测试 Ascend 910C 推理速度为 H100 的 60%(BF16)
- 不支持 FP8(NVIDIA Blackwell 2× 优势)
- 主要适用于中国市场
适用场景
- 中国市场 LLM 训练与推理
- 大模型推理部署
- 政府、国企 AI 项目
- 国产化替代
相关产品对比