Huawei Ascend 910C

产品概述

Huawei Ascend 910C 于 2025 年 4 月开始大规模量产，双小芯片（dual-chiplet）设计，将两颗 910B 计算芯片封装在一起。800 FP16 TFLOPS 算力（约为 H100 的 60%）。在 CloudMatrix 384 系统中，384 颗 Ascend 910C 组成 16 机柜的超级系统，总 BF16 算力超过 NVIDIA GB200 NVL72。

重大里程碑（2026-06-05）：深圳河套学院联合哈工大（深圳）、深圳市大数据研究院及华为等团队，依托昇腾 910C 国产 AI 算力集群，成功完成 1.6 万亿参数 DeepSeek V4 Pro 大模型全参数后训练，标志着国产 AI 芯片正式具备训练万亿参数大模型的能力。

核心规格

| 项目 | 参数 |

发布	2024-04-24（推测）
架构	Da Vinci（双小芯片）
制程	7nm 级（含 SMIC 国产化）
小芯片数	2×（2× Ascend 910B 计算芯片）
HBM	8× HBM2E 模块
BF16 算力	800 TFLOPS（~H100 的 60%）
总内存容量	~128 GB（双芯片）
TDP	310 W

CloudMatrix 384 系统

项目	配置
芯片数	384 颗 Ascend 910C
机柜数	16（12 计算 + 4 网络）
HBM 总量	~49 TB（128GB × 384）
互联	全光网状，6,912 LPO 光模块
总 BF16 算力	~300 PFLOPS（系统级）

厂商信息

项目	内容
制造商	华为技术有限公司
官网	https://www.hiascend.com
CANN	https://www.hiascend.com/en/software/cann
MindSpore	https://www.mindspore.cn
2025 年计划	80 万颗出货

关键特性

双小芯片设计：7nm 工艺堆叠
无中心 I/O die：2 个计算芯片直接封装
HBM2E × 8：苏三星供应
通过 CoAsia、Faraday 等中介规避出口管制

DeepSeek 性能参考

DeepSeek 测试 Ascend 910C 推理速度为 H100 的 60%（BF16）
不支持 FP8（NVIDIA Blackwell 2× 优势）
主要适用于中国市场

适用场景

中国市场 LLM 训练与推理
大模型推理部署
政府、国企 AI 项目
国产化替代

产品概述​

核心规格​

CloudMatrix 384 系统​

厂商信息​

关键特性​

DeepSeek 性能参考​

适用场景​

相关产品对比​