Skip to main content

华为昇腾 Ascend

厂商: 华为 Huawei

分类: NPU 神经网络处理器

架构: 达芬奇 (Da Vinci)

简介

华为昇腾 AI 处理器系列,包括训练芯片昇腾 910B/910 和推理芯片昇腾 310P/310。搭配 CANN(华为 AI 计算框架)和 MindSpore 深度学习框架,广泛用于国产 AI 基础设施建设。

规格参数

型号算力显存/内存接口TDP制程
昇腾 910B280 TFLOPS (FP16) / 560 TOPS (INT8)64GB HBM2eOAM310W7nm
昇腾 910256 TFLOPS (FP16)32GB HBM2PCIe 4.0300W7nm
昇腾 310P70 TOPS (INT8)24GB LPDDR4XPCIe 4.075W12nm
昇腾 31022 TOPS (INT8)8GB LPDDR4PCIe 3.08W12nm

官方网站

访问官方网站

驱动下载

Linux

相关文档

操作系统支持

WindowsLinuxmacOSAndroid

版本历史

版本发布时间说明
CANN 8.02024-Q4910B 全面优化 + MindSpore 2.x
CANN 7.02024-Q1torch_npu PyTorch 原生适配
CANN 6.02023-Q13D Cube 架构深度优化

性能基准

型号任务性能指标
昇腾 910B × 8GPT-3 175B 训练~1.5 天 (官方数据)
昇腾 910BLlama 2 70B 推理~80 tok/s (FP16)
昇腾 310P图像分类/检测~2000 img/s (ResNet-50)
昇腾 310边缘推理8W 超低功耗

定价信息

型号参考价格备注
昇腾 910B需询价主要通过 Atlas 产品线销售
昇腾 310P需询价Atlas 300I Pro
昇腾 310需询价Atlas 200 DK 开发者套件

快速安装

Linux (Ubuntu 22.04 / EulerOS)

# 1. 安装昇腾驱动和固件
sudo ./Ascend-cann-npu-driver_*.run --install

# 2. 安装 CANN 工具包
sudo ./Ascend-cann-toolkit_*.run --install

# 3. 设置环境变量
source /usr/local/Ascend/ascend-toolkit/set_env.sh

# 4. 验证安装
npu-smi info

代码示例

Python (torch_npu)

import torch
import torch_npu # 昇腾 NPU 扩展

# 使用 NPU 后端
device = torch.device("npu:0")
x = torch.randn(1024, 1024, device=device)
y = torch.matmul(x, x)
print(f"NPU matrix multiply: {y.shape}")
print(f"NPU device: {torch.npu.get_device_name(0)}")

MindSpore (昇腾原生框架)

import mindspore as ms

# MindSpore 自动使用昇腾 NPU
context.set_context(device_target="Ascend")
x = ms.Tensor(np.random.randn(1024, 1024), ms.float32)
y = ms.ops.matmul(x, x)
print(f"MindSpore NPU multiply: {y.shape}")

架构特色

  • 达芬奇架构: 3D Cube 计算单元,专为矩阵乘法优化;Cube 单元可加速 Transformer 注意力计算
  • CANN 全栈: Compute Architecture for Neural Networks — 从驱动到编译器到算子库的完整软件栈
  • torch_npu: PyTorch 的昇腾 NPU 后端,API 与 CUDA 后端高度一致,迁移成本低
  • MindSpore: 华为自研全场景 AI 框架,自动微分 + 分布式训练

模型兼容性

模型/框架支持情况备注
MindSpore✅ 原生最佳支持
PyTorch✅ torch_npuAPI 兼容 CUDA
TensorFlow⚠️通过 CANN 适配
Llama / Qwen 等 LLMMindIE / torch_npu 均支持
PaddlePaddle⚠️适配中
语音/视觉模型ModelScope 支持

大规模集群部署

基于全球 AI 超算集群数据统计,华为昇腾 在已公开的集群部署中累计超过 6,000 颗芯片,分布在 1 个集群中。

芯片型号统计

芯片型号总部署量集群数
Huawei Ascend 910B6,0001

知名部署集群 Top 10

#集群名称芯片总数芯片型号运营方
1Huawei Pangu Ultra MoE 910Bs6,000Huawei Ascend 910B ×6,000

相关产品

如果你在评估替代方案,以下产品可能也适合你的场景: