寒武纪思元 MLU

厂商: 寒武纪 Cambricon

分类: ASIC 专用加速卡

架构: MLUarch

简介

寒武纪（Cambricon）国产 AI 加速卡，思元系列覆盖训练与推理场景。思元 590（MLU590）采用 7nm Chiplet 封装，FP16 算力 256 TFLOPS，INT8 算力 512 TOPS，96GB HBM2e。自研 Bangware 软件栈实现 CUDA 兼容，通过 NeuWare SDK 调用。2025 年出货约 11.6 万颗，国产第三梯队。

规格参数

型号	算力	显存/内存	接口	TDP	制程
思元 590	256 TFLOPS (FP16) / 512 (INT8) / 80 (FP32)	96GB HBM2e (2.7 TB/s)	OAM	350W	7nm
思元 370	128 TOPS (INT8)	24GB LPDDR5	PCIe 4.0	150W	12nm
思元 270	64 TOPS (INT8)	8GB DDR4	PCIe 3.0	70W	16nm

官方网站

访问官方网站

驱动下载

Linux

操作系统支持

Windows	Linux	macOS	Android
❌	✅	❌	❌

版本历史

版本	发布时间	说明
Neuware 5.0	2024	590 支持 + CNN/Transformer 双优化
BANG C 2.0	2023	兼容 CUDA 编程模型

性能基准

型号	任务	性能指标
思元 590	BERT-Large 训练	~80% A100 效率 (官方数据)
思元 590	INT8 推理	512 TOPS
思元 370	推理吞吐	INT8 优化
思元 270	边缘推理	64 TOPS, 70W

定价信息

型号	参考价格	备注
思元 590	需询价	企业级训练卡
思元 370	需询价	推理加速卡
思元 270	需询价	边缘/端侧

快速安装

Linux (Ubuntu 22.04 / Kylin)

# 1. 安装 NeuWare 驱动
sudo ./neuware-driver-*.run --install

# 2. 安装 NeuWare SDK
sudo ./neuware-sdk-*.run --install

# 3. 验证
cnmon

NeuWare 从寒武纪开发者社区下载。

代码示例

Python (Cambricon PyTorch)

import torch
import torch_cambricon  # 寒武纪 NPU 扩展

# 使用 MLU 后端
device = torch.device("mlu")
x = torch.randn(1024, 1024, device=device)
y = torch.matmul(x, x)
print(f"MLU matrix multiply: {y.shape}")

Bang C (寒武纪 CUDA 兼容)

// Bang C API 与 CUDA 高度兼容
__mlu_entry__ void kernel(float *input, float *output) {
    int idx = get_thread_id();
    output[idx] = input[idx] * 2.0f;
}

架构特色

MLUarch: 寒武纪自研 AI 加速架构，590 采用 7nm Chiplet 封装，96GB HBM2e 大显存
Bang C: 寒武纪 CUDA 兼容编程语言，CUDA 代码可低成本迁移
NeuWare: 完整软件栈 — 驱动 + 运行时 (CNRT) + 算子库 (CNBL/CNCL) + 编译器

模型兼容性

模型/框架	支持情况	备注
PyTorch	✅ torch_cambricon	MLU 后端
Bang C	✅ 原生	CUDA 兼容
MindSpore	⚠️	适配中
Llama / Qwen 等 LLM	⚠️	生态逐步完善
模型量化	✅	INT8 优化
国产 OS	✅	麒麟/UOS 适配

寒武纪思元 MLU

简介

规格参数

官方网站

驱动下载

Linux

相关文档

操作系统支持

版本历史

性能基准

定价信息

快速安装

Linux (Ubuntu 22.04 / Kylin)

代码示例

Python (Cambricon PyTorch)

Bang C (寒武纪 CUDA 兼容)

架构特色

模型兼容性

相关产品

简介​

规格参数​

官方网站​

驱动下载​

Linux​

相关文档​

操作系统支持​

版本历史​

性能基准​

定价信息​

快速安装​

Linux (Ubuntu 22.04 / Kylin)​

代码示例​

Python (Cambricon PyTorch)​

Bang C (寒武纪 CUDA 兼容)​

架构特色​

模型兼容性​

相关产品​

简介

规格参数

官方网站

驱动下载

Linux

相关文档

操作系统支持

版本历史

性能基准

定价信息

快速安装

Linux (Ubuntu 22.04 / Kylin)

代码示例

Python (Cambricon PyTorch)

Bang C (寒武纪 CUDA 兼容)

架构特色

模型兼容性

相关产品