产品概述
昆仑芯 M100 是昆仑芯科技于 2025 年 11 月 13 日百度世界大会上发布的新一代 AI 推理芯片,针对大规模 AI 推理场景优化设计,尤其面向 MoE(Mixture of Experts)架构模型推理。计划于 2026 年初上市,已于 2026 年 1 月进入商业放量期。
注:M100 于发布时未公开详细硬件规格(算力、显存、功耗等),以下信息基于官方发布和行业报道整理。
M 系列定位:
- 昆仑芯 M100(2026 初):大规模 AI 推理 — 本页
- 昆仑芯 M300(2027 初):超大规模多模态大模型训练与推理
- 昆仑芯 P800(2024):训练与推理通用加速卡 — 已有页
- 昆仑芯 N 系列(2029):下一代架构
核心规格
| 项目 | 参数 |
|---|
| 定位 | 大规模 AI 推理专用 |
| 架构 | 自研架构(具体代号未公开) |
| 制程 | 未公开 |
| FP16 / BF16 | 未公开 |
| INT8 / INT4 | 未公开 |
| 显存容量 | 未公开 |
| 显存类型 | 未公开 |
| 带宽 | 未公开 |
| TDP | 未公开 |
| 互联 | 天池超节点生态 |
| 发布 | 2025 年 11 月 13 日(百度世界大会) |
| 上市 | 计划 2026 年初 |
| 量产状态 | 2026 年 1 月起商业放量 |
关键特性
- MoE 推理优化:硬件层面针对 MoE 稀疏激活特性优化,MoE 模型推理性能显著提升
- PD 分离推理:支持 Prefill-Decode 分离部署,单卡性能提升 95%
- 单实例性能:结合推理优化,最高提升至 8 倍
- 天池超节点:与天池 256/天池 512 超节点协同,构建千卡级推理集群
- 中国移动中标:推理型集采 CUDA 生态标段份额第一
厂商信息
| 项目 | 内容 |
|---|
| 公司 | 昆仑芯科技(北京)有限公司 |
| 母公司 | 百度(持股 57.67%) |
| M100 发布 | 2025 年 11 月 13 日百度世界大会 |
| IPO 状态 | 2026 年 5 月启动科创板 IPO 辅导 |
| 部署规模 | 昆仑芯全系列累计数万卡部署 |
| 核心场景 | 百度智能云推理服务底座 |
适用场景
- ✅ 大规模 AI 推理(LLM 在线服务)
- ✅ MoE 模型推理(稀疏激活硬件优化)
- ✅ PD 分离部署(Prefill + Decode 独立优化)
- ✅ 百度云推理服务(千问、文心等模型推理)
- ✅ 国产化推理集群
- ❌ AI 训练(定位为推理专用,训练用 P800/M300)
- ❌ 规格待确认(详细参数建议关注 2026 年正式产品发布)
与 P800 定位对比
| 维度 | M100(推理) | P800(训推一体) |
|---|
| 定位 | 推理专用 | 训练 + 推理通用 |
| MoE 优化 | 原生优化 | 支持 |
| PD 分离 | 支持(+95% 性能) | 基础支持 |
| 单机部署 | 云端推理服务 | 单机 8 卡 671B |
| 上市 | 2026 初 | 2024-03 |
| 超节点 | 天池 256/512 | 天池 256/512 |
| 规格公开度 | 待公布 | 已公开 |
关键时间线
| 时间 | 事件 |
|---|
| 2024-03 | P800 上市 |
| 2025-04 | 天池超节点在百舸 5.0 启用 |
| 2025-11-13 | M100/M300 发布(百度世界大会) |
| 2026-01 | M100 进入商业放量期 |
| 2026 上半年 | M100 正式量产交付 |
| 2027 初 | M300 上市(万亿参数级训练) |
相关卡