Kunlun 昆仑芯 M100 (2026)

产品概述

昆仑芯 M100 是昆仑芯科技于 2025 年 11 月 13 日百度世界大会上发布的新一代 AI 推理芯片，针对大规模 AI 推理场景优化设计，尤其面向 MoE（Mixture of Experts）架构模型推理。计划于 2026 年初上市，已于 2026 年 1 月进入商业放量期。

注：M100 于发布时未公开详细硬件规格（算力、显存、功耗等），以下信息基于官方发布和行业报道整理。

M 系列定位：

昆仑芯 M100（2026 初）：大规模 AI 推理 — 本页
昆仑芯 M300（2027 初）：超大规模多模态大模型训练与推理
昆仑芯 P800（2024）：训练与推理通用加速卡 — 已有页
昆仑芯 N 系列（2029）：下一代架构

核心规格

项目	参数
定位	大规模 AI 推理专用
架构	自研架构（具体代号未公开）
制程	未公开
FP16 / BF16	未公开
INT8 / INT4	未公开
显存容量	未公开
显存类型	未公开
带宽	未公开
TDP	未公开
互联	天池超节点生态
发布	2025 年 11 月 13 日（百度世界大会）
上市	计划 2026 年初
量产状态	2026 年 1 月起商业放量

关键特性

MoE 推理优化：硬件层面针对 MoE 稀疏激活特性优化，MoE 模型推理性能显著提升
PD 分离推理：支持 Prefill-Decode 分离部署，单卡性能提升 95%
单实例性能：结合推理优化，最高提升至 8 倍
天池超节点：与天池 256/天池 512 超节点协同，构建千卡级推理集群
中国移动中标：推理型集采 CUDA 生态标段份额第一

厂商信息

项目	内容
公司	昆仑芯科技（北京）有限公司
母公司	百度（持股 57.67%）
M100 发布	2025 年 11 月 13 日百度世界大会
IPO 状态	2026 年 5 月启动科创板 IPO 辅导
部署规模	昆仑芯全系列累计数万卡部署
核心场景	百度智能云推理服务底座

适用场景

✅ 大规模 AI 推理（LLM 在线服务）
✅ MoE 模型推理（稀疏激活硬件优化）
✅ PD 分离部署（Prefill + Decode 独立优化）
✅ 百度云推理服务（千问、文心等模型推理）
✅ 国产化推理集群
❌ AI 训练（定位为推理专用，训练用 P800/M300）
❌ 规格待确认（详细参数建议关注 2026 年正式产品发布）

与 P800 定位对比

维度	M100（推理）	P800（训推一体）
定位	推理专用	训练 + 推理通用
MoE 优化	原生优化	支持
PD 分离	支持（+95% 性能）	基础支持
单机部署	云端推理服务	单机 8 卡 671B
上市	2026 初	2024-03
超节点	天池 256/512	天池 256/512
规格公开度	待公布	已公开

关键时间线

时间	事件
2024-03	P800 上市
2025-04	天池超节点在百舸 5.0 启用
2025-11-13	M100/M300 发布（百度世界大会）
2026-01	M100 进入商业放量期
2026 上半年	M100 正式量产交付
2027 初	M300 上市（万亿参数级训练）

产品概述​

核心规格​

关键特性​

厂商信息​

适用场景​

与 P800 定位对比​

关键时间线​

相关卡​

产品概述

核心规格

关键特性

厂商信息

适用场景

与 P800 定位对比

关键时间线

相关卡