跳到主要内容

Kunlun 昆仑芯 M100 (2026)

产品概述

昆仑芯 M100 是昆仑芯科技于 2025 年 11 月 13 日百度世界大会上发布的新一代 AI 推理芯片,针对大规模 AI 推理场景优化设计,尤其面向 MoE(Mixture of Experts)架构模型推理。计划于 2026 年初上市,已于 2026 年 1 月进入商业放量期。

:M100 于发布时未公开详细硬件规格(算力、显存、功耗等),以下信息基于官方发布和行业报道整理。

M 系列定位

  • 昆仑芯 M100(2026 初):大规模 AI 推理 — 本页
  • 昆仑芯 M300(2027 初):超大规模多模态大模型训练与推理
  • 昆仑芯 P800(2024):训练与推理通用加速卡 — 已有页
  • 昆仑芯 N 系列(2029):下一代架构

核心规格

项目参数
定位大规模 AI 推理专用
架构自研架构(具体代号未公开)
制程未公开
FP16 / BF16未公开
INT8 / INT4未公开
显存容量未公开
显存类型未公开
带宽未公开
TDP未公开
互联天池超节点生态
发布2025 年 11 月 13 日(百度世界大会)
上市计划 2026 年初
量产状态2026 年 1 月起商业放量

关键特性

  • MoE 推理优化:硬件层面针对 MoE 稀疏激活特性优化,MoE 模型推理性能显著提升
  • PD 分离推理:支持 Prefill-Decode 分离部署,单卡性能提升 95%
  • 单实例性能:结合推理优化,最高提升至 8 倍
  • 天池超节点:与天池 256/天池 512 超节点协同,构建千卡级推理集群
  • 中国移动中标:推理型集采 CUDA 生态标段份额第一

厂商信息

项目内容
公司昆仑芯科技(北京)有限公司
母公司百度(持股 57.67%)
M100 发布2025 年 11 月 13 日百度世界大会
IPO 状态2026 年 5 月启动科创板 IPO 辅导
部署规模昆仑芯全系列累计数万卡部署
核心场景百度智能云推理服务底座

适用场景

  • 大规模 AI 推理(LLM 在线服务)
  • MoE 模型推理(稀疏激活硬件优化)
  • PD 分离部署(Prefill + Decode 独立优化)
  • 百度云推理服务(千问、文心等模型推理)
  • 国产化推理集群
  • AI 训练(定位为推理专用,训练用 P800/M300)
  • 规格待确认(详细参数建议关注 2026 年正式产品发布)

与 P800 定位对比

维度M100(推理)P800(训推一体)
定位推理专用训练 + 推理通用
MoE 优化原生优化支持
PD 分离支持(+95% 性能)基础支持
单机部署云端推理服务单机 8 卡 671B
上市2026 初2024-03
超节点天池 256/512天池 256/512
规格公开度待公布已公开

关键时间线

时间事件
2024-03P800 上市
2025-04天池超节点在百舸 5.0 启用
2025-11-13M100/M300 发布(百度世界大会)
2026-01M100 进入商业放量期
2026 上半年M100 正式量产交付
2027 初M300 上市(万亿参数级训练)

相关卡