产品概述
中昊芯英 是国内新兴的 TPU 架构 AI 芯片 创业公司,2026 年 5 月正式发布 自研 TPU 芯片 并实现 量产交付,成为继 Google 之后全球少数掌握 TPU 架构的企业。在 400W 功耗下提供 512 TOPS INT8 算力,能效比高达 1.28 TOPS/W(H100 的 2.3× 倍)。天津移动 TPU 智算中心 已投入运行,是 国产 TPU 商业化的首个标杆案例。
核心设计理念:摒弃 GPU 的图形渲染模块,纯 ASIC 设计专注于 AI 计算,在相同工艺节点下能效显著优于传统 GPU。千卡集群可支撑 超千亿参数大模型 运算。
核心规格
| 项目 | 参数 |
|---|
| 架构 | 自研 TPU(纯 ASIC,无图形渲染) |
| 制程 | 7nm(推测) |
| INT8 算力 | 512 TOPS |
| FP16/BF16 算力 | 256 TFLOPS(推测) |
| FP32 算力 | 128 TFLOPS(推测) |
| TDP | 400 W |
| 能效比 | 1.28 TOPS/W |
| 集群规模 | 千卡级(可扩展) |
| 支持参数规模 | 超千亿参数大模型 |
| 发布时间 | 2026 年 5 月 |
| 量产状态 | 已量产交付 |
| 单价 | 未公开 |
能效对比
| 芯片 | 功耗 | INT8 算力 | 能效比 | 相对 H100 |
|---|
| 中昊芯英 TPU | 400 W | 512 TOPS | 1.28 TOPS/W | +129% |
| NVIDIA H100 | 700 W | 3959 TOPS | 0.56 TOPS/W | 基线 |
| 寒武纪 思元590 | 350 W | 512 TOPS | 1.46 TOPS/W | +161% |
ℹ️ 能效优势来源:纯 ASIC 设计无图形冗余,专用矩阵乘法单元(MXU)架构类比 Google TPU,在推理场景功耗和散热成本显著低于 GPU。
商业化落地
| 项目 | 详情 |
|---|
| 首发客户 | 天津移动 |
| 部署场景 | 天津移动 TPU 智算中心 |
| 运行状态 | 已投入运行 |
| 行业意义 | 国产 TPU 商业化首批标杆 |
与 GPU 架构差异
| 维度 | 中昊芯英 TPU | 传统 GPU(如 H100) |
|---|
| 设计理念 | 纯 AI ASIC | 通用 GPU(图形+AI) |
| 能效 | 高(无图形冗余) | 较低 |
| 编程灵活度 | 较低(固定数据流) | 高(CUDA 通用计算) |
| 生态兼容 | 自研(无 CUDA 兼容) | CUDA 生态 |
| 适用场景 | AI 推理 + 训练 | 通用计算 |
适用场景
- ✅ AI 推理(高能效场景)
- ✅ 智算中心建设(国产化合规)
- ✅ 千亿参数大模型训练(千卡集群)
- ✅ 低功耗 / 低散热成本场景
- ❌ 复杂数据流模型(灵活度低于 GPU)
- ❌ 图形渲染 / 通用计算
厂商信息
| 项目 | 内容 |
|---|
| 公司 | 中昊芯英(杭州)科技有限公司 |
| 定位 | 国产 TPU 架构 AI 芯片新势力 |
| 核心产品 | 自研 TPU 芯片 |
| 官网 | 待确认 |
| 首发客户 | 天津移动 |
| 首发时间 | 2026 年 5 月 |
| 融资 | 多轮融资 |
相关产品对比