中昊芯英国产 TPU (AI 训练/推理)

产品概述

中昊芯英 是国内新兴的 TPU 架构 AI 芯片 创业公司，2026 年 5 月正式发布 自研 TPU 芯片 并实现 量产交付，成为继 Google 之后全球少数掌握 TPU 架构的企业。在 400W 功耗下提供 512 TOPS INT8 算力，能效比高达 1.28 TOPS/W（H100 的 2.3× 倍）。天津移动 TPU 智算中心 已投入运行，是 国产 TPU 商业化的首个标杆案例。

核心设计理念：摒弃 GPU 的图形渲染模块，纯 ASIC 设计专注于 AI 计算，在相同工艺节点下能效显著优于传统 GPU。千卡集群可支撑 超千亿参数大模型 运算。

核心规格

| 项目 | 参数 |

发布	2025-Q3（推测）
架构	自研 TPU（纯 ASIC，无图形渲染）
制程	7nm（推测）
INT8 算力	512 TOPS
FP16/BF16 算力	256 TFLOPS（推测）
FP32 算力	128 TFLOPS（推测）
TDP	400 W
能效比	1.28 TOPS/W
集群规模	千卡级（可扩展）
支持参数规模	超千亿参数大模型
发布时间	2026 年 5 月
量产状态	已量产交付
单价	未公开

能效对比

芯片	功耗	INT8 算力	能效比	相对 H100
中昊芯英 TPU	400 W	512 TOPS	1.28 TOPS/W	+129%
NVIDIA H100	700 W	3959 TOPS	0.56 TOPS/W	基线
寒武纪思元590	350 W	512 TOPS	1.46 TOPS/W	+161%

ℹ️ 能效优势来源：纯 ASIC 设计无图形冗余，专用矩阵乘法单元（MXU）架构类比 Google TPU，在推理场景功耗和散热成本显著低于 GPU。

商业化落地

项目	详情
首发客户	天津移动
部署场景	天津移动 TPU 智算中心
运行状态	已投入运行
行业意义	国产 TPU 商业化首批标杆

与 GPU 架构差异

维度	中昊芯英 TPU	传统 GPU（如 H100）
设计理念	纯 AI ASIC	通用 GPU（图形+AI）
能效	高（无图形冗余）	较低
编程灵活度	较低（固定数据流）	高（CUDA 通用计算）
生态兼容	自研（无 CUDA 兼容）	CUDA 生态
适用场景	AI 推理 + 训练	通用计算

适用场景

✅ AI 推理（高能效场景）
✅ 智算中心建设（国产化合规）
✅ 千亿参数大模型训练（千卡集群）
✅ 低功耗 / 低散热成本场景
❌ 复杂数据流模型（灵活度低于 GPU）
❌ 图形渲染 / 通用计算

厂商信息

项目	内容
公司	中昊芯英（杭州）科技有限公司
定位	国产 TPU 架构 AI 芯片新势力
核心产品	自研 TPU 芯片
官网	待确认
首发客户	天津移动
首发时间	2026 年 5 月
融资	多轮融资

产品概述​

核心规格​

能效对比​

商业化落地​

与 GPU 架构差异​

适用场景​

厂商信息​

相关产品对比​