跳到主要内容

中昊芯英 国产 TPU (AI 训练/推理)

产品概述

中昊芯英 是国内新兴的 TPU 架构 AI 芯片 创业公司,2026 年 5 月正式发布 自研 TPU 芯片 并实现 量产交付,成为继 Google 之后全球少数掌握 TPU 架构的企业。在 400W 功耗下提供 512 TOPS INT8 算力,能效比高达 1.28 TOPS/W(H100 的 2.3× 倍)。天津移动 TPU 智算中心 已投入运行,是 国产 TPU 商业化的首个标杆案例。

核心设计理念:摒弃 GPU 的图形渲染模块,纯 ASIC 设计专注于 AI 计算,在相同工艺节点下能效显著优于传统 GPU。千卡集群可支撑 超千亿参数大模型 运算。

核心规格

项目参数
架构自研 TPU(纯 ASIC,无图形渲染)
制程7nm(推测)
INT8 算力512 TOPS
FP16/BF16 算力256 TFLOPS(推测)
FP32 算力128 TFLOPS(推测)
TDP400 W
能效比1.28 TOPS/W
集群规模千卡级(可扩展)
支持参数规模超千亿参数大模型
发布时间2026 年 5 月
量产状态已量产交付
单价未公开

能效对比

芯片功耗INT8 算力能效比相对 H100
中昊芯英 TPU400 W512 TOPS1.28 TOPS/W+129%
NVIDIA H100700 W3959 TOPS0.56 TOPS/W基线
寒武纪 思元590350 W512 TOPS1.46 TOPS/W+161%

ℹ️ 能效优势来源:纯 ASIC 设计无图形冗余,专用矩阵乘法单元(MXU)架构类比 Google TPU,在推理场景功耗和散热成本显著低于 GPU。

商业化落地

项目详情
首发客户天津移动
部署场景天津移动 TPU 智算中心
运行状态已投入运行
行业意义国产 TPU 商业化首批标杆

与 GPU 架构差异

维度中昊芯英 TPU传统 GPU(如 H100)
设计理念纯 AI ASIC通用 GPU(图形+AI)
能效高(无图形冗余)较低
编程灵活度较低(固定数据流)高(CUDA 通用计算)
生态兼容自研(无 CUDA 兼容)CUDA 生态
适用场景AI 推理 + 训练通用计算

适用场景

  • ✅ AI 推理(高能效场景)
  • ✅ 智算中心建设(国产化合规)
  • ✅ 千亿参数大模型训练(千卡集群)
  • ✅ 低功耗 / 低散热成本场景
  • ❌ 复杂数据流模型(灵活度低于 GPU)
  • ❌ 图形渲染 / 通用计算

厂商信息

项目内容
公司中昊芯英(杭州)科技有限公司
定位国产 TPU 架构 AI 芯片新势力
核心产品自研 TPU 芯片
官网待确认
首发客户天津移动
首发时间2026 年 5 月
融资多轮融资

相关产品对比