跳到主要内容

清微智能 TX81 (2024)

产品概述

TX81 是清微智能于 2024 年量产的云端大算力 AI 芯片,基于清微自研 可重构计算架构(RPU)设计,采用独特的 C2C(Compute-to-Compute)算力网格技术,构建高带宽、低延迟的数据流通路,支持万亿以上参数大模型部署,整体解决方案成本相比同行业产品降低 50%,能效比提升 3 倍,是清微智能面向智算中心等大规模 AI 应用场景的主力芯片产品。

定位云端训练+推理一体芯片(RPU 架构,与 GPU/ASIC 路径不同),依托可重构架构的灵活性,同时支持训练与推理场景。

核心规格

项目参数
架构自研 RPU(Reconfigurable Processing Unit),可重构计算架构
制程未公开(推测 7nm/6nm)
FP32/FP16/INT8 算力未公开(官方未披露具体 TFLOPS/TOPS 数值)
C2C 算力网格独特架构,高带宽、低延迟数据通路,扩展性和灵活性优于传统交换机方案
大模型支持万亿以上参数大模型部署
显存容量未公开
TDP300 W(推测)
互联C2C 网格互联(多卡扩展)
发布2024 年(量产)
量产2024 年起
软件栈清微智能软件栈(支持 PyTorch/TensorFlow 适配)

⚠️ 规格说明:TX81 的详细规格(TDP、显存、具体算力数值)官方未完整公开,以上部分为基于公开报道的推测,以清微智能后续官方数据表为准。

RPU 架构优势

清微智能的 RPU 架构是 CPU、FPGA、GPU 之外的第四类通用计算芯片

特性RPU(可重构)GPU优势
能效比同等算力下能耗比 GPU 降低 50%+基准RPU 更优
灵活性硬件级可重构,算法与硬件协同优化固定架构RPU 更灵活
扩展性C2C 算力网格,无外部交换机瓶颈NVLink/InfiniBand架构级优势
成本解决方案成本比同行业 降低 50%基准RPU 更优

清微智能产品矩阵

系列定位代表产品发布
TX5 系列IoT/边缘视觉TX5102021
TX8 系列云端大算力TX812024
TX8 系列(下一代)云端大算力(升级)TX82(规划)2026(规划)

已验证部署

  • REX1032 训推一体服务器:搭载 TX81 芯片,支持万亿参数大模型部署
  • 适配 DeepSeek-R1 系列模型:已在多个行业实现服务器部署
  • 应用场景:智算中心、金融、能源等行业

出货情况

产品出货量
可重构芯片(全品类,含 IoT)超 3000 万颗
云端 AI 算力卡(TX81 等)超 2 万张

适用场景

  • 智算中心(C2C 网格架构,低延迟高带宽)
  • 万亿参数大模型训练/推理(TX81 已验证)
  • 成本敏感型项目(解决方案成本降低 50%)
  • 能效敏感型数据中心(能效比提升 3 倍)
  • DeepSeek 等国产大模型部署(已适配)
  • CUDA 生态强依赖(RPU 为独立架构,需迁移)
  • 公开算力基准测试(官方未披露具体 TFLOPS)

产品演进

产品发布状态
TX510(IoT 视觉)2021在售
TX81(云端大算力)2024当前主力
TX82(云端大算力升级)2026(规划)下一代

相关卡

参考资料