Skip to main content

Moore Threads 摩尔线程 MTT S4000 (2023)

产品概述

MTT S4000 是摩尔线程于 2023 年 12 月发布的大模型智算加速卡,基于自研 曲院 GPU 架构(第三代 MUSA 内核架构)打造,配备 48GB GDDR6 显存(带宽 768 GB/s),FP32 算力 25 TFLOPS,TF32 算力 50 TFLOPS,INT8 算力 200 TOPS,为千亿规模大语言模型的训练、微调和推理进行了定制优化,结合先进的图形渲染能力、视频编解码能力和超高清 8K HDR 显示输出。

定位全功能元计算卡(训推一体 + 图形渲染),为 KUAE 智算中心解决方案的核心组件。

核心规格

项目参数
架构自研 曲院 GPU(第三代 MUSA 内核架构)
制程未公开(推测 7nm/6nm)
FP3225 TFLOPS
TF3250 TFLOPS
INT8200 TOPS
FP16/BF16支持(具体数值未公开)
显存容量48 GB GDDR6
显存带宽768 GB/s
TDP450 W
互联MTLink(x8 Serdes,最高 56Gbps PAM4)
接口PCIe 5.0 x16,4× DisplayPort
供电CPU 8-pin × 1
发布2023 年 12 月
量产2024 年起
软件栈MUSA 软件栈(兼容 CUDA)

MUSA 架构演进

架构内核代表产品发布
第一代 MUSA春晓MTT S80/S70(消费级)2022
第二代 MUSA曲院(改进)MTT S30002023
第三代 MUSA曲院 GPUMTT S40002023.12

与 MTT S3000 对比

指标MTT S3000MTT S4000提升
架构第二代 MUSA第三代 MUSA(曲院 GPU)新一代
显存未公开48GB GDDR6更大
带宽未公开768 GB/s更高
FP32未公开25 TFLOPS公开数值
TDP未公开450W数据中心级
发布2023 年2023.12同期改进

KUAE 智算中心解决方案

MTT S4000 是摩尔线程 KUAE 智算中心解决方案的核心组件:

  • 千亿参数大模型训练、微调、推理全栈支持
  • MTLink 多卡高速互联(x8 Serdes,56Gbps PAM4)
  • MUSA 软件栈完整支持 PyTorch/DeepSpeed 等主流框架
  • CUDA 兼容层,降低模型迁移成本

适用场景

  • 千亿参数大模型训练(定制优化)
  • 大模型推理即服务(INT8 200 TOPS)
  • 图形渲染 + AI 混合负载(全功能 GPU)
  • 视频编解码(8K HDR 显示输出)
  • 国产智算中心(KUAE 解决方案)
  • 超高 FP16 训练算力(25 TFLOPS FP32 低于 H100)
  • 超大规模集群(MTLink 待验证 vs NVLink)

产品矩阵

系列定位代表产品
MTT S 系列服务器 GPU(数据中心)S3000、S4000、S5000
MTT S 系列(消费级)桌面 GPUS80、S70
KUAE智算中心解决方案S4000 + MTLink + MUSA 软件栈

相关卡

参考资料