Moore Threads 摩尔线程 MTT S4000 (2023)

产品概述

MTT S4000 是摩尔线程于 2023 年 12 月发布的大模型智算加速卡，基于自研 曲院 GPU 架构（第三代 MUSA 内核架构）打造，配备 48GB GDDR6 显存（带宽 768 GB/s），FP32 算力 25 TFLOPS，TF32 算力 50 TFLOPS，INT8 算力 200 TOPS，为千亿规模大语言模型的训练、微调和推理进行了定制优化，结合先进的图形渲染能力、视频编解码能力和超高清 8K HDR 显示输出。

定位：全功能元计算卡（训推一体 + 图形渲染），为 KUAE 智算中心解决方案的核心组件。

核心规格

项目	参数
架构	自研曲院 GPU（第三代 MUSA 内核架构）
制程	未公开（推测 7nm/6nm）
FP32	25 TFLOPS
TF32	50 TFLOPS
INT8	200 TOPS
FP16/BF16	支持（具体数值未公开）
显存容量	48 GB GDDR6
显存带宽	768 GB/s
TDP	450 W
互联	MTLink（x8 Serdes，最高 56Gbps PAM4）
接口	PCIe 5.0 x16，4× DisplayPort
供电	CPU 8-pin × 1
发布	2023 年 12 月
量产	2024 年起
软件栈	MUSA 软件栈（兼容 CUDA）

MUSA 架构演进

架构	内核	代表产品	发布
第一代 MUSA	春晓	MTT S80/S70（消费级）	2022
第二代 MUSA	曲院（改进）	MTT S3000	2023
第三代 MUSA	曲院 GPU	MTT S4000	2023.12

与 MTT S3000 对比

指标	MTT S3000	MTT S4000	提升
架构	第二代 MUSA	第三代 MUSA（曲院 GPU）	新一代
显存	未公开	48GB GDDR6	更大
带宽	未公开	768 GB/s	更高
FP32	未公开	25 TFLOPS	公开数值
TDP	未公开	450W	数据中心级
发布	2023 年	2023.12	同期改进

KUAE 智算中心解决方案

MTT S4000 是摩尔线程 KUAE 智算中心解决方案的核心组件：

千亿参数大模型训练、微调、推理全栈支持
MTLink 多卡高速互联（x8 Serdes，56Gbps PAM4）
MUSA 软件栈完整支持 PyTorch/DeepSpeed 等主流框架
CUDA 兼容层，降低模型迁移成本

适用场景

✅ 千亿参数大模型训练（定制优化）
✅ 大模型推理即服务（INT8 200 TOPS）
✅ 图形渲染 + AI 混合负载（全功能 GPU）
✅ 视频编解码（8K HDR 显示输出）
✅ 国产智算中心（KUAE 解决方案）
❌ 超高 FP16 训练算力（25 TFLOPS FP32 低于 H100）
❌ 超大规模集群（MTLink 待验证 vs NVLink）

产品矩阵

系列	定位	代表产品
MTT S 系列	服务器 GPU（数据中心）	S3000、S4000、S5000
MTT S 系列（消费级）	桌面 GPU	S80、S70
KUAE	智算中心解决方案	S4000 + MTLink + MUSA 软件栈

Moore Threads 摩尔线程 MTT S4000 (2023)

产品概述

核心规格

MUSA 架构演进

与 MTT S3000 对比

KUAE 智算中心解决方案

适用场景

产品矩阵

相关卡

参考资料

产品概述​

核心规格​

MUSA 架构演进​

与 MTT S3000 对比​

KUAE 智算中心解决方案​

适用场景​

产品矩阵​

相关卡​

参考资料​

产品概述

核心规格

MUSA 架构演进

与 MTT S3000 对比

KUAE 智算中心解决方案

适用场景

产品矩阵

相关卡

参考资料