Moore Threads 摩尔线程 MTT S4000 (2023)
产品概述
MTT S4000 是摩尔线程于 2023 年 12 月发布的大模型智算加速卡,基于自研 曲院 GPU 架构(第三代 MUSA 内核架构)打造,配备 48GB GDDR6 显存(带宽 768 GB/s),FP32 算力 25 TFLOPS,TF32 算力 50 TFLOPS,INT8 算力 200 TOPS,为千亿规模大语言模型的训练、微调和推理进行了定制优化,结合先进的图形渲染能力、视频编解码能力和超高清 8K HDR 显示输出。
定位:全功能元计算卡(训推一体 + 图形渲染),为 KUAE 智算中心解决方案的核心组件。
核心规格
| 项目 | 参数 |
|---|
| 架构 | 自研 曲院 GPU(第三代 MUSA 内核架构) |
| 制程 | 未公开(推测 7nm/6nm) |
| FP32 | 25 TFLOPS |
| TF32 | 50 TFLOPS |
| INT8 | 200 TOPS |
| FP16/BF16 | 支持(具体数值未公开) |
| 显存容量 | 48 GB GDDR6 |
| 显存带宽 | 768 GB/s |
| TDP | 450 W |
| 互联 | MTLink(x8 Serdes,最高 56Gbps PAM4) |
| 接口 | PCIe 5.0 x16,4× DisplayPort |
| 供电 | CPU 8-pin × 1 |
| 发布 | 2023 年 12 月 |
| 量产 | 2024 年起 |
| 软件栈 | MUSA 软件栈(兼容 CUDA) |
MUSA 架构演进
| 架构 | 内核 | 代表产品 | 发布 |
|---|
| 第一代 MUSA | 春晓 | MTT S80/S70(消费级) | 2022 |
| 第二代 MUSA | 曲院(改进) | MTT S3000 | 2023 |
| 第三代 MUSA | 曲院 GPU | MTT S4000 | 2023.12 |
与 MTT S3000 对比
| 指标 | MTT S3000 | MTT S4000 | 提升 |
|---|
| 架构 | 第二代 MUSA | 第三代 MUSA(曲院 GPU) | 新一代 |
| 显存 | 未公开 | 48GB GDDR6 | 更大 |
| 带宽 | 未公开 | 768 GB/s | 更高 |
| FP32 | 未公开 | 25 TFLOPS | 公开数值 |
| TDP | 未公开 | 450W | 数据中心级 |
| 发布 | 2023 年 | 2023.12 | 同期改进 |
KUAE 智算中心解决方案
MTT S4000 是摩尔线程 KUAE 智算中心解决方案的核心组件:
- 千亿参数大模型训练、微调、推理全栈支持
- MTLink 多卡高速互联(x8 Serdes,56Gbps PAM4)
- MUSA 软件栈完整支持 PyTorch/DeepSpeed 等主流框架
- CUDA 兼容层,降低模型迁移成本
适用场景
- ✅ 千亿参数大模型训练(定制优化)
- ✅ 大模型推理即服务(INT8 200 TOPS)
- ✅ 图形渲染 + AI 混合负载(全功能 GPU)
- ✅ 视频编解码(8K HDR 显示输出)
- ✅ 国产智算中心(KUAE 解决方案)
- ❌ 超高 FP16 训练算力(25 TFLOPS FP32 低于 H100)
- ❌ 超大规模集群(MTLink 待验证 vs NVLink)
产品矩阵
| 系列 | 定位 | 代表产品 |
|---|
| MTT S 系列 | 服务器 GPU(数据中心) | S3000、S4000、S5000 |
| MTT S 系列(消费级) | 桌面 GPU | S80、S70 |
| KUAE | 智算中心解决方案 | S4000 + MTLink + MUSA 软件栈 |
相关卡
参考资料