沐曦 曦思 N100
沐曦首款人工智能推理GPU,内置MXN100异构GPGPU处理器,2023年6月量产,INT8算力160 TOPS,面向云端数据中心AI推理场景。
核心规格
| 规格 | 参数 |
|---|---|
| 架构 | MXN100 异构 GPGPU(MetaX 自研) |
| 制程 | 7 nm(台积电,预估) |
| TDP | 75 W(预估) |
| 显存 | 8 GB HBM2E |
| 显存带宽 | 410 GB/s(预估) |
| FP32 算力 | 未公开 |
| FP16 算力 | 80 TFLOPS |
| INT8 算力 | 160 TOPS |
| 接口 | PCIe 4.0 x16(预估) |
| 视频处理 | 128路编码 / 96路解码,最高8K |
| 首发 | 2023-06-07(量产) |
| 价格 | 未公开(预估 ¥15,000) |
技术亮点
- MXN100 架构:沐曦自研异构GPGPU处理器,专为AI推理优化,支持混合精度计算
- 高密视频处理:支持128路编码和96路解码,兼容HEVC、H.264、AV1、AVS2等多种视频格式,最高支持8K分辨率
- MXMACA 软件栈:配套自研软件栈,支持多种主流AI框架、计算机视觉处理及多媒体处理框架
- HBM2E 显存:采用高带宽HBM2E显存,满足大语言模型推理的显存带宽需求
- 已规模量产:2023年6月已宣布实现规模量产,应用于安防、智慧城市等领域
产品定位
曦思N100是沐曦首款AI推理GPU,对标NVIDIA L4/T4推理卡,主打云端AI推理场景。作为沐曦产品矩阵中的推理专用产品,N100与曦云C系列(训推一体)形成互补。
应用场景
- 智慧城市/安防AI推理(视频分析)
- 云端CV/NLP推理服务
- 智能视频处理(转码、分析)
- 边缘推理服务器
- 大模型推理加速(INT8量化)
参考价格
| 渠道 | 价格 | 说明 |
|---|---|---|
| 官方定价 | 未公开 | 2023年量产,预估 ¥10,000–20,000/卡 |
| 渠道预估 | ≈ ¥15,000 | 基于L4定价比例估算 |