燧原科技 云燧 S60
燧原科技第三代人工智能推理加速卡,基于自研 GCU320(邃思320)芯片,2024年3月发布,单卡典型功耗约300W,面向数据中心大规模部署。
核心规格
| 规格 | 参数 |
|---|---|
| 架构 | GCU320(邃思320) |
| 制程 | 7 nm(预估) |
| TDP | 300 W(典型) |
| 显存 | 48 GB HBM2e(预估) |
| 显存带宽 | 1.6 TB/s(预估) |
| FP32 算力 | 25 TFLOPS(预估) |
| FP16 / BF16 算力 | 100 TFLOPS(预估) |
| INT8 算力 | 200 TOPS(预估) |
| 接口 | PCIe 5.0 x16,全高全长 |
| 发布 | 2024-03 |
| 价格 | 未公开(预估 ¥35,000) |
技术亮点
- 第三代推理卡:基于邃思320(GCU320)芯片,是燧原科技第三代AI推理产品
- 大模型推理优化:专为 LLaMA、GPT 等大语言模型推理场景优化
- 搜广推支持:支持搜索、广告、推荐系统的高并发推理场景
- 易迁移:模型覆盖面广、易用性强,支持从 NVIDIA GPU 平滑迁移
- 高密度部署:典型功耗300W,适合大规模数据中心部署
产品定位
云燧S60是燧原科技面向数据中心大规模部署的新一代AI推理加速卡,对标NVIDIA L4/L40。作为第三代产品,S60在算力、显存、带宽等方面均有显著提升。
应用场景
- 大语言模型推理(LLaMA、GPT、ChatGLM等)
- 搜索、广告、推荐系统推理
- 计算机视觉推理(CV)
- 自然语言处理推理(NLP)
- 数据中心大规模推理部署
参考价格
| 渠道 | 价格 | 说明 |
|---|---|---|
| 官方定价 | 未公开 | 2024年发布,预估 ¥30,000–40,000/卡 |
| 渠道预估 | ≈ ¥35,000 | 基于L4定价比例估算 |