Skip to main content

燧原科技 云燧 S60

燧原科技第三代人工智能推理加速卡,基于自研 GCU320(邃思320)芯片,2024年3月发布,单卡典型功耗约300W,面向数据中心大规模部署。


核心规格

规格参数
架构GCU320(邃思320)
制程7 nm(预估)
TDP300 W(典型)
显存48 GB HBM2e(预估)
显存带宽1.6 TB/s(预估)
FP32 算力25 TFLOPS(预估)
FP16 / BF16 算力100 TFLOPS(预估)
INT8 算力200 TOPS(预估)
接口PCIe 5.0 x16,全高全长
发布2024-03
价格未公开(预估 ¥35,000)

技术亮点

  • 第三代推理卡:基于邃思320(GCU320)芯片,是燧原科技第三代AI推理产品
  • 大模型推理优化:专为 LLaMA、GPT 等大语言模型推理场景优化
  • 搜广推支持:支持搜索、广告、推荐系统的高并发推理场景
  • 易迁移:模型覆盖面广、易用性强,支持从 NVIDIA GPU 平滑迁移
  • 高密度部署:典型功耗300W,适合大规模数据中心部署

产品定位

云燧S60是燧原科技面向数据中心大规模部署的新一代AI推理加速卡,对标NVIDIA L4/L40。作为第三代产品,S60在算力、显存、带宽等方面均有显著提升。


应用场景

  • 大语言模型推理(LLaMA、GPT、ChatGLM等)
  • 搜索、广告、推荐系统推理
  • 计算机视觉推理(CV)
  • 自然语言处理推理(NLP)
  • 数据中心大规模推理部署

参考价格

渠道价格说明
官方定价未公开2024年发布,预估 ¥30,000–40,000/卡
渠道预估≈ ¥35,000基于L4定价比例估算

相关产品


参考资料