跳到主要内容

瀚博半导体 载天VA10 (2022)

产品概述

载天VA10 是瀚博半导体(Vastai Tech)于 2022年9月3日 在2022世界人工智能大会上发布的首款数据中心AI推理加速卡,搭载自研 SV100 芯片,采用 7nm 制程INT8 峰值算力达 400 TOPS功耗仅 150W,整体最高推理性能达到同功耗主流GPU的 2倍以上,是国产AI推理卡的重要突破。

定位数据中心AI推理加速(低延时、高吞吐),支持直播视频增强、智慧交通管理、实时语义理解等高实时性云端AI应用部署场景。

核心规格

项目参数
架构瀚博统一计算架构 VUCA(SV100 芯片)
制程7nm
INT8 算力400 TOPS
FP16 算力未公开(推测 ~200 TFLOPS)
TDP150 W
板卡形态PCIe(具体接口版本未公开)
发布2022-09-03(2022世界人工智能大会)
量产时间2022-Q4
视频编解码支持 100路 1080P 30帧编解码转码
适用场景直播视频增强、智慧交通、实时语义理解

瀚博统一计算架构 VUCA

组件说明
AI 引擎超低延时、超高吞吐AI推理引擎
矢量计算引擎可编程矢量计算
视频处理引擎流媒体、视频编解码加速
VastStream API统一API接口,支持PyTorch/TensorFlow适配

与同功耗主流GPU对比

指标载天VA10同功耗主流GPU对比
INT8 算力400 TOPS~200 TOPS
功耗150W150W持平
低延时场景(YoloV3 <4ms)3× 性能基准VA10 优势
视频编解码100路 1080P较少VA10 优势

厂商信息

项目内容
公司瀚博半导体(Vastai Tech)
成立2018-12
总部中国上海
创始人钱军(前AMD高管)
产品页https://www.vastaitech.com/product/general/va10
软件栈VastStream(类CUDA API)
状态已量产,第二代SG100已发布

产品线

产品发布定位状态
载天VA102022-09AI推理加速卡✅ 量产
载天VE1S/VE1M2022-09边缘AI推理✅ 量产
SG100(乾元)2023-07第二代全功能GPU✅ 发布
南禺 VG1600/VG18002023-07数据中心GPU加速卡✅ 发布
VA1L2023-07LLM大模型AI加速卡✅ 发布

适用场景

  • 直播视频增强(100路1080P实时处理)
  • 智慧交通管理(低延时YoloV3检测)
  • 实时语义理解(高实时性AI推理)
  • 数据中心推理部署(150W低功耗,高性价比)
  • AI训练(推理专用)
  • 图形渲染(无渲染引擎)

相关产品

参考资料