产品概述
载天VA10 是瀚博半导体(Vastai Tech)于 2022年9月3日 在2022世界人工智能大会上发布的首款数据中心AI推理加速卡,搭载自研 SV100 芯片,采用 7nm 制程,INT8 峰值算力达 400 TOPS,功耗仅 150W,整体最高推理性能达到同功耗主流GPU的 2倍以上,是国产AI推理卡的重要突破。
定位:数据中心AI推理加速(低延时、高吞吐),支持直播视频增强、智慧交通管理、实时语义理解等高实时性云端AI应用部署场景。
核心规格
| 项目 | 参数 |
|---|
| 架构 | 瀚博统一计算架构 VUCA(SV100 芯片) |
| 制程 | 7nm |
| INT8 算力 | 400 TOPS |
| FP16 算力 | 未公开(推测 ~200 TFLOPS) |
| TDP | 150 W |
| 板卡形态 | PCIe(具体接口版本未公开) |
| 发布 | 2022-09-03(2022世界人工智能大会) |
| 量产时间 | 2022-Q4 |
| 视频编解码 | 支持 100路 1080P 30帧编解码转码 |
| 适用场景 | 直播视频增强、智慧交通、实时语义理解 |
瀚博统一计算架构 VUCA
| 组件 | 说明 |
|---|
| AI 引擎 | 超低延时、超高吞吐AI推理引擎 |
| 矢量计算引擎 | 可编程矢量计算 |
| 视频处理引擎 | 流媒体、视频编解码加速 |
| VastStream API | 统一API接口,支持PyTorch/TensorFlow适配 |
与同功耗主流GPU对比
| 指标 | 载天VA10 | 同功耗主流GPU | 对比 |
|---|
| INT8 算力 | 400 TOPS | ~200 TOPS | 2× |
| 功耗 | 150W | 150W | 持平 |
| 低延时场景(YoloV3 <4ms) | 3× 性能 | 基准 | VA10 优势 |
| 视频编解码 | 100路 1080P | 较少 | VA10 优势 |
厂商信息
产品线
| 产品 | 发布 | 定位 | 状态 |
|---|
| 载天VA10 | 2022-09 | AI推理加速卡 | ✅ 量产 |
| 载天VE1S/VE1M | 2022-09 | 边缘AI推理 | ✅ 量产 |
| SG100(乾元) | 2023-07 | 第二代全功能GPU | ✅ 发布 |
| 南禺 VG1600/VG1800 | 2023-07 | 数据中心GPU加速卡 | ✅ 发布 |
| VA1L | 2023-07 | LLM大模型AI加速卡 | ✅ 发布 |
适用场景
- ✅ 直播视频增强(100路1080P实时处理)
- ✅ 智慧交通管理(低延时YoloV3检测)
- ✅ 实时语义理解(高实时性AI推理)
- ✅ 数据中心推理部署(150W低功耗,高性价比)
- ❌ AI训练(推理专用)
- ❌ 图形渲染(无渲染引擎)
相关产品
参考资料