天数智芯 天垓150 (BI-V150)
产品概述
天数智芯天垓150(BI-V150) 是天数智芯(Iluvatar CoreX)面向云端训练市场推出的通用GPU加速卡,2023年发布,2024年量产。基于天数智芯自主研发的 ivcore11 通用GPU架构,采用 7nm 制程工艺和 2.5D CoWoS封装技术,旨在为AI训练、高性能计算等场景提供国产算力解决方案。
产品定位:国产通用GPU训练卡,兼容CUDA生态,支持FP32、FP16、INT8多精度计算。
核心规格
| 项目 | 参数 |
|---|---|
| 架构 | ivcore11(第二代通用GPU架构) |
| 制程 | TSMC 7nm |
| 封装 | 2.5D CoWoS |
| FP32 | 48 TFLOPS |
| FP16 | ~192 TFLOPS(推算) |
| INT8 | ~384 TOPS(推算) |
| 显存 | 64 GB HBM2e |
| 显存带宽 | ~2 TB/s(推算) |
| TDP | 350 W |
| 接口 | PCIe 4.0 x16 |
| 发布 | 2023年 |
| 量产 | 2024年 |
| 产品形态 | 风冷PCIe加速卡 / OAM模组 |
数据说明:
- ✅ FP32、显存、TDP为官方数据或可靠评测
- ⚠️ FP16、INT8、显存带宽为推算值,官方未公布,待验证
产品特点
1. 全自研架构
- ivcore11架构:天数智芯第二代通用GPU架构,拥有完整指令集系统
- 兼容CUDA生态:支持CUDA C++编程,迁移成本低
- 多精度支持:FP32、FP16、INT8、FP8(需ixTE库)
2. 大显存容量
- 64GB HBM2e:支持大规模模型训练
- 高带宽:~2 TB/s显存带宽(推算)
3. 软件栈IXUCA
- 兼容主流框架:TensorFlow、PyTorch、PaddlePaddle
- 完整工具链:编译器、数学库、通信库、管理工具
- 无缝迁移:高度兼容CUDA生态,迁移时间下降50%以上
软件栈:IXUCA
IXUCA(Iluvatar Unified Computing Architecture)是天数智芯自主研发的统一计算架构软件栈。
| 组件 | 名称 | 功能 | 对标 |
|---|---|---|---|
| 深度学习框架 | PyTorch-Cambricon、TensorFlow-Cambricon | 适配版深度学习框架 | PyTorch、TensorFlow |
| 推理框架 | IGIE | 高性能推理框架 | TensorRT |
| 推理引擎 | IxRT | 专用推理加速引擎 | TensorRT |
| 大模型推理框架 | IxFormer | 大模型推理和训练优化 | vLLM |
| 编译器 | IXUCA Compiler | 编译器 | nvcc |
| 数学库 | ixDNN、ixBLAS | 深度学习基础算子 | cuDNN、cuBLAS |
| 通信库 | ixCCL | 多卡通信库 | NCCL |
| 管理工具 | ixsmi | GPU管理工具 | nvidia-smi |
适用场景
- ✅ AI模型训练(CNN、RNN、Transformer等)
- ✅ 高性能计算(HPC)
- ✅ 大模型预训练(需多卡并联)
- ✅ 国产化替代项目(政府、国企、军工)
- ❌ 顶级前沿模型训练(算力限制)
- ❌ 国际市场(受美国出口管制影响)
性能对标
| 指标 | 天垓150 | A100 80GB | 差距 |
|---|---|---|---|
| FP32 | 48 TFLOPS | 19.5 TFLOPS | +146% |
| 显存 | 64 GB | 80 GB | -20% |
| TDP | 350W | 400W | -12.5% |
说明:天垓150的FP32算力高于A100(可能是因为不同精度定义或测试条件),但实际训练性能还需考虑软件栈优化程度。
厂商信息
| 项目 | 内容 |
|---|---|
| 公司 | 上海天数智芯半导体有限公司 |
| 英文名称 | Iluvatar CoreX |
| 成立 | 2015年 |
| 创始人 | 刁石京 |
| 总部 | 上海 |
| 定位 | 国产通用GPU芯片设计公司 |
| 官网 | https://www.iluvatar.com |
| 软件栈 | https://support.iluvatar.com |
相关产品
- 智铠100(MR-V100) - 推理GPU(页面待创建)
- 天垓100(BI-V100) - 第一代训练GPU(页面待创建)
- Huawei Ascend 910C - 国产最强AI训练芯片
- Cambricon MLU690 - 国产AI训练芯片
- 完整对比表
待补充信息
- FP16/INT8官方算力数据
- 显存带宽官方数据
- 实际训练性能测试(ResNet、BERT、LLM等)
- 多卡扩展性能(ixCCL)
- 能效比测试
数据来源:
- 什么值得买开箱评测(2026-01-08)
- 模力方舟产品文档
- 天数智芯官方资料
最后更新:2026-06-28