跳到主要内容

Biren 壁仞 BR104 (国产 AI 训练/推理)

产品概述

壁仞科技(Biren Technology) 是中国 AI 芯片创业公司,2019-09 成立,总部上海。BR104 是其首款量产 AI 训练/推理芯片,2022-Q3 发布7nm 工艺1024 TOPS INT8 算力(约 H100 的 2×),64GB HBM2E 内存,896 GB/s 带宽。配套自研 BIRENSUPA 软件栈(类 CUDA)。

战略地位:壁仞与摩尔线程、景嘉微、芯原微电子、天数智芯并称"国产 AI 创业五虎"。融资 $700M+(B 轮 2021-Q1 创中国半导体单笔融资纪录),目标科创板 IPO(2026-2027 预计)。

核心规格

项目参数
架构Biren BR104(自研)
制程TSMC 7nm(2022 量产时),未来 SMIC 国产化
GPU 核心2 颗 BR104 小芯片(双 chiplet)
计算核心64× Biren 私有 ISA(类 GPGPU)
HBM64GB HBM2E
内存带宽896 GB/s
INT81024 TOPS
BF16256 TFLOPS
FP32128 TFLOPS
TDP300 W
板卡形态PCIe Gen4 ×16
互连BirenLink(自研,类 NVLink)
量产2022-Q4
单价~$3,500-5,500

双小芯片设计

维度规格
小芯片数2× BR104 计算芯片
封装CoWoS(TSMC 封装)
互连内部 SerDes,400 GB/s 双向
HBM32GB × 2(双芯片各带)
单芯片 INT8512 TOPS
双芯片 INT81024 TOPS(理论,可叠加)
优势良率高(双小芯片 vs 单大芯片)
劣势内部互连延迟略高

壁仞 7nm 双小芯片 vs 华为 7nm 双小芯片:两家都采用相同架构规避 SMIC 7nm 良率问题。壁仞 BR104 早华为 Ascend 910C 1 年(2022 vs 2023)

与 NVIDIA H100 对比

指标Biren BR104NVIDIA H100差异
INT81024 TOPS1513 TOPSH100 +48%
BF16256 TF756 TFH100 3×
内存64GB HBM2E80GB HBM3H100 +25%
带宽896 GB/s3.35 TB/sH100 3.7×
TDP300W700WBR104 -57%
软件BIRENSUPACUDAH100 成熟
价格~$4K~$25-30KBR104 -85%

BR104 优势TDP 仅 300W(H100 57% 节能)价格 15% H100国产化设计。在 H100 出口管制背景下是重要国产替代方案

BIRENSUPA 软件栈

层级工具对标 NVIDIA
AI 框架PyTorch-BIRENPyTorch + CUDA
TensorFlow-BIRENTensorFlow
BIRENSUPA统一计算平台
编译器BPA Compilernvcc
运行时BIRENSUPA RuntimeCUDA Runtime
数学库BIREN BblascuBLAS
深度学习库BIREN DNNcuDNN
通信库BIREN CollectiveNCCL

⚠️ 生态限制:相比 CUDA 18 年生态,BIRENSUPA 仅 3-4 年,算子覆盖率约 60-70%(vs CUDA 99%+),复杂 LLM 模型迁移需大量手工优化

厂商信息

项目内容
公司壁仞科技(Biren Technology)
创始人张文(CEO,前商汤科技副总裁)
成立2019-09
总部上海市浦东新区
融资$700M+(B 轮 2021-Q1 创中国半导体单笔融资纪录)
估值(2025)~¥30B
2025 营收~¥1.5B
员工~1500 人
状态准备科创板 IPO(2026-2027 预计)
主要客户中国移动、浪潮、联想、字节跳动、智谱 AI、商汤
生态合作飞桨(PaddlePaddle)、昇思(MindSpore)、阿里平头哥

国产 AI 创业五虎

公司成立代表产品算力融资状态
壁仞科技2019BR1041024 INT8 TOPS$700M+准备 IPO
摩尔线程2020MTT S5000100 INT8 TOPS$500M+准备 IPO
天数智芯 Iluvatar2018MR 100/200256 INT8 TOPS$400M+港股上市
寒武纪 Cambricon2016MLU 590256 INT8 TOPS科创板上市上市公司
景嘉微2006JM9军用为主创业板上市上市公司

关键特性

  • 双小芯片 7nm:规避 SMIC 7nm 良率问题
  • 1024 INT8 TOPS:国产 AI 芯片前列
  • TDP 300W:比 H100 省 57% 功耗
  • 国产软件栈:BIRENSUPA 完全自研
  • 缺点:FP8 不支持、ROCm/CUDA 兼容弱、生态 3-4 年

适用场景

  • 国产 AI 训练(H100 出口管制替代)
  • LLM 训练(256 BF16 TF + 64GB HBM2E)
  • 政府/国企 AI 项目(国产化政策强制)
  • 智算中心建设("东数西算"枢纽)
  • 互联网公司(字节、商汤、智谱)
  • ❌ 国际市场(无 CUDA 兼容)
  • ❌ 顶级前沿 FP8 模型训练

Biren 产品线

产品发布算力状态
BR1042022-Q41024 INT8 TOPS量产
BR106 (推测)2025 H22048 INT8 TOPS路线图
BR200 (推测)2026 H24096 INT8 TOPS路线图

相关卡