Skip to main content

Cerebras Wafer Scale (WSE)

厂商: Cerebras (已 IPO)

分类: ASIC 专用加速卡

架构: CS-3

简介

Cerebras 晶圆级引擎(WSE-3)是目前最大的 AI 处理器,单芯片包含 4 万亿晶体管和 90 万个 AI 核心。专注于大模型训练,提供与其他集群相当的性能而无需分布式编程。2026年5月14日,Cerebras 在纳斯达克 IPO,首日估值约 $560亿

规格参数

型号算力显存/内存接口TDP制程
WSE-34 万亿晶体管,90万核心44GB 芯上 SRAMCS-2 Fabric20000+5nm
WSE-22.6 万亿晶体管,85万核心40GB 芯上 SRAMCS-2 Fabric20000+7nm

官方网站

访问官方网站

驱动下载

Linux

相关文档

操作系统支持

WindowsLinuxmacOSAndroid
✅ (Cerebras Cloud)

版本历史

版本发布时间说明
Cerebras Cloud 2.02024WSE-3 上线 + API 访问

性能基准

型号任务性能指标
WSE-3Llama 3 70B 推理~1800 tok/s (流水线)
WSE-3超长上下文推理支持 128K 上下文
WSE-2GPT-J 6B 训练数分钟完成

定价信息

型号参考价格备注
WSE-3云端 API 按量Cerebras Cloud / CSP
WSE-3需询价裸机部署

快速安装

Cerebras Cloud (API)

# 安装 Cerebras SDK
pip install cerebras-cloud-sdk

# 使用 Cerebras 推理 API
# 类似 OpenAI API 兼容接口

WSE 系列主要通过 Cerebras Cloud API 或合作伙伴云服务使用,不单独出售裸卡给终端用户。

代码示例

Python (Cerebras API)

from cerebras.cloud.sdk import Cerebras

# 兼容 OpenAI 接口
client = Cerebras(api_key="your-key")
response = client.chat.completions.create(
model="llama3.1-8b",
messages=[{"role": "user", "content": "你好"}],
max_tokens=100
)
print(response.choices[0].message.content)

架构特色

  • 晶圆级引擎 (WSE): 整个晶圆作为单个芯片,WSE-3 拥有 4 万亿晶体管、90 万 AI 核心
  • CS-3 系统: 16 个 WSE-3 互联,支持万亿参数模型训练
  • 零碎片: 晶圆级设计消除传统芯片互联瓶颈,延迟极低

模型兼容性

模型/框架支持情况备注
Llama 系列✅ 原生Cerebras 官方部署
大语言模型API 推理
训练框架⚠️通过 Cerebras PyTorch 扩展
自定义模型⚠️需联系 Cerebras 定制

大规模集群部署

基于全球 AI 超算集群数据统计,Cerebras WSE 在已公开的集群部署中累计超过 65 颗芯片,分布在 2 个集群中。

芯片型号统计

芯片型号总部署量集群数
Cerebras CS-2641
Cerebras CS-111

知名部署集群 Top 10

#集群名称芯片总数芯片型号运营方
1Condor Galaxy 1 (CG-1)64Cerebras CS-2 ×64G42,Cerebras Systems, United States of America
2Lawrence Livermore NL Lassen Phase 21Cerebras CS-1 ×1US Department of Energy, United States of America

相关产品

如果你在评估替代方案,以下产品可能也适合你的场景: