Skip to main content

晶圆级 AI 训练超算

晶圆级(Wafer-Scale)AI 训练芯片是将整片晶圆作为一个处理器的革命性架构,规避了传统 GPU 多芯片互联的瓶颈。CerebrasTesla Dojo 是这一领域的两大代表。

主流晶圆级训练系统

型号厂商晶体管数核心数片上 SRAM算力 (FP16 稀疏)系统算力状态
Cerebras WSE-4 (CS-4, 推测)Cerebras~5 万亿~1,500,000~80GB~200 PFLOPS~200 PFLOPS2027 预计
Cerebras WSE-3 (CS-3)Cerebras4 万亿900,00044GB125 PFLOPS125 PFLOPS2024
Cerebras WSE-2 (CS-2)Cerebras2.6 万亿850,00040GB~62 PFLOPS~62 PFLOPS2021
Tesla Dojo ExaPODTesla180,000 亿 (360× D1)127,440N/AN/A100 EFLOPs2023
Tesla Dojo CabinetTesla3,000 亿 (6× D1 Tile)2,124N/AN/A~1.7 EFLOPs2023
Tesla Dojo D1Tesla500 亿354N/A36.7 TFLOPS (BF16)2022

Cerebras WSE-2 vs WSE-3 vs WSE-4 (推测)

指标WSE-2 (CS-2)WSE-3 (CS-3)WSE-4 (CS-4, 推测)
制程TSMC 7nmTSMC 5nmTSMC 3nm
晶体管2.6 万亿4 万亿~5 万亿
核心数850,000900,000~1,500,000
片上 SRAM40GB44GB~80GB
FP16 稀疏算力~62 PFLOPS125 PFLOPS~200 PFLOPS
系统 TDP15 kW15 kW~30 kW
发布时间202120242027 预计

Cerebras WSE 关键特性

  • 无内存墙:所有数据片上 SRAM(无 HBM)
  • Weight Streaming:流式加载模型权重到 SRAM
  • 无模型并行:单芯片可训练超大模型
  • CS-3 系统液冷:15kW TDP
  • 集群方案:可互联多个 CS-3

Tesla Dojo 关键特性

  • D1 单芯片 354 核:定制架构
  • 6 颗 D1 = 1 Tile:高密度封装
  • ExaPOD = 360 颗 D1 = 100 EFLOPs:单集群冠绝全球
  • 专为 FSD 视频训练:特斯拉定制
  • 不外售:仅 Tesla 内部使用

选型建议

  • 大模型科研 / 制药 / 材料科学:Cerebras CS-3(云端租赁 Cerebras Cloud)
  • 自动驾驶 / 视频训练:Tesla Dojo(仅 Tesla 内部)
  • 云端 AI 服务:Cerebras Cloud 可访问

详细产品页

相关类型