Skip to main content

Tesla Dojo v2 (2025 推测)

:::warning 推测内容 本页规格基于 Tesla 2024-10 We Robot 发布 + Elon Musk 公开声明 + 行业分析师推测。Tesla 官方尚未发布 Dojo v2 完整规格正式数据以 2025 H2 实际发布为准。 :::

产品概述

Tesla Dojo v2(代号 Dojo 2)是 Tesla 第二代训练 AI 芯片预计 2025 H2 发布。基于 TSMC 3nm 制程1 PFLOPS FP8 dense 算力,Tesla 自研 D1 第二代芯片2nd Gen Fabric 互联。配套 PyTorch + Tesla Dojo SDK,主攻 FSD(Full Self-Driving)v13/v14 + Optimus 机器人 + Robotaxi 训练

战略意义:Tesla 是 唯一既造车又自研 AI 训练芯片的公司(Apple 是 Mobile 端、Meta 是 GPU 集群、Microsoft/OpenAI 用 NVIDIA)。Dojo v2 是 Tesla 从 NVIDIA H100 依赖转向自研的关键产品。

核心规格(推测)

项目参数
架构Tesla D1 第二代
制程TSMC 3nm (N3)
计算核心每 D2 芯片 256 个 SCD(Single Core for Dojo)
SCD 算力4 TFLOPS FP8 dense(推测)
D2 芯片1 PFLOPS FP8 dense(256 × 4 TF)
Tile5×5 D2 = 25 芯片 / tile
Tile 算力25 PFLOPS
Cabinet2 tile = 50 芯片 / cabinet
Cabinet 算力50 PFLOPS
ExaPod8 cabinet = 400 芯片 / ExaPod
ExaPod 算力400 PFLOPS FP8
互联2nd Gen Fabric(2 TB/s 双向,vs D1 1.6 TB/s)
TDP(ExaPod)~150 kW
量产2025 H2
价格(ExaPod)~$5-10M(推测)

Tesla Dojo 演进

代际发布制程算力互联用途
Dojo v12023-077nm362 PFLOPS ExaPod1.6 TB/sFSD v12
Dojo v22025 H23nm400-500 PFLOPS ExaPod2 TB/sFSD v13/v14
Dojo v3 (推测)2027+2nm1 EFLOPS ExaPod4 TB/sOptimus Gen 3 / Robotaxi

Dojo v1 (D1 芯片) 已知规格

项目参数
架构Tesla D1
制程TSMC 7nm
晶体管数500 亿
核心数354 个 SCD(Single Core for Dojo)
每 SCD64-bit 标量 + 64×64 矩阵 + 16×16 SIMD
每 SCD 算力1 TFLOPS BF16
D1 芯片362 TFLOPS BF16
Tile5×5 = 25 颗 D1 芯片
Tile 算力9 PFLOPS BF16
Cabinet2 个 tile = 50 颗 D1
ExaPod10 个 cabinet = 500 颗 D1 = 1.1 EFLOPS BF16

Dojo v1 ExaPod 已知:1.1 EFLOPS BF16(已部署 7 个 ExaPod,共 ~7.7 EFLOPS)

Dojo v1 vs Dojo v2 对比

指标Dojo v1 (2023-07)Dojo v2 (2025 H2 推测)提升
芯片D1D2新代
制程7nm3nm新代
SCD 数354256(推测)-27%
单 SCD 算力1 TF BF164 TF FP8(推测)
单芯片算力362 TF BF161 PF FP8(推测)2.7×
Tile5×5 = 25 芯片5×5 = 25 芯片
Cabinet2 tile = 50 芯片2 tile = 50 芯片
ExaPod10 cabinet = 500 芯片8 cabinet = 400 芯片优化
ExaPod 算力1.1 EF BF16400-500 PF FP830-50% 提升
Fabric 带宽1.6 TB/s2 TB/s+25%
TDP1+ MW~150 kW大幅节能

Dojo SDK 软件栈

层级工具说明
AI 框架PyTorchTesla 主要使用 PyTorch(vs NVIDIA 主推 CUDA)
JAX实验
编译器Dojo Compiler自动向量化 + 矩阵优化
运行时Dojo RuntimeExaPod 调度
Python APIdojo.torch类 torch.device('dojo')
分布式Dojo Fabric跨 ExaPod 通信
可视化Dojo VisualizerExaPod 3D 实时监控

Dojo 软件优势PyTorch 原生支持(vs Cerebras 需 SDK 转换),Tesla 自研 5 年

Tesla 自研 Dojo 战略

维度2023-20242025-2026 推测2027+ 推测
FSD 训练Dojo v1 + NVIDIA H100Dojo v2Dojo v3
机器人-Optimus 训练Optimus Gen 3
Robotaxi-Robotaxi 训练商业化
Dojo 部署7 ExaPod20+ ExaPod50+ ExaPod
算力~7.7 EF~10-20 EF50+ EF
NVIDIA 依赖50% 训练30% 训练10% 训练
成本节省-~$2B/年 vs 全部 NVIDIA$5B/年

Dojo 战略意义:**Tesla 是唯一既自研训练芯片 + 自研推理芯片(FSD Computer)+ 自研数据(Tesla Fleet)**的公司。Dojo 让 Tesla AI 完全垂直整合

客户(仅 Tesla 内部)

场景用途
FSD v12(2024-Q4)端到端神经网络训练
FSD v13(2025 H1)Dojo v1 训练
FSD v14(2025 H2)Dojo v2 训练
Optimus Gen 2(2025)机器人 AI 训练
Robotaxi(2026)L4-L5 自动驾驶训练
xAI Grok备用(Tesla 与 xAI 合作)

厂商信息

项目内容
公司Tesla, Inc.
业务部门Tesla AI / Dojo 团队(Palo Alto + Austin)
Dojo 团队200+ 工程师(前 AMD / Apple / Intel)
代工TSMC 3nm (Dojo v2)
2024 投入$5B+(Dojo 研发 + 制造)
目标FSD / Optimus / Robotaxi 全栈 AI 训练
状态持续迭代(每年新代)

适用场景

  • FSD 自动驾驶(v13/v14 训练)
  • Optimus 机器人(Gen 2/3 训练)
  • Robotaxi L4-L5(2026 商业化)
  • Tesla 内部分布式训练(20+ ExaPod)
  • 成本节省(vs NVIDIA H100 $30K/卡)
  • Tesla 外部销售(仅 Tesla 内部)
  • CUDA 兼容(需 Dojo SDK 移植)
  • 推理部署(仅训练)

与 NVIDIA H100 集群对比(Dojo v2 ExaPod vs 1,000×H100)

指标Dojo v2 ExaPod (400 芯片)1,000× NVIDIA H100
FP8400 PF1.5 PF sparse (400W/H100)
FP16~200 PF1 PF sparse
TDP150 kW700 kW
能效2.67 TF/W2.16 TF/W
价格~$5-10M~$25-30M
软件Dojo SDKCUDA
训练 LLM 405B~7 天(推测)~3 天
训练 FSD 网络数小时数天(Tesla 报告)

Dojo vs NVIDIA 集群能效 1.2× + 价格 50% + FSD 训练专项优化Tesla 2025+ 减少 50% NVIDIA 依赖

Dojo v2 关键时间线(推测)

时间事件
2023-07Dojo v1 ExaPod 启用(Tesla 7 个 ExaPod)
2024-08FSD v12 端到端 NN(部分 Dojo 训练)
2024-10We Robot 发布 Optimus Gen 2 / Robotaxi(提及 Dojo v2)
2025 H2Dojo v2 发布(推测)
2026Optimus Gen 3 + Robotaxi 商业化(Dojo v2 训练)
2027+Dojo v3 发布(2nm)

关键特性

  • D2 自研芯片:Tesla 100% 自研(vs NVIDIA 商用)
  • 3nm TSMC:与 NVIDIA B200 同代
  • 1 PFLOPS 单芯片:业界领先训练专用
  • 2 TB/s Fabric:跨 ExaPod 高带宽
  • PyTorch 原生:vs Cerebras 需 SDK 转换
  • FSD / Optimus / Robotaxi 全栈:Tesla 唯一垂直整合
  • 缺点:仅 Tesla 内部、生态 2 年、单 Tesla 客户

相关卡