Google Cloud TPU v7 (Ironwood)
产品概述
Google TPU v7(代号 Ironwood)是 2025 年发布的最新一代 TPU,专为推理时代设计。BF16 算力 2,307 TFLOPS(每芯片),HBM 容量 192GB(与 NVIDIA H200 / MI300X 同级),带宽 7,380 GB/s。Ironwood 是首批以推理为先的 TPU,FP8 算力 4,614 TFLOPS(每芯片)。
核心规格
| 项目 | 参数 |
|---|
| 架构 | TPU v7(Ironwood) |
| BF16 算力(每芯片) | 2,307 TFLOPS |
| FP8 算力(每芯片) | 4,614 TFLOPS |
| HBM 容量 | 192 GB |
| HBM 带宽 | 7,380 GB/s |
| ICI 互联带宽 | 1,200 GB/s(双向) |
| DCN 带宽 | 100 Gbps |
| TensorCores | 2/芯片 |
| SparseCores | 4/芯片 |
| Pod 规模 | 9,216 芯片 |
| 拓扑 | 3D Torus |
历代 TPU 对比
| 指标 | v4 | v5p | v6e (Trillium) | v7 (Ironwood) |
|---|
| BF16 算力 | 275 TFLOPS | 459 TFLOPS | 918 TFLOPS | 2,307 TFLOPS |
| FP8 算力 | N/A | 459 TFLOPS | 918 TFLOPS | 4,614 TFLOPS |
| HBM 容量 | 32 GB | 95 GB | 32 GB | 192 GB |
| HBM 带宽 | 1,200 GB/s | 2,575 GB/s | 1,638 GB/s | 7,380 GB/s |
| Pod 规模 | 4,096 | 8,960 | 256 | 9,216 |
Ironwood vs H200 / MI300X
| 指标 | TPU v7 | H200 | MI300X |
|---|
| 显存 | 192 GB | 141 GB | 192 GB |
| 带宽 | 7,380 GB/s | 4,800 GB/s | 5,300 GB/s |
| FP8 算力 | 4,614 TFLOPS | 3,958 TFLOPS | 2,614 TFLOPS |
关键优势:TPU v7 在显存带宽和 FP8 算力上领先。
厂商信息
关键特性
- 推理优先:相比前代侧重训练,Ironwood 优化推理
- 超大内存容量:192GB 可加载 70B+ 模型单芯片
- FP8 双倍 BF16:现代推理算力
- 3D Torus 9,216 芯片 Pod
适用场景
- LLM 推理(Gemini 3 / 4)
- 大规模 MoE 模型
- 多模态 AI 推理
- 嵌入密集型应用
相关产品对比