跳到主要内容

Google Cloud TPU v5p

产品概述

Google TPU v5p(v5 Premium)是 Google 第五代 Premium TPU,2023 年发布,专注于大规模 LLM 训练(如 Gemini)。459 TFLOPS BF16 算力95GB HBM,单 Pod 规模 8,960 芯片。通过 3D Torus + OCS(光路交换机)互联,仅通过 Google Cloud 提供。

核心规格

项目参数
架构Google TPU v5p(脉动阵列)
制程TSMC 5nm
BF16 算力(每芯片)459 TFLOPS
INT8 算力(每芯片)459 TOPS
HBM 容量95 GB
HBM 带宽2,575 GB/s
ICI 互联带宽1,200 GB/s(双向)
DCN 带宽50 Gbps
Pod 规模8,960 芯片(4×4×4×140 3D Torus)
散热液冷
提供方式仅 Google Cloud

TPU v5p vs v5e vs v4

指标v4v5ev5p
BF16 算力275 TFLOPS197 TFLOPS459 TFLOPS
HBM 容量32 GB16 GB95 GB
带宽1,200 GB/s400 GB/s2,575 GB/s
Pod 规模4,0962568,960
定位训练推理训练

厂商信息

项目内容
制造商Google LLC
官网https://cloud.google.com/tpu
产品页https://cloud.google.com/tpu/docs/v5p
仅限Google Cloud Platform

软件

关键特性

  • 脉动阵列(Systolic Array):矩阵乘法高效
  • 3D Torus 互联 + OCS 光交换机
  • Pathways 编排:可扩展到多个 Pod
  • JAX 一等公民

适用场景

  • LLM 训练(Gemini、PaLM)
  • 推荐系统
  • 多模态模型

相关产品对比