Skip to main content

NVIDIA H100 (Hopper)

产品概述

NVIDIA H100 是基于 Hopper 架构 GH100 芯片的旗舰级数据中心 GPU,2022 年发布,是当前(2025 年)大语言模型训练和推理的事实标准。它引入了 Transformer Engine(FP8 精度动态加速)和 DPX 指令集(动态规划算法加速)。

核心规格

项目参数
架构Hopper GH100
制程TSMC 4N(定制 5nm)
晶体管数800 亿
显存80 GB HBM3
显存带宽3.35 TB/s(3,352 GB/s)
CUDA Core16,896
Tensor Core528 个(第四代)
FP3260 TFLOPS
FP6434 TFLOPS(双精度 HPC 重要)
TF32 Tensor Core989 TFLOPS(稀疏)
FP16/BF16 Tensor Core1,979 TFLOPS(稀疏)
FP8 Tensor Core3,958 TFLOPS(稀疏)
INT8 Tensor Core3,958 TOPS(稀疏)
TDP700 W(SXM5)
互联NVLink 4.0(900 GB/s),PCIe 5.0
MIG最多 7 个实例
形式SXM5 / PCIe 5.0

厂商信息

项目内容
制造商NVIDIA Corporation
官网https://www.nvidia.com
产品页https://www.nvidia.com/en-us/data-center/h100/
发布2022 年 3 月 GTC 大会
停产大部分渠道已被 H200 / Blackwell 替代

软件与驱动

资源链接
数据中心驱动https://www.nvidia.com/Download/index.aspx
CUDA Toolkithttps://developer.nvidia.com/cuda-toolkit
TensorRThttps://developer.nvidia.com/tensorrt
NVIDIA AI Enterprisehttps://www.nvidia.com/en-us/data-center/products/ai-enterprise/
NCCL(多卡通信)https://developer.nvidia.com/nccl

关键特性

  • Transformer Engine:自动在 FP8 与 FP16 之间切换,加速 Transformer 训练
  • 第四代 Tensor Core:支持 FP8(E4M3、E5M2)
  • DPX 指令:硬件加速动态规划算法
  • MIG:单卡虚拟化为最多 7 个独立 GPU
  • NVLink 4.0 + NVSwitch 3.0:服务器内 900 GB/s 互联

适用场景

  • LLM 训练与微调
  • 推荐系统与多模态 AI
  • HPC 科学计算
  • 大规模分布式训练集群

相关产品对比