跳到主要内容

Apple M1 Ultra (128GB 统一内存)

产品概述

Apple M1 Ultra 是 Apple Silicon 第一代 Ultra 旗舰2022-03-08 WWDC 发布。通过 UltraFusion 互连(第一代) 将两片 M1 Max 芯片合并为单芯片,128GB 统一内存 + 800 GB/s 内存带宽业界首款消费级 128GB UMA 方案),是 Apple Silicon 史上里程碑产品。

历史地位:M1 Ultra 是 Apple Silicon Ultra 系列开山之作,为后续 M2/M3/M4/M5 Ultra 奠定了架构基础。Mac Studio 2022 首发2023-06 被 M2 Ultra 替代

核心规格

项目参数
架构Apple Silicon (M1 Max × 2, UltraFusion 1.0)
制程TSMC 5nm
CPU 核心20(16P + 4E)
GPU 核心64
Neural Engine32-core, 22 TOPS
统一内存64GB / 128GB LPDDR5
内存带宽800 GB/s
FP32 GPU21 TFLOPS
FP16 GPU42 TFLOPS
媒体引擎硬件 H.264/HEVC/ProRes
TDP60-120 W
首发价Mac Studio M1 Ultra 128GB: $5,999(2022-03 首发价)
首发日期2022-03-18(Mac Studio 首发)
停产2023-06(M2 Ultra 替代)

UltraFusion 1.0 互连

维度UltraFusion 1.0 (M1)UltraFusion 2.0 (M3+)
带宽2.5 TB/s2.5 TB/s
通道4 通道4 通道
延迟~100ns~80ns
首次出现2022 M1 Ultra2023 M3 Ultra

关键技术

  • 裸片间硅中介层(Interposer):TSMC CoWoS 类似
  • 对软件透明:系统显示为单芯片
  • 统一内存池:CPU/GPU/Neural Engine 均可访问 128GB

Apple Silicon 演进时间线

代际旗舰制程内存带宽CPU 核GPU 核NE
M1M1 Ultra (2022)5nm128GB800 GB/s20 (16P+4E)6422 TOPS
M2M2 Ultra (2023)5nm192GB800 GB/s24 (16P+8E)7631.6 TOPS
M3M3 Ultra (2023-12)3nm256GB800 GB/s32 (24P+8E)8072 TOPS
M4M4 Ultra (2025-Q4 推测)3nm256GB819 GB/s32 (24P+8E)8076 TOPS
M5M5 Ultra (2026 H2 推测)2nm384GB~1 TB/s40 (24P+16E)96-120~120 TOPS

与 M1 Max 对比

指标M1 UltraM1 Max提升
制程5nm5nm
CPU 核心20 (16P+4E)10 (8P+2E)
GPU 核心6432
Neural Engine22 TOPS11 TOPS
内存128GB LPDDR564GB LPDDR5
带宽800 GB/s400 GB/s
UltraFusion2.5 TB/s(双 Max 互联)-新增
价格(Mac Studio 128GB)$5,999$3,999+50%

本地 LLM 推理性能(128GB 版本)

模型量化性能(tok/s)备注
Llama 2 7BFP16~35 tok/s主流
Llama 2 13BQ4_K_M~18 tok/s性能限制
Llama 2 70BQ4_K_M~3-4 tok/s128GB 可装量化版
Llama 1 65BQ4_K_M~4 tok/s早期
Mistral 7BQ4_K_M~38 tok/s极快
Falcon 40BQ4_K_M~6 tok/s
MPT 30BFP16~5 tok/s完整可载
Code Llama 34BQ4_K_M~7 tok/s编程

128GB M1 Ultra 意义2022 年首次让消费级硬件跑 70B LLM(虽然需要 Q4 量化),价格 $5,999(远低于 NVIDIA DGX Station $50K+)。

厂商信息

项目内容
厂商Apple Inc.
产品Mac Studio(2022-03 首发,2023-06 停产)
Mac Studio M1 Ultra 128GB$5,999(2022-03 首发价)
停产2023-06(M2 Ultra 替代)
目标市场创作者、本地 AI(早期)、ML 研究者
历史地位Apple Silicon Ultra 系列开山之作

适用场景

  • 本地 LLM 推理(128GB UMA,2022 革命性)
  • ✅ Stable Diffusion 1.x 图像生成
  • ✅ Final Cut Pro / Logic Pro 硬件加速
  • ✅ 4K 视频编辑
  • ✅ 早期 Apple Silicon 端侧 AI 开发
  • ❌ 数据中心训练
  • ❌ 大规模推理
  • ❌ FP8 训练(仅 FP16/BF16)

M1 Ultra vs M2 Ultra vs M3 Ultra

指标M1 Ultra (2022)M2 Ultra (2023)M3 Ultra (2023-12)
制程5nm5nm (N5P)3nm
CPU 核20 (16P+4E)24 (16P+8E)32 (24P+8E)
GPU 核647680
NE22 TOPS31.6 TOPS72 TOPS
内存128GB LPDDR5192GB LPDDR5256GB LPDDR5
带宽800 GB/s800 GB/s800 GB/s
价格$5,999$5,499$5,899

关键特性

  • UltraFusion 1.0:业界首款消费级芯片间硅互连 2.5 TB/s
  • 128GB UMA:2022 业界最大消费级统一内存
  • 800 GB/s:消费级 GPU/SoC 最高带宽之一
  • 5nm TSMC:第一代 Apple Silicon 旗舰
  • 缺点:FP8 不支持、价格 $6K、已停产

时代意义

  • 2022 革命:消费级硬件首次跑 70B LLM
  • 架构基础:M2/M3/M4/M5 Ultra 都基于此架构演进
  • 生态开端:llama.cpp / MLX 早期适配
  • NVIDIA 替代:本地 AI 工作站的起点

相关卡