3 篇博文含有标签「AMD」

AMD AI accelerators and Instinct series

AMD Advancing AI 2026明日开幕：MI400三款CDNA5齐发，Helios机架3 exaFLOPS，OpenAI+Meta锁定12GW大单

2026年7月11日 · 阅读需 5 分钟

AI Hardware Analyst

AMD 已确认旗舰 AI 大会 Advancing AI 2026 将于 2026年7月22-23日 在旧金山 Moscone Center 举行，主题演讲定于 7 月 23 日，由董事长兼 CEO 苏姿丰（Lisa Su）主持。大会将补全 Instinct MI400 系列 的可用性时间线、定价与独立基准数据。

1. Instinct MI400 家族：三款 CDNA 5 加速器

AMD 在 CES 2026 已完整公布 MI400 产品矩阵，三款加速器均基于 CDNA 5 架构、TSMC 2nm 制程，按精度与场景分工：

型号	定位	关键规格
MI455X（旗舰）	大规模训练/推理（机架级）	3200 亿晶体管、12 chiplet、432 GB HBM4（12×36GB）、19.6 TB/s、FP4 40 PFLOPS / FP8 20 PFLOPS
MI440X（企业版）	本地企业 AI（8 卡节点）	低精度 AI（FP4/FP8/BF16），可直接替换 MI300/MI350，兼容既有机房供电散热
MI430X（HPC/主权 AI）	高精度科学计算 + AI	完整 FP32/FP64，已部署橡树岭 Discovery、法国首台 exascale Alice Recoque

MI455X 与 MI440X 主攻低精度 AI（FP4/FP8/BF16），MI430X 补齐传统 HPC 高精度需求——通过"按精度裁减执行单元"提升能效与性价比。三者均支持 UALink（首批兼容该标准的加速器）与 Infinity Fabric 片间互联，机架扩展走 Ultra Ethernet。

苏姿丰在 2026 Q1 财报会上确认：已向核心客户送样 MI455X GPU，客户需求"超过公司对 2027 年的内部预期"。

2. Helios 机架：3 exaFLOPS 单柜

AMD 以 Helios 机架级平台 切入超大规模市场：

指标	Helios 机架
加速器	72 × MI455X
聚合 HBM4	31 TB
总内存带宽	1.4 PB/s
单柜算力	最高 3 AI exaFLOPS（Q3 交付目标）
目标客户	超大规模训练/推理集群

Helios 采用 AMD 自研 Zen 6 EPYC Venice CPU（每机架 18 颗）+ Pensando Vulcano 800G NIC，通过开放 ROCm 软件栈整合；AMD 还规划了 双宽 128 卡 Helios 变体，单柜算力可推高至 3 AI exaFLOPS 上限。更长远的 MI500 系列（CDNA 6、2nm、HBM4E） 计划 2027 年推出，官方称相对 MI300X 的 AI 性能提升最高达 1000 倍。

3. 12GW 大单：OpenAI + Meta 双重背书

AMD 手握两份历史级别的算力协议，合计约 12 GW，全生命周期潜在收入或达 1000 亿美元：

客户	规模	首批部署	结构
OpenAI	6 GW（多代产品）	首期 1 GW，2026 H2 用 MI450	"compute-for-upside"：授予最多 1.6 亿股认股权证，随里程碑与股价目标分阶段归属
Meta	6 GW	定制 MI450 芯片，2026 H2 起	部署于下一代数据中心

财务预期

指标	2026 预测
MI400 系列营收	~$72 亿（约占数据中心销售 25%）
数据中心 GPU 营收	~$150 亿（同比 +114%）
数据中心总营收	或达 $287 亿（同比 +73%）

⚠️ 执行风险：AMD 已提示 MI450 于 Q3 量产将拖累毛利率（新品低于公司平均）；先进制程与先进封装（TSMC CoWoS）产能仍是主要约束。

产业解读

CUDA 护城河被撬动：当 Meta、OpenAI 这类构建全球最大训练集群的公司押注 AMD 硅片，AMD 长期 5–7% 的 GPU 份额天花板正被打破。
内存优势差异化：432 GB HBM4 / 19.6 TB/s 相较 NVIDIA Rubin 的 288 GB 具备容量优势，对大模型推理（KV Cache 受限场景）尤为关键。
对标节奏咬紧：MI450 与 NVIDIA Vera Rubin 同在 2026 H2 放量，两强在 HBM4 供应、CoWoS 产能上正面争夺。

参考资料

本文写于 Advancing AI 2026（7月22-23日，明日开幕）前夕；大会主题演讲定于 7 月 23 日由苏姿丰主持，届时将揭晓 MI400 最终上市时间、定价与独立基准数据，我们将同步更新。

2026 H2 AI 芯片路线图重大更新：Qualcomm 入局、AMD MI400 三款型号揭晓、华为三代路线图

2026年6月20日 · 阅读需 7 分钟

Charles Qing

AI Hardware Analyst

2026 年 6 月更新——AI 算力卡市场正在经历近年来最剧烈的格局变化。本文将为您梳理最新路线图动态。

核心要点

Qualcomm AI 200/250 正式进入数据中心 AI 推理市场，对标 NVIDIA H200
AMD MI400 系列 揭晓三款型号：MI430X（HPC）、MI440X（企业）、MI455X（旗舰）
华为公布三代路线图：950（2026）→ 960（2027-Q4）→ 970（2028-Q4）
Intel Jaguar Shores 时间线存疑，可能延迟至 2027 或之后
NVIDIA Rubin R200 已全面量产，Vera CPU + Rubin GPU 组合正式交付

1. Qualcomm：移动芯片巨头进军数据中心 AI

AI 100 → AI 200 → AI 250

Qualcomm 在 2025 年 10 月正式发布了 AI 200 数据中心推理芯片，标志着移动芯片巨头正式进入数据中心 AI 市场。

型号	发布时间	上市时间	关键特性
AI 100	2025-10	2026 H2	机架级 AI 推理，768GB LPDDR/卡
AI 250	2025-10	2027 H1	近存计算架构，10x 有效内存带宽

为什么 Qualcomm 能成功？

低 TCO：LPDDR 内存比 HBM 便宜得多
能效优势：移动芯片设计经验，功耗控制出色
推理专用：不追求训练性能，专注推理场景
机架规格：直接液冷，160kW 机架级功耗，Ethernet 互联

市场影响

对标 NVIDIA H200：AI 200 推理性能接近 H200，但 TCO 低 30-40%
倒逼 NVIDIA：可能促使 NVIDIA 推出推理专用芯片（如 Rubin CPX）
多样化选择：打破 NVIDIA 在推理市场的垄断

2. AMD MI400 系列：三款型号精准定位

在 CES 2026（2026 年 1 月）上，AMD 正式揭晓了 MI400 系列 的三款型号，精准覆盖不同市场：

MI430X（HPC + 主权 AI）

特性	规格
定位	HPC + 主权 AI
FP32/FP64	支持（这是关键区别）
适用场景	科学计算、气候模拟、国家 AI 基础设施
竞争对手	NVIDIA 不做 FP64 的 AI 卡

MI440X（企业服务器）

特性	规格
定位	企业 8-GPU 服务器
兼容性	兼容现有数据中心基础设施
适用场景	企业 AI、私有云、边缘推理
竞争优势	比 MI455X 更便宜，更易部署

MI455X（旗舰 AI 训练）

特性	规格
定位	旗舰 AI 训练 + 推理
优化精度	FP4/FP8/BF16
Helios 机架	核心组件
竞争对手	NVIDIA Rubin R200

Helios 机架级解决方案

AMD 在 CES 2026 同时发布了 Helios 机架级 AI 解决方案：

18 颗 Zen 6 CPU（2nm 制程）
72 颗 MI455X GPU
直接液冷
预计 2026 H2 出货

3. 华为三代路线图：950 → 960 → 970

华为在全联接大会 2025（2025 年 9 月）公布了三代芯片路线图，时间线非常清晰：

昇腾 950 系列（2026）

型号	发布时间	关键特性
950PR	2026-Q1	PR（推理优化），已量产
950DT	2026-Q4	DT（Decode + 训练），预计全面放量

技术亮点：

新增支持 FP8/MXFP8/MXFP4
互联带宽 2TB/s（相比 910C 提升 2.5 倍）

昇腾 960（2027-Q4）

算力翻倍：相比 950 系列，各项规格翻倍
FP8：预计 ~2 PFLOPS
工艺：N+3（等效 5nm）
定位：对标 NVIDIA B200

昇腾 970（2028-Q4）

三代旗舰：目前仅公布时间线，规格待定
意义：华为首个覆盖完整代际的路线图
信号：中国国产 AI 芯片已进入"规划驱动"阶段

4. Intel Jaguar Shores：时间线存疑

原定计划

发布时间：2026 年
架构：Xe-HPC + Gaudi 融合
制程：18A（Intel 最先进制程）
内存：可能采用 HBM4E（而非原计划的 HBM4）

对路线图的影响

如果 Jaguar Shores 延迟至 2027 年，Intel 在 AI 芯片市场将基本出局。

5. NVIDIA Rubin 平台：已全面量产

Rubin R200（2026-Q2 全面量产）

特性	规格
HBM	288GB HBM4
算力	50 PFLOPS FP4
NVLink	NVLink 6（1800 GB/s）
制程	TSMC 4NP

Rubin NVL72 机柜（2026 H2 出货）

72 颗 Rubin GPU
36 颗 Vera CPU
1.8 EFLOPS FP4
直接液冷

Vera CPU（首次亮相）

架构：自研 CPU，替代 Grace
定位：与 Rubin GPU 深度协同
意义：NVIDIA 从 GPU 公司转型为计算平台公司

6. Google TPU v8：训练/推理正式拆分

TPU 8t（训练） + TPU 8i（推理）

Google 在 Cloud Next 2026 宣布 TPU v8 将正式拆分为训练版和推理版：

特性	TPU 8t（训练）	TPU 8i（推理）
优化方向	高算力、高带宽	低延迟、低成本
互联	光学互联	以太网
发布时间	2027	2027

意义

行业趋势：训练/推理芯片专用化
跟随者：Qualcomm AI 200 也是推理专用
NVIDIA 压力：是否需要推出推理专用芯片？

7. Cerebras WSE-4：晶圆级引擎再进化

核心规格

特性	规格
晶体管	1.4 万亿
算力	125 PFLOPS FP8
发布时间	2026 H2
制程	TSMC 5nm

竞争优势

超大模型训练：单颗 WSE-4 可训练 10T+ 参数模型
低延迟推理：整个模型在单颗芯片上，无通信开销
软件栈成熟：Cerebras 软件栈已支持 PyTorch、TensorFlow

8. 市场格局分析

训练市场

排名	厂商	产品	市场份额（预估）
1	NVIDIA	Rubin R200	70%
2	AMD	MI455X	15%
3	Google	TPU v8t	10%
4	华为	昇腾 960	5%（中国为主）

推理市场（新战场）

排名	厂商	产品	优势
1	NVIDIA	H200 / Rubin CPX	生态成熟
2	Qualcomm	AI 200	低 TCO
3	AMD	MI440X	兼容性好
4	Intel	Gaudi 4	价格低廉

9. 关键趋势

趋势 1：推理专用芯片崛起

Qualcomm AI 200：移动芯片巨头入局
NVIDIA Rubin CPX：NVIDIA 首次推出推理专用芯片
Google TPU 8i：训练/推理正式拆分

趋势 2：机架级解决方案成为标配

NVIDIA NVL72：72 GPU + 36 CPU
AMD Helios：18 CPU + 72 GPU
Qualcomm 机架：160kW 液冷机架

趋势 3：中国国产芯片进入"规划驱动"阶段

华为三代路线图：950 → 960 → 970
时间线清晰：2026-Q1 → 2027-Q4 → 2028-Q4
意义：从"追赶"到"规划"

趋势 4：HBM 产能成为瓶颈

SK 海力士：HBM4 产能已被 NVIDIA 预订
三星：HBM4E 样品已交付 AMD
影响：MI400、Rubin R200 出货量受 HBM 产能限制

10. 采购建议

如果您在 2026 H2 采购

训练场景：
- 首选：NVIDIA Rubin R200（性能最强）
- 备选：AMD MI455X（性价比更高）
- 国产：华为昇腾 950DT（中国客户）
推理场景：
- 首选：NVIDIA H200（生态成熟）
- 性价比：Qualcomm AI 200（如果可用）
- 成本敏感：AMD MI440X
HPC 场景：
- 唯一选择：AMD MI430X（支持 FP64）

如果您在 2027 采购

等待 Rubin Ultra：性能可能是 R200 的 2x
关注 MI500：AMD 下一代产品
评估 TPU v8：如果已在用 Google Cloud

结论

2026 H2 将是 AI 芯片市场有史以来最卷的半年：

NVIDIA 继续领跑，但优势缩小
AMD 三款型号精准定位，市场份额将持续提升
Qualcomm 入局推理市场，低 TCO 策略可能颠覆市场
华为三代路线图清晰，国产替代加速
Intel Jaguar Shores 成败在此一举

对于采购决策者，现在是最难做决定的时刻——因为每个选项都有明显的优缺点。

对于技术从业者，这是最好的时代——芯片性能每年翻倍，架构创新层出不穷。

参考资料

AI 算力卡未来路线图 - MirrorFrog 实时更新
NVIDIA Rubin R200 深度解析（见本站相关文章）
AMD MI400 系列 CES 2026 发布（见本站相关文章）
Qualcomm AI 100 发布分析（即将发布）

最后更新：2026-06-20
作者：Charles Qing
标签：#路线图 #市场分析 #采购决策

AMD MI455X CES 2026 震撼发布：4年AI芯片性能涨1000倍

2026年6月16日 · 阅读需 7 分钟

AI Compute Cards Wiki Editorial

Industry Research Team

2026年1月5日，在CES 2026（国际消费电子展）首日，AMD董事会主席兼CEO苏姿丰博士在主题演讲中震撼发布：Instinct MI400系列AI加速卡。

其中最引人注目的是MI455X——AMD史上性能最强的AI加速卡，采用2nm + 3nm混合制程、432GB HBM4显存、FP4算力高达40 PFLOPS（FP8为20 PFLOPS）。

核心亮点

MI455X：FP4算力40 PFLOPS，FP8算力20 PFLOPS，相比MI355X提升10×
MI450：高性价比版，FP4算力28 PFLOPS，288GB HBM4
制程升级：全球首款采用2nm + 3nm混合制程的AI芯片（GCD用2nm，MCD用3nm）
显存升级：从MI350X的288GB HBM3e升级到432GB HBM4（MI455X）
带宽升级：从MI350X的8 TB/s升级到19.6 TB/s（提升2.45×）
架构升级：从CDNA 4升级到CDNA 5
量产时间：MI455X 2026年Q4，MI450 2026年Q3

MI400系列完整规格

📌 重要更正（2026-06-16）：经官方规格核对，MI455X 显存为 432GB HBM4（非早期报道的 288GB），FP4 算力为 40 PFLOPS。特此更正。

型号	定位	显存	FP4 算力	FP8 算力	TDP（推测）
MI455X	旗舰训练+推理	432GB HBM4	40 PFLOPS	20 PFLOPS	~1,000W
MI450	高性价比训练	288GB HBM4	28 PFLOPS	14 PFLOPS	~800W
MI440X	企业推理	216GB HBM4	25 PFLOPS	12.5 PFLOPS	~600W
MI430X	HPC / 科学计算	192GB HBM4	20 PFLOPS	10 PFLOPS	~500W
MI400X	通用 / 边缘推理	128GB HBM4	12 PFLOPS	6 PFLOPS	~400W

关键升级（vs MI350系列）：

显存：HBM3e → HBM4，容量提升 50%（432GB vs 288GB）
带宽：19.6 TB/s（vs MI350的 8 TB/s，提升 2.45×）
算力：FP4 40 PFLOPS（vs MI355X的 20 PFLOPS，提升 2×）
制程：2nm + 3nm 混合制程（GCD用2nm，MCD用3nm）
架构：CDNA 5（vs MI350的 CDNA 4）

与MI355X的性能对比

指标	MI355X（2025）	MI455X（2026）	提升
FP4算力	20 PFLOPS	40 PFLOPS	2×
FP8算力	10 PFLOPS	20 PFLOPS	2×
显存容量	288GB HBM3e	432GB HBM4	1.5×
显存带宽	8 TB/s	19.6 TB/s	2.45×
制程	TSMC 3nm	2nm + 3nm 混合	新一代
架构	CDNA 4	CDNA 5	新一代
TDP	800-1000W	~1,000W	持平

苏姿丰在CES 2026上说：

"4年前，MI250的AI性能是X。现在，MI455X的性能提升了1000倍。这就是AI芯片的进步速度。"

CDNA 5架构详解

MI400系列采用CDNA 5架构（MI355X用CDNA 4）：

关键升级

Matrix Core 升级：支持FP8/INT8/FP16，稀疏化加速
HBM4控制器：支持12层HBM4（ vs HBM3e的8层）
Infinity Fabric 4.0：Die间/Die-GPU间互联带宽提升50%
稀疏化原生支持：MoE模型的Expert Parallel优化
长上下文优化：1M+ token KV Cache加速

与NVIDIA Blackwell / Rubin对比

指标	AMD MI455X	NVIDIA B200	NVIDIA Rubin R200（2026 Q4）
FP4算力	40 PFLOPS	20 PFLOPS（稀疏 45 PFLOPS）	~40 PFLOPS（推测）
FP8算力	20 PFLOPS	10 PFLOPS（稀疏 22.5 PFLOPS）	~20 PFLOPS（推测）
显存	432GB HBM4	192GB HBM3e	288GB HBM4
显存带宽	19.6 TB/s	8 TB/s	13 TB/s
TDP	~1,000W	700-1000W	~1,000W
制程	2nm + 3nm 混合	TSMC 4np	TSMC 3nm
量产时间	2026年Q4	2024年Q4	2026年Q4
软件生态	ROCm	CUDA	CUDA
优势	显存容量、开放生态	生态最成熟	下一代架构
劣势	软件生态差距	显存较小	尚未发布

结论：MI455X在FP4/FP8算力和显存容量/带宽上领先B200，但软件生态仍是短板。与Rubin R200相比，纸面性能相近，但Rubin有CUDA生态护城河。

量产时间表

时间	事件
2025年6月12日	Advancing AI大会首次公布MI400系列规格
2026年1月5日	CES 2026正式发布MI455X/MI450/MI440X
2026年Q3	MI450开始送样
2026年Q4	MI455X正式量产
2026年Q4	MI440X（企业推理版）发布
2027年Q1	MI430X/MI400X（HPC/边缘推理版）发布
2027年	MI500系列（下一代）

AMD AI芯片路线图（2025-2027）

时间	产品	制程	备注
2024年Q4	MI325X	TSMC 5nm	HBM3e升级版
2025年Q3	MI355X（MI350系列）	TSMC 3nm	CDNA 4，288GB HBM3e
2026年Q4	MI455X（MI400系列）	2nm + 3nm 混合	CDNA 5，432GB HBM4
2027年Q1	MI500系列	TSMC 2nm（推测）	下一代，性能再提升

软件生态：ROCm的进步与挑战

✅ 进步

PyTorch 2.5+：原生支持MI300X/MI455X
Hugging Face Transformers：官方支持AMD GPU
vLLM 0.8+：MI300X推理支持（实验性）
JAX：AMD正在适配（对标Google TPU）

⚠️ 挑战

框架优化度：PyTorch在AMD GPU上的性能仍低于NVIDIA
算子覆盖率：部分小众算子需要自己写HIP代码
多卡通信：RCCL（对标NCCL）性能仍有差距
开发者生态：教程、案例、社区活跃度远不及NVIDIA

与竞品对比

厂商	产品	FP4算力	显存	量产时间	优势	劣势
AMD	MI455X	40 PFLOPS	432GB HBM4	2026 Q4	显存容量最大、开放生态	软件生态差距
NVIDIA	B200	20 PFLOPS	192GB HBM3e	2024 Q4	生态最成熟	显存较小
NVIDIA	Rubin R200	~40 PFLOPS	288GB HBM4	2026 Q4	下一代架构、CUDA生态	价格昂贵
华为	昇腾910C	~1.6 PFLOPS	64GB HBM	2026 Q2	中国本土化	受出口管制
Google	TPU 8t	~9.2 PFLOPS	~256GB HBM3e	2027年底	与Gemini集成	仅Google Cloud

行业影响

1. 对NVIDIA的冲击

AMD MI455X在纸面性能上已经追上B200（FP4 40 PFLOPS vs 20 PFLOPS），甚至在显存容量上大幅领先（432GB vs 192GB）。

但：

NVIDIA有CUDA生态护城河
NVIDIA有Vera Rubin平台（整体方案，2026 Q4发布）
AMD只能卖单卡/单机，NVIDIA卖AI工厂
MI455X量产时间（2026 Q4）与Rubin R200相同，正面竞争

2. 对国产芯片的压力

MI455X的发布意味着：国际主流AI芯片在2026年将进入2nm + HBM4时代。

国产芯片（华为昇腾、寒武纪、沐曦等）需要：

在2026-2027年追上5nm + HBM3e水平
否则差距将从"1代"扩大到"2代"

3. 对云服务商的意义

MI455X给云服务商提供了NVIDIA之外的第二选择：

微软Azure：已部署MI355X，可能跟进MI455X
谷歌Cloud：自研TPU，不会用AMD
亚马逊AWS：自研Trainium/Inferentia，不会用AMD
阿里云、腾讯云：可能采购MI455X作为NVIDIA替代方案

参考资料

MI455X芯片 - 百度百科 - 官方规格参数
AMD甩出最猛两代AI芯片！全球首推432GB HBM4 - 知乎 - 智东西现场报道
对标英伟达：AMD推出MI440X，抢攻企业级AI数据中心市场 - 腾讯新闻
AMD MI400上了432GB HBM4：纸面参数碾压NVIDIA - CocoLoop
AMD CES 2026主题演讲回放

本文基于AMD CES 2026官方公告、百度百科及知乎智东西现场报道整理，规格参数已核对官方来源。2026-06-16更新：修正MI455X显存（288GB → 432GB）和算力（FP8 6 PFLOPS → FP4 40 PFLOPS）

1. Instinct MI400 家族：三款 CDNA 5 加速器​

2. Helios 机架：3 exaFLOPS 单柜​

3. 12GW 大单：OpenAI + Meta 双重背书​

财务预期​

产业解读​

相关链接​

参考资料​

核心要点​

1. Qualcomm：移动芯片巨头进军数据中心 AI​

AI 100 → AI 200 → AI 250​

为什么 Qualcomm 能成功？​

市场影响​

2. AMD MI400 系列：三款型号精准定位​

MI430X（HPC + 主权 AI）​

MI440X（企业服务器）​

MI455X（旗舰 AI 训练）​

Helios 机架级解决方案​

3. 华为三代路线图：950 → 960 → 970​

昇腾 950 系列（2026）​

昇腾 960（2027-Q4）​

昇腾 970（2028-Q4）​

4. Intel Jaguar Shores：时间线存疑​

原定计划​

最新动态​

对路线图的影响​

5. NVIDIA Rubin 平台：已全面量产​

Rubin R200（2026-Q2 全面量产）​

Rubin NVL72 机柜（2026 H2 出货）​

Vera CPU（首次亮相）​

6. Google TPU v8：训练/推理正式拆分​

TPU 8t（训练） + TPU 8i（推理）​

意义​

7. Cerebras WSE-4：晶圆级引擎再进化​

核心规格​

竞争优势​

8. 市场格局分析​

训练市场​

推理市场（新战场）​

9. 关键趋势​

趋势 1：推理专用芯片崛起​

趋势 2：机架级解决方案成为标配​

趋势 3：中国国产芯片进入"规划驱动"阶段​

趋势 4：HBM 产能成为瓶颈​

10. 采购建议​

如果您在 2026 H2 采购​

如果您在 2027 采购​

结论​

参考资料​

核心亮点​

MI400系列完整规格​

与MI355X的性能对比​

CDNA 5架构详解​

关键升级​

与NVIDIA Blackwell / Rubin对比​

量产时间表​

AMD AI芯片路线图（2025-2027）​

软件生态：ROCm的进步与挑战​

✅ 进步​

⚠️ 挑战​

与竞品对比​

行业影响​

1. 对NVIDIA的冲击​

2. 对国产芯片的压力​

3. 对云服务商的意义​

相关芯片​

参考资料​

1. Instinct MI400 家族：三款 CDNA 5 加速器

2. Helios 机架：3 exaFLOPS 单柜

3. 12GW 大单：OpenAI + Meta 双重背书

财务预期

产业解读

相关链接

参考资料

核心要点

1. Qualcomm：移动芯片巨头进军数据中心 AI

AI 100 → AI 200 → AI 250

为什么 Qualcomm 能成功？

市场影响

2. AMD MI400 系列：三款型号精准定位

MI430X（HPC + 主权 AI）

MI440X（企业服务器）

MI455X（旗舰 AI 训练）

Helios 机架级解决方案

3. 华为三代路线图：950 → 960 → 970

昇腾 950 系列（2026）

昇腾 960（2027-Q4）

昇腾 970（2028-Q4）

4. Intel Jaguar Shores：时间线存疑

原定计划

最新动态

对路线图的影响

5. NVIDIA Rubin 平台：已全面量产

Rubin R200（2026-Q2 全面量产）

Rubin NVL72 机柜（2026 H2 出货）

Vera CPU（首次亮相）

6. Google TPU v8：训练/推理正式拆分

TPU 8t（训练） + TPU 8i（推理）

意义

7. Cerebras WSE-4：晶圆级引擎再进化

核心规格

竞争优势

8. 市场格局分析

训练市场

推理市场（新战场）

9. 关键趋势

趋势 1：推理专用芯片崛起

趋势 2：机架级解决方案成为标配

趋势 3：中国国产芯片进入"规划驱动"阶段

趋势 4：HBM 产能成为瓶颈

10. 采购建议

如果您在 2026 H2 采购

如果您在 2027 采购

结论

参考资料

核心亮点

MI400系列完整规格

与MI355X的性能对比

CDNA 5架构详解

关键升级

与NVIDIA Blackwell / Rubin对比

量产时间表

AMD AI芯片路线图（2025-2027）

软件生态：ROCm的进步与挑战

✅ 进步

⚠️ 挑战

与竞品对比

行业影响

1. 对NVIDIA的冲击

2. 对国产芯片的压力

3. 对云服务商的意义

相关芯片

参考资料