Skip to main content

OpenAI 自研 AI 芯片 Jalapeño 深度解析:9 个月流片,推理成本降低 50%

· 10 min read
AI Hardware Analyst

2026 年 6 月 24 日,OpenAI 与博通(Broadcom)联合发布首款自研 AI 推理芯片 Jalapeño。这款专为大型语言模型推理设计的 ASIC,从设计到流片仅用 9 个月,推理成本降低约 50%,标志着 OpenAI 从纯模型公司转型为全栈 AI 基础设施提供商。


一、核心结论(先看这里)

维度Jalapeño当前 GPU 方案优势
推理成本-50%基准✅ 成本减半
每瓦性能显著优于当前最先进加速器✅ 能效领先
设计周期9 个月~18 个月✅ 速度快 2x
定位推理 ASIC训练+推理 GPU专用优化
供货仅内部市场采购⚠️ 不对外销售

一句话总结:Jalapeño 是 OpenAI 全栈 AI 战略的关键一步,用自研芯片将推理成本降低 50%,同时开启"AI 辅助设计 AI 芯片"的新范式。


二、Jalapeño 是什么?

2.1 基本信息

项目内容
名称Jalapeño(哈拉贝诺辣椒)
类型专用集成电路(ASIC)
定位大型语言模型推理任务
发布时间2026-06-24
流片时间2025-09(推测,9 个月极速流片)
部署时间2026 年底(千兆瓦级数据中心)
合作方博通(Broadcom)、台积电(TSMC)、Celestica
制程TSMC 3nm
架构Systolic Array(脉动阵列)
HBM8 堆栈(推测 HBM3E 或 HBM4)

2.2 为什么叫"Jalapeño"?

Jalapeño 是一种墨西哥辣椒,以"中等辣度、强烈风味"著称。OpenAI 以此命名,暗示这款芯片:

  • 辣度适中:不是最激进的架构(相比 Cerebras WSE),但足够有效
  • 风味强烈:在推理场景下有强烈的存在感(成本降低 50%)
  • 开胃前菜:这只是"多代路线图的第一步"(博通 CEO 陈福阳)

三、技术深度解析

3.1 9 个月极速流片:AI 辅助设计芯片的新范式

通常情况下,从零开始设计一块 ASIC 芯片需要 1.5 到 2 年。而 Jalapeño 从初始设计到制造流片仅用了 9 个月

关键原因:深度软硬件协同开发

技术手段说明
AI 辅助架构探索OpenAI 用自家前沿模型(GPT-5.3-Codex-Spark)探索芯片架构设计空间
AI 功耗仿真用 AI 模型进行功耗仿真与优化
强化学习优化用 RL 优化芯片布局布线
博通硅实现能力博通提供业界顶尖的 ASIC 实现能力(网络芯片、交换芯片经验)

OpenAI 总裁 Greg Brockman 表示:

"我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。"

3.2 专为推理优化的架构

与通用 GPU 不同,Jalapeño 是围绕 OpenAI 对 LLM 推理工作负载的深度理解从零构建的 ASIC:

架构特性说明
降低数据移动架构核心在于减少数据搬运(推理任务的主要瓶颈)
平衡计算-内存-网络资源分配针对推理优化,使实际利用率更接近理论峰值
结合高吞吐与低延迟目标是将当前领先加速器的吞吐能力与最快专用推理系统的低延迟结合起来
支持未来模型不仅支持现有模型(GPT-5、GPT-5.3),也适配未来新一代模型的推理需求

3.3 全栈平台:不只是芯片

Jalapeño 是一个多代计算平台,而不仅仅是一颗芯片:

组件供应商说明
加速器芯片OpenAI 设计,台积电制造TSMC 3nm,8 堆栈 HBM
网络交换芯片博通 Tomahawk高速互联(与 NVIDIA NVLink 竞争)
电路板、机架、系统Celestica整机架解决方案
软件栈OpenAI深度适配 GPT、Codex、Agent 产品

部署目标千兆瓦(Gigawatt)级数据中心

博通 CEO 陈福阳表示:

"Jalapeño 将于今年开始与微软和其他合作伙伴一起部署在千兆瓦级数据中心。"


四、性能与成本分析

4.1 推理成本降低 50%

虽然 OpenAI 官方新闻稿中针对 Jalapeño 带来的成本节约表述相当保守,仅透露其"每瓦性能大幅优于当前最先进水平",未给出具体百分比。

但据彭博社报道,博通 CEO 陈福阳透露:

早期内部测试显示,相较于当前主流 AI GPU,Jalapeño 可实现约 50% 的推理成本节省

对于 OpenAI 的意义

项目当前(GPU 方案)Jalapeño 方案节省
每天 API 调用数亿次数亿次
推理成本占比~60-70% 运营成本~30-35%-50%
年算力支出数十亿美元数亿美元节省数十亿美元

4.2 每瓦性能显著优于当前最先进水平

OpenAI 公告指出:

"Jalapeño 工程样品已以目标频率和功耗成功运行 GPT-5.3-Codex-Spark 等复杂强化学习任务,早期测试显示每瓦性能显著优于当前最先进的 AI 加速器。"

对比对象:NVIDIA Blackwell(当前最先进的 AI 加速器)

指标JalapeñoNVIDIA Blackwell说明
每瓦性能显著优于基准OpenAI 官方表述
推理延迟媲美最快专用推理系统基准目标
吞吐量媲美当前领先加速器基准目标
TDP未公开(推测 400-700W)700-1000WJalapeño 可能更低

五、对 AI 芯片市场的影响

5.1 "去英伟达化"加速

Jalapeño 的发布是科技巨头集体挑战英伟达市场主导地位的又一注脚

厂商自研芯片类型状态与 OpenAI 的关系
GoogleTPU v6e / Ironwood训练+推理✅ 已商用Google Cloud 供应 OpenAI
AmazonTrainium 3训练✅ 已发布AWS 供应 OpenAI
MicrosoftMaia 100训练+推理✅ 已发布OpenAI 独家合作伙伴
MetaMTIA训练+推理✅ 已发布
AppleNeural Engine端侧推理✅ 已商用
OpenAIJalapeño推理🚧 2026 年底部署自用 + 可能出售给第三方

5.2 OpenAI 并非要完全"抛弃"英伟达

Brockman 坦言:

"我们根本无法足够快地获得算力。"

目前,OpenAI 同时在向英伟达、AWS、AMD 和 Cerebras 等多方采购芯片,Jalapeño 是对其爆炸性算力需求的结构性补充,而非替代。

5.3 可能出售给第三方

博通 CEO 陈福阳特别强调:

"这只是一个'多代路线图的起点',OpenAI 与博通的目标是共同建设千兆瓦(Gigawatt)级算力集群。"

这意味着,OpenAI 有可能将其硬件出售给第三方,前提是它能从博通和台积电获得足够的供货。


六、Jalapeño vs 其他自研芯片对比

指标Jalapeño(OpenAI)TPU v6e(Google)Trainium 3(Amazon)Maia 100(Microsoft)
发布时间2026-06-2420242025 Q42023
类型推理 ASIC训练+推理 TPU训练 ASIC训练+推理
制程TSMC 3nmTSMC 4nmTSMC 5nm(推测)TSMC 5nm(推测)
是否对外销售❌ 仅内部(可能未来出售)✅ GCP✅ AWS❌ 仅内部
设计周期9 个月~18 个月~18 个月~18 个月
AI 辅助设计✅ 首款❌ 否❌ 否❌ 否
成本优势-50% 推理成本优化优化优化

关键差异

  • ✅ Jalapeño 是首款由 AI 辅助设计的 AI 芯片
  • ✅ Jalapeño 设计周期仅 9 个月(行业平均 18 个月)
  • ⚠️ Jalapeño 不对外销售(至少目前如此)

七、未来路线图

7.1 多代芯片平台

Jalapeño 只是一个"多代路线图的起点":

时间事件
2026 年底Jalapeño 初始部署(千兆瓦级数据中心)
2027 年Jalapeño v2(推测,架构优化)
2027-2028 年Jalapeño 训练版本(推测,挑战 TPU/Trainium)
2028 年及以后千兆瓦级算力集群全面建成

7.2 OpenAI 全栈 AI 基础设施战略

层次OpenAI 自研外包/采购
模型✅ GPT-5、GPT-5.3、Codex
芯片✅ Jalapeño(推理)NVIDIA GPU、AWS Trainium、AMD GPU
系统✅ 与 Celestica 合作微软 Azure 数据中心
网络✅ 博通 Tomahawk微软 Azure 网络
云平台❌ 无微软 Azure(独家合作伙伴)

八、行业反响与专家观点

8.1 支持观点

专家观点
博通 CEO 陈福阳"Jalapeño 只是一个多代路线图的起点,目标是共同建设千兆瓦级算力集群。"
OpenAI 总裁 Greg Brockman"我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。"
业内人士"Jalapeño 的发布是科技巨头集体挑战英伟达市场主导地位的又一注脚。"

8.2 质疑观点

质疑点说明
不对外销售目前仅内部使用,第三方无法采购,对英伟达市场份额影响有限
软件生态OpenAI 需要自建软件栈,与 CUDA 生态竞争难度大
供货能力台积电产能有限,能否满足 OpenAI + 博通 + 其他客户的需求?
性能数据不透明OpenAI 未公布具体规格(算力、显存、带宽、TDP),难以客观评估

九、对开发者的意义

9.1 如果 OpenAI 未来出售 Jalapeño 给开发者...

场景当前(NVIDIA GPU)未来(Jalapeño)
推理成本基准-50%
推理延迟基准可能更低
软件栈CUDA + TensorRTOpenAI API(可能开源软件栈)
采购难度高(出口管制、供不应求)低(OpenAI 直接供应)

9.2 即使不出售,也值得关注

  • 推理成本降低 50% 会倒逼英伟达、AMD、英特尔降低 GPU 价格
  • AI 辅助设计芯片的新范式会被行业快速复制
  • 9 个月流片周期会成为行业新基准

十、总结

维度评价
技术创新⭐⭐⭐⭐⭐ 首款 AI 辅助设计的 AI 芯片,9 个月流片
成本优势⭐⭐⭐⭐⭐ 推理成本降低 50%,年节省数十亿美元
战略意义⭐⭐⭐⭐⭐ OpenAI 从纯模型公司转型为全栈 AI 基础设施提供商
市场影响⭐⭐⭐⭐ "去英伟达化"加速,科技巨头自研芯片阵营壮大
开放性⭐⭐ 目前仅内部使用,未来可能出售给第三方

最终建议

  • 🇨🇳 中国市场:继续关注华为昇腾、寒武纪 MLU、摩尔线程 MTT(Jalapeño 不对中国出售)
  • 🌍 国际市场:关注 Jalapeño 是否未来对外销售,以及其对英伟达市场份额的影响
  • 💡 开发者:关注 OpenAI API 降价可能性(推理成本降低 50% 可能部分让利给开发者)

参考资料


声明:本文部分规格为推测值,以 OpenAI 官方技术白皮书为准。OpenAI 将在未来数月内发布详细性能技术白皮书。

最后更新:2026-06-26