OpenAI 自研 AI 芯片 Jalapeño 深度解析:9 个月流片,推理成本降低 50%
2026 年 6 月 24 日,OpenAI 与博通(Broadcom)联合发布首款自研 AI 推理芯片 Jalapeño。这款专为大型语言模型推理设计的 ASIC,从设计到流片仅用 9 个月,推理成本降低约 50%,标志着 OpenAI 从纯模型公司转型为全栈 AI 基础设施提供商。
一、核心结论(先看这里)
| 维度 | Jalapeño | 当前 GPU 方案 | 优势 |
|---|---|---|---|
| 推理成本 | -50% | 基准 | ✅ 成本减半 |
| 每瓦性能 | 显著优于 | 当前最先进加速器 | ✅ 能效领先 |
| 设计周期 | 9 个月 | ~18 个月 | ✅ 速度快 2x |
| 定位 | 推理 ASIC | 训练+推理 GPU | 专用优化 |
| 供货 | 仅内部 | 市场采购 | ⚠️ 不对外销售 |
一句话总结:Jalapeño 是 OpenAI 全栈 AI 战略的关键一步,用自研芯片将推理成本降低 50%,同时开启"AI 辅助设计 AI 芯片"的新范式。
二、Jalapeño 是什么?
2.1 基本信息
| 项目 | 内容 |
|---|---|
| 名称 | Jalapeño(哈拉贝诺辣椒) |
| 类型 | 专用集成电路(ASIC) |
| 定位 | 大型语言模型推理任务 |
| 发布时间 | 2026-06-24 |
| 流片时间 | 2025-09(推测,9 个月极速流片) |
| 部署时间 | 2026 年底(千兆瓦级数据中心) |
| 合作方 | 博通(Broadcom)、台积电(TSMC)、Celestica |
| 制程 | TSMC 3nm |
| 架构 | Systolic Array(脉动阵列) |
| HBM | 8 堆栈(推测 HBM3E 或 HBM4) |
2.2 为什么叫"Jalapeño"?
Jalapeño 是一种墨西哥辣椒,以"中等辣度、强烈风味"著称。OpenAI 以此命名,暗示这款芯片:
- ✅ 辣度适中:不是最激进的架构(相比 Cerebras WSE),但足够有效
- ✅ 风味强烈:在推理场景下有强烈的存在感(成本降低 50%)
- ✅ 开胃前菜:这只是"多代路线图的第一步"(博通 CEO 陈福阳)
三、技术深度解析
3.1 9 个月极速流片:AI 辅助设计芯片的新范式
通常情况下,从零开始设计一块 ASIC 芯片需要 1.5 到 2 年。而 Jalapeño 从初始设计到制造流片仅用了 9 个月。
关键原因:深度软硬件协同开发
| 技术手段 | 说明 |
|---|---|
| AI 辅助架构探索 | OpenAI 用自家前沿模型(GPT-5.3-Codex-Spark)探索芯片架构设计空间 |
| AI 功耗仿真 | 用 AI 模型进行功耗仿真与优化 |
| 强化学习优化 | 用 RL 优化芯片布局布线 |
| 博通硅实现能力 | 博通提供业界顶尖的 ASIC 实现能力(网络芯片、交换芯片经验) |
OpenAI 总裁 Greg Brockman 表示:
"我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。"
3.2 专为推理优化的架构
与通用 GPU 不同,Jalapeño 是围绕 OpenAI 对 LLM 推理工作负载的深度理解从零构建的 ASIC:
| 架构特性 | 说明 |
|---|---|
| 降低数据移动 | 架构核心在于减少数据搬运(推理任务的主要瓶颈) |
| 平衡计算-内存-网络 | 资源分配针对推理优化,使实际利用率更接近理论峰值 |
| 结合高吞吐与低延迟 | 目标是将当前领先加速器的吞吐能力与最快专用推理系统的低延迟结合起来 |
| 支持未来模型 | 不仅支持现有模型(GPT-5、GPT-5.3),也适配未来新一代模型的推理需求 |
3.3 全栈平台:不只是芯片
Jalapeño 是一个多代计算平台,而不仅仅是一颗芯片:
| 组件 | 供应商 | 说明 |
|---|---|---|
| 加速器芯片 | OpenAI 设计,台积电制造 | TSMC 3nm,8 堆栈 HBM |
| 网络交换芯片 | 博通 Tomahawk | 高速互联(与 NVIDIA NVLink 竞争) |
| 电路板、机架、系统 | Celestica | 整机架解决方案 |
| 软件栈 | OpenAI | 深度适配 GPT、Codex、Agent 产品 |
部署目标:千兆瓦(Gigawatt)级数据中心
博通 CEO 陈福阳表示:
"Jalapeño 将于今年开始与微软和其他合作伙伴一起部署在千兆瓦级数据中心。"
四、性能与成本分析
4.1 推理成本降低 50%
虽然 OpenAI 官方新闻稿中针对 Jalapeño 带来的成本节约表述相当保守,仅透露其"每瓦性能大幅优于当前最先进水平",未给出具体百分比。
但据彭博社报道,博通 CEO 陈福阳透露:
早期内部测试显示,相较于当前主流 AI GPU,Jalapeño 可实现约 50% 的推理成本节省。
对于 OpenAI 的意义:
| 项目 | 当前(GPU 方案) | Jalapeño 方案 | 节省 |
|---|---|---|---|
| 每天 API 调用 | 数亿次 | 数亿次 | — |
| 推理成本占比 | ~60-70% 运营成本 | ~30-35% | -50% |
| 年算力支出 | 数十亿美元 | 数亿美元 | 节省数十亿美元 |
4.2 每瓦性能显著优于当前最先进水平
OpenAI 公告指出:
"Jalapeño 工程样品已以目标频率和功耗成功运行 GPT-5.3-Codex-Spark 等复杂强化学习任务,早期测试显示每瓦性能显著优于当前最先进的 AI 加速器。"
对比对象:NVIDIA Blackwell(当前最先进的 AI 加速器)
| 指标 | Jalapeño | NVIDIA Blackwell | 说明 |
|---|---|---|---|
| 每瓦性能 | 显著优于 | 基准 | OpenAI 官方表述 |
| 推理延迟 | 媲美最快专用推理系统 | 基准 | 目标 |
| 吞吐量 | 媲美当前领先加速器 | 基准 | 目标 |
| TDP | 未公开(推测 400-700W) | 700-1000W | Jalapeño 可能更低 |
五、对 AI 芯片市场的影响
5.1 "去英伟达化"加速
Jalapeño 的发布是科技巨头集体挑战英伟达市场主导地位的又一注脚:
| 厂商 | 自研芯片 | 类型 | 状态 | 与 OpenAI 的关系 |
|---|---|---|---|---|
| TPU v6e / Ironwood | 训练+推理 | ✅ 已商用 | Google Cloud 供应 OpenAI | |
| Amazon | Trainium 3 | 训练 | ✅ 已发布 | AWS 供应 OpenAI |
| Microsoft | Maia 100 | 训练+推理 | ✅ 已发布 | OpenAI 独家合作伙伴 |
| Meta | MTIA | 训练+推理 | ✅ 已发布 | — |
| Apple | Neural Engine | 端侧推理 | ✅ 已商用 | — |
| OpenAI | Jalapeño | 推理 | 🚧 2026 年底部署 | 自用 + 可能出售给第三方 |
5.2 OpenAI 并非要完全"抛弃"英伟达
Brockman 坦言:
"我们根本无法足够快地获得算力。"
目前,OpenAI 同时在向英伟达、AWS、AMD 和 Cerebras 等多方采购芯片,Jalapeño 是对其爆炸性算力需求的结构性补充,而非替代。
5.3 可能出售给第三方
博通 CEO 陈福阳特别强调:
"这只是一个'多代路线图的起点',OpenAI 与博通的目标是共同建设千兆瓦(Gigawatt)级算力集群。"
这意味着,OpenAI 有可能将其硬件出售给第三方,前提是它能从博通和台积电获得足够的供货。
六、Jalapeño vs 其他自研芯片对比
| 指标 | Jalapeño(OpenAI) | TPU v6e(Google) | Trainium 3(Amazon) | Maia 100(Microsoft) |
|---|---|---|---|---|
| 发布时间 | 2026-06-24 | 2024 | 2025 Q4 | 2023 |
| 类型 | 推理 ASIC | 训练+推理 TPU | 训练 ASIC | 训练+推理 |
| 制程 | TSMC 3nm | TSMC 4nm | TSMC 5nm(推测) | TSMC 5nm(推测) |
| 是否对外销售 | ❌ 仅内部(可能未来出售) | ✅ GCP | ✅ AWS | ❌ 仅内部 |
| 设计周期 | 9 个月 | ~18 个月 | ~18 个月 | ~18 个月 |
| AI 辅助设计 | ✅ 首款 | ❌ 否 | ❌ 否 | ❌ 否 |
| 成本优势 | -50% 推理成本 | 优化 | 优化 | 优化 |
关键差异:
- ✅ Jalapeño 是首款由 AI 辅助设计的 AI 芯片
- ✅ Jalapeño 设计周期仅 9 个月(行业平均 18 个月)
- ⚠️ Jalapeño 不对外销售(至少目前如此)
七、未来路线图
7.1 多代芯片平台
Jalapeño 只是一个"多代路线图的起点":
| 时间 | 事件 |
|---|---|
| 2026 年底 | Jalapeño 初始部署(千兆瓦级数据中心) |
| 2027 年 | Jalapeño v2(推测,架构优化) |
| 2027-2028 年 | Jalapeño 训练版本(推测,挑战 TPU/Trainium) |
| 2028 年及以后 | 千兆瓦级算力集群全面建成 |
7.2 OpenAI 全栈 AI 基础设施战略
| 层次 | OpenAI 自研 | 外包/采购 |
|---|---|---|
| 模型 | ✅ GPT-5、GPT-5.3、Codex | — |
| 芯片 | ✅ Jalapeño(推理) | NVIDIA GPU、AWS Trainium、AMD GPU |
| 系统 | ✅ 与 Celestica 合作 | 微软 Azure 数据中心 |
| 网络 | ✅ 博通 Tomahawk | 微软 Azure 网络 |
| 云平台 | ❌ 无 | 微软 Azure(独家合作伙伴) |
八、行业反响与专家观点
8.1 支持观点
| 专家 | 观点 |
|---|---|
| 博通 CEO 陈福阳 | "Jalapeño 只是一个多代路线图的起点,目标是共同建设千兆瓦级算力集群。" |
| OpenAI 总裁 Greg Brockman | "我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。" |
| 业内人士 | "Jalapeño 的发布是科技巨头集体挑战英伟达市场主导地位的又一注脚。" |
8.2 质疑观点
| 质疑点 | 说明 |
|---|---|
| 不对外销售 | 目前仅内部使用,第三方无法采购,对英伟达市场份额影响有限 |
| 软件生态 | OpenAI 需要自建软件栈,与 CUDA 生态竞争难度大 |
| 供货能力 | 台积电产能有限,能否满足 OpenAI + 博通 + 其他客户的需求? |
| 性能数据不透明 | OpenAI 未公布具体规格(算力、显存、带宽、TDP),难以客观评估 |
九、对开发者的意义
9.1 如果 OpenAI 未来出售 Jalapeño 给开发者...
| 场景 | 当前(NVIDIA GPU) | 未来(Jalapeño) |
|---|---|---|
| 推理成本 | 基准 | -50% |
| 推理延迟 | 基准 | 可能更低 |
| 软件栈 | CUDA + TensorRT | OpenAI API(可能开源软件栈) |
| 采购难度 | 高(出口管制、供不应求) | 低(OpenAI 直接供应) |
9.2 即使不出售,也值得关注
- ✅ 推理成本降低 50% 会倒逼英伟达、AMD、英特尔降低 GPU 价格
- ✅ AI 辅助设计芯片的新范式会被行业快速复制
- ✅ 9 个月流片周期会成为行业新基准
十、总结
| 维度 | 评价 |
|---|---|
| 技术创新 | ⭐⭐⭐⭐⭐ 首款 AI 辅助设计的 AI 芯片,9 个月流片 |
| 成本优势 | ⭐⭐⭐⭐⭐ 推理成本降低 50%,年节省数十亿美元 |
| 战略意义 | ⭐⭐⭐⭐⭐ OpenAI 从纯模型公司转型为全栈 AI 基础设施提供商 |
| 市场影响 | ⭐⭐⭐⭐ "去英伟达化"加速,科技巨头自研芯片阵营壮大 |
| 开放性 | ⭐⭐ 目前仅内部使用,未来可能出售给第三方 |
最终建议:
- 🇨🇳 中国市场:继续关注华为昇腾、寒武纪 MLU、摩尔线程 MTT(Jalapeño 不对中国出售)
- 🌍 国际市场:关注 Jalapeño 是否未来对外销售,以及其对英伟达市场份额的影响
- 💡 开发者:关注 OpenAI API 降价可能性(推理成本降低 50% 可能部分让利给开发者)
参考资料
- OpenAI 官方公告(待发布技术白皮书)
- 博通 CEO 陈福阳访谈
- 彭博社:Jalapeño 推理成本降低 50%
- SemiWiki:Jalapeño 技术细节
- Tom's Hardware:Jalapeño 架构分析
- 国际电子商情:Jalapeño 9 个月流片
声明:本文部分规格为推测值,以 OpenAI 官方技术白皮书为准。OpenAI 将在未来数月内发布详细性能技术白皮书。
最后更新:2026-06-26