OpenAI Jalapeño (自研 AI 推理芯片)
OpenAI 首款自研 AI 推理芯片,2026 年 6 月 24 日正式发布,与博通(Broadcom)联合开发,采用 TSMC 3nm 工艺,推理成本降低约 50%。
产品概述
OpenAI Jalapeño(哈拉贝诺辣椒)是 OpenAI 与博通(Broadcom)联合推出的首款自研 AI 推理芯片,2026-06-24 正式发布。定位为专用集成电路(ASIC),专为大型语言模型推理任务设计,不是通用 GPU。
战略意义:这标志着 OpenAI 从纯模型公司转型为全栈 AI 基础设施提供商,与谷歌 TPU、亚马逊 Trainium、微软 Maia 并列,成为科技巨头自研 AI 芯片阵营的重要一员。
核心规格(推测)
| 项目 | 参数 |
|---|---|
| 架构 | Systolic Array(脉动阵列) |
| 制程 | TSMC 3nm |
| 晶体管数 | 未公开(推测 500-1000 亿) |
| HBM | 8 堆栈(推测 HBM3E 或 HBM4) |
| HBM 容量 | 未公开(推测 128-256GB) |
| HBM 带宽 | 未公开(推测 6-10 TB/s) |
| 算力(推理) | 未公开(目标媲美 Blackwell) |
| TDP | 未公开(推测 400-700W) |
| 互联 | Broadcom Tomahawk 交换芯片 |
| 封装 | Celestica 提供电路板、机架和系统 |
| 设计工具 | OpenAI 前沿模型辅助架构探索、功耗仿真与强化学习优化 |
| 发布 | 2026-06-24 |
| 流片时间 | 2025-09(推测,9 个月极速流片) |
| 部署 | 2026 年底(千兆瓦级数据中心) |
| 供货 | 仅内部使用(OpenAI + 微软),不对外销售 |
⚠️ 注意:Jalapeño 是 OpenAI 内部专用芯片,不对外销售。博通 CEO 陈福阳表示,未来可能出售给第三方,但需获得足够供货。
Jalapeño vs 其他 AI 加速器对比
| 指标 | Jalapeño | NVIDIA Blackwell | Google TPU v6e | AWS Trainium 3 |
|---|---|---|---|---|
| 类型 | 推理 ASIC | 训练+推理 GPU | 训练+推理 TPU | 训练 ASIC |
| 制程 | TSMC 3nm | TSMC 4nm | TSMC 4nm | TSMC 5nm(推测) |
| 是否对外销售 | ❌ 仅内部 | ✅ | ✅(GCP) | ✅(AWS) |
| 推理成本 | -50% | 基准 | 基准 | 基准 |
| 每瓦性能 | 显著优于 | 基准 | 基准 | 基准 |
| 设计周期 | 9 个月 | ~18 个月 | ~18 个月 | ~18 个月 |
关键洞察:Jalapeño 的每瓦性能显著优于当前最先进的 AI 加速器,推理成本降低约 50%。
技术亮点
1. 9 个月极速流片
通常情况下,从零开始设计一块 ASIC 芯片需要 1.5 到 2 年。而 Jalapeño 从初始设计到制造流片仅用了 9 个月。
OpenAI 硬件主管 Richard Ho 将此归因于深度软硬件协同开发:
- OpenAI 用自家前沿模型辅助架构探索
- 功耗仿真与强化学习优化
- 博通提供业界顶尖的硅实现能力
2. AI 辅助芯片设计
Jalapeño 是首款由 AI 辅助设计的 AI 芯片:
- OpenAI 用 GPT-5.3-Codex-Spark 等模型辅助架构探索
- 用 AI 进行功耗仿真与优化
- 用强化学习优化芯片布局布线
正如 OpenAI 总裁 Greg Brockman 所言:
"我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。"
3. 专为推理优化
与通用 GPU 不同,Jalapeño 是围绕 OpenAI 对 LLM 推理工作负载的深度理解从零构建的 ASIC:
- 降低数据移动:架构核心在于减少数据搬运
- 平衡计算-内存-网络资源分配:使实际利用率更接近理论峰值
- 结合高吞吐与低延迟:目标是将当前领先加速器的吞吐能力与最快专用推理系统的低延迟结合起来
4. 全栈平台(多代路线图)
Jalapeño 是一个多代计算平台的第一步:
- 2026 年底:初始部署(千兆瓦级数据中心)
- 2027-2028 年:逐步扩展
- 平台组成:
- OpenAI 设计的加速器
- 博通的芯片实现、网络和连接技术
- Celestica 的电路板、机架和系统专业技术
- Broadcom Tomahawk 交换芯片(网络部分)
为什么需要自研芯片?
1. 算力需求爆炸式增长
- ChatGPT 每天处理数亿次 API 调用
- GPT-5、Claude、Gemini 等前沿模型训练需要数万张 GPU
- 英伟达 GPU 供不应求,交付周期长达 6-12 个月
2. 推理成本压力
- OpenAI 每年算力支出约 数十亿美元
- 推理成本占运营成本的 60-70%
- 即使推理成本的边际下降也会显著改善盈利模型
3. 软硬件协同优化
- 通用 GPU 无法针对特定模型(如 GPT-5)进行极致优化
- 自研芯片可以深度适配自家模型,实现更高能效比
对 AI 芯片市场的影响
1. "去英伟达化"加速
科技巨头集体挑战英伟达市场主导地位的又一注脚:
| 厂商 | 自研芯片 | 类型 | 状态 |
|---|---|---|---|
| TPU v6e / Ironwood | 训练+推理 | ✅ 已商用 | |
| Amazon | Trainium 3 | 训练 | ✅ 已发布 |
| Microsoft | Maia 100 | 训练+推理 | ✅ 已发布 |
| Meta | MTIA | 训练+推理 | ✅ 已发布 |
| OpenAI | Jalapeño | 推理 | 🚧 2026 年底部署 |
| Apple | Neural Engine | 端侧推理 | ✅ 已商用 |
2. AI 芯片竞争维度升级
Jalapeño 的发布标志着 AI 产业的竞争维度正在发生根本性跃迁:
- 从单一的模型能力比拼
- 升级为"模型 + 芯片 + 系统 + 网络"的全栈基础设施竞赛
3. "AI 辅助设计 AI 芯片"成为新范式
当 OpenAI 从 GPT-5 的开发者变身为 Jalapeño 的设计者,当 9 个月成为芯片研发的新速度基准,这场芯片战争才刚刚拉开序幕。
适用场景
- ✅ OpenAI 内部工作负载(ChatGPT、Codex、API)
- ✅ 微软 Azure 数据中心(可能与 OpenAI 合作部署)
- ✅ 未来 Agent 产品的大规模交互场景
- ❌ 第三方用户(目前不对外销售)
- ❌ 训练任务(Jalapeño 专为推理设计)
厂商信息
| 项目 | 内容 |
|---|---|
| 公司 | OpenAI |
| 合作方 | 博通(Broadcom)、台积电(TSMC)、Celestica |
| CEO | Sam Altman |
| 总裁 | Greg Brockman |
| 硬件主管 | Richard Ho |
| 成立 | 2015-12 |
| Jalapeño 发布 | 2026-06-24 |
参考资料
- OpenAI 官方公告(待发布技术白皮书)
- 博通 CEO 陈福阳访谈
- 彭博社:Jalapeño 推理成本降低 50%
- SemiWiki:Jalapeño 技术细节
- Tom's Hardware:Jalapeño 架构分析
声明:本文部分规格为推测值,以 OpenAI 官方技术白皮书为准。OpenAI 将在未来数月内发布详细性能技术白皮书。
最后更新:2026-06-26