OpenAI 的首颗自研 AI 芯片正式亮相,名为 Jalapeño(墨西哥辣椒),由 OpenAI 和 Broadcom 联合发布,专门用于大模型的推理加速。

Jalapeño:专为推理优化
Jalapeño 专精于推理优化而非模型训练,官方说法是"blank-slate design for modern LLM inference",兼容所有 LLM。架构层面围绕三条核心思路:减少数据搬运、平衡算力内存网络三者的资源分配、让实际利用率逼近理论峰值。
网络部分由 Broadcom 提供了 Tomahawk 交换芯片。据 SemiWiki 和 Tom's Hardware 报道,Jalapeño 预计采用 TSMC 3nm 工艺制造,架构为脉动阵列(systolic array),搭配高带宽内存(HBM3E 或 HBM4),Arm 为这颗芯片设计了配套 CPU。
9 个月,从设计到流片
从最初设计到进入流片,这款芯片只用了 9 个月。在高性能先进半导体领域,这算是有史以来最快的开发速度——常规高性能 ASIC 设计周期通常是 2 到 3 年。OpenAI 表示:大模型可以用来加速部分设计和优化流程。
OpenAI 的硬件团队由 Richard Ho 领导,他之前在 Google 做 TPU 芯片工程,2023 年 11 月入职 OpenAI。
三方分工
参与芯片制造的三方分别是:
- OpenAI:芯片架构设计、内核优化、serving 系统
- Broadcom:硅实现、网络技术(含 Tomahawk 网络芯片)、芯片制造落地
- Celestica:板卡、机架、系统集成(也是 Google TPU 的首选制造合作伙伴)
Broadcom CEO Hock Tan 表示,与 OpenAI 的合作是为未来十年 AI 所需物理基础设施的规模扩展做出的基本承诺,Jalapeño 只是多代路线图的第一步。从 2026 年开始,将与 Microsoft 等合作伙伴部署千兆瓦级数据中心。
已在运行 GPT-5.3-Codex-Spark
在实验室里,这款芯片已经在进行以生产目标频率和功耗来运行部分模型了,包括 GPT-5.3-Codex-Spark(这个模型可以在 Codex 中使用)。

初步测试显示,Jalapeño 的每瓦性能达到 SOTA 水平,具体技术报告会在未来几个月发布。
年底开始部署
部署时间线:2026 年底开始初步部署,之后逐年扩展。整个项目的目标是 GW(吉瓦)级数据中心规模,合作伙伴包括微软等。10GW 大约相当于整个北京市的居民用电量。
这是一个多代平台路线图,Jalapeño 是第一代,第二代芯片代号"Serrano"(也是一种辣椒)。
时间线回顾
- 2025.10:与 Broadcom 宣布合作,计划部署 10GW 自研加速器
- 2025.10:与 NVIDIA 达成协议,后者投资最高 1000 亿美元并提供至少 10GW 数据中心系统
- 2025.10:与 AMD 签了 6GW 芯片供应协议(含 AMD 至多 10% 股权期权)
- 2026.06:与 Cerebras 签了 750MW 推理算力协议
- 2026.06.24:Jalapeño 芯片实物交付
整体策略是:自研芯片 + NVIDIA + AMD + Cerebras,四条线并行。Google 有 TPU,Amazon 有 Trainium,Meta 有 MTIA,微软有 Maia——现在 OpenAI 也有 Jalapeño 了。