当前位置：首页 » AI最新动态

OpenAI 首款自研芯片 Jalapeño：9 个月从设计到流片，专为推理优化

58分钟前 AI最新动态 0 0

OpenAI 的首颗自研 AI 芯片正式亮相，名为 Jalapeño（墨西哥辣椒），由 OpenAI 和 Broadcom 联合发布，专门用于大模型的推理加速。

Jalapeño：专为推理优化

Jalapeño 专精于推理优化而非模型训练，官方说法是"blank-slate design for modern LLM inference"，兼容所有 LLM。架构层面围绕三条核心思路：减少数据搬运、平衡算力内存网络三者的资源分配、让实际利用率逼近理论峰值。

网络部分由 Broadcom 提供了 Tomahawk 交换芯片。据 SemiWiki 和 Tom's Hardware 报道，Jalapeño 预计采用 TSMC 3nm 工艺制造，架构为脉动阵列（systolic array），搭配高带宽内存（HBM3E 或 HBM4），Arm 为这颗芯片设计了配套 CPU。

9 个月，从设计到流片

从最初设计到进入流片，这款芯片只用了 9 个月。在高性能先进半导体领域，这算是有史以来最快的开发速度——常规高性能 ASIC 设计周期通常是 2 到 3 年。OpenAI 表示：大模型可以用来加速部分设计和优化流程。

OpenAI 的硬件团队由 Richard Ho 领导，他之前在 Google 做 TPU 芯片工程，2023 年 11 月入职 OpenAI。

三方分工

参与芯片制造的三方分别是：

OpenAI：芯片架构设计、内核优化、serving 系统
Broadcom：硅实现、网络技术（含 Tomahawk 网络芯片）、芯片制造落地
Celestica：板卡、机架、系统集成（也是 Google TPU 的首选制造合作伙伴）

Broadcom CEO Hock Tan 表示，与 OpenAI 的合作是为未来十年 AI 所需物理基础设施的规模扩展做出的基本承诺，Jalapeño 只是多代路线图的第一步。从 2026 年开始，将与 Microsoft 等合作伙伴部署千兆瓦级数据中心。

已在运行 GPT-5.3-Codex-Spark

在实验室里，这款芯片已经在进行以生产目标频率和功耗来运行部分模型了，包括 GPT-5.3-Codex-Spark（这个模型可以在 Codex 中使用）。

初步测试显示，Jalapeño 的每瓦性能达到 SOTA 水平，具体技术报告会在未来几个月发布。

年底开始部署

部署时间线：2026 年底开始初步部署，之后逐年扩展。整个项目的目标是 GW（吉瓦）级数据中心规模，合作伙伴包括微软等。10GW 大约相当于整个北京市的居民用电量。

这是一个多代平台路线图，Jalapeño 是第一代，第二代芯片代号"Serrano"（也是一种辣椒）。

时间线回顾

2025.10：与 Broadcom 宣布合作，计划部署 10GW 自研加速器
2025.10：与 NVIDIA 达成协议，后者投资最高 1000 亿美元并提供至少 10GW 数据中心系统
2025.10：与 AMD 签了 6GW 芯片供应协议（含 AMD 至多 10% 股权期权）
2026.06：与 Cerebras 签了 750MW 推理算力协议
2026.06.24：Jalapeño 芯片实物交付

整体策略是：自研芯片 + NVIDIA + AMD + Cerebras，四条线并行。Google 有 TPU，Amazon 有 Trainium，Meta 有 MTIA，微软有 Maia——现在 OpenAI 也有 Jalapeño 了。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：OpenAI 首款自研芯片 Jalapeño：9 个月从设计到流片，专为推理优化

请登录后发表评论