OpenAI 和 Broadcom 发布 Jalapeño AI 芯片,用于大语言模型推理

TIA1.97%

OpenAI 与 Broadcom 于 2026 年 6 月 24 日发布了 Jalapeño,这是一款专为大型语言模型推理而设计的定制 AI 加速芯片。该芯片是 OpenAI 的首款 Intelligence Processor(智能处理器),也是两家公司联合开发的多代计算平台的首个组件,其明确目标是提升先进 AI 系统的速度、效率和可及性。这一里程碑反映了 OpenAI 日益致力于控制其模型和应用程序所依赖的整个基础设施栈,而非仅仅依赖外部计算平台的更广泛战略方向。

Jalapeño 架构与技术规格

Jalapeño 基于对现代 LLM 推理需求的内部研究从头设计。其架构反映了从 OpenAI 模型开发路线图中获得的洞察,包括内核优化、内存处理、网络和服务器系统方面的考量。该芯片是与 Broadcom 和 Celestia 合作开发的,后者贡献了制造工艺、板卡与机架集成、网络系统以及大规模部署基础设施。据两家公司称,该设计旨在保持对不同大型语言模型的灵活性,不局限于单一架构或产品线。

早期工程样品已在实验室环境中以目标工作频率和功耗水平运行机器学习工作负载,包括与 GPT-5.3-Codex-Spark 等先进模型相关的工作负载。初步内部评估表明,Jalapeño 与现有领先 AI 加速器相比,可能实现更高的每瓦性能。该架构强调减少数据移动以及计算、内存和网络资源的更均衡分配,旨在使实际利用率更接近理论硬件极限。Broadcom 的硅技术(包括其 Tomahawk 网络组件)被定位为大规模部署的关键推动因素。

Broadcom 与 Celestia 合作伙伴角色

该芯片是与 Broadcom 和 Celestia 合作开发的。Broadcom 贡献了硅技术和网络组件,包括 Tomahawk 网络系统。Celestia 贡献了制造工艺、板卡与机架集成、网络系统以及大规模部署基础设施。该设计借鉴了 ChatGPT、Codex 和基于 API 的服务等产品中使用的生产系统,以及未来基于代理的应用程序的预期需求。

OpenAI 全栈基础设施集成战略

该公司将这一开发视为向计算驱动经济模式更广泛转变的一部分。在此背景下,该芯片被定位为增加计算资源可用性、降低运营成本以及提升消费级和企业级 AI 系统响应能力的举措。其底层战略涉及模型开发、硬件设计和基础设施部署之间的更紧密集成,从而在整个系统层面而非孤立组件层面实现优化。

Jalapeño 背后的工程方法高度专注于 LLM 推理,而非通用计算工作负载。它借鉴了 ChatGPT、Codex 和基于 API 的服务等产品中使用的生产系统,以及未来基于代理的应用程序的预期需求。设计目标是结合高吞吐量和低延迟,从而在规模化条件下为交互式 AI 用例提供更灵敏的性能。

该计划的一个关键方面是软硬件系统的协同设计,即模型与基础设施共同演进。这包括芯片架构、内存系统、网络层、调度机制和部署框架。通过协调这些组件,该系统旨在提高效率并降低每单位交付智能的成本。

更广泛的平台战略将 Jalapeño 定位为长期基础设施路线图的第一步,该路线图计划于 2026 年开始分阶段部署,并整合 Broadcom 在硅和网络方面的贡献以及 Celestia 在系统集成方面的贡献。

FAQ

OpenAI 和 Broadcom 于 2026 年 6 月 24 日宣布了什么?

OpenAI 和 Broadcom 宣布了 Jalapeño,这是一款专为大型语言模型推理而设计的定制 AI 加速芯片。该芯片是 OpenAI 的首款 Intelligence Processor(智能处理器),也是两家公司联合开发的多代计算平台的首个组件。

早期 Jalapeño 工程样品正在运行哪些工作负载?

早期工程样品已在实验室环境中以目标工作频率和功耗水平运行机器学习工作负载,包括与 GPT-5.3-Codex-Spark 等先进模型相关的工作负载。

Jalapeño 的分阶段部署计划何时开始?

更广泛的平台战略将 Jalapeño 定位为长期基础设施路线图的第一步,该路线图计划于 2026 年开始分阶段部署。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论